- 中文名
- 中国哲学书电子化计划
- 外文名
- Chinese Text Project
- 统一码联盟
- Unicode Consortium
- 后设资料
- 元资料
简介
播报编辑
它的主要内容包括原典资料库、当代研奔戒套究资料库以煮骗霸及内部字典;原典资料库的内容包括:儒家、墨家、道家巩乐、法家、名家、兵家、算书匪蒸、杂家、史书、经典文献只少签宙项屑宙、字书、医桨寻页学以及出土文献先秦两汉各种原文资料。部分原典有现代汉语和英文的翻译坑照本,另外还有内部字典、底本扫描版、相似段落提示等独特的功能。 [1]
发展历程
播报编辑
截至到2018年,收藏的文本已超过三万部著作 [5]。
主要内容和功能
播报编辑
原典资料库
网站最主要的部分为古籍资料库,此资料库包含各种从哲学、历史、语言学等角度被视为重要的文献,写作年代以先秦两汉为主。网站的所有资料都存在一个专门设计的数据库,以便读浏览和搜索的方便。此外,部分原典有附英文或现代汉语翻译,这些翻译是一段一段对照原典而附上的,因此很容易从译文找出对应的原典,或从原典找出对应的译文。
内部字典
内部汉字字典合并三个来源的信息:统一码联盟(Unicode Consortium)的「Unihan」数据库、上述的原典资料库、以及网站新开发的CTP字典。其中Unihan数据库提供有关汉字的基本信息,包括部首、笔画数、异体字、标准字典中的出处、以及英文翻译(但此英文翻译以现代汉语用法为主)。原典资料库则给每一个字提供原典中的具体出处。最后,CTP字典试图对汉字的语义和实际运用提供一个尽可能完整的分析。虽然从汉字的数量上看大多数汉字是单义词,但少数很常用的字却有许多不同的用法,这些不同用法通常有不同语义或读法。 CTP字典把这些不同意义或不同读法的用法分开处理,并且通过原典数据库给每一个不同用法分别提供原典出处。这一功能是透过一种「语义链接」的手段而实现的,即建立从某篇某段某句中的某字到CTP字典中的相关用法的链接。建立这些链接需要对文本的理解,因而是一个手动的且耗时的程序;因此CTP字典的范围暂时很有限(但日益增加)。
词语分析表
通过内部字典和上述的语义链接,还可以对原典数据库中的任何段落提供词语分析表。词语分析表为段落中的每一个字显示字典中的英文翻译及其它信息,并且对於有语意链接的词语显示词语在此脉络中的意义。例如,在《论语》的第一段中,系统会显示「乐」的正确读法是「le」而不是「yue」,且该句中「说」的用法跟「悦」的读法、意义相同。
建立语意链接的计划正在进行,因此暂时也有缺少链接的字。当一个字尚未有语意链接时,系统将会显示此字的基本资料,并提供至完整字典项目的连接。
相似段落资料
由於种种原因,许多早期文献含有与其它文献相似的片段或较长的段落,足以证明两个著作并非完全独立而形成的。此现象有时表明原作者有意识的抄写了当时已形成的其它著作;有时表明谋一个俗语当时已流行;也有时是由其它的原因造成的。在许多情况下,虽然这些相似的片段具有明显的相似性,并足以保证此相似性并非巧合,与此同时这些片段有时候具有重要且有趣的不同之处。
相似段落功能把这些相似或相同的段落连接起来,且显示相似部份以便对照。任何具有相似段落讯息的段落将会显示图标;点击此图标将会显示此段落、所有相似段落及其连接。
原典影印本
许多早期文献具有不同的现存版本。这些版本的不同有些是因不同的文献历史背景而产生的,也有一些产生於纠正抄写错误,也有部份来自假借字现象而造成的,而另外还有更多造成原因。这些造成原因加起来使得我们很难看出今天的电子版或印刷版的原典是否「正确」;甚至使得我们很难以下定义说什麼叫做「正确」的版本,毕竟未必真的曾经存在过所谓「最原始的」由一个作者所写作的版本。
因此,本站为越来越多的原典提供原典扫瞄版,且为原典每一段落提供至扫瞄版的连接。原典数据库中的每一个字应对应於扫瞄版的一个字,而系统能够给使用者显示原典及原典扫瞄版的对照本,以便使用者确定原典与扫瞄本无误。另,因为扫瞄本有可能经过後世的研究而被视为本身有误,因此系统将会注明所有被修改的字词,同时保留原本错误的字以便与扫瞄版对照。
引得、索引讯息
在文献(尤其是英文文献)中提到原典资料时,学者经常使用此段落在标准的引得或索引中的编号来指称它,例如,使用哈佛燕京学社引得系列,或逐字索引丛刊系列,在文献中标注索引或引得中的第几页、第几篇、第几行的原典是他所探讨的对象,例如,「《庄子引得》4/2/35」,即在《庄子引得》中的第4页第2篇第35行中所出现的文字,就这一例子而言,是指「故为是举莛与楹,厉与西施,恢恑憰怪,道通为一。其分也,成也;其成也,毁也。凡物」。但如果学者的文献中尚未引用原典文字或其翻译(在某些英文期刊及其它出版物中,经常是如此),则读者很难以确认作者所指的是原典中哪一个段落,除非读者手中也有同一本索引或引得。
为了试图解决这个问题,本站对部份原典提供索引、引得查询服务,透过输入索引、引得编号,可检索到其所对应的原典段落。例如,就上述的例子,读者输入了编号「4/2/35」之後,马上就可以找出所对应的原文。若想要使用这一功能,请先打开原典的目录页,然後在目录右边的「引得、索引查询」输入方块中输入编号,或者使用引得、索引讯息页面中的输入方块输入。另外,可以查询支持这一功能的原典文献的任何一个段落的索引、引得编号。只要点击段落左边的图标,然後把滑鼠移到原典上,就可以看出相关的索引、引得讯息。
后设资料系统
许多功能都依赖于某种「后设资料」(又称「元资料」),即有关资料的资料;就本站而言,「后设资料」是指有关原典文献的资料。后设资料系统的目的是让使用者能够为资料库中的原典增加新的后设资料,因而使得资料库能够实现上述功能所无法实现的目的。后设资料可以是个人专用的,也可以是公开给所有人分享。
本站的每件后设资料包括:一个属性,例如「成语来源」或「我认为有趣的原文」,以及原典文献中具有此属性的段落或片段;另外也可以有其它相关的资料,例如,一句话说明为什麼此片段具有此属性。后设资料成立之后,可以使用下述的「高级搜索」功能搜索。 [3]
原典来源
播报编辑