新版天文学名词网站

宇宙驿站升级了服务器,我也顺便更新了一下,把主题调宽了一些,不光是为了宽屏下好看,也希望自己能多写一点。这半年的业余时间基本用在了新版天文学词库网站上,现在终于可以松一口气了。


目前数据库整合了2000年李竞、许邦信老师的《英汉天文学名词》、2001年名词委的《天文学名词(定义版)》,发表于《天文学进展》的前后十七批天文学名词推荐译名,以及即将出版的《海峡两岸天文学名词》校对稿。包括 23563 个英(外)文术语和 20739个中文名词,注释2182条。每个条目都增添了语种、拼音、中文繁体、台湾译名、审定状态、出处、备注等十多项属性,以满足不同方面的需求。

之前的数据库是中英文词条一一对应,经常有含义相近的词条由于字面差异或拼写不同而被赋予不同译名的情况,而词条按字母顺序排列,分散在辞典各处,很难发现。这样编排对于传统词典而言无可厚非,只有按固定的顺序排列才能有效检索。但对于可以全文搜索的数据库来说就显得多此一举了。倒是词条内部的关联需要有合适的方式来体现。比如埃勒曼炸弹(Ellerman bomb)和 胡须状结构(moustache)这两个看上去毫无关联的术语其实是同一个意思,如果不是研究太阳的相关领域,恐怕永远都不会意识到这一点。所以仅仅提供字面含义是远远不够的。另一方面,在更新维护数据库时,每个条目的更改都要照顾到已有的相关条目,如果同义词条以不尽相同的译名存在于不同位置,就很难在修订过程中保证数据库内部的一致性,也不利于日后的资料扩充。

我于是采用多对多的模式。将词条按实际意义合并,一个词条可以有多种英文表达,也可以有并列的中文译名,但释义是唯一的。再加上语种,用例,分类和标签,基本可以明确地界定外延内涵。每个概念在数据库只出现一次,名词委也只需要审定一次。不同的表达形式集中在同一条目内,方便比对参照,修订时可以统一更改,使用者也能够根据实际情况作出不同的选择。虽然有的中英文名词本身有多种含义,会出现在多个词条中,比如bias本意是“偏差”,而CCD的固有偏差习惯称作“本底”,但只要分别注释,就不会有混淆的情况。此外还增加了用于区别多音字,制作输入法辞典的“拼音” ,方便香港用户的“繁体中文”,跟踪审核流程的“审定状态”,记录修订讨论过程的“备注”等几个附加项,尽量满足当前的各类需求。

在数据维护方面,词条俗名、别名、曾用名,乃至错误拼写都会记录在备注中,可以用模糊查询检索。保证每个曾在数据库中出现过的词条都能查到去向,最大限度的保持数据的连续性。有争议或歧义的词条也尽量给出定名的根据和理由。之前的定名过程因为记录缺失而无从考证,不能不说是一个遗憾。

基于新版数据库,新名词的收录也有了一个清晰完整的流程:

  1. 任何用户在使用网站时发现未被收录的新名词,都可以通过填写在线表格,直接向名词为推荐。
  2. 网站管理员定期整理用户推荐列表,提交到名词委邮件列表中进行讨论。名词委成员也可以直接登录网站后台查看。
  3. 经过邮件讨论达成初步意见的条目会以待审定词条的形式进入数据库检索,及时提供给用户作为参考,在更广泛征集意见的同时仍留有调整的余地。
  4. 在审定会议上正式通过的名词译名便是“已审定”的标准名称。在正式出版物上发表之后,我们会注明来源,以便核对。

这样就将名词审定和辞典编篡工作分离开来。将后者交给程序自动完成,不用再担心体例、格式、拼写错误等琐碎的问题。数据库的更新也能够及时出现在下载辞典和相关出版物中。

天文学辞典样例截图

最新的“天文学名词数据库下载版”包括英汉(ec)汉英(ce)两个文本文件,均为UTF-8编码。文件格式为以制表符(TAB)分割的一对多列表,主词条唯一。包含了数据库中的英文全称,缩写及对应中文。可用于免费辞典,在线查询,输入法辞典等非商业性公共及个人应用。不过由于目前下载版本是不定期更新,最新数据还是要以在线查询结果为准。

网站方面崔博添加了许多新的功能。其中我最喜欢的是在时昭提议下增加的RSS输出,用来监视数据库中的条目变动再好不过。其他的变化大家可以在使用中慢慢体会。如果觉得有不尽如人意的地方可以直接同我或者崔博联系。

标签:, , , , , .

条回应

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

porno film