由于工作原因接触过一些本地化工作,经常会遇到专有名词的重复翻译或者相似句式的反复输入,一直希望能够借助自动化的软件减少这样的重复劳动。在现在的翻译工作中,最实用的技术是计算机辅助翻译(CAT),它利用词汇库(TB)和翻译记忆库(TM)自动替换相似文本,在多人协作或者延续时间较长、雷同内容多的项目中能够有效地提高工作效率。
利用这个技术来做网页本地化的软件有很多,CatsCradle就是其中最简单直接的一个。它所见即所得的编辑方式回避了对底层代码的操作,让译员能够专心处理文字,支持csv格式的术语表和记忆库,但它直接修改原始文件,使用前需要自行备份。而且这个免费软件从3.6开始收费,3.5的网页预览栏又无法正常显示被IE7限制了脚本或ActiveX控件的页面,编辑区还不能正常显示UTF-8字符。
更普遍的方式是采用专业的CAT软件,老西专门对此做过点评,龙头老大Trados中附带的TagEditor能够处理众多格式化文本,源码式的编辑方式一目了然,结合workbench的相关分析和MultiTerm的语料库,即使大型项目也能应对自如,改html自然不在话下。默认设置处理页面内容没有问题,但meta标签中的注释和说明都直接忽略了,虽然不影响用户体验,但关系到搜索引擎优化,有些还是应该翻出来的。这要在Tools菜单栏下的Tag Settings中进行设置:选择HTML的Properties,在Elements一项中找到Meta项,打开属性设置,将Content Type由Empty改为Normal,在Attributes中勾选content,然后在Formatting中更改显示效果(默认是红色)。这样再导入html文件时,就可以处理Meta标签中content的内容了。
曾是SDL公司主打产品的SDLX,在05年收购了Trados之后就退居二线,成为与TagEditor并列的Trados Tools,不再单独发行,它能够顺利识别 Meta 标签的title,keywords 等属性,也支持定制,不过需要相应的license许可;而位列第三的Deja Vu X 没有提供那么灵活自由的定制接口,便老老实实的将给爬虫看的Robots选项都列了出来,用起来反倒简单。
不过这些都是基于Windows平台的,要在Linux下工作的话,类似的软件要数Heartsome。这是一个用Java开发的翻译套件,包括记忆库管理,词典编辑,交互翻译(上面的图片便是它漂亮的启动Logo)一系列完整工具,支持Open/Star Office,记忆库需要本机或网络数据库支持,这对于自给自足的自由译者也许意义不大,但在大型协作项目中就能发挥威力了。试想,本地化项目启动时建立一个在线数据库,汇总各地译者工作,审校人员审批之后,便可以立刻进入翻译记忆库为其他译者提供参考,即使进度中断或者人员变动也能很好的保证内容连续和风格一致。另一方面,如果各学科的名词专业委员会都能提供这样一个在线更新的术语库,标准化的工作也会因此好做的多吧!