网页本地化软件

由于工作原因接触过一些本地化工作,经常会遇到专有名词的重复翻译或者相似句式的反复输入,一直希望能够借助自动化的软件减少这样的重复劳动。在现在的翻译工作中,最实用的技术是计算机辅助翻译(CAT),它利用词汇库(TB)和翻译记忆库(TM)自动替换相似文本,在多人协作或者延续时间较长、雷同内容多的项目中能够有效地提高工作效率。

利用这个技术来做网页本地化的软件有很多,CatsCradle就是其中最简单直接的一个。它所见即所得的编辑方式回避了对底层代码的操作,让译员能够专心处理文字,支持csv格式的术语表和记忆库,但它直接修改原始文件,使用前需要自行备份。而且这个免费软件从3.6开始收费,3.5的网页预览栏又无法正常显示被IE7限制了脚本或ActiveX控件的页面,编辑区还不能正常显示UTF-8字符。

更普遍的方式是采用专业的CAT软件,老西专门对此做过点评,龙头老大Trados中附带的TagEditor能够处理众多格式化文本,源码式的编辑方式一目了然,结合workbench的相关分析和MultiTerm的语料库,即使大型项目也能应对自如,改html自然不在话下。默认设置处理页面内容没有问题,但meta标签中的注释和说明都直接忽略了,虽然不影响用户体验,但关系到搜索引擎优化,有些还是应该翻出来的。这要在Tools菜单栏下的Tag Settings中进行设置:选择HTML的Properties,在Elements一项中找到Meta项,打开属性设置,将Content Type由Empty改为Normal,在Attributes中勾选content,然后在Formatting中更改显示效果(默认是红色)。这样再导入html文件时,就可以处理Meta标签中content的内容了。

曾是SDL公司主打产品的SDLX,在05年收购了Trados之后就退居二线,成为与TagEditor并列的Trados Tools,不再单独发行,它能够顺利识别 Meta 标签的title,keywords 等属性,也支持定制,不过需要相应的license许可;而位列第三的Deja Vu X 没有提供那么灵活自由的定制接口,便老老实实的将给爬虫看的Robots选项都列了出来,用起来反倒简单。

不过这些都是基于Windows平台的,要在Linux下工作的话,类似的软件要数Heartsome。这是一个用Java开发的翻译套件,包括记忆库管理,词典编辑,交互翻译(上面的图片便是它漂亮的启动Logo)一系列完整工具,支持Open/Star Office,记忆库需要本机或网络数据库支持,这对于自给自足的自由译者也许意义不大,但在大型协作项目中就能发挥威力了。试想,本地化项目启动时建立一个在线数据库,汇总各地译者工作,审校人员审批之后,便可以立刻进入翻译记忆库为其他译者提供参考,即使进度中断或者人员变动也能很好的保证内容连续和风格一致。另一方面,如果各学科的名词专业委员会都能提供这样一个在线更新的术语库,标准化的工作也会因此好做的多吧!

订阅评论
提醒

1 评论
最旧
最新 最多投票
内联反馈
查看所有评论
2009 年 6 月 11 日 04:05

[…] 后来FeedDemon免费,我就开始用Newsgator的账号,有剪贴板可以同步,收藏文章的时候方便多了。Newsgator公司统一RSS的战略还是非常明确的,为智能手机开发了NewsGator Go!,为Mac 和 iphone 开发了 NetNewsWire,甚至还有Outlook专用的Newsgator Inbox,加上浏览器工具条和在线阅读模式,覆盖了Linux之外的全部平台,完美同步。稍微有不足的是,剪贴板的已读条目会在一段时间后自动删除,好在还提供了rss输出功能,用Google Reader收集一下就是一份个人网摘。现在有iTouch把坐公交地铁、泡茶喝咖啡的时间利用起来,一天50来个频道500+的更新也没有占用太多时间。朋友们看意大利报纸,我看iTouch~ Google的思路就不一样了,Reader 和其他服务都只提供了基于Gears的离线模式,把操作限制在浏览器内,用网络标准弭平了系统平台间的差异,这是个巧妙的思路,不论它是否能最终取代微软,我们的生活已经因此改变。今天google又将翻译服务中的翻译建议功发展成机器辅助翻译平台,作为 Google translator toolkit 发布,这真是个惊喜。我当初测试CAT软件时就很希望能有一个开放的语料术语库,每个翻译者都是贡献者,人名地名专业名词的标准翻译都由庞大的数据库自动给出,译者不用再关心软件的安装设置,词库的转换导入,只需专注于语言表达,安心陈述。现在google 辅助翻译工具的出现,方便的不仅仅是译者,相信机器翻译也能因为语料库的大大丰富而给出质量更高的译文。 […]