网页本地化软件

由于工作原因接触过一些本地化工作,经常会遇到专有名词的重复翻译或者相似句式的反复输入,一直希望能够借助自动化的软件减少这样的重复劳动。在现在的翻译工作中,最实用的技术是计算机辅助翻译(CAT),它利用词汇库(TB)和翻译记忆库(TM)自动替换相似文本,在多人协作或者延续时间较长、雷同内容多的项目中能够有效地提高工作效率。

利用这个技术来做网页本地化的软件有很多,CatsCradle就是其中最简单直接的一个。它所见即所得的编辑方式回避了对底层代码的操作,让译员能够专心处理文字,支持csv格式的术语表和记忆库,但它直接修改原始文件,使用前需要自行备份。而且这个免费软件从3.6开始收费,3.5的网页预览栏又无法正常显示被IE7限制了脚本或ActiveX控件的页面,编辑区还不能正常显示UTF-8字符。

更普遍的方式是采用专业的CAT软件, 继续阅读

Matlab误差棒增强版

Matlab中自带的误差棒函数 errorbar 功能单一,只能在普通坐标下绘制纵向误差,而水平误差棒、对数坐标也经常会用到,就写了一个功能完整点的。帮助如下:

% 误差棒函数增强版
% ERRORBARE(SYM,X,Y,Xbar,Ybar) 能够按需要绘制误差棒,
% 可沿水平、垂直,或者两轴方向,能够根据所选坐标类型
% 调整端点线长。并可处理上下限不同的情况。
%
% SYM 参数包括 v,h,d,vlogx,hlogx,dlogx,vlogy,hlogy,
% dlogy,vlogd,hlogd,dlogd 共12种
% v 表示误差棒垂直,
% h 表示误差棒水平,
% d (dual) 显示双轴误差,
% logx 对应 semilogx,前缀 v,h,d 意义同上
% logy 对应 semilogy,前缀 v,h,d 意义同上
% logd 对应 loglog,前缀 v,h,d 意义同上
%
% 范例:
% x = 1:10;
% y = sin(x)+2;
% e = std(y)*ones(size(x));
% errorbare(x,y,e) % 直接调用errorbar函数
% errorbare(‘v’,x,y,e) % e为 y 误差限
% errorbare(‘v’,x,y,[e;2*e]) % 上下限不等
% errorbare(‘hlogx’,x,y,e) % e为 x 误差限,
% errorbare(‘d’,x,y,e,e) % 双轴误差棒

代码参考了原始函数,运行效率没有下降,就是程序有点啰嗦,也不贴出来了,点此下载,其实这次的异常处理部分还是考虑得比较仔细的:)

WP升级到2.3

过年了,这里自然也要收拾一下,WordPress2.3已经出来一段时间了,但因为变化较大,自己原来又改动太多,模板插件都要重新定制,就一直拖到现在。希望朋友们能喜欢!

数据库升级比我想象的要顺利,从2.0直接update,完美保留UTW,TP-Guestbook等插件的内容;K2 RC4的功能更加强大了,有了SBM(Sidebar Modules)就不用手工编辑sidebar.php了,但似乎IE(6/7)兼容不好,用FireFox才能正常配置,详细说明可以参考Yskin的文章。页面导航功能取代了PageNavi插件,有了自带的最新文章和评论模块也不用装桑葚的中文WordPress工具箱了,不过要过滤自己的评论,还是要在k2\app\modules目录下的latest_comments.php文件的$sql 表达式中加入user_id != 1或者comment_author != ‘gerry’的条件;页眉的图片可以在K2选项中直接更换;侧边栏顶端的公告现在也能够利用Asides存档编入“闲情偶寄”,只要不输入标题就不会在最新文章中出现。这样主题文件中就只有header和footer需要改动了,想换个风格就编个css丢到k2\styles下面就可以了

现在要安装的插件就不多了:

    Akismet,版本2.1.3,过滤垃圾评论的首选
    TP-Guestbook 0.9.8,功能齐全的留言本插件,作者很久没有更新了,但只要保证theme目录下的留言页面与模板配套就能够正常使用,本站的定制版点此下载

留言本已经清理完毕,以前的页面评论就不改了,不过旧文的Tag还是补上的好,要是还有时间倒想试试阅读网络那样的双语版……

用BibTEX输出arXiv

今天检查论文引文格式的时候突然发现所有来对预印本网站ArXiv的引用方式全部出错,因为是用BibTeX自动生成的,赶紧回头检查,发现问题出在ADS的导出格式上,其中对于ArXiv的定位是这样的,如果文章已正式发表,则Journal一项自然为发表刊物,若尚未发表,则为 ArXiv e-prints ,前缀(年+月)即为卷数,后四位即为文章编号(在07年改编号规则之前的文章,刊名加分类名称如 astro-ph 对应ArXiv Astrophysics e-prints,年月照写,无卷数,但也取后四位做文章编号),这样在输出为EndNote格式时就有了差别,已发表的文章arxiv编号同DOI编号并列在一起,虽然无法单独提取但不影响使用,而尚未发表的文章arxiv编号则被拆开,对应某卷某页,这的确是个变通的办法,但是按正常期刊的格式显示出来,怎么都对不了。只有BibTeX输出中多了一个eprint项,单独对应arxiv编号,于是其他导出格式都可以无视了。

接下来要把导出的BibTeX汇总整理,其实最好的办法是在线编辑,在ADS上注册个帐号,建个个人数据库,要用的文章打个勾点一下添加,用的时候按期刊格式一导出,什么麻烦都省了,可咱这儿的网络实在不让人放心……我一直用的Biblioscape这回是真不好用了,说是从7.0开始支持BibTeX,结果导入时主动忽略eprint这一项,改一下导入滤镜倒也不麻烦,可导出总不对我就没有办法了,看来目前的29个patch有希望继续出下去……国产的NoteExpress的情况也与此相同,虽然可以修改输出式样,但总归是绕远了;FF插件Zotero刚跨过1.0,便也找来试了一下,从ArXiv页面导入时将文章号列入期刊名一项,是个很巧妙的做法,虽然不符合Tag规定,但这样就能够不更改样式文件而获得正确输出,可惜没有加 ArXiv 标识,在ADS页面能正常识别已发表的文章,却将尚未发表的识别为网页,这样的话,就只有 JabRef 能够兼容这些少见的Tag,因为它就是基于bib文件操作的,不认识的标签就按照字母顺序往后排,原样输出。

继续阅读