网页本地化软件

1条回复

由于工作原因接触过一些本地化工作，经常会遇到专有名词的重复翻译或者相似句式的反复输入，一直希望能够借助自动化的软件减少这样的重复劳动。在现在的翻译工作中，最实用的技术是计算机辅助翻译(CAT)，它利用词汇库(TB)和翻译记忆库(TM)自动替换相似文本，在多人协作或者延续时间较长、雷同内容多的项目中能够有效地提高工作效率。

利用这个技术来做网页本地化的软件有很多，CatsCradle就是其中最简单直接的一个。它所见即所得的编辑方式回避了对底层代码的操作，让译员能够专心处理文字，支持csv格式的术语表和记忆库，但它直接修改原始文件，使用前需要自行备份。而且这个免费软件从3.6开始收费，3.5的网页预览栏又无法正常显示被IE7限制了脚本或ActiveX控件的页面，编辑区还不能正常显示UTF-8字符。

更普遍的方式是采用专业的CAT软件，继续阅读 →

Matlab误差棒增强版

Matlab中自带的误差棒函数 errorbar 功能单一，只能在普通坐标下绘制纵向误差，而水平误差棒、对数坐标也经常会用到，就写了一个功能完整点的。帮助如下：

% 误差棒函数增强版
% ERRORBARE(SYM,X,Y,Xbar,Ybar) 能够按需要绘制误差棒，
% 可沿水平、垂直，或者两轴方向，能够根据所选坐标类型
% 调整端点线长。并可处理上下限不同的情况。
%
% SYM 参数包括 v,h,d,vlogx,hlogx,dlogx,vlogy,hlogy,
% dlogy,vlogd,hlogd,dlogd 共12种
% v 表示误差棒垂直，
% h 表示误差棒水平，
% d (dual) 显示双轴误差，
% logx 对应 semilogx，前缀 v,h,d 意义同上
% logy 对应 semilogy，前缀 v,h,d 意义同上
% logd 对应 loglog，前缀 v,h,d 意义同上
%
% 范例:
% x = 1:10;
% y = sin(x)+2;
% e = std(y)*ones(size(x));
% errorbare(x,y,e) % 直接调用errorbar函数
% errorbare(‘v’,x,y,e) % e为 y 误差限
% errorbare(‘v’,x,y,[e;2*e]) % 上下限不等
% errorbare(‘hlogx’,x,y,e) % e为 x 误差限，
% errorbare(‘d’,x,y,e,e) % 双轴误差棒

代码参考了原始函数，运行效率没有下降，就是程序有点啰嗦，也不贴出来了，点此下载，其实这次的异常处理部分还是考虑得比较仔细的:)

WP升级到2.3

过年了，这里自然也要收拾一下，WordPress2.3已经出来一段时间了，但因为变化较大，自己原来又改动太多，模板插件都要重新定制，就一直拖到现在。希望朋友们能喜欢！

数据库升级比我想象的要顺利，从2.0直接update，完美保留UTW，TP-Guestbook等插件的内容；K2 RC4的功能更加强大了，有了SBM(Sidebar Modules)就不用手工编辑sidebar.php了，但似乎IE(6/7)兼容不好，用FireFox才能正常配置，详细说明可以参考Yskin的文章。页面导航功能取代了PageNavi插件，有了自带的最新文章和评论模块也不用装桑葚的中文WordPress工具箱了，不过要过滤自己的评论，还是要在k2\app\modules目录下的latest_comments.php文件的$sql 表达式中加入user_id != 1或者comment_author != ‘gerry’的条件；页眉的图片可以在K2选项中直接更换；侧边栏顶端的公告现在也能够利用Asides存档编入“闲情偶寄”，只要不输入标题就不会在最新文章中出现。这样主题文件中就只有header和footer需要改动了，想换个风格就编个css丢到k2\styles下面就可以了

现在要安装的插件就不多了：

Yskin’s wp-statistics

Ajax Comments_Reply

点此下载

留言本已经清理完毕，以前的页面评论就不改了，不过旧文的Tag还是补上的好，要是还有时间倒想试试阅读网络那样的双语版……

10的次方

2条回复

偶然看见一篇“從10億光年外看地球”的转帖，介绍不同尺度的世界图像，图片制作相当精细，中文解说也很很到位，这样的视角在这个普及了卫星地图、电脑动画、电子隧道扫描显微镜的时代的确算不上新鲜，但如果是三十年前呢？

继续阅读 →

用BibTEX输出arXiv

7条回复

今天检查论文引文格式的时候突然发现所有来对预印本网站ArXiv的引用方式全部出错，因为是用BibTeX自动生成的，赶紧回头检查，发现问题出在ADS的导出格式上，其中对于ArXiv的定位是这样的，如果文章已正式发表，则Journal一项自然为发表刊物，若尚未发表，则为 ArXiv e-prints ，前缀（年+月）即为卷数，后四位即为文章编号（在07年改编号规则之前的文章，刊名加分类名称如 astro-ph 对应ArXiv Astrophysics e-prints，年月照写，无卷数，但也取后四位做文章编号），这样在输出为EndNote格式时就有了差别，已发表的文章arxiv编号同DOI编号并列在一起，虽然无法单独提取但不影响使用，而尚未发表的文章arxiv编号则被拆开，对应某卷某页，这的确是个变通的办法，但是按正常期刊的格式显示出来，怎么都对不了。只有BibTeX输出中多了一个eprint项，单独对应arxiv编号，于是其他导出格式都可以无视了。

接下来要把导出的BibTeX汇总整理，其实最好的办法是在线编辑，在ADS上注册个帐号，建个个人数据库，要用的文章打个勾点一下添加，用的时候按期刊格式一导出，什么麻烦都省了，可咱这儿的网络实在不让人放心……我一直用的Biblioscape这回是真不好用了，说是从7.0开始支持BibTeX，结果导入时主动忽略eprint这一项，改一下导入滤镜倒也不麻烦，可导出总不对我就没有办法了，看来目前的29个patch有希望继续出下去……国产的NoteExpress的情况也与此相同，虽然可以修改输出式样，但总归是绕远了；FF插件Zotero刚跨过1.0，便也找来试了一下，从ArXiv页面导入时将文章号列入期刊名一项，是个很巧妙的做法，虽然不符合Tag规定，但这样就能够不更改样式文件而获得正确输出，可惜没有加 ArXiv 标识，在ADS页面能正常识别已发表的文章，却将尚未发表的识别为网页，这样的话，就只有 JabRef 能够兼容这些少见的Tag，因为它就是基于bib文件操作的，不认识的标签就按照字母顺序往后排，原样输出。

继续阅读 →