标签存档: code

Python简繁转换

简繁转换的工具很多,但始终没有一个完美的解决方案。由于字符之间从来都不是简单的一一对应,不仅一简对多繁的情况大量存在,多简对一繁也屡见不鲜。情况的复杂性由下面几例可见一斑:

头发发展 -> 頭髮發展
萝卜卜卦 -> 蘿蔔卜卦
秒表表达 -> 秒錶表達
晾干乾坤 -> 晾乾乾坤

要正确完成这样的转换,就要在单字对应关系之外加上词组对应。这一点无论Google 翻译,MS Word 或者ConvertZ 基本都可以做到(虚词部分可能稍微困难些)。但两岸相差的不只是字形,还有名称叫法。这一点嘻来嚷往最早的一篇文章中讲的很清楚。转引一个例子:“大衛碧咸在寮國見到了布希”。我第一次看到时完全不知所谓,虽然认得每一个字,还是猜不到这就是“大卫·贝克汉姆在老挝见到了布什”的香港版。要想正确转换这样的句子,就要建立更广泛的简繁词组对照表。也许你会觉得这已经超出了字体转换的范畴,开始接近自动翻译了。但从技术的角度上讲,把“软件”对应为“軟件”,”軟體” 或者 “ruan jian”并没有什么不同,前提是要有一个完善的转换语料库。当然这个前提并不容易满足,因为“所有的规则都有例外“。
继续阅读

标签:, , , , .

python换桌面脚本2.0

原来发过一个Python下的换桌面脚本,由于相关网站改版,脚本失效.。我也相应更新一下。移除了图片质量一般的EPOD。充分测试了windows(XP) 和 linux(Ubuntu gnome)双平台. 同时将原有的拉伸全屏模式,更改为保持长宽比的居中模式(其他模式的使用参数也已写在注释中)。 对于APOD,可以手动指定更新任意一天的图片(只支持JPG), 而NGPOD的网站地址与时间无关,只能获取最新图片。下载前会检查文件名,如果图片已经存在,则自动跳过。默认下载大图,然后根据设定分辨率生成桌面图片。各项参数要在源码中自行调整。仍需要PIL模块支持,这个模块的详细介绍可以看这里。新脚本点此下载
继续阅读

标签:, , .

Simbad座标查询脚本

近日为一个项目做天体证认,要根据候选天体的座标查找临近天体。Simbad支持座标文件查询,但因为目标很多,返回的页面内容太多,不便查看;但可以提交脚本来定制输出格式,但是脚本查询的返回结果中不区分座标来源,也就是说所有座标的全部查询结果都顺次输入,完全不做区分也没有标记,这样对应关系就全乱了。在问过CDS的Marc Wenger之后,得知系统可以用echodata来人工插入注释。但我有几百个目标写起来太麻烦了,于是写了段python脚本,直接从文件中读取座标,转换为链接格式提交查询,并将结果返回终端,按指定格式写入文件保存,一键完成。
继续阅读

标签:, , , , .

Python中文排序

Python比较字符串大小时,根据的是ord函数得到的编码值。基于它的排序函数sort可以很容易为数字和英文字母排序,因为它们在编码表中就是顺序排列的。

但要很处理中文就没那么容易了。中文通常有拼音和笔画两种排序方式,在最常用中文标准字符集GB2312中,3755个一级中文汉字是按照拼音序进行编码的,而3008个二级汉字则是按部首笔画排列,

出现这样的结果是因为‘曙’和‘曾’都是常用字,而‘鲑’和‘怡’都是次常用字,但无论从笔画还是拼音来看,这两对顺序都应该反过来。后来扩充的GBK和GB18030编码为了向下兼容,都没有更改之前的汉字顺序,于是sort之后的次序就很乱了。
继续阅读

标签:, , .

误差棒函数1.1

应读者要求,为Matlab误差棒函数增强版加入了颜色和点型控制功能,顺便加了个英文说明,上传到Mathworks 社区,点此访问,这才发现已经有了那么多类似的函数,果然工作还是要趁早啊,看论文去了……

% ERRORBARE Enhanced Errorbar Function.
% ERRORBARE(STY,X,Y,Xbar,Ybar,symbol)
% It can draw errorbar along X/Y/Dual axis
% in normal,semilog,loglog coordinate system,
% and adjust width of bar handles automatically,
% can also control dotstyle/color in the same way with errorbar.
%
% If the lower and upper error range of x/y is different,
% they should be input as [lower,upper] if x/y is a column vector;
% for a row vector, they should be [lower;uper].
%
% parameter STY include 12 types:
% v,h,d,vlogx,hlogx,dlogx,vlogy,hlogy,
% dlogy,vlogd,hlogd,dlogd
% where
% v stands for vertical errorbar,
% h draws horizontal errorbar,
% d means dual direction,
% logx corresponding to semilogx,can use preffix v/h/d
% logy corresponding to semilogy,can use preffix v/h/d
% logd corresponding to loglog,can use preffix v/h/d
继续阅读

标签:, , .

python脚本换桌面

原来何勃亮发过一个gnome下自动更新每日天图(APOD)作为桌面的脚本,挺有意思的,我这里发一个Python的,可以看作是免费软件Pic-a-PODPicture of the Day的替代品,在2.6下测试通过,需要安装PIL库,可以自行选择天文每日一图(APOD)、地理每日一图(EPOD)、或者美国国家地理每日一图(NGPOD),点此下载

这是由seasons的版本修改而来,他那里漏了一个setWallpaperFromBMP函数,还好在他的 javaEye 日志中找到了,有人是用win32gui实现,不过我测试没有成功。

源码如下,方便引擎收录:)
继续阅读

标签:, , , , .

用Matlab做星点识别

随着工作学习的深入,和原始天文照片的接触越来越多,发现对天文专业来说数字图像处理还是一门很有用的基础课程,连CMB功率谱之类看上去高深莫测的技术,其实都写在信号处理专业的本科教材里,把这段流程完全交给现成软件或者编程人员是没办法真正理解观测数据的。开始补课了,先从找星星开始~


比如我们有上面这张照片, 图中的亮点就是实际拍摄的星空,但左中和右下两个最亮的白点都是打在CCD上的宇宙线,它们能量很集中,没有扩展的形状。那要怎么让程序找到这些天体的位置,并识别出正确的星点呢? 继续阅读

标签:, , , , .
porno film