分类目录归档:筑云晴雨

小更新一下

梅西耶中文资料站恢复运行已经一个月了,由于是静态网站,不便用Google Analytics 统计流量,用CPanel自带的的Webalizer显示平均日访问量已有300人次,看来还是有一定需求的。本来是准备十一期间完成更新,结果一直拖到现在,只是重写了主页说明,增加了几个索引页面,后来翻译的内容由于代码简化太多还是没能加进去,只好留着以后慢慢弄了。本来还想统一成黑色背景,但有人觉得白底黑字的文字更适合阅读(反正我是不习惯),加上html的格式定义已经过时,虽然工作量不大(在Emeditor中用正则表达式批量处理即可,Editplus不支持多文件替换,Ultraedit也能找但是会有遗漏),但调整起来很麻烦,改成css式样表比较好……不过,再说吧……

favicon

然后是本站的一些更新(主要是因为准备贴的几个主题都没有短时间内能完成的迹象-_-):十一前在抓虾客服的帮助下,修正合并了其中的无效订阅,处理速度还是很让人满意的,于是在右下角添加了那里的订阅页面;另外在后台解封了因Spam被ban的IP地址,都是无辜的代理;今天看到一个合适的传统云纹,随手做了一个favicon,就是在IE左上角IE地址栏和收藏夹中显示的小图标,这样在多标签浏览器中就容易辨认了,自我感觉良好。其实现在还是灰常灰常地忙……只不过有时候会把闲事当作正事来做一下罢了^_^

身份认证

居然是in the known universe

要在博客统计排名最权威的Technorati 上claim自己的blog有两个途径,其一是提交用户名密码让爬虫登录,我一向不相信网络,虽然这样的大站信用很好,但中间传输过程难保不出问题,数据包侦听、会话劫持……另一种方法是写一篇新日至,其中包含如下链接 :Technorati Profile ,这倒是简单,只是这篇日志未免单薄了些。

7月6日补记:
早上收到宋同学的来信,公共帐号使用Python脚本自动登录Eyou网关的问题终于解决了,这下再不用担心写blog时突然掉线了,感谢Elias同学的无私奉献,我也由此见识到Python的简洁与强大。其实最早是在AAS的招聘要求中注意到这个语言,包括夏威夷在内的各大观测站和实验室的技术岗位都要求有C/C++,Python以及Linux脚本的编程经验;后来又在GaoMiao那里听说豆瓣就是完全用Python实现,而NASA和Google也在使用这个语言;这样,即使是出于职业规划的考虑,我也有必要熟悉一下这门新兴的脚本语言。

垃圾评论

我实在忍无可忍了,每天几十条垃圾评论让原本充满期待的评论审核变得枯燥无聊,今天就来做个了断!

WordPress自带评论审核功能,可以设定屏蔽关键词,审核IP或邮件地址。我采用的是比较严格的策略:要求来访者至少提交过一条已经通过审核的评论,他/她的留言才会直接显示出来。这样,垃圾评论几乎不可能在前台出现,即使长时间不登陆后台管理,也不会影响到访客的阅读体验;但是,对于管理者来说,问题仍然很严重——要在堆积如山的审核队列中挑出真正的交流信息,无疑需要巨大的耐心,但是如果要天天如此呢?这时,一个准确有效的过滤规则就显得十分必要了。我根据最近一周所收到的垃圾评论确定评论黑名单中的关键词列表如下:

ambien (美国最受欢迎的处方安眠药,平均年销售额20亿美元)
carisoprodol (肌安宁,安眠药)
celexa (西酞普兰,抗抑郁药)
cialis (用于治疗勃起功能障碍,他达那非tadalafil的商品名)
diazepam (安定,安眠药)
hydrocodone (氢可酮,用于麻醉、镇痛,可成瘾)
levitra (艾力达,盐酸伐地那非片,属伟哥家族)
paxil (帕罗西汀,抗抑郁症,可成瘾)
phentermine (芬特明,减肥药)
tamiflu (达菲,感冒药,据说可减轻禽流感症状)
tramadol (曲马多,戒毒者解瘾替代品,但也被用作毒品)
viagra (伟哥,不用多说)
……

都是网上药店的广告,渡虎谷曾经介绍过一篇这方面的统计报告,我这里的情况与之基本相同。不过这类广告倒是特征明显,这些专有名词使用频率很低,通常不会在文章或者评论中出现,即使真要提到,也可以用中文替代,拿来做屏蔽关键词就可以有效地避免误判。不过评论机器人也没这么低级,有的会自动更换链接地址和关键词,有些能够利用代理自动更换IP,我的关键词名单是有限的,而用来赚钱的新药是却层出不穷的,要想一劳永逸,就不得不动用WP强大的插件了!

继续阅读

报到

回来很久了,终于有心情过来写点什么,为那些惦记我的朋友们。

其实,当我提前十天拿到正月初四的返程票时,我的年就已经过完了……

四下转了转,人家那里“院径无媒草自深”,我这里可好,不种粮食也不长草,落个清静。一个月没管,PageRank指数还有2,搜狗也重新收录,百度上也找得到了, 搜gerry,排名还很靠前,窃喜一下,看来当初选择走原创路线还是对滴,就像练内功,虽然辛苦一点,进展也比较慢,不过后劲足啊,所谓厚积薄发~~~

WP又出2.0.9了,我是升还是不升呢?2.1.1也比较稳定了,听说2.2也快出了……这什么软件都要找最新版的毛病是从什么时候开始的呢?

最后做个广告,在黑三角那里看到的“奥林匹克扑克大赛”算是过年期间看到的最有意思的笑话了,我就不转了,大家自己顺着链接看过去吧,废话就说这么多,招呼算是打过了。

站点重生

网站终于再一次恢复了,感谢崔博士与何勃亮兄的辛勤工作,他们已经为这个公益服务器投入了太多的时间和精力。

现在新平台仍不是很完善,还不能换主题模版,无法选择插件,样式在IE下显示有些异常,不过FireFox下没有问题。以后慢慢调吧

在停开的一周里,我忽然发现自己有了足够的时间来处理数据、整理FTP、重新备份系统……不过,还是没有看书。

电脑本是个工具,熟悉它是为了更好的工作,他们说磨刀不误砍柴功,然而技术的进步是没有止境的,为了有一把更顺手的柴刀,是不是还要去学打铁呢?

别说,有人就是这样做的(更多细节):

计算机算法经典巨著《计算机程序设计艺术》The Art of Computer Programming 的作者Knuth在1973年写完第三卷后(计划有七卷),不愿再继续忍受当时效率低下的排版系统,于是决定自行开发一套新系统,这就是现在学术出版界的规范──Tex,甚至其中的字体都是他亲自设计的!他因此获得了无数荣誉,但并没有忘记初衷,1992年──也就是二十年后,他提前从斯坦福退休,停止对Tex的更新,集中全部精力撰写后四卷……

其实不只是电脑是这样,我们工作不也是为了更好的生活?

所以,我上山了,那里有自己的房间,灯一盏,茶一壶,信手取书,无不可读,窗下是未化的雪,山外是不灭的星。