标签存档: arXiv

ADS 速查页面

写论文时经常需要从ADS系统中复制文章的BibTeX代码,中间的重复操作很多。于是就写了一个python 脚本,可以根据arXiv编号或文章发表的期刊信息直接获取Bib信息,本想找个支持Python的空间分享,无奈GAE被墙,SAE尚不支持。于是又改成php版挂在这里:http://gerry.lamost.org/ads/。优先使用国台镜像以加快响应速度,也可以切换到原始网站。基本用法如下:

可以直接输入文章的arXiv编号,如果是07年4月以前的非astro-ph文章,则需要加上分类名称,比如gr-qc/0501001;如果知道发表期刊的具体信息,也可以按 年、期刊名、卷、页数的次序来输入参数,中间用空格隔开,期刊名不分大小。由于ADS收录的期刊很多,许多缩写和常用的并不一致,目前只支持对常见的几个进行后台转换,比如MN、PRL等。大部分期刊的缩写还是需要按照ADS的规范进行输入。

此外,在阅读文献和听取报告时,经常要根据首作者和年份信息来查询。在ADS原系统中需要在作者名字前增加一个脱字符”^”。我这里也进行了简单的支持。只要输入作者和年代,就会对指定年份进行搜索,并返回HMTL格式的列表结果。
——————————–
重要更新:
8月13日 : 增加文献引用数联合查询。目前支持ADS,Google Scholar, 以及arXiv所采用的inSPIRE。暂时只能解析arxiv编号。重新设计检索界面,整合各类搜索的说明和范例。logo为史瓦西度规下的空间曲率,Framm抛物面(Flamm’s paraboloid)。

目前的功能就是这些,有任何意见和建议可在此反馈。

标签:, , , .

天文数据的挑战

对arxiv文章0608638的译介

信息资源的爆炸式增长彻底改变了数据库管理分析的方法。数据处理的挑战几乎涵盖了所有的科学分支。当天文学开始用CCD取代了照相底板的时候,就走上了信息化的进程,来自于观测(数字化巡天)和模拟(比如宇宙结构形成、超新星爆发)的数据容量开始指数增长。现在全球的天文数据量已经达到了1PB,而且还在以2T/天的速度增长。数十TB的数据处理已经十分寻常,几PB的数据集很快就会出现。

天文社区为了应对这样的挑战引入了“虚拟天文台”(VO)的概念:这是一个基于网络的天文研究环境,将分散在各地的研究资源整合在一起,有着规范的海量数据存档、并提供高维的数据分析和计算工具。在虚拟天文社区中,像存档、标准、协议等数据管理方面的内容都已经有了显著的进展。但是在为这些庞大昂贵的数据库开发检索和分析工具,增加科学产出方面,进展缓慢。虽然有很多现成的数据挖掘工具和系统,但真能有效用于TB甚至PB级数据的却很少。高维统计和复杂度带来的挑战比数据量本身更大。工具的缺乏以及科学产出的不足阻碍了群体的进一步投入。这恐怕是eScience所面临的最严峻的问题。 继续阅读

标签:, .

用BibTEX输出arXiv

今天检查论文引文格式的时候突然发现所有来对预印本网站ArXiv的引用方式全部出错,因为是用BibTeX自动生成的,赶紧回头检查,发现问题出在ADS的导出格式上,其中对于ArXiv的定位是这样的,如果文章已正式发表,则Journal一项自然为发表刊物,若尚未发表,则为 ArXiv e-prints ,前缀(年+月)即为卷数,后四位即为文章编号(在07年改编号规则之前的文章,刊名加分类名称如 astro-ph 对应ArXiv Astrophysics e-prints,年月照写,无卷数,但也取后四位做文章编号),这样在输出为EndNote格式时就有了差别,已发表的文章arxiv编号同DOI编号并列在一起,虽然无法单独提取但不影响使用,而尚未发表的文章arxiv编号则被拆开,对应某卷某页,这的确是个变通的办法,但是按正常期刊的格式显示出来,怎么都对不了。只有BibTeX输出中多了一个eprint项,单独对应arxiv编号,于是其他导出格式都可以无视了。

接下来要把导出的BibTeX汇总整理,其实最好的办法是在线编辑,在ADS上注册个帐号,建个个人数据库,要用的文章打个勾点一下添加,用的时候按期刊格式一导出,什么麻烦都省了,可咱这儿的网络实在不让人放心……我一直用的Biblioscape这回是真不好用了,说是从7.0开始支持BibTeX,结果导入时主动忽略eprint这一项,改一下导入滤镜倒也不麻烦,可导出总不对我就没有办法了,看来目前的29个patch有希望继续出下去……国产的NoteExpress的情况也与此相同,虽然可以修改输出式样,但总归是绕远了;FF插件Zotero刚跨过1.0,便也找来试了一下,从ArXiv页面导入时将文章号列入期刊名一项,是个很巧妙的做法,虽然不符合Tag规定,但这样就能够不更改样式文件而获得正确输出,可惜没有加 ArXiv 标识,在ADS页面能正常识别已发表的文章,却将尚未发表的识别为网页,这样的话,就只有 JabRef 能够兼容这些少见的Tag,因为它就是基于bib文件操作的,不认识的标签就按照字母顺序往后排,原样输出。

继续阅读

标签:, , , , , , .

利用RSS跟踪arXiv更新


现在终于下定决心开始跟踪论文预印本站点arXiv的每日更新了,但这每天提交的几十篇论文一口气看下来的确需要时间和耐心;如果中途有事中断,甚至耽误了一两天没看,新旧文章百十篇夹杂在一起……我无法想象自己每天吃饱了中饭就坐到电脑前做一下午人肉搜索……

要在这种情况下跟踪最新论文必须借助工具,于是我想到了RSS。RSS是随着blog和各类自助建站系统发展起来的一种全新浏览方式,动态页面技术将站点维护和内容更新有效分离,而大量模式化站点的出现也使标准化的更新查询容易实现。如果只是看blog,抓虾,netvibes,google reader 等在线阅读器已经足够了,但是要对这样大数据量的文献进行浏览检索以及随时的查阅,还是要用离线阅读器,其中最顺手的还是GreatNews

继续阅读

标签:, , , .
porno film