标签归档:arXiv

2022年天文学研究热门术语

2022年,疫情仍没有消失,但人们都在努力回到正常的生活之中。天文学家们的工作效率似乎并没有明显起色。论文预印本网站Arxiv上的天文学论文数量仍在下降,2022年全年共收到13393篇,比2021年的文章数少了1054 篇,下降约7%(今年统计的2021年文章总数为14447,和2022年1月统计的数目13243相差1204篇,怀疑arxiv系统将2022年提交的2021年文章的更新版本也计入在内)。虽然没有大家所期待的触底反弹,但下降的势头无疑有所放缓。随着各国形势逐渐恢复正常,天文界的科研交流和产出也能在今年逐渐恢复吧。

继续阅读

2021年天文学研究趋势初分析

2021年总算过去了。虽然疫情还没有结束的迹象,但是人们已经开始习惯新冠环伺的生活。疫情对社会带来的长期影响也在慢慢显现。2021年全世界天文学家提交到论文预印本Arxiv上的天文学论文数量只有13243篇,比2020年少了1577 篇(下降10.6%,甚至少于2018年的提交数)。这是自1994年arxiv开设天文学学科分类以来年度提交论文总数的第一次下降。我们在疫情的影响下被迫放慢了探索宇宙的脚步,但并未停止前进,毕竟连推迟了14年的韦布空间望远镜都发射成功了。

arxiv天文(astroph)论文收录数
继续阅读

ADS 速查页面

写论文时经常需要从ADS系统中复制文章的BibTeX代码,中间的重复操作很多。于是就写了一个python 脚本,可以根据arXiv编号或文章发表的期刊信息直接获取Bib信息,本想找个支持Python的空间分享,无奈GAE被墙,SAE尚不支持。于是又改成php版挂在这里:http://gerry.lamost.org/ads/。优先使用国台镜像以加快响应速度,也可以切换到原始网站。基本用法如下:

可以直接输入文章的arXiv编号,如果是07年4月以前的非astro-ph文章,则需要加上分类名称,比如gr-qc/0501001;如果知道发表期刊的具体信息,也可以按 年、期刊名、卷、页数的次序来输入参数,中间用空格隔开,期刊名不分大小。由于ADS收录的期刊很多,许多缩写和常用的并不一致,目前只支持对常见的几个进行后台转换,比如MN、PRL等。大部分期刊的缩写还是需要按照ADS的规范进行输入。

此外,在阅读文献和听取报告时,经常要根据首作者和年份信息来查询。在ADS原系统中需要在作者名字前增加一个脱字符”^”。我这里也进行了简单的支持。只要输入作者和年代,就会对指定年份进行搜索,并返回HMTL格式的列表结果。
——————————–
重要更新:
8月13日 : 增加文献引用数联合查询。目前支持ADS,Google Scholar, 以及arXiv所采用的inSPIRE。暂时只能解析arxiv编号。重新设计检索界面,整合各类搜索的说明和范例。logo为史瓦西度规下的空间曲率,Framm抛物面(Flamm’s paraboloid)。

目前的功能就是这些,有任何意见和建议可在此反馈。

天文数据的挑战

对arxiv文章0608638的译介

信息资源的爆炸式增长彻底改变了数据库管理分析的方法。数据处理的挑战几乎涵盖了所有的科学分支。当天文学开始用CCD取代了照相底板的时候,就走上了信息化的进程,来自于观测(数字化巡天)和模拟(比如宇宙结构形成、超新星爆发)的数据容量开始指数增长。现在全球的天文数据量已经达到了1PB,而且还在以2T/天的速度增长。数十TB的数据处理已经十分寻常,几PB的数据集很快就会出现。

天文社区为了应对这样的挑战引入了“虚拟天文台”(VO)的概念:这是一个基于网络的天文研究环境,将分散在各地的研究资源整合在一起,有着规范的海量数据存档、并提供高维的数据分析和计算工具。在虚拟天文社区中,像存档、标准、协议等数据管理方面的内容都已经有了显著的进展。但是在为这些庞大昂贵的数据库开发检索和分析工具,增加科学产出方面,进展缓慢。虽然有很多现成的数据挖掘工具和系统,但真能有效用于TB甚至PB级数据的却很少。高维统计和复杂度带来的挑战比数据量本身更大。工具的缺乏以及科学产出的不足阻碍了群体的进一步投入。这恐怕是eScience所面临的最严峻的问题。 继续阅读

用BibTEX输出arXiv

今天检查论文引文格式的时候突然发现所有来对预印本网站ArXiv的引用方式全部出错,因为是用BibTeX自动生成的,赶紧回头检查,发现问题出在ADS的导出格式上,其中对于ArXiv的定位是这样的,如果文章已正式发表,则Journal一项自然为发表刊物,若尚未发表,则为 ArXiv e-prints ,前缀(年+月)即为卷数,后四位即为文章编号(在07年改编号规则之前的文章,刊名加分类名称如 astro-ph 对应ArXiv Astrophysics e-prints,年月照写,无卷数,但也取后四位做文章编号),这样在输出为EndNote格式时就有了差别,已发表的文章arxiv编号同DOI编号并列在一起,虽然无法单独提取但不影响使用,而尚未发表的文章arxiv编号则被拆开,对应某卷某页,这的确是个变通的办法,但是按正常期刊的格式显示出来,怎么都对不了。只有BibTeX输出中多了一个eprint项,单独对应arxiv编号,于是其他导出格式都可以无视了。

接下来要把导出的BibTeX汇总整理,其实最好的办法是在线编辑,在ADS上注册个帐号,建个个人数据库,要用的文章打个勾点一下添加,用的时候按期刊格式一导出,什么麻烦都省了,可咱这儿的网络实在不让人放心……我一直用的Biblioscape这回是真不好用了,说是从7.0开始支持BibTeX,结果导入时主动忽略eprint这一项,改一下导入滤镜倒也不麻烦,可导出总不对我就没有办法了,看来目前的29个patch有希望继续出下去……国产的NoteExpress的情况也与此相同,虽然可以修改输出式样,但总归是绕远了;FF插件Zotero刚跨过1.0,便也找来试了一下,从ArXiv页面导入时将文章号列入期刊名一项,是个很巧妙的做法,虽然不符合Tag规定,但这样就能够不更改样式文件而获得正确输出,可惜没有加 ArXiv 标识,在ADS页面能正常识别已发表的文章,却将尚未发表的识别为网页,这样的话,就只有 JabRef 能够兼容这些少见的Tag,因为它就是基于bib文件操作的,不认识的标签就按照字母顺序往后排,原样输出。

继续阅读