标签归档：arXiv

2022年天文学研究热门术语

2022年，疫情仍没有消失，但人们都在努力回到正常的生活之中。天文学家们的工作效率似乎并没有明显起色。论文预印本网站Arxiv上的天文学论文数量仍在下降，2022年全年共收到13393篇，比2021年的文章数少了1054 篇，下降约7%（今年统计的2021年文章总数为14447，和2022年1月统计的数目13243相差1204篇，怀疑arxiv系统将2022年提交的2021年文章的更新版本也计入在内）。虽然没有大家所期待的触底反弹，但下降的势头无疑有所放缓。随着各国形势逐渐恢复正常，天文界的科研交流和产出也能在今年逐渐恢复吧。

继续阅读 →

2021年天文学研究趋势初分析

发表评论

2021年总算过去了。虽然疫情还没有结束的迹象，但是人们已经开始习惯新冠环伺的生活。疫情对社会带来的长期影响也在慢慢显现。2021年全世界天文学家提交到论文预印本Arxiv上的天文学论文数量只有13243篇，比2020年少了1577 篇（下降10.6%，甚至少于2018年的提交数）。这是自1994年arxiv开设天文学学科分类以来年度提交论文总数的第一次下降。我们在疫情的影响下被迫放慢了探索宇宙的脚步，但并未停止前进，毕竟连推迟了14年的韦布空间望远镜都发射成功了。

arxiv天文(astroph)论文收录数
继续阅读 →

ADS 速查页面

8条回复

写论文时经常需要从ADS系统中复制文章的BibTeX代码，中间的重复操作很多。于是就写了一个python 脚本，可以根据arXiv编号或文章发表的期刊信息直接获取Bib信息，本想找个支持Python的空间分享，无奈GAE被墙，SAE尚不支持。于是又改成php版挂在这里:http://gerry.lamost.org/ads/。优先使用国台镜像以加快响应速度，也可以切换到原始网站。基本用法如下：

可以直接输入文章的arXiv编号，如果是07年4月以前的非astro-ph文章，则需要加上分类名称，比如gr-qc/0501001；如果知道发表期刊的具体信息，也可以按年、期刊名、卷、页数的次序来输入参数，中间用空格隔开，期刊名不分大小。由于ADS收录的期刊很多，许多缩写和常用的并不一致，目前只支持对常见的几个进行后台转换，比如MN、PRL等。大部分期刊的缩写还是需要按照ADS的规范进行输入。

此外，在阅读文献和听取报告时，经常要根据首作者和年份信息来查询。在ADS原系统中需要在作者名字前增加一个脱字符”^”。我这里也进行了简单的支持。只要输入作者和年代，就会对指定年份进行搜索，并返回HMTL格式的列表结果。
——————————–
重要更新：
8月13日：增加文献引用数联合查询。目前支持ADS，Google Scholar，以及arXiv所采用的inSPIRE。暂时只能解析arxiv编号。重新设计检索界面，整合各类搜索的说明和范例。logo为史瓦西度规下的空间曲率，Framm抛物面(Flamm’s paraboloid)。

目前的功能就是这些，有任何意见和建议可在此反馈。

天文数据的挑战

7条回复

对arxiv文章0608638的译介

信息资源的爆炸式增长彻底改变了数据库管理分析的方法。数据处理的挑战几乎涵盖了所有的科学分支。当天文学开始用CCD取代了照相底板的时候，就走上了信息化的进程，来自于观测（数字化巡天）和模拟（比如宇宙结构形成、超新星爆发）的数据容量开始指数增长。现在全球的天文数据量已经达到了1PB，而且还在以2T/天的速度增长。数十TB的数据处理已经十分寻常，几PB的数据集很快就会出现。

天文社区为了应对这样的挑战引入了“虚拟天文台”（VO）的概念：这是一个基于网络的天文研究环境，将分散在各地的研究资源整合在一起，有着规范的海量数据存档、并提供高维的数据分析和计算工具。在虚拟天文社区中，像存档、标准、协议等数据管理方面的内容都已经有了显著的进展。但是在为这些庞大昂贵的数据库开发检索和分析工具，增加科学产出方面，进展缓慢。虽然有很多现成的数据挖掘工具和系统，但真能有效用于TB甚至PB级数据的却很少。高维统计和复杂度带来的挑战比数据量本身更大。工具的缺乏以及科学产出的不足阻碍了群体的进一步投入。这恐怕是eScience所面临的最严峻的问题。继续阅读 →

用BibTEX输出arXiv

7条回复

今天检查论文引文格式的时候突然发现所有来对预印本网站ArXiv的引用方式全部出错，因为是用BibTeX自动生成的，赶紧回头检查，发现问题出在ADS的导出格式上，其中对于ArXiv的定位是这样的，如果文章已正式发表，则Journal一项自然为发表刊物，若尚未发表，则为 ArXiv e-prints ，前缀（年+月）即为卷数，后四位即为文章编号（在07年改编号规则之前的文章，刊名加分类名称如 astro-ph 对应ArXiv Astrophysics e-prints，年月照写，无卷数，但也取后四位做文章编号），这样在输出为EndNote格式时就有了差别，已发表的文章arxiv编号同DOI编号并列在一起，虽然无法单独提取但不影响使用，而尚未发表的文章arxiv编号则被拆开，对应某卷某页，这的确是个变通的办法，但是按正常期刊的格式显示出来，怎么都对不了。只有BibTeX输出中多了一个eprint项，单独对应arxiv编号，于是其他导出格式都可以无视了。

接下来要把导出的BibTeX汇总整理，其实最好的办法是在线编辑，在ADS上注册个帐号，建个个人数据库，要用的文章打个勾点一下添加，用的时候按期刊格式一导出，什么麻烦都省了，可咱这儿的网络实在不让人放心……我一直用的Biblioscape这回是真不好用了，说是从7.0开始支持BibTeX，结果导入时主动忽略eprint这一项，改一下导入滤镜倒也不麻烦，可导出总不对我就没有办法了，看来目前的29个patch有希望继续出下去……国产的NoteExpress的情况也与此相同，虽然可以修改输出式样，但总归是绕远了；FF插件Zotero刚跨过1.0，便也找来试了一下，从ArXiv页面导入时将文章号列入期刊名一项，是个很巧妙的做法，虽然不符合Tag规定，但这样就能够不更改样式文件而获得正确输出，可惜没有加 ArXiv 标识，在ADS页面能正常识别已发表的文章，却将尚未发表的识别为网页，这样的话，就只有 JabRef 能够兼容这些少见的Tag，因为它就是基于bib文件操作的，不认识的标签就按照字母顺序往后排，原样输出。

继续阅读 →