其他

【ArXiv究竟多受欢迎?】计算机科学63大顶会10年数据证明

2017-10-22 新智元

AI WORLD 2017世界人工智能大会倒计时 17 

“AI达摩”齐聚世界人工智能大会,AI WORLD 2017议程嘉宾重磅发布 


大会早鸟票已经售罄,现正式进入全额票阶段。还记得去年一票难求的AI WORLD 2016盛况吗?今年,即将于2017年11月8日在北京国家会议中心举办的AI World 2017世界人工智能大会上,我们请到CMU教授、冷扑大师发明人Tuomas Sandholm、 百度副总裁王海峰 、微软全球资深副总裁王永东、亚马逊AWS机器学习总监Alex Smola 、科大讯飞执行总裁胡郁,华为消费者事业群总裁邵洋、腾讯优图实验室杰出科学家贾佳亚 等国内外人工智能领袖参会并演讲,一起探讨中国与世界AI的最新趋势。


点击文末阅读原文,马上参会!


抢票链接:http://www.huodongxing.com/event/2405852054900?td=4231978320026


大会官网:http://www.aiworld2017.com

  新智元报道  

来源:ArXiv

作者:闻菲

 

【新智元导读】爱丁堡大学的研究人员彻底调查了63大计算机科学领域顶会过去10年论文发表情况,发现如今有23%都在arXiv.org上有电子版本,而10年前这个数字只有1%。其中,机器学习和CS理论两个子领域的电子版增长幅度尤甚,超过60%的论文都有arXiv电子版本。不仅如此,在2017年arXiv上发布的论文中,有56%是在提交之前或在审核中的预印本。报告针对预印版对学术/会议发表的影响,以及研究者该如何传播自己的学术成果提出了意见和建议。


ArXiv在计算机科学里究竟有多受欢迎?先来看一组数字:


  • 2017年,所有计算机科学论文里,有23%在arXiv.org上有电子版本,而10年前这个数字只有1%

  • 许多研究人员都使用arXiv来发布预印版论文。在2017年arXiv上发布的论文中,有56%是在提交同行评议之前或在审核中的预印本

  • 计算机科学的各个领域中,电子文献的流行程度差异很大。理论计算机科学与机器学习领域,超过60%的发表论文有arXiv电子版本其他领域对arXiv的使用率基本为零。不过,大多数领域对arXiv的使用都处于上升趋势


上述统计来自爱丁堡大学信息学院的 Charles Sutton 和 Linan Gong 的一份报告,发表在arXiv上面,题为《ArXiv.org 在计算机科学领域的流行程度》(Popularity of arXiv.org within Computer Science,链接:https://arxiv.org/pdf/1710.05225.pdf)。


作者认为,现如今arXiv/CoRR、HAL、bioRxiv这样的集中式电子文献库(centralized e-print repository),流行程度已经达到引爆点,有必要对其进行系统性的调研,关注其对计算机科学研究人员和开发者的影响。


ArXiv 流行程度已达引爆点,研究人员和开发者都应予以关注


在计算机科学领域传播研究的一个重要方面,便是论文是否,或者在何处以及何时以电子形式被人获取。在报告中,Charles Sutton 和 Linan Gong 调查了过去十年中在计算机科学领域最顶尖的63个会议中发表的所有论文,并将这一庞大的数据与arXiv预印版服务器相匹配。


他们量化了计算机科学家在这些电子文献库中存储论文的程度,有多少论文在审查过程之前或期间以预印本的形式发表,以及有多少论文只在经过同行评议后才上传到arXiv做交流使用。


在继续之前,有一些名词要明确意义。首先,文中提到的“e-prints”,也即电子文献,指作者直接在线公开的论文,包括在arXiv的版本,也包括在作者所属研究机构及个人主页的版本。其次,“preprint”,预印本,在这项调查中,指在被同行评议接受前的电子论文,也可以在不同的地方发表。


调查所覆盖的 63 大计算机科学顶级会议:


  • 算法(Algorithms and complexity):STOC, SODA, FOCS

  • 人工智能(Artificial intelligence):AAAI, IJCAI

  • 计算机体系结构(Computer architectures):MICRO, ISCA, ASPLOS

  • 密码学(Cryptography):EUROCRYPT, CRYPTO

  • 数据挖掘(Data mining):KDD

  • 数据库(Databases):PVLDB, SIGMOD

  • 设计自动化(Design automation):DAC, ICCAD

  • 嵌入式系统(Embedding systems):RTSS, RTAS, EMSOFT

  • 计算机图形学(Graphics):SIGGRAPH (+Asia)

  • 人机交互(HCI):UbiComp, CHI, UIST

  • 高性能计算(High performance computing):SC, ICS, HPDC

  • 信息检索(Information retrieval):WWW, SIGIR

  • 逻辑和验证(Logic and verification):CAV, LICS

  • 机器学习(Machine learning):NIPS, ICML

  • 系统性能评估(Measurement):SIGMETRICS, IMC

  • 移动计算(Mobile computing):MobiSys, MobiCom, SenSys

  • 自然语言处理(NLP):ACL, HLT-NAACL, EMNLP

  • 网络(Networking):NSDI, INFOCOM, SIGCOMM

  • 操作系统(Operating systems):USENIX, SOSP/OSDI, EuroSys

  • 编程语言(Programming languages):POPL, PLDI

  • 机器人技术(Robotics):RSS, ICRA, IROS

  • 网络与信息安全(Security):CCS, IEEE S&P, USENIX Security

  • 软件工程(Software engineering):ASE, ICSE, FSE

  • 视觉(Vision):ECCV, CVPR, ICCV

  • 可视化(Visualization):IEEE VIS + VR


机器学习和人工智能领域电子文献盛行,ICML预印本数量排第一


下图展示了相关会议(至少有10篇电子文献在arXiv上),2017年接收论文中电子文献(e-prints)和预印版(preprints)的比例。



由上图可知,机器学习顶会ICML,2017年共接收论文427篇,其中有278篇(65%)有电子文献,也是所有会议中电子文献比例最高的,有204篇(48%)有预印本——单看数量是最多的,看比例也在所有会议中排第二,仅次于计算理论国际年会STOC。


人工智能顶会AAAI和IJCAI也有上榜,分别有25%和18%的论文有电子传播形式(也即拥有电子文献eprints),分别有12%和8%的论文提前发表(也即有预印本pre-prints)。


为了更加形象的展示这些趋势,作者对上述统计做了可视化。下图中,每条线段代表了会议的电子呈现情况,左边浅蓝色的点表示预印本比例,右边蓝色点表示电子文献比例。




作者还考虑了计算机科学各个子领域中拥有电子文献的差距。由下图可见,实际上差距并不太大(排除部分没有DBLP数据会议的情况)。



结论:拥抱集中式电子文库,进一步讨论如何应对预印本


根据统计数据结果,作者指出,预印版论文和电子文献库在计算机科学领域已经达到普及的程度,可以说今后也将一直存在。不过,这种趋势出现的时间相对较近,因此CS社区可能还会有变化也说不定。作者还就研究人员和从业者如何应对预印版和电子文献库给出了几点建议:


  • 作者:将电子文献库纳入研究成果传播范围。有鉴于arXiv/CoRR的流行程度,“我们认为所有的CS研究论文都应当在arXiv/CoRR有公开的电子文献,除非领域中已有受欢迎的专业库”


  • 评审、期刊编辑和会议主席:要意识到预印版的流行,并相应调整评审指导规则和规范。需要指出,虽然预印版的出现加大了让双盲评审失效的风险,但真心要让双盲评审失效,有各种各样的手段,这在预印版和电子文献库出现以前就已经存在


  • 研究社区:需要就是否鼓励预印版进行长期的讨论。作者表示,预印版确实是个很棘手的问题,尤其涉及双盲评审——就连开创了公开评议机制(open review)的ICLR,在2018年也将采用双盲评审。


  • 计算机从业者:应当意识到arXiv这样集中式的电子文献库已经成为CS领域快速传播的有效载体,应当考虑订阅自己专业领域的邮件提醒


  • 工具创建者:为CS创建评审、传播和发表/出版模型的相关人士,应当投入多一倍的努力,考虑新的发表/出版模型。现在正是重新思考arXiv提出的大好时机。



报告地址:https://arxiv.org/pdf/1710.05225.pdf



除了学术会议,将产学研聚集到一起的第三方综合会议也是深入了解AI 技术最新进展和产业情况的绝好场所! 点击“阅读原文”,参加新智元世界人工智能大会,马上抢票!

【AI WORLD 2017世界人工智能大会倒计时 17 点击图片查看嘉宾与日程。


大会门票销售火热,抢票链接:http://www.huodongxing.com/event/2405852054900?td=4231978320026


【扫一扫或点击阅读原文抢购大会门票

AI WORLD 2017 世界人工智能大会购票二维码: 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存