个主要的会议/期刊进行数据统计,从会议、作者、第一作者以及组织机构四个维度进行了论文发表数量的排名。这种选择是为了覆盖机器学习和语言技术领域论文发表的最知名和高排名的会议。会议论文发表数量排名(注:图中论文发表数量为零的点,都表示会议在该年份没有举行。作者论文发表数量排名年在这些会议上发表论文数量最多的个人作者。第一作者论文发表数量排名
雷锋网 AI 科技评论按:随着 2018 年的结束,剑桥大学高级研究员 Marek Rei 再度更新了过去一年机器学习和自然语言处理领域的论文发表统计数据,本次,他选择了ACL、EMNLP、NAACL、EACL、COLING、TACL、CL、CoNLL、NeurIPS、ICML、ICLR 以及 AAAI 12 个主要的会议/期刊进行数据统计,从会议、作者、第一作者以及组织机构四个维度进行了论文发表数量的排名。雷锋网 AI 科技评论编译如下。
今年,又到了更新过去一年机器学习和自然语言处理领域的论文发表统计数据的时候了。这两个领域依旧在快速发展,无论是发表论文数量还是参会人员数量都打破了往年的记录。今年学术会议界最轰动的事件莫过于「NeurIPS 大会正会门票 11 分钟售罄」了。在本文中,我将针对这些数据提供详细的统计,显示在特定会议上作者或者组织机构所发表论文的数量。
2018 年,我统计了以下会议/期刊的数据:ACL、EMNLP、NAACL、EACL、COLING、TACL、CL、CoNLL、NeurIPS、ICML、ICLR 以及 AAAI。这种选择是为了覆盖机器学习和语言技术领域论文发表的最知名和高排名的会议。与去年相比,我去掉了 SemEval,因为它主要关注共享任务相关的论文,而我在其它会议中也没有统计该领域的论文发表数据。同时,我添加上了 作为顶级会议之一但在过去的排名中被遗漏的 AAAI。NeurIPS(原名为 NIPS)在 2018 年改名了,为了保持名称的一致性,我在这里将使用最新的名称。
这个分析是通过我多年来一直在不断改进的一系列脚本自动完成的。该论文列表抓取自在线会议录,在那里通常也可以找到作者的姓名。组织机构的名称则需要直接从 PDF 中提取,这就可能会带来相当多的噪声。我开发了各种方法来检查各类不同的名称并对其进行分组,但是如果你在文中发现了任何剩下的错误,请告知我。
虽然这篇文章重点介绍了近年来发表论文数最多的研究者和组织机构,但我想指出的是,我不认为论文发表数量是一个领域应该追逐或赞扬的东西。如下图所示,该领域正变得越来越热门,并且论文数量的快速增长也伴随着论文质量的参差不齐。写 1 篇独具开创性的论文总比发布 10 篇通通都容易被遗忘的充量性的论文要好。这篇文章旨在从更清晰、更高的视角来看待发表论文的研究者、组织机构以及他们在各会议上发表论文的现状,或许能为有好想法的新的研究者带来一些灵感。
会议论文发表数量排名
首先,我们来看一下所有会议在 2012-2018 年间的论文发表数量。大多数机器学习会议的论文发表数量保持继续增长,其中 AAAI 和 NeurIPS 超过了 1000 篇论文;EMNLP 和 NAACL 的论文发表数量与往年相比也有大幅增长; ACL 和 COLING 的论文发表数量则与往年差不多;EACL 在今年没有举行;而 TACL 和 CL 的论文发表数量多年来一直保持相对平稳的状态。
(注:图中论文发表数量为零的点,都表示会议在该年份没有举行。)
作者论文发表数量排名
接下来,我们来看看 2018 年在这些会议上发表论文数量最多的个人作者。其中,有三位作者的论文发表数量惊人,为 22 篇,他们分别是周明(微软)、Graham Neubig(卡耐基梅隆大学)和 Sergey Levine(UC 伯克利)。紧随其后的是张潼(腾讯 AI,近期离职)、孙茂松(清华大学)和 Iryna Gurevych(达姆施塔特工业大学)发表论文作者排名,其中,张潼的论文发表数为为 21 篇,孙茂松和 Iryna Gurevych 则各自发表了 20 篇论文。
从 2012-2018 年的论文发表总数来看,Chris Dyer(DeepMind)仍以 97 篇论文位居榜首。紧随其后的是周明(微软)、Yoshua Bengio(蒙特利尔大学)、张岳(西湖大学)和 Noah A. Smith(华盛顿大学),发表的论文总数分别为 90 篇、84 篇、80 篇、79 篇。大部分作者都明确地偏爱某个领域的会议——要么偏爱 NLP 领域的会议,要么偏爱核心 ML 领域,大概只有 Percy Liang 算是个例外,他对这两个领域都不偏不倚。
我们还可以查看每位作者在不同年份发表的论文数量。与其他作者相比,Chris Dyer 在 2015、2016 这两年发表的论文数量引人注目,虽然张岳(西湖大学)和周明(微软)之后也迎头赶上了。
第一作者论文发表数量排名
然后,来看一下关于第一作者的统计数据。前面所提到的作者大部分都是团队领导者,而通常第一作者才是那个实际执行、进行实验和撰写论文大部分内容的人。这类作者当中的佼佼者当属 Yi Tay(南洋理工大学),他就读博士三年级,2018 年以第一作者在几个重要大会上共发表 10 篇优秀的论文。之后是微软研究院的朱泽园,以第一作者共发表 6 篇论文。紧随其后的是 Mikel Artetxe、Jiatao Gu(香港大学),Dinghan Shen(杜克大学)和 Nathan Kallus(康奈尔大学),他们以第一作者各发表 5 篇论文。
再看看 2012-2018 年的论文发表总量,李纪为(香侬科技)发表了 22 篇一作论文。其后是朱泽园(微软)、Young-Bum Kim(亚马逊)、Ryan Cotterell(剑桥大学)和 Ivan Vuli(剑桥大学),其中朱泽园以第一作者发表的论文数量为 18 篇,Young-Bum Kim、Ryan Cotterell 、Ivan Vuli 均为 17 篇。
组织机构论文发表数量排名
接着,看一下关于组织机构的统计数据。和前两年一样,2018 年 CMU 再度位居榜首,其在 NLP 和核心 ML 两个领域发表的论文数量旗鼓相当。谷歌和微软依旧是业界领导企业,紧随其后的是清华大学、斯坦福大学、北京大学、MIT 和伯克利大学。
此排名中,中国上榜的组织机构有清华大学、北京大学、中国科学院大学、中国科学院、上海交通大学以及香港中文大学,其中清华大学位列第四,北京大学位列第六,中国科学院大学位列第九,中国科学院位列第十一,上海交通大学以及香港中文大学则分别排在第十六、第二十四。
我们再来看一下 2012-2018 年的组织机构排名,情况类似。CMU 仍然占据榜首,微软和谷歌分列占据第二、第三的宝座。普林斯顿大学、法国国家信息与自动化研究所(INRIA)、杜克大学的关注度似乎主要聚焦在核心 ML 领域,它们在 NLP 领域发表的论文几乎没有。与他们相反,清华、中科院和爱丁堡大学则主要聚焦于语言应用领域,在 NeurIPS/ICML 会议上发表了大量论文。
从下图的时间线来看,我们可以看到 CMU 多年来都保持了大量的论文输出,且论文输出数量仍在继续增长。谷歌和微软竞争激烈,不过目前看来谷歌似乎稍占上风。清华、北大等中国的大学目前的论文输出数量也正在剧烈增长。
主题分类
最后发表论文作者排名,我对作者和组织机构进行了主题分类。我收集了与特定作者/组织机构相关的所有论文,将它们转换为小写并进行令牌化(tokenized),然后用 LDA 处理,并用 t-SNE 对这些论文进行可视化。排名靠前的论文字符实体可视化效果非常好,显示了他们的论文内容与图中其他论文内容的相似度。
以上就是今年机器学习和自然语言处理领域的论文发表统计数据及排名。如果你在文中发现了任何错误,或者你对明年的文章有什么建议,通过留言或者发送邮件让我知道。
via: 雷锋网AI 科技评论编译 雷锋网
原创文章,作者:admin,如若转载,请注明出处:https://1.d1.net.cn/704261.html
相关推荐
-
2020年9月手机CPU天梯图是怎么样的?2020手机处理器最新排行榜
手机cpu可以说是手机中的焦点硬件之一,手机的许多性能操作都需要靠手机处理器来运作,看一款手机的性能好不好主要就是看cpu,9月份的手机处理器天梯图已经有了,今天我们就来领会一下手…
-
有哪些高颜值苹果手机?2020苹果手机颜值排行榜
今年又出了几款苹果手机,无论是外观照样性能上看都异常受欢迎,尤其是绿色的那款,许多专卖店的试用机都被人人玩坏了,实在之前苹果出的手机颜值也异常高,今天我们就来清点一下有哪些悦目的苹…
-
儿童拖鞋十大名牌 儿童拖鞋哪个牌子好
我已经列了十个著名品牌的儿童拖鞋供你参考。 1、米菲 详情:米菲属于伊利来团体。自1986年建立以来,米菲一直专注于鞋业的生长,集开发、设计、生产和销售于一体,致力于为客户提供最优…
-
香港验血鉴定男女骗局,无创dna哪家最权威
估计对于那些怀上宝宝的准爸爸和准妈妈们来说,很多都有听说过香港的验血检测宝宝的性别,因为这项检测技术如今在大陆内地以及很多地方都受到了许多人的选择,所以逐渐的在孕妈妈们这个圈子里面…
07/16/2022 -
香港邮寄验血3600元(香港验血验出多少个y是男孩)
我是一个85后的妈妈,家庭条件还不错,现在想生二胎,大宝是个男孩,所以二胎自然想要个闺女,宝爸都特别想要个女儿,贴心小棉袄,在刚怀孕的时候就听一个同学说香港七周可以查,于是在网上各…
-
现在香港验血多少钱,最详细的流程都在这了
可能大家也都经历过这些的一个年代,那就是家里的长辈都是比较看重男孩而轻视女孩子的,这是一种封建性的传统思想,这种思想必然不是好的,但是现在随着改革开放以来,人们的思想、思维方式也是…
07/27/2022 -
去香港验血男女几周可以验(间隔时间太短香港验血)
到香港做性别鉴定,性别鉴定真会翻盘吗?怀孕妈妈在一起的时候最主要讨论的就是肚子胎儿的性别。这应该是每个怀孕妈妈都会好奇和思考的。大家也会讨论一些关于性别检测的技术。我相信现在大家讨…
-
香港验血会不会有翻盘的可能性(验血验染色体可以知道男女吗)
每一个准妈妈怀孕之后就越来越关心自己肚子里宝宝的性别,关心宝宝吸收的营养够不够,出生以后给他们准备什么花衣服之类的,但是随着时间的推移,准妈妈容易患上抑郁症,这是为什么呢?因为准妈…
-
双十一好用的家用护理产品榜单-性价比生涯护理产品榜单
对于许多在外的小伙伴来说,好用的生涯家居照顾护士剂,可以说是异常的需要了,能够很好的提升自己的生涯质感,为自己提供恬静的生涯环境,珍爱自己的生涯环境,小编为人人推荐几款好用的生涯家…
-
孕兩個月能知道男女嗎(微信香港驗血騙局)
香港驗血10mm,哪個驗血機構最好?香港驗血查男女在如今做為一個全新的檢驗胎兒性別的技術,其實對於寶寶的預測,從古至今都未曾停歇,“江湖”上也是流傳有很多所謂的準確判斷腹中寶寶的是…