ACL 五篇最佳论文出炉，Barbara Grosz获终身成就奖（附最佳论文打包下载）

原创 2017-08-03 AI科技大本营 AI科技大本营

翻译 | AI科技大本营（rgznai100）

ACL 大会是自然语言处理与计算语言学领域最具影响力的学术会议之一，由计算机语言协会主办。

今年 6 月，ACL 公布了 22 篇杰出论文，国内有 5 篇论文入选，其中复旦大学黄萱菁团队、清华大学孙茂松团队、北京大学万小军团队、北京大学王厚峰团队，以及中科院自动化研究所包红云团队各有一篇论文入选。

今天（8 月 3 日），ACL 委员会公布了 5 篇获奖论文，分别是最佳长论文、最佳短论文、最佳资源论文、以及两篇最佳展示论文。此外，哈佛大学教授 Barbara Grosz 获得了终身成就奖。可惜的是，国内的 5 篇杰出论文最终无缘任何奖项。

以下是 5 篇获奖论文和 Barbara Grosz 教授的简介：

最佳短论文

论文作者：Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia and Emmanuel Dupoux

论文标题：分词任务中语域和韵律学的作用

论文摘要：本文研究了分词任务中语域(speech register)和韵律的作用。由于这两个因素被认为在早期语言习得过程中发挥了重要作用，我们的目标是量化这两个因素对分词任务的贡献。我们通过应用四种不同的分词模型，它们分别带有或不带有韵律学边界的知识，对一个包含婴儿导向和成人导向语音的日语语料库进行了研究。实验表明，语域间的差异小于之前的报告，韵律学边界信息对成人导向的语音作用比其对婴儿导向的语音作用更大。

评奖词：众所周知，把研究报告按照一个简短论文的格式写出来很难，但 Ludusan 他们在这个格式下却非常合乎标准。评委会成员的意见如下：

在评委会委员，包括我自己，推荐的短论文中，只有这一篇符合我心目中“最佳短论文”的标准。这代表它
(a) 以短论文写成（省略了细节，没有成为长论文）
(b) 包含了研究论文中的所有必要内容
(c)在“短论文”的层面上表现最好
它完美的符合了短论文的格式，是一篇优雅的论文。它提出的实验设计方法合理，拥有一套完整的结果，并对实验进行了深入的讨论，堪称短论文的样板。

论文地址：http://aclweb.org/anthology/P17-2028

最佳长论文

论文作者：Ryan Cotterell, Jason Eisner

论文标题：概率类型学：元音库存的深度生成式模型

论文摘要：语言类型学研究的是人类语言中存在的结构的范围。该领域的主要目的是发现哪一组的可能现象是普遍存在的，而哪些现象仅仅是频繁发生的。例如，所有的语言都包含元音，而大多数的-并不是所有的语言都包含/u/音，本文针对语音类型学中的一个基本问题提出了第一个概率处理方法：是什么构成了一个自然元音的库存？我们引入了一系列的深度随机过程，并将它们与之前的计算、建立在模拟基础上的方法进行了对比。我们提供了超过200种不同语言的综合实验。

评奖词：

在选择Cotterell 和 Eisner 的论文为最佳论文的时候，我们注意到，他们的工作风格是原创性的，并且是恰当的。他们把成熟的“经典的”生成模型与神经网络相结合，以一种周详的方式来回答语言学的问题。第一位审稿人的这两段，对我的观点做出了一个非常仔细的总结。

这篇论文给我留下了很深的印象，它运用了现代深度学习的工具，但是以一种微妙而适当的方式。这个计算旨在建立一个清晰而有意义的目标，据我所知，这在以前的方法中是不曾实现的。我们现在可以评估一个合并起来的、完整的库存的可能性，而不是一个一个元音的有条件的可能性。我们也是通过把正的和负的结果合并起来，来确定什么是可行的，什么是不可行的。

论文地址：https://arxiv.org/abs/1705.0168

最佳展示论文

论文作者：Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight

论文标题：Hafez：自动诗歌生成系统

论文摘要：Hafez 是一个自动生成诗歌的系统，它将递归神经网络（RNN）和有限状态接收器（FSA）整合在一起。给定任意主题，该系统可以生成十四行诗。而且，Hafez 还允许用户调整各种不同风格的配置，对生成的诗歌进行修改和润色。试验证明，这种“润色”机制可以考虑用户的意向，从而创作出更好的诗歌。为了对诗歌进行评估，我们创建了一个网页界面，用户可以通过这个界面对诗歌进行一星至五星的评分。另外，我们对整个系统进行了 10 倍加速，并进行了词汇精简和 GPU 计算，以确保能够快速地收集足够多的反馈。根据这些反馈，系统可以学习如何调整其参数，以改进诗歌质量。

论文地址：http://xingshi.me/data/pdf/ACL2017demo.pdf

最佳展示论文（第二名）

论文作者: Guillaume Klein, Yoon Kim, Yuntian Deng, Jean Senellart, Alexander Rush

论文标题：OpenNMT: 神经机器翻译的开源工具包

论文摘要：我们提出了一种用于神经机器翻译的开源工具包（NMT）。该工具包优先侧重效率、模块化和延展性，以在模型架构、特征表征和开源形态上推动 NMT 研究，同时保证了足够有竞争力的性能和合理的训练要求。此工具包包含建模和翻译功能，以及关于基础技术的教学文档。

论文地址：https://arxiv.org/abs/1701.02810

最佳资源论文

论文作者：Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi

论文标题：基于视觉推理的自然语言语料库

论文摘要：我们提出了一种新的视觉推理语言数据集，包含对合成图像进行自然描述（3962 条语句）的 92244 对样本。我们还介绍了一种众包（crowdsourcing）语言学多样性数据的方法，并演示了对我们数据的分析。我们的数据证明，大多语言学现象都需要视觉和集合论(set-theoretic)推理。我们对多种模型进行了试验，表明该数据集在未来的研究当中将是极具竞争力的。

评奖词：

我非常赞赏的一件事是他们进行的完整性检查，以确保不会创建可以在不需要任何理解的情况下解决的数据集。令人欣慰的是，“纯文本”和“纯图像”基线几乎完全符合多数类基线，而且像以前的神经模块网络方法那样基线越多越好，但仍有很大的改进空间。而且和视觉QA数据集相比，我也欣赏（他们提出的）该数据集中的各种语言问题。

论文地址：http://yoavartzi.com/pub/slya-acl.2017.pdf

终身成就奖：Barbara Grosz

Barbara J. Grosz 是哈佛大学的 Higgins 自然科学教授。她在自然科学处理、多智能体系统领域做出了开创性的贡献。

Grosz 教授专门从事自然语言处理与多智能体领域的研究。她开发过最早的电脑对话系统，并确立了计算机模型的语篇研究这一领域。

她在模型协作方面的成果帮助确立了该研究领域，并为协作式多智能体和人机交互系统研究提供了基本框架。Grosz 教授所发明的语篇结构理论，详细阐明了语篇理解是如何取决于说话者的意图、注意状态及语言形式的。

她当前的研究工作，是专注于探索协作式智能体系统与协作式交互在医疗规划与沟通方面的应用，特别是用于提升医患之间的沟通效果。

华人论文无一获奖

据报道，此次 ACL 大会共收到 1419 篇论文，其中长文 829 篇、短文 590 篇，最终录用长文 195 篇（录用率 23.5%）、短文 149 篇。

据悉，今年 ACL 收录的长文论文中，有 79 篇论文的第一作者为华人，占被录用长文总数的 40%。遗憾的是，此次并没有第一作者为华人的论文获奖。

上图是 jeffhuang 统计的历届 ACL 最佳论文清单，可以看到，华人第一次获奖要追溯到 2008 年，而国内的论文获奖则是在 2012 年。

虽然华人在 ACL 领域的存在感越来越强，但是数量并不能反映质量，希望未来能够看到更多的华人获奖。

附完整杰出论文名单：

长论文（15 篇）:

1.Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier, Yoshua Bengio and Joelle PineauRyan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier, Yoshua Bengio and Joelle Pineau

Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses

2.Daniel Hershcovich, Omri Abend and Ari Rappoport

A Transition-Based Directed Acyclic Graph Parser for UCCA

3.Maxim Rabinovich, Mitchell Stern and Dan Klein

Abstract Syntax Networks for Code Generation and Semantic Parsing

4.Yanzhuo Ding, Yang Liu, Huanbo Luan and Maosong Sun

Visualizing and Understanding Neural Machine Translation

5.Ines Rehbein and Josef Ruppenhofer

Detecting annotation noise in automatically labelled data

6.Suncong Zheng, Feng Wang and Hongyun Bao

Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme

7.Mingbin Xu, Hui Jiang and Sedtawut Watcharawittayakul

A Local Detection Approach for Named Entity Recognition and Mention Detection

8.Milan Gritta, Mohammad Taher Pilehvar, Nut Limsopatham and Nigel Collier

Vancouver Welcomes You! Minimalist Location Metonymy Resolution

9.Yasuhide Miura, Motoki Taniguchi, Tomoki Taniguchi and Tomoko Ohkuma

Unifying Text, Metadata, and User Network Representations with a Neural Network for Geolocation Prediction

10.Ramakanth Pasunuru and Mohit Bansal

Multi-Task Video Captioning with Visual and Textual Entailment

11.Jiwei Tan and Xiaojun Wan

Abstractive Document Summarization with a Graph-Based Attentional Neural Model

12.Ryan Cotterell and Jason Eisner

Probabilistic Typology: Deep Generative Models of Vowel Inventories

13.Xinchi Chen, Zhan Shi, Xipeng Qiu and Xuanjing Huang

Adversarial Multi-Criteria Learning for Chinese Word Segmentation

14.Shuhei Kurita, Daisuke Kawahara and Sadao Kurohashi

Neural Joint Model for Transition-based Chinese Syntactic Analysis

15.Jan Buys and Phil Blunsom

Robust Incremental Neural Semantic Graph Parsing

短论文（7 篇）：

1.Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia and Emmanuel Dupoux

The Role of Prosody and Speech Register in Word Segmentation: A Computational Modelling Perspective

2.Yizhong Wang and Sujian Li

A Two-stage Parsing Method for Text-level Discourse Analysis

3.Keisuke Sakaguchi, Matt Post and Benjamin Van Durme

Error-repair Dependency Parsing for Ungrammatical Texts

4.Jindřich Libovický and Jindřich Helcl

Attention Strategies for Multi-Source Sequence-to-Sequence Learning

5.Xinyu Hua and Lu Wang

Understanding and Detecting Diverse Supporting Arguments on Controversial Issues

6.Afshin Rahimi, Trevor Cohn and Timothy Baldwin

A Neural Model for User Geolocation and Lexical Dialectology

7.Alane Suhr, Mike Lewis, James Yeh and Yoav Artzi

A Corpus of Compositional Language for Visual Reasoning

在AI科技大本营微信公众号（rgznai100）会话回复“ACL”，下载本届ACL 五篇最佳论文论文。

关注福利

关注AI科技大本营，进入公众号，回复对应关键词打包下载学习资料

回复：CCAI，下载《CCAI 2017嘉宾演讲PPT 》

回复：路径，下载深度学习Paper阅读路径（128篇论文，21大领域）

回复：法则，下载《机器学习的四十三条经验法则》

回复：美团，下载《深度学习在美团外卖的应用，NLP在美团点评的应用》，《NLP在美团点评的应用》pdf

回复：沙龙，下载CSDN学院7月15日线下沙龙PPT（蒋涛、孟岩、智亮）

回复：对抗，下载台大李宏毅老师关于生成对抗学习视频教程(附PPT)

回复：AI报告，下载麦肯锡、波士顿、埃森哲咨询公司AI报告

回复：银行，下载银行和证券公司的AI报告

回复：人才，下载 2017 领英《全球AI领域人才报告》

回复：发展，下载2017 全球人工智能发展报告_框架篇

回复：设计，下载人工智能与设计的未来

回复：1986，下载李开复1986年论文《评价函数学习的一种模式分类方法》和1990年论文《The Development of a World Class Othello Program》

人类感知外界信息，80%以上通过视觉得到。2015年，微软在ImageNet大赛中，算法识别率首次超越人类，视觉由此成为人工智能最为活跃的领域。为此，AI100特邀哈尔滨工业大学副教授、视觉技术研究室负责人屈老师，为大家介绍计算机视觉原理及实战。扫描上图二维码或加微信csdn02，了解更多课程信息。

反向激励，在加速这个社会的黑化

🪁来汕头，实现“露营自由”

微信潜规则：你发的朋友圈，其实别人看不见。

方志远：不能指望借助古人的智慧、指望倡导古人的精神来解决现实的问题

阿哲发圈点赞大太子！杰哥爆电母X视频，曝瓜三平台年度电母！