查看原文
其他

本周值得读的15篇AI论文,还有源码搭配服用

让你更懂AI PaperWeekly 2022-03-17



在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。


在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。


点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 131 篇文章


@jingyihiter 推荐

#Neural Sequence Generation

本文是自动化所张家俊老师发表于 TACL 2019 的工作,论文研究的问题是在序列生成任务的解码过程中如何进行双向解码。文章提出一种新的 beam search 算法用于双向解码,提出了改进 transformer 进行双向解码的 BIFT model,在机器翻译和文本摘要任务上都取得明显的提升。文中分别给出了详细的实验,并附有开源实现代码。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2867


源码链接

https://github.com/ZNLP/sb-nmt



@paperweekly 推荐

#Abstractive Summarization

本文来自 NAACL-HLT 2019,论文提出了一个名为多级存储网络(MMN)的生成式摘要模型,直接用多级卷积存储器代替基于 RNN 的编码器。该模型利用卷积来控制多级句子,段落和整个文本中的表示程度。

此外,本文还贡献了一个大型抽象摘要数据集—Reddit TIFU,包含来自 Reddit 的 120K 个帖子。基于 AMT 的定量评估和用户研究,本文模型在 Reddit TIFU 和新闻类生成式摘要数据集上均优于当前最先进的抽象概括方法。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2901


源码链接

https://github.com/ctr4si/MMN


@stevewyl 推荐

#Natural Language Understanding

本文来自微软,论文提出将多任务学习(MTL)和语言模型进行结合,提升了 NLU 领域的 GLUE 榜单 1.8%。本文是基于多任务学习框架和特征共享层硬连接的方式实现的,将原有 MT-DNN 模型中的特征表示层,替换为目前大热的 BERT。与 BERT 不同的是,微调是在多个任务上同时进行的。

本文是在 BERT 的基础上比较成功的一次探索,后续可以考虑任务之间的相关性。BERT 和 MTL 的结合可能是接下来的一个研究热点。 不足之处是没有重大创新,MTL 的使用比较简单,有提升空间。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2809


源码链接

https://github.com/namisan/mt-dnn



@Hutommy 推荐

#Dialogue Systems

本文是波恩大学和波鸿鲁尔大学发表于 CoNLL 2018 的工作,论文基本说明了对话系统的类别,而且介绍了 RNN,BiRNN 以及 GRU 的思想。此外,本文结合了外部知识增加了一种机制,提高处理较低频的字词的能力。同时结合了领域关键字描述编码,在多回合对话中有所帮助。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2838


源码链接

https://github.com/SmartDataAnalytics/AK-DE-biGRU




@chunhualiu 推荐

#Story Ending Generation

本文是清华大学黄民烈老师组发表于 AAAI 2019 的工作,论文提供了一种如何利用常识知识做故事结尾生成的新思路。作者提出利用增量编码的方式来对 RocStories 数据集中的 context 进行编码,并且将从 ConceptNet 中检索得到的知识进行编码,利用 multi-source attention 的方式融合到 context 的编码过程中。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2775


源码链接

https://github.com/JianGuanTHU/StoryEndGen





@paperweekly 推荐

#Named Entity Recognition

本文是曼彻斯特大学和丰田工业大学发表于 NAACL 2018 的工作,论文提出了一种由 flat NER layers 动态连续堆叠而成的神经网络模型,每个 flat NER layer 含有一个 BiLSTM 和 CRF 分别进行输入编码和标签预测,整体模型为 Layered-BiLSTM-CRF。

当前 flat layer 将已被识别为实体的 token 经过 LSTM 处理的新表示合并起来,传递给下一个 flat layer,从而使得模型能以从内到外的方式,充分利用内部实体编码信息识别出外部实体,直到没有更外部的实体被识别出来。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2696


源码链接

https://github.com/meizhiju/layered-bilstm-crf




@xiaolu 推荐

#Visual Question Answering

本文是一篇来自港中文、清华大学等机构的最新 VQA 论文,被 CVPR 2019 接收为口头报告。Github 上已经有人复现了该工作。

学习多模态之间的高效特征融合是视觉问答问题的核心,本文提出了一种动态融合多模态特征的新方法,通过模态内(intra-modality )和模态间(inter-modality)的信息流,交替地在视觉和语言模态之间传递动态信息。它可以稳健地捕获语言和视觉域之间的高层次语义交互,从而显著提高视觉问答的性能。 

本文还发现,基于其它模态的约束,一种模态内的注意力可以动态调节目标模态的注意力。本文模型在 VQA2.0 数据集上实现了当前最好的效果。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2859


源码链接

https://github.com/bupt-cist/DFAF-for-VQA.pytorch




@vimjian 推荐

#6D Object Pose Estimation

本文是斯坦福和上海交大发表于 CVPR 2019 的工作,论文提出了一种可单独处理两个数据源的异质架构—DenseFusion。实验表明,DenseFusion 在 YCB-Video 和 LineMOD 两个数据集上的表现都优于当前最先进的方法。此外,研究者还将该方法应用于真实的机器人上,使其可以根据估计的姿态来抓取和操纵目标。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2862


源码链接

https://github.com/j96w/DenseFusion




@Flawless1202 推荐

#Object Detection

本文是中山大学和华为诺亚方舟实验室发表于 NeurIPS 2018 的工作,论文提出了大尺度目标检测的新思路,通过显性知识和隐性知识模块,将先验信息融合到神经网络中以丰富特征,取得了 SOTA 的效果。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2820


源码链接

https://github.com/chanyn/HKRM





@paperweekly 推荐

#Pose Transfer

本文来自特伦托大学和Snap,论文研究的问题是将视频中的物体动作迁移到一张图片上,然后基于这张图片和指定动作生成一个新视频。

作者通过一个深度框架够将外形和运动信息解耦,该框架由三个模块组成:1)关键点检测器,可以无监督训练提取对象关键点;2)深度运动预测网络,可从稀疏关键点生成密集的热图(heatmaps),从而更好地编码运动信息;3)运动迁移网络,该网络基于运动热图和从输入图像提取的外形信息去合成输出帧。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2836


源码链接

https://github.com/AliaksandrSiarohin/monkey-net




@BelieveOP5 推荐

#Image Generation

本文是 Google AI 发表于 PMLR 2018 的工作,论文将图像超分辨和 Self-Attention 机制结合起来,提出了一种将 Self-Attention 机制应用在图像生成领域上的新方法,值得一看。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2842


源码链接

https://github.com/tensorflow/tensor2tensor



@alichen 推荐

#Robotics

本文是普渡大学发表于 ICRA 2019 的工作。这篇文章提出了 Flapping Wing Micro Air Vehicles (FWMAVs) 开源仿真平台,并比较了仿真和实验测得的 force map,开环控制响应及闭环控制响应,发现仿真结果和实验结果非常相近。

和其他机器人仿真相比(例如 legged robots, ground vehicles),FWMAVs 仿真需要考虑在高频的 flapping motion 下,周围空气动力学的不稳定性,对系统进行建模难度更大。这个平台可用于机器人设计、控制与优化的研究,并与和 OpenAI Gym 环境完全兼容,利于今后强化学习和飞行控制相结合的研究。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2860


源码链接

https://github.com/purdue-biorobotics/flappy



@paperweekly 推荐

#Collaborative Filtering

本文是 Netflix、MIT 和 Google AI 发表于 WWW 2018 的工作,论文将变分自编码器(VAE)扩展到协同过滤以进行隐式反馈,通过非线性概率模型克服线性因子模型的局限。其次,作者引入了具有多项式似然(multinomial likelihood)的生成模型,并使用贝叶斯推断进行参数估计。

作者基于 VAE 提出了一个生成模型 VAE_CF,并针对 VAE 的正则参数和概率模型选取做了适当调整,使其在当前推荐任务中取得最佳结果。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2606


源码链接

https://github.com/dawenl/vae_cf



@zhangjun 推荐

#Bayesian Neural Network

本文是 UCLA 和 UC Davis 发表于 ICLR 2019 的工作,论文提出了一种新的对抗防御方法,结合了贝叶斯神经网络(BNN)和对抗训练的优势,获得了不错的效果。其中,BNN 将每个权重参数视作一个随机变量,在预测时相当于一个无限个数的集成模型,实验证明只依靠 BNN 并不能做好防御,结合对抗训练才会提升模型的防御能力。

点评:本文没有提出原创的方法,而是结合两种现有的方法进行了组合测试,取得了不错的效果。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2758


源码链接

https://github.com/xuanqing94/BayesianDefense





@RememberMe 推荐

#Financial Time Series

本文提出了一种确定股票价格时间序列中最佳 buy, sell, hold 时间点的股票交易模型,作者结合了两种已有方法 GA+DMLP (Genetic Algorithm and Deep Multi Layer Perceptron)。

具体思路:已有 1)技术分析指标(technical analysis indicator)作为深度网络模型的输入特征来做时间序列预测;2)用于技术分析指标寻优的进化算法。本文结合二者,将进化算法优化后的技术分析指标作为深度网络的输入特征,从而尝试使深度网络从进化算法的优化中学习判断最佳的进出点。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2889


源码链接

https://github.com/omerbsezer/SparkDeepMlpGADow30





@chlr1995 推荐

#Network Pruning

本文是图森发表在 ECCV 2018 的工作,论文在结构稀疏化的基础上提出了一种更简洁的方式,达到粗粒度的剪枝(直接剪枝整个 residual function/aggregated residual block 中的一个 group),通过引入一个结构缩放因子 lambda,在训练过程中对 lambda 施加一个 L1 正则化,训练结束后,剪掉 lambda=0 的块或 group,达成网络剪枝的效果。

 论文模型:点击查看大图



论文链接

https://www.paperweekly.site/papers/2540


源码链接

https://github.com/huangzehao/sparse-structure-selection




#推 荐 有 礼#


本期所有入选论文的推荐人

均将获得PaperWeekly纪念周边一份




▲ 深度学习主题行李牌/卡套 + 防水贴纸


 礼物领取方式 


推荐人请根据论文详情页底部留言

添加小助手领取礼物

*每位用户仅限领取一次


想要赢取以上周边好礼?

点击阅读原文即刻推荐论文吧!



点击以下标题查看往期推荐: 




#投 稿 通 道#

 让你的论文被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢? 答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。


📝 来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向) 

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接 

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志


📬 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site 

• 所有文章配图,请单独在附件中发送 

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通




🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧



关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。


▽ 点击 | 阅读原文 | 获取更多论文推荐

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存