查看原文
其他

Reddit 网友票选 2018 最佳论文(附阅读技巧)

神经小姐姐 超神经HyperAI 2019-05-13

by 超神经


读论文这件事,对深入了解细分领域的技术和难题来说,重要性毋庸置疑。 

 

2018 年也出现了很多优质的论文,比如各大顶级学术会议上的获奖论文,我们今天盘点的是 Reddit 网友心中那些 2018 帮助过他们的论文。



Reddit 网友:这篇论文我投一票


@beezlebub33  推荐论文:

《Large-Scale Study of Curiosity-Driven Learning》

大规模的好奇驱动学习研究

https://pathak22.github.io/large-scale-curiosity/


推荐理由:

这篇文章的重要性体现在,它无需好的奖励机制,就在很多游戏中实现了优异的性能。重要的是它学会了通过预测去玩游戏,能辨别违反期望的行为,能够去探索未知的领域。这可能是 AI 以后发展的方向:自我监督、无标签数据、会预测、好奇心、具有内动力等等。 

 

人们还没有足够的时间去创造出有监督训练集,并且给这些数据集定义矩阵。但如果,给 AI 提供原始数据,并且它可以学习该系统的时空演变的内部表示,那么您可以通过定义目标,最终用 AI 将它实现。 



@YBuzzinGA  推荐论文:

《Learning Unsupervised Learning Rules》

学习无监督学习法则

https://arxiv.org/abs/1804.00222.


推荐理由:

 这篇文章是关于使用无监督学习来完成一些任务,它的特点在于,模型正在学习如何自己学习。


元学习是一个关键领域,学习那些学习规则会让 AI 去理解自己,并且去改善自己。如果你可以教一台计算机如何学习了解自己,那么我们就有可能实现飞跃。 



@breadwithlice  推荐论文:

《Phrase-Based & Neural Unsupervised 

Machine Translation》

基于短语和无监督神经机器翻译

https://arxiv.org/abs/1810.04805v1


推荐理由:

这篇文章里,仅使用单语料库,就能将完成翻译,而且不需要任何映射,字典或并行数据。 

论文里使用了一种反向翻译技术,从A转换为B时,然后将B转换为A,这么做大大改善翻译器,然后切换A和B,这个结果令人惊喜! 




@kartayyar 推荐论文:

《Pre-training of Deep Bidirectional Transformers

 for Language Understanding 》

语言理解中深层双向法的预训练

https://arxiv.org/abs/1809.10756


推荐理由:

我喜欢它的地方: 

很棒的创新理念,他们使用的遮蔽方法是非常有创意的。 


他们用很简单的语句就说清楚了他们的核心理念。 

在Github上有代码可重现的结果。 

能够处理了多项不同的任务。 

 



@ndha1995  推荐论文:

《An Introduction to Probabilistic Programming》

概率规划导论

https://arxiv.org/abs/1809.10756

推荐理由:

这是我在2018年最喜欢的论文。


作者对概率规划进行了全面而严谨的介绍,并在最后一章中,介绍了最近关于深度神经网络,和概率规划相结合的研究 。



读论文的硬核建议


就算知道了厉害的论文,除了喊着哇,真厉害,那怎么样才能看懂它们呢?  

 

首先还是想清楚你的动机,主动地想要探索和被动的完成任务,效果和体验就会完全不同了。我们找到了一些硬核建议,嗯,就帮你们到这了。 

 

批判性地阅读


这是一个很重要的态度。不要盲从作者的观点。相反,要去怀疑和求证。  

 

什么是批判性阅读?尝试着去提出问题。如果作者试图解决某个问题,他们是否正确的解决了?有没有作者没有考虑到简单方案?解决方案有哪些局限性(包括作者没注意到或明确承认的)?  

 


作者的假设是否合理?鉴于假设,论文的逻辑是否明确合理,或者推理中是否存在缺陷?  


如果作者提供数据,他们的数据能不能来证实他们的论点,他们是收集数据的路径是否合理?那他们解释数据的方式呢?换用其他数据会更好吗?  

 

创造性地阅读


批判性地阅读一篇论文难度系数不是最高,因为毁坏比构建更容易。而创造性的阅读就涉及更难,更积极的思考。  

 

比如:本文有哪些很好的想法?这些想法是否有其他应用程序或扩展?它们能被进一步推广吗?是否存在会带来重大差异的改进?如果自己进行相关的探究,接下来会做些什么呢?  

 

在阅读论文时做笔记

 

许多人都在读论文时记录笔记。这个方法是很不错的,用你喜欢的方式,把想到的任何问题或批注,统统记录下来。试着去找到作者的关键点。


大受好评的康奈尔笔记法


标记那些最重要或看似有问题的数据。这样的标记有助于理解论文,同时还也有助于之后的回顾。 

 

在第一次阅读之后,

尝试用一两句话来总结论文

 

几乎所有优秀的论文都在提出一个具体问题的答案。如果你能简洁地描述一篇论文,你可能已经弄懂了到了作者的工作,包括他们想要解决的问题和最终的答案。一旦您专注于主要想法,再回过头去概述论文,就能更深入的了解具体细节。


实际上,如果用一两句话总结论文很容易,那么可以来尝试另一种方法,列出三个或四个要点大纲来总结主要思想。  

 

如果可能,

将论文与其他作品进行比较

 

总结论文是尝试确定论文科学贡献的一种方法。但要真正掌握科学价值,你必须将论文与该领域的其他作品进行比较。去弄清楚这些想法是新颖的,还是以前出现过? 

  

值得一提的是,科学研究呈现的方式有多种。比如一些论文只提出新的想法,而其他人去实施验证,并展示其工作方式;还有一些人将之前想法结合在一起,并在一个新颖的框架下整合起来。了解该领域的其他工作可以帮助你更好的了解论文的价值。  

 



超神经小百科


无监督学习  Unsupervised learning


机器学习可以分为监督式学习、无监督式学习和半监督式学习。


无监督学习是不为训练集提供对应类别标识的学习方法。适用于有数据集但无标签的情况。


无监督学习中使用的数据是没有标记过的,而训练中也不知道输入数据对应的输出结果是什么。没有受到监督式增强 (告诉它何种学习是正确的)。


无监督学习只能默默的读取数据,自己寻找数据的模型和规律,比如聚类(把相似数据归为一组)和异常检测(寻找异常)。


无监督式学习的目的是去对原始资料进行分类,以便了解资料内部结构。其特点是仅对此种网络提供输入范例,而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后,也可以将之应用到新的案例上。



历史文章(点击图片阅读)

协助你写 Python,只是 AI 取代程序员的第一步

回顾 2018 :最 6 的 6 个机器学习开源项目

今年两百多场计算机学术会议,你 Pick 谁?

AI 百科

教程

数据集

商店

更多

http://hyper.ai

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存