其他

关于RNN的几篇高质量Blog

2017-09-11 Unideep UniDeep数据科学家


RNN 是针对序列数据非常有用的模型,其可以完成翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等任务。在2015年,谷歌通过基于CTC训练的LSTM程序大幅提升了安卓手机和其他设备中语音识别的能力。苹果的iPhone在QucikType和Siri中使用了LSTM;微软不仅将LSTM用于语音识别,还将这一技术用于虚拟对话形象生成和编写程序代码。亚马逊Alexa通过双向LSTM在家中与你交流,而谷歌使用LSTM的范围更加广泛,它可以生成图像字幕,自动回复电子邮件,它包含在新的智能助手Allo中,也显著地提高了谷歌翻译的质量。事实上,谷歌数据中心的很大一部分计算资源现在都在执行LSTM任务。

 

这里我们为大家整理了有关RNN入门,理解,以及实现的各类文章。这些文章并没有学术论文那么枯燥,而是深入浅出地描述什么是RNN,以及RNN能干什么。是RNN入门的非常好的学习材料。

 

http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/

 

WILDML的这四篇blog非常适合RNN的入门。这一系列文章分别介绍了什么是RNN,RNN能做什么,RNN的一些拓展,RNN on Python, BackpropagationThrough Time,以及什么是GRU和LSTM。是了解RNN的第一步。

 

http://blog.echen.me/2017/05/30/exploring-lstms/

 

Edwin Chen 的这篇blog 很好地可视化了RNN是如何拥有记忆能力的。对深入了解RNN,以及其每个Neuron的作用非常有帮助。

 

http://colah.github.io/posts/2015-08-Understanding-LSTMs/

 

在了解什么是RNN之后,我们来看看RNN的最经典结构LSTM。 Colah 的这篇blog非常经典,深入浅出地解释了LSTM的原理,以及每一个gate所代表的意义。强烈推荐!

 

在了解了理论之后,让我们来看看RNN在Tensorflow上的实现。

 

http://www.wildml.com/2016/08/rnns-in-tensorflow-a-practical-guide-and-undocumented-features/

WILDML的另一篇blog,非常详细的展现了如何用Tensorflow实现RNN。

 

https://zhuanlan.zhihu.com/p/28196873

同样,知乎上何之源的一篇文章,也阐述了如何在Tensorflow中实现RNN。这两篇文章可以结合着看。

 

http://karpathy.github.io/2015/05/21/rnn-effectiveness/

李飞飞高徒,Andrej Karpathy的这篇blog实现了character-based RNN 模型的效果,非常有趣。虽然code并不是用Tensorflow写的,但是,机器不学习博客的一篇blog手把手展示了如何用Char-RNN in Tensorflow。

 

https://zhuanlan.zhihu.com/p/27087310

 

现在相信我们已经掌握了RNN的理论知识和Tensorflow代码,接下来让我们看看RNN相关的知识及应用。

 

https://zhuanlan.zhihu.com/p/28054589

 

在了解了什么是RNN和LSTM之后,我们有必要了解各种基于RNN的变体,这篇文章很好地总结了几种典型的RNN。

 

https://zhuanlan.zhihu.com/p/27608348

 

这篇文章详细解释了用于语言翻译领域中的Encoder-Decoder机制。

 

https://zhuanlan.zhihu.com/p/27771046

 

Image Caption 是 RNN 和CNN 结合的重要应用之一。这篇文章综述了Image Caption领域中比较重要的五篇文章。

 

 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存