深度学习：巨头竞相追逐的未来

此帐号已被封,内容无法查看此帐号的内容被自由微信解封。

文章于 2016年12月25日被检测为删除。

被微信屏蔽

深度学习：巨头竞相追逐的未来

2014-09-22 张潼新媒体前沿

按语：虎嗅FM节上，百度研究院副院长张潼发表了有关于深度学习的主题演讲。现在为什么大家都很重视深度学习？最主要的原因是数据量比较大，计算规模变大了；此外，复杂模型有其独特的优势。在张潼及百度的愿景里，深度学习的意义是研发出最接近人脑复杂程度的模型，而这也是Google正在追逐的未来，这可能是互联网公司目前正在进行的最前沿研究。

很多人对深度学习感兴趣，包括VC等等，他们看到的是什么呢？很多互联网公司会对技术非常感兴趣。像谷歌做了很多事，2011年成立了谷歌大脑的计划，这个比较著名的人是Andrew Ng，另外一个是Jeff Dean，他们当时的目的是想建一个世界最大的深度学习网络。

我跟大家分享一下这个技术能做什么，为什么大家的兴趣那么大？互联网，大家说大数据，为什么我们这么重视数据，百度要用数据来做智能化，特别是人工智能实验室，一个是数据，一个是智能，这两个是关键词。互联网目前是几种模式，如果看BAT的话，一个是联接人和信息，像百度，阿里是联接人和商品，还有腾讯和facebook都是联接人和人。主要是这三个模式，另外还有线上线下。

这些实际上都是数据驱动，跟传统的不太一样，互联网企业讲快速迭代，一个是数据驱动，这样要进行很多分析。特别是进行到一定的程度，比较高度的时候，你需要提取数据，其中一个是数据制导，比如百度的搜索技术、语音技术等等。深度学习更大的概念是机器学习，如果我们看一个图的话首先是有大数据，然后是分析，包括建模，用高效的算法解决这些模型，然后集合到你的系统里面，最后就成为一个智能化的系统。深度学习在整个流程里面最主要的是复杂模型，像人脑的模型，这个模型的效果非常好。深度学习是互联网数据分析必不可少的。

我们说一下语音，这是深度学习用得比较广的领域，你说一句话，通过计算机给你翻译出来。机器学习有输入输出，输入是声学信号，输出就是变成文字，比如说你好或者其他的。问题规模是非常大，基于大数据，百度或者类似大的互联网企业都是上万小时的语料，数据规模是百亿级，类别上万类。你进来的是一些文字，最后你希望用它训练出来一个模型，而这些模型最后可以在线上用。模型在这里是深度学习的模型，这是目前效果最好的一个方式。计算技术上需要大规模的计算技术，有一些技术的瓶颈需要处理。

从模型上来讲有两种，深度学习相对应的概念是浅度学习，浅度也是一个机器学习模型，它的意思就是人工要抽取特征，通过人工的方式变成计算机可以识别的，然后学习跟学习线性组合。后来发现数据量变得更大的时候，你可以用更复杂的模型，这些模型包括深度的模型，它的好处就是可以从原始出发自动学习组合，这样的能力是人工不足的地方就用机器代替，然后要并行大数据，另外要很大的计算能力，这样就能得到更好的效果，就能实现类似智能化。

智能化是今后十年大家最关注的技术前沿，这从技术瓶颈上也是非常高的。举一个图像识别的例子，它怎么从产生到生成，然后学习一些比较高级的。比如开始进来的都是一些图像的像素，后面一层就会有一些边出来，再下一层就是学习特征，再上面就组建成人脸。这种信息是自动学出来的，不是人制造的。传统的学习方法是人来做的。语音也类似，也是从低到高慢慢建立起来的。另外它非常像人大脑的结构，深度学习本身是模拟大脑的，它的结构跟大脑走得非常近。从某种意义上来讲深度学习跟人脑是非常近的。图像识别传统的方法是在2010年用浅层模型，达到了74%，到2012年有了非常大的提升，达到了85%。

现在为什么大家都很重视深度学习呢？最主要的原因是数据量比较大，计算规模变大了；此外，复杂模型独特的优势就会显现出来了。想象一下将来数据会越来越大，特别是互联网里面，各位如果创业的话对数据也非常关心，将来也是非常大的数据，建立复杂模型也是非常重要的。

数据规模，首先是成倍的增长，包括广告、语音、图像等等。另外一个是计算能力，其中有一个代表，GPU的出现，你计算是用CPU，最近深度学习用得比较多的是GPU，GPU使得计算能力大大提高，GPU一两个星期能处理的数据，CPU可能要一年。还有复杂的图像模型。最后要有一些算法支持它，它有异步式的算法来支持它的计算。

我们的目标是使计算机更加智能，这是在座各位想做的事，要智能，能够理解人，能够知道意图。我们现在的手段跟以前的区别是我们有大数据。那我们就要分析它，复杂模型就很重要。计算能力也上去了，最后要做一个系统才能达到你的目的。深度学习是非常接近人脑，第二是向人工智能走得非常近，也许它不是最终的目标，但是有很好的效果提升。

（本文转载自虎嗅网《深度学习接近人脑，巨头竞相追逐的未来》）

反向激励，在加速这个社会的黑化

呼伦贝尔跨省抓捕，我弟弟指居期间死亡，泣求自治区调查真相

把抄袭说的如此冠冕堂皇，雷军让年轻人丢掉了耻辱感

女律师白天上法庭，晚上去卖淫，协会判定：具有“良好品质”，有资格担任律师！

一般人看不到的内部公众号！（刚刚开放）