查看原文
其他

2017-03-14

中国第一最有趣图文公号

点击题目下方蓝字关注 顾颖琼博士说天下

人工智能(英语:Artificial Intelligence, AI)亦称机器智能,是指由人工制造出来的系统所表现出来的智能。通常人工智能是指通过普通电脑实现的智能。该词同时也指研究这样的智能系统是否能够实现,以及如何实现的科学领域。


深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。


深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。


所谓“深度”,是特指训练三层以上的神经网络。小于三层就是浅的,大于三层就是深的。神经网络在90年代火过一阵,各种理论早就已经成熟了。back propagation的理论跟网络深度是无关的,但实际运行的时候就是发现层数大于三的话就训练不上去。所以相当长一段时间内神经网络在机器学习方面被SVM等“浅度”神经网络特例压得抬不起头。90年代神经网络拿美国国家基金得时候,应该把深浅网络都promise了拿过一遍钱了。然后没有deliver,并且把整个人工智能得名声都搞臭了。现在把训练深度网络的问题部分解决了,需要旧瓶装新酒再拿一次钱。因为“神经网络”的名声已经臭了,所以造出来“深度学习”这个概念来乎悠人。(CNN的经典论文LeCun 1998 Gradient-based learning applied to document recognition.)

然后来说这个“部分解决”的问题。现在深度网络可以训练了,不是理论有了突破,而是靠的大数据+快硬件。如果按传统的机器学习套路,一个对象先提取一个特征,然后应用学习算法,这个数据量其实还是不够大的。各种深度学习的一个典型特征就是convolution,或者说是sliding window。一个400x400的图片,用40x40的sliding window扫过去,每隔4个pixel采一次样,就能出来快100个样本。如果有1,000,000个图片,其实这种window就有100M个。如果是图片的话一般还需要对输入图片进行各种抖动产生更多的样本。

除了图片以外,深度学习应用范围都有一个明显的特征,就是可以做sliding window:从大对象里掐下来局部的一小片,还是一个对象。比如声音,文本,序列。不是说神经网络对别的数据不干活,而是在别的数据上神经网络对传统技术没那么大的优势。股票数据是典型的时间序列,所以是落在神经网络的应用范围内的,所以可以比较肯定地说,神经网络预测股票价格要比别的机器学习技术要强。至于是否能干活,依赖一个大前提,就是股市本身得是可以预测的。图片,语音啥的,人能识别,所以明显是可以预测的,所以神经网络干活了。股市在多大程度上可以预测,这个本身就是一个大问题。


已经从数学上证明:
1:神经网络能拟合任意数学函数
2:recursive神经网络能模拟图灵机。

这两点是这么多人前赴后继地折腾这个技术的理论支持。数学分析多得很。
机器学习这个领域其实一直是做系统的牛于数学分析。在好的数学,不干活就是没用。几个响当当的算法,比如boosting, naive bayes啥的名气都是建立在解决实际问题上的。现在再回过头来看,naive bayes (boosting)没啥了不起的,垃圾邮件监测(人脸识别)也不一定非要用naive bayes (boosting)来做,如果光看推公式是没法理解这些算法的业界地位的。业界地位就是第一个解决某问题的系统用了某方法,而不是某方法在数学上有啥独到之处。


围棋也是game theory,现在神经网络也号称用上了。

对股市的理解:股市基本上是一个multi-scale massive multi-player game。
这个游戏在任意时间scale上,都有很多人在玩。如果众多玩家中使用最优策略
的玩家数量超过一定的阈值,这个游戏的走向就会变得不可预测。(Boosting理论:足够多的傻B玩家,这些傻B玩家如果每个人能比随机乱猜好哪怕一星星点,足够多的傻B玩家合起来就能顶得上超级玩家。所以玩的人多,钱就不好赚。)

想赚钱,就得找到一个使用最优策略玩家少的时间scale。一个办法就是利用
系统门槛,在极小的时间scale上玩high frequency trading。如果你的scale比所有人小,那么这个scale上就只有你一个人玩,钱就容易赚。


数学上能证明可行的事情有很多,很多idea几十年前都已经被写成paper发出来了。但是写paper的人自己不会去绞尽脑汁把系统做出来,或者说其实就是绞尽脑汁其实也做不出来。爱因斯坦语言的引力波过了100年整才被观测到。无非也就是系统最近做成了而已。实现上有很多engineering的困难是跟数学证明没啥关系的。

东西做成了再回过头来看,发现paper其实早被发过了,再推广一下理论,其实发现牛顿柏努力那时候就已经早研究清楚了。没啥奇怪的。但是给你一堆paper,证明都是对的,要挑出来一篇做成系统其实非常难。

神经网络最后超过人脑,电脑控制机器,发展出self-reproducing machine,飞出地球,指数增长,耗尽宇宙资源,最大化全宇宙的entropy。基本上就是这个过程。

其他阅读:

㊣ 别了,卡斯特罗,别了,卡斯特罗们!

论言论自由| 在美国焚烧国旗到底什么时候有罪,什么时候无罪?

🔥美国四大宝:嘴炮,信仰,选票,刀枪

㊣ 2016年美国大选,希拉里输在哪儿?

∮ 马云想要跑路?!

🔥从对待邓文迪的态度,看中美两国的巨大社会人文差距



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存