查看原文
其他

羊习习 2018-05-20


全文共1466字,预计阅读时长2分钟



熟练掌握C语言却总是在转型机器学习算法的道路上屡屡跌倒?懂得AI模型的逻辑却在每次伪代码修改后都被报错?

 

你的绊脚石或许不仅仅是对于Python语法的陌生,还有对于数据集的处理摸不着头脑。



这时候,就需要我们回归基本概念——从向量、矩阵开始,读懂机器学习语言。

 

不同在何处?


在一般性C语言编程中,对于数据的处理主要利用指针。

 

熟悉它的同学们都知道,所谓内存,其实可以被视作一栋有许多房间的旅馆,数据按照特定顺序存在于这些房间之中。而指针,就是房间的门牌号。每一个指令的下达,就是依据编号敲开对应的门,而不用每一次处理之前,都得对房内的具体数据有所了解。

 


但机器学习的逻辑却与这完全不同。如果说前者是演绎法,那么机器学习则是归纳法,对于机器学习模型最重要的,就是理解单位数据本身。

 

就图像识别而言,模型为了正确识别狗,需要掌握的是每一张含有狗的图片数据中有何特征点,这些特征点与猫、与人、与桌椅板凳的特点有何不同,从而让图中的狗成为计算机眼中的狗。

 

在这样的运算中,计算机是逻辑的主宰者。计算机在图片的特征参数提取中,学会了头圆、有深色鼻头、尖耳朵、可伸缩爪子的物体是猫,而吐舌头、塌耳朵、长脸的是狗。至于模型如何判断塌耳朵和尖耳朵,我们很难给出确切的答案。

 


我们最有控制权和控制可能性的,是通过奖励信号训练模型,让计算机在自己的推理逻辑下,给出我们想要的答案。

 

这就意味着,在机器学习中,我们需要一个更加灵活的东西,让机器可以为不同数据之间的联系赋予权重,而不仅仅只有指向。这就是运用向量的意义所在。


向量与矩阵


在机器学习算法中,有这样几个要素值得关注。


 

首先是数据集,它将作为输入信号(inputs),根据训练阶段的需求,被划分为模型的训练集、验证集、测试集。

 

其次就是向量。虽然在不同语境下,向量的意义各不相同,但并不妨碍我们将其归纳为含有数量级与方向的量。这样一来,向量便能搭载着数据的逻辑关系及权重,从而让数据集被输入编码器,形成数组,随之进入神经网络模型运算。

 

而这个庞大的数组,通常以矩阵的方式出现。

 

所谓矩阵(Matrix),当然不是《黑客帝国》里的那个邪恶智能体Matrix了,不过它的确有这方面的潜质。矩阵是一个按照长方阵列排列的复数或实数集合,它在计算模型中可以指代许多东西。

 

 

比如这个3 x 3的矩阵,其中的1可能指代的是物体颜色为红色,其中的5可能说的就是物体的位置。

 

而将矩阵放置在神经网络算法中,通常指代的是向量与数据集的组合。

 

为什么要利用矩阵呢?首先,大家都知道,单个向量本身就是一个1 x n的矩阵。其次,在Python中,Numpy系统可以直接进行矩阵之间运算。这样一来,便可以避免使用不断将单位数据代回公式的for循环,从而提升运算效率。


如何读懂?


理解了向量与矩阵的重要性,只是迈出了读懂机器学习的第一步,要继续走下去,必然需要夯实基础。


在许多机器学习入门教程中,许多作者都提供了他们所认可的线性代数课程。

 

一位网名叫@SEFDstuff的小哥就在他的YouTube频道里提供了几个关于向量和矩阵的公开课链接。

 

向量 (explained with Linear Algebra):

https://www.khanacademy.org/math/linear-algebra/vectors-and-spaces

 

向量 (explained with PreCal):

https://www.khanacademy.org/math/precalculus/vectors-precalc

 

矩阵:

https://www.khanacademy.org/math/precalculus/precalc-matrices

 

不用翻墙,手指动一动,迈出你读懂机器学习的第一步吧!


读芯君开扒

读懂机器学习,需要建立自己的词典


入门机器学习并非难事,更不需要从零开始。


掌握Python固然重要,但Python不过也只是机器学习这本海量词典中的一个部分,而剩下的绝大多数内容,还有待发掘。


而发掘的过程,就是学习他人研究和代码过程。利用诸如TensorFlow,PyTorch这样的机器学习框架,开启学习的第一步将是一个很好的选择。


要知道,只有当你真正开始着手写作神经网络模型,你才能真正地发现问题,并获得寻找解决方案的动力。你的机器学习词典,才不会永远都停留在肤浅的层面。


留言 点赞 发个朋友圈

我们一起探讨AI落地的最后一公里

作者:羊习习

参考文献链接:

https://www.leiphone.com/news/201804/wmYdmBLjATQZoH7c.html?viewType=weixin


如需转载,请后台留言,遵守转载规范


推荐文章阅读

你是否对区块链一无所知

这年头,你连吵架都吵不过AI了……

什么?这个大数据比赛既有奖金还能提供工作?!

学AI,连你的老师都那么拼,你还有什么理由不努力?!

[大咖专访]CCF IT女性精英大会(二):具备“爱”的能力,敢于向权威挑战

CCF IT女性精英大会(一):勇敢说“愿意”,为自己发声

看BAT如何破解中国“缺芯”之痛?

有AI演员,还看什么小鲜肉抠图戏?

看啊,那个面试你的不是人!

学AI能救命?机器学习之父这样说

AI同传闹乌龙,先别急着嘲笑!

Facebook泄密元凶暴露?这个锅AI不背

AI也要讲道德了!英国开始行动

想吸引男神顺利脱单?交给AI吧

最全指南!如何准确找到适合你的AI实习?

取钱就朝ATM喊“给钱”?全靠声纹识别!

移动的孩子成为射杀目标?AI武器必须遭声讨!

无人车来了,无人车的人才呢?

震惊!“莎士比亚”要干掉人类小编?

AI读心术上线,就问你怕不怕!

速看!程序员的未来竟然在这里

AI说:没错!玩游戏绝对能促进学习

去和水准很高的东西碰撞,才懂“做自己”!

AI那么牛,你离失业还有多远?

给你讲个恐怖的故事:女朋友妆前妆后……


长按识别二维码可添加关注

读芯君爱你

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存