查看原文
其他

用最通俗语言来聊聊“什么是机器学习”

hanniman hanniman 2023-11-28
提到人工智能,大众听得最多的概念就是“机器学习(Machine Learning,缩写ML)”了,不过,一般技术视角的文章可能有点晦涩,不方便产品经理(或小白用户)入门了解;今天,咱们就用最通俗的语言来聊聊“什么是机器学习”。


一、3个非常有趣的例子
1、小朋友以为“分享”是“(利益)收到伤害”的意思


上图是马伯庸的一条微博(目前已被删除)
马小烦常和小区里的同龄宝宝一起玩,大部分的大人会教育孩子要懂得分享,把心爱的玩具给其他宝宝玩。不知何时起,宝宝们开始说类似“这只蚂蚁被鞋子分享了”、“我的腿摔倒了很分享”的话,大概是某一个宝宝认为这个词的意思是利益受到伤害,并且这个用法迅速传遍整个宝宝圈……

有意思吧?“分享”这个词,被小区宝宝用成了“利益受到伤害”的意思,当这个用法被1次、2次、3次的使用后,所有宝宝们都学会了。从结果看,“分享”的意思被篡改了,但如果所有人类把“分享”和“受伤/伤害”对调一下,好像也是可以的……当然,这里我们也可以看到,数据样本的质量太重要了。


2、小鸡性别鉴别师

可能很多人不知道,世界上有个职位叫做“小鸡性别鉴别师”:)

为什么要对小鸡做性别鉴定呢?因为在养鸡场里,要养商品蛋鸡当然只养母鸡;而商品肉鸡呢,虽然公母都要,但如果混合饲养的话,由于小公鸡发育快、抢食多,会影响到小母鸡的生长,因此要保证经济效益也最好分开饲养。

鉴别小鸡性别,对经验要求很高,据说老师傅们带徒弟,就是不断给徒弟做示范,“这个,公!这个母!……”,然后也让徒弟自己判断,然后师傅点评“这个不是公鸡,是母的!这个不是母鸡,是公的!……”通过不断的(有监督)学习,徒弟的鉴别准确率就不断提升了……

这么好玩的事,我还特意查了下相关信息:最初,人们靠外形来鉴别雏鸡性别。比如小公鸡头大、体宽、趾粗长、眼大有神、叫声响亮、活泼好动、骨架较硬,而小母鸡正相反。但即使是老司机,准确率也只有80%,满足不了畜牧生产需要。

现在养殖场里常用的方法是“翻肛鉴别法”,就是把小鸡屁屁反过来看生殖器的性状。准确率可达98%以上,熟练工人的鉴别速度可达每小时1200只(3秒钟1只,赞),伤残死亡率低于0.5%。

更多有意思的信息,大家可看:

3、二战中分辨敌我战机


二战中,两军战斗机在空中对战,而守方在地面上还有防空炮可以用,这时如何如何分辨敌机我机就性命攸关了。而在“敌我识别应答机”等专业电子设备发明之前,人们只能通过人眼来看(目视识别),比如看飞机的外观,以及飞行员的操作习惯等。

所以,防空炮的炮手,也需要有老司机在旁边配合或训练指导,指出哪架是敌机,哪架是我机,经过不断的学习,来提高辨别准确率。

这方面有专业性,就不多说了,也附上2个延伸阅读链接吧:
  • 《知乎-战机如何分清敌我》https://www.zhihu.com/question/36086173

  • 《知乎-在大规模战争中如何分清敌我》https://www.zhihu.com/question/33280351


总之,希望先通过这3个例子,大家能对“机器学习”建立一点感性认知。

对了,大家如果能用自己的话来描述下“什么是机器学习”,不妨告诉我,期待你的惊艳回答:)

二、机器学习的定义
网上有各种版本,这里分享3个:

1、机器学习是这样的一个研究领域,它能让计算机不依赖确定的编码指令来自主的学习工作——Arthur Samuel(亚瑟·塞缪尔)

2、机器学习,是对能通过经验自动改进的计算机算法的研究。——百度百科

3、机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。——百度百科

三、机器学习的本质
知乎上有各种说法,供大家参考:
1、机器学习的本质是空间搜索和函数的泛化。
2、总结过去,预测未来。
3、机器学习的本质是模式识别。一部分可以用于预测(有监督学习,无监督学习),另一类直接用于决策(强化学习)。
4、本质来说就是用数据猜测一个复杂函数,由模型复杂程度决定函数复杂程度,对于模型参数求解设计到优化问题。
5、机器学习和生物学习的过程本质上应该是一样的。我认为本质都是映射。

四、机器学习的通俗理解
我看到过的各种解读里,最通俗易懂的说法,来自北京师范大学系统科学学院教授、集智俱乐部创始人@张江 老师——机器学习,是计算的反问题(逆运算)

解释一下——

什么是计算?从上图大家可以看到,计算就是给定输入,得到输出。而其运算的过程,就是程序,就是图中的表达式y=x²+x。

那什么是机器学习呢?就是将计算反过来:给定输入输出对,经过机器学习,得到模型,也就是要得到表达式是什么。

五、举例说明-线性回归
看上面这个图,已知某商品在2012年~2017年中某些月份的价格,希望预测出2018年某月该商品的价格。

预测模型:选择某个模型(图中是y=a*t+b;当然可以更复杂、一般,但这里先用最简单的来举例),希望能穿过(覆盖cover)尽可能多的点。

学习(训练)过程:通过不断调整参数(a、b),寻找一条误差最小的直线。


预测:根据找到的最优模型y=a*t+b,带入年份为2018中的某个月份,则可“预测”出该月份中,该商品的预估价格。



测试:根据预测值和真实值进行对比,可以得出测试误差(也叫泛化误差,上图中橘色直线);相应的,之前训练过程中,预测值和训练数据的误差叫做训练误差(上图中白色直线)


六、上面这个过程,也可以认为是“拟合”
拟合在百度百科的解释是:已知某函数的若干离散函数值{f1,f2,…,fn},通过调整该函数中若干待定系数f(λ1, λ2,…,λn),使得该函数与已知点集的差别(最小二乘意义)最小。

还有一种通俗解释:拟合,就是依葫芦画瓢;是能呈现一个想要的结果,但说不出原因(没有明确的逻辑规则);打个比方,一个人画画或游泳很好,但他也说不清楚该怎么画画或游泳。总结就是,不管白猫黑猫,抓到老鼠就是好猫!

七、再举个有趣的例子——看相

从某种意义讲,其实这张图——看相,也是某种机器学习的过程,可能是古人通过大量的观察总结,发现具有某种面相特征的人,会有某种性格或命运,然后沉淀出了一套规则,传给后人。


八、机器学习和深度学习的关系

看上图,人工智能,是一种科技领域,是最宽泛的一个概念;机器学习,是一种偏技术角度的方法。

根据不同的学习方式,机器学习可以分为全监督学习、无监督学习、半监督学习、强化学习、迁移学习等等。而根据是否应用了神经网络,机器学习可分为应用了神经网络的机器学习,和没有应用神经网络的机器学习。

更进一步的,对于应用了多层神经网络的机器学习,我们称之为深度学习。——也就是说,在这个角度上看,深度学习是机器学习的子集,而不是并列关系,这个概念区别,大家先有个印象。咱们再重复一遍:应用了多层神经网络的机器学习,就叫做深度学习,他们是子集关系,不是并列关系。
 
九、相关概念的通俗理解汇总
1、机器学习——计算的反问题(举例:线性回归)。
2、深度学习——应用了多层神经网络的机器学习。
3、有监督学习——需要“标签”来当老师(举例:肿瘤诊断)。
4、无监督学习——人不告诉机器标准答案,让机器自己来学习(点赞暴露性格)。
5、强化学习——做中学(个体/环境、动作、反馈、方案;可以自我博弈)(举例:AlphaGo)。
6、迁移学习——触类旁通(举例:夜光图+街景图来分析非洲贫困)。
7、特征学习——自动学习特征(增删改查)(举例:肿瘤诊断)。
8、贝叶斯学习——仅从一个例子就形成概念(举例:学会写字)。


注:以上内容来自“AI产品经理大本营”——由黄钊hanniman建立的、行业内第一个“AI产品经理的成长和求职社群”,通过干货分享、线下交流、每职位内推等方式,帮助大家完成“AI产品经理成长的实操路径”;详情可点击“阅读原文”查看。


-END-


- hanniman往期精选 -

一、AI产品分析

【重点】如何从“品类”角度做AI产品(2C)的需求定位

重点】产品视角看智能客服

【重点】智能音箱上的语音技能市场,能否对标手机上的应用市场?

重点AI产品经理视角下的AI翻译机 in 旅游场景

【重点】进击的人工智能:产品视角解析“对话机器人”

【重点】如何从零开始搭建智能外呼系统

一文了解“教育+AI”方向通识(场景、产品、公司、商业模式、短期风险及机会)

现阶段实践“拿着锤子找钉子”的六个步骤


二、AI产品经理

【重点】【重磅福利】人工智能产品经理的新起点(200页PPT下载)(注:后台回复“200”,可获取PPT下载链接)

重点】AI产品经理的定义和分类

【重点】AI产品经理的价值和未来 | 学习俞军老师分享有感

团员分享_AI小白如何拿到AI产品经理offer

深度报告 | AI新职位“人工智能训练师”

福利 | 《从互联网产品经理到AI产品经理》PPT下载及讲解(58P)


三、AI技术

【重点】AI产品经理需要了解的语音交互评价指标

【重点】语音合成TTS | AI产品经理需要了解的AI技术概念

重点一文看懂“语音识别ASR” | AI产品经理需要了解的AI技术概念

【重点】值得收藏 | 关于机器学习,这可能是目前最全面最无痛的入门路径和资源!

重点DIY面试题 for AI产品经理 | “智能音箱半夜诡异笑声”的原因分析及建议方案

重点】“AI芯片”通识_AI产品经理看这一篇就够了

重点人脸识别产品设计,AI产品经理需要了解的实战干货都在这里了_团员分享_@阳春柏樰

重点一文看懂“声纹识别VPR” | AI产品经理需要了解的AI技术概念_团员分享_@cony

NLP基本功-文本相似度 | AI产品经理需要了解的AI技术通识

看AI产品经理如何介绍“计算机视觉”(基于实战经验和案例)

人脸识别 | AI产品经理需要了解的CV通识(二)

多目标跟踪 | AI产品经理需要了解的CV通识(三)

填槽与多轮对话 | AI产品经理需要了解的AI技术概念

AI产品经理需要了解的数据标注工作入门

语音识别类产品的分类及应用场景


四、AI行业及个人成长

重点】【深度】工作5年以上,到底要不要进AI创业公司?

重点】深度 | 人工智能让我们失业?不,这取决于我们自己

重点】我们还没准备好和AI共生——柯洁和AlphaGo大战之观后感

重点】AI产品经理视角下的V2X、车联网和自动驾驶

一文了解“医疗影像+AI”发展现状_团员分享_@lazy_yy

新技术带来产业格局周期波动的3个阶段(以智能汽车领域为例分析)

“人工智能与法律”对AI产品经理有何实际借鉴意义

稻盛和夫的这些话,是鸡汤还是干货?

跨过这十个误区,提前2年告别职场小白

【重点】如何分辨明师并遇到他 | 周日换频道(7)


---------------------

黄钊hanniman,前图灵机器人-人才战略官/AI产品经理,前腾讯产品经理,8年AI背景,11年互联网经验;垂直于“AI产品经理”的第一自媒体,微信公众号/知乎/在行ID“hanniman”;行业内第一个AI产品经理的成长交流社区-“AI产品经理大本营”的创建者(已运营近4年);200页PPT《人工智能产品经理的新起点》被业内广泛好评,下载量1万+。

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存