查看原文
其他

关于人工智能,30年来我越来越迷糊了

一、地震剖面的专家系统

上世纪八十年代末期,老外给我们讲他们开发的专家系统,说可以帮助我们自动理解和解释地震勘探数据处理后的地震剖面,从地震剖面上识别各种地质构造,并圈定储气、储油或者煤层的可能位置,虽然我们觉得很神奇,但也大概知道了这样的软件系统,是以很多地震解释专家的知识、经验、弹性力学以及地质构造等理论为基础的,这个叫Landmark解释工作站的专家系统还是没有在我们地矿系统进行推广,老外们算是白忙活一场了。


二、人工智能找厕所

说,地震专家系统这件事没过多久,俺去北京出差,鉴于我们在PC UNIX上立项并开发地震资料处理系统Seispro,于是就见到了一位在学校就认识的师兄,77级物探系的,他一不小心竟然考上了清华大学人工智能的博士研究生,这位师兄可厉害了,不仅学问做的好,还会做生意,那时候他在成府路到五道口一带,就有了两家很有规模的打字复印店了,有事没事还写点关于地震数据二维滤波和波动方程偏移处理的软件,师兄告诉我说:博士不想上了,想退学。这给我急的,好一番做了他的思想工作,我说,人工智能绝对是未来的方向,何况你师从清华的常迥教授,那可是大名鼎鼎呀。

(从前的厕所Style)

(现在的厕所)

在做师兄思想工作期间,我还特别给他举了一个例子:如何识别厕所的问题,我说,我们人类找厕所包括分辨男女厕所,是一件很简单的事情吧(那年头还有一部电视剧,有一个镜头描写老外是如何靠鼻子寻找厕所的),但是要让机器去找厕所、还要搞清楚男女厕所,估计不太容易吧,别的不说,兄弟你要是把这件事弄明白了,那可是牛逼大发了。那时候我们只知道这是一个模式识别问题,更不知道现在很时髦的神经元网络、哈希什么的。


三、人工智能识别和田玉籽料真假

和田玉籽料,尤其是品质好一些的,由于稀缺,价格越来越高,于是乎造假者也越来越多,辨别籽料真假,变成了江湖上趋之若鹜的需求了,还好,我花了几年的时间练就了这门手艺,不仅看实物,就是看照片也能整个七七八八没问题,于是我一直就在想如何做一个APP,帮助更多人的鉴定真假籽料,避免大家伙上当、吃药和入坑。在过去的好几年内,我一直在寻找这方面的人工智能专家,包括某部委的某个很著名的人工智能群里,没有人能给一个令我信服的说法,巧了,2018年参加一个人工智能协会的成立,终于见到人工智能专家了,我给大师们汇报了我的想法以及我识别真假籽料的一些经验和方法,他们的答案出奇的一致:只要我提供清晰的十几二十张照片就行,让他们的机器去学习一下就OK。


这下我真的晕了,因为他们竟然不需要我提供有关的知识框架和经验,仅靠机器学习照片,就能锻炼出识别真假籽料的火眼金睛吗?

这一堆小石头,是我经常给网友们讲课用的,有和田玉籽料、岫岩玉籽料、石英岩和泥岩鹅卵石、料器假籽料等,都是鹅卵石形状、表面都有坑斑(毛孔),仅靠照片的学习,没有矿物学、物理学和相关经验做支撑,真的能做出来一个识别真假籽料的人工智能APP吗?把我激动的稀里哗啦的。


四、人工智能系统与幼儿的成长是否有相似之处

昨天的研讨会,人工智能的专家们在很认真的讨论图片图像的标注问题,这让我感到非常的意外和惊喜,因为我第一次听说label图片的话题,于是一边听专家们交流,一边在紧急搜索什么是标注或者标记?于是我似乎很快就理解了这么一件事儿,例如:这就像我们给一个幼儿讲这是汽车、这是树、这是你大爷等等,幼儿通过很多次的训练和学习,才能知道什么是汽车、什么是树、谁才是他大爷,我们家孙子在早期经常认错人,我们就需要不断的给孩子进行新的标注和更新判断。一个人工智能系统刚刚诞生下线,估计也像幼儿一样,需要父母给他喂很多标记了这是树木、这是房子、这是和田玉籽料、这是上世纪80年代的老厕所、这是新厕所、这是你三舅、这是你二大爷之类的照片、图像或者视频,当然还会有更多的结构化数据和非结构化数据的信息。


五、人工智能可能长时间还要处于模拟和仿生的阶段

仿生或者仿真用于科技的例子很多,比如:我们在实验室得到一组实验数据,看上去近似于一条直线,那么我们就会用简单的最小二乘法拟合这一组实验数据得到一条直线方程,以便帮助我们寻找客观事物的内在规律,但实际上,我们这组实验数据所代表的客观规律或许只是一个近似的线性关系、或者在一定的实验条件下是近似的线性关系,当试验条件改变了,就会呈现出另一种非线性的规律,例如变压器铁芯的磁滞效应

如果我们没有认识到变压器铁芯完整的客观规律,错把一个区间内的线性关系,当成了普遍规律,那么,由此训练出来的人工智能系统在设备故障分析时,就有可能导致严重的分析和判断错误。


据说,人工智能有三个发展阶段:感知认知推理,我想大概其,前面所讲的给刚刚出生的人工智能系统喂很多做了标记或者标注的图片,就是一个仿生问题,这个阶段的仿生主要是完成感知积累,之后才会是认知,有了认知,我想人工智能系统是不是就可以踉踉跄跄的登场进入初步的应用了?


据说,关于人的思维机理还没有搞清楚,在这种背景下,人们搞人工智能(感知、认知、推理),还都是用神经元网络等什么的模型来模拟、仿真人脑的思维过程,这就是人工智能的仿生学,或者说人工智能还处在仿生的阶段,这个阶段能持续多久呢,我不知道,但我大致知道,在人类思维的机理被真正揭示之前,这种模拟的仿生需要一直继续下去。


或许就像变压器铁芯的磁滞效应一样,在一个区间,人工智能的某一种模型或者算法的仿生模拟是可以的,但也许随着研究的不断深入或者场景的变化,人们会发现,这条路子走错了。


六、人工智能的成熟度、可靠性

发生在我们家孙子上的两件事,经常被我拿来做思考,一是还不到两岁的时候,我们带他去郑州,在下了火车回家的路上,他妈妈告诉他,这是奶奶、这是爷爷,然后问他:小叔在哪里啊?这孩子迟疑了一下用手指了指我旁边的侄子,我们很惊讶,因为孙子第一次见他小叔,他是怎么完成这个指认过程的呢?我想应该是进行了最基本的推理,因为车里的其他人他都认识,当听到小叔一词时,他首先应该认知到了小叔是一个人,车里只有一个未曾见面的陌生人,所以,第二步应该是推理帮助我们家孙子完成了这个指认。


类似这样的事情放在初成长的一个人工智能系统上,会不会指认方向盘或者门把手是他小叔呢?这就涉及到一个人工智能系统的感知认知推理到什么程度才能进入实际应用的问题,也就是可靠性和成熟度问题。由此也充分认识到了前面说的专家们为什么会如此认真的讨论图片图像的label问题了。说到图片的Label真是一个非常严肃的大问题,例如,无人机或者机器人在做电力巡检的时候,如何识别电线上的风筝、鸟等外来物、如何判断变压器上的一坨东西是鸟粪还是设备缺陷、下雨留下的流水痕迹是不是设备外壳开裂、闪电和其他瞬间光亮是不是局放问题等等。


七、人工智能系统的想象力和情感问题

今年初,孙子在家里玩英文字母,我们问他哪个是A,哪个是B,哪个是W,然后再问他哪个是M,这孩子竟然把手里的W倒过来给我们看,这又是什么逻辑呢?我们认为这应该是想象想象或者联想是属于推理呢,还是比推理更近一步的思维能力呢?例如:未来的机器人走到大街上,看到一只猫,他会不会想到他二叔家也有一只猫呢?他会不会想到他二叔曾经告诉他,想找一只公猫过来配对下一窝好可爱的小猫咪,从而激发机器人的好奇心,去问猫的主人一些问题呢?再例如:以前讨论非结构化大数据时,经常拿革命样板戏《红灯记》里李玉和买木梳的场景说事儿:有木梳吗?有,桃木的,微信可以吗?不,要现钱,同志我可找到你了。还有诸如:呵呵、我去、我看你再敢跑之类的对话,基于NLP的人工智能系统该如何准确理解这些对话呢?


前几年,写大数据分析的文章时,我画了一张图片,把大数据简单的分为四种类型,并初步认识到,大数据分析的难点应该是勇敢的跨越结构化和非结构化数据的断层。

并费劲心机的构建了一个特别捣糨糊的场景,说,有三亿人晚上讲鬼故事,吓得另外五亿人夜里开灯睡觉,第二个月,统计局的报表出来了,报告说,上月的GDP环比上升,而且也知道上升的主要原因之一是用电量上升了,而且还知道是居民用电量上升了,当记者询问统计局官员,这是为什么时,我们想想看,统计局官员该如何解释和回答上个月居民用电量上升的驱动因素到底是什么呢?他怎么能知道,用电量的上升其中包含了三亿人讲鬼故事的重要贡献呢?基于人工智能的大数据分析系统,能够发现这背后的驱动因素吗?


所以,回到文章的标题,关于人工智能,30年来我越来越迷糊了,有多少迷糊,就会有多少期待。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存