查看原文
其他

凯哥讲人工智能:人工智能的四个层次

筱愚她爸 凯哥讲故事系列 2021-08-09

    前面我们分析了人工智能的行业格局,见《凯哥讲人工智能:行业格局》,了解了人工智能的发展,带来了软件技术行业的一次革命,所有的企业都希望在这一次革命中弯道超车,快速建立起自己的相关的能力。


    和众多企业CIO和信息化同业人士沟通,凯哥发现,在人工智能的话题上,普遍存在两种极端的认知:

    ● 万能论者:

    这一类认知认为人工智能是灵丹妙药,并且是通用的灵丹妙药,不管什么问题,只要上了AI了,就一定能搞定,搞不定那就是你能力不行。这一类凯哥称为万能论者。

    ● 无用论者:

    这一类认知认为人工智能是纯忽悠,是概念,本质上和传统的数据分析,BI没有太大区别,所以对人工智能技术带着抵触和抗拒的情绪,一听到人工智能就觉得不靠谱,肯定是忽悠钱来的。这一类,凯哥称为忽悠论者。


    但是,人工智能在应用上到底能发挥什么作用,靠谱不靠谱,我们应该如何去认知人工智能技术对于业务的驱动作用呢?


    我们要理解人工智能从本源到应用过程,理解它的结构,从而客观的认知这个问题。


人工智能应用的四个层次

凯哥把人工智能人工智能技术的应用分成四个层次:

从下往上,分别是:

第一层,学术论文层:

    最底层是学术论文层,就是纯理论的数学、计算科学相关的算法论文,这是人工智能产业的基石。这一层就可以比喻成人工智能领域的理论基础,一篇论文可能会给多个领域带来影响,比如现在非常流行的深度学习,其中很重要的一篇论文,是Hinton在2015年的论文《Deep Learning》,对于语言识别、物体识别、目标检测以及药物发现、基因组合等方向都有促进。这一个层次的能力主要在学术领域,研究机构,比如斯坦福,哈佛等。而大部分的企业所应用的算法,在底层都是类似的,很多经典的算法甚至都已经存在了20年以上。这些论文是公开的,开放使用的,在这个层次来讲,所有的非研究性机构和企业差异都不大,。

    

    比如,全球顶级的跟人工智能相关的顶级论文大会清单如下:



比如这里面的ACL大会,是自然语言处理领域全球最顶级的会议,每年都能产生一些很有影响力的论文从而改变和促进自然语言处理技术的发展。

2018年的ACL大会,在墨尔本举办:

    我很欣喜的看到,近几年的国际顶级学术会议的赞助商中,有很多我们中国的企业了,比如ACL2018的顶级赞助商里出现了今日头条这样的中国企业。


学术算法层有几个特性:

    ● 基础性

学术论文层的能力,往往是非常基础的理论,解决的是某一个理论领域的基础性问题。


    ● 通用性

这个层次的成果,很多时候能够在多个细分领域应用,具有一定的通用性。


● 持续性

程序语言本身会不断地进化,而论文本身则有一定的持续性。随着编程语言,工程技术的发展,对一篇论文算法的实现经常是持续优化的。


总结一下,学术算法层是人工智能现阶段的核心层,目前大部分人工智能所应用的算法都是公开通用的,很多经典的算法都已经存在了十几年以上。


在人工智能的商业应用行业里,这一层大家的差异都不是很大,基础都差不多。


    第二层,工程实现层:

    有软件编程能力的工程师(一般我们叫他们数据科学家)将第一层的论文学术成果实现成工程代码,从而能够被软件所调用。这一层是人工智能的核心能力层,同样的算法,不同的工程代码实现的效果,速度是有差异的,也会影响在软件中的应用。软件工程能力直接决定了这些算法的优化程度。


比如CNN的算法相关的实现在GitHub上就有不下15000种,见下图所示:



第一层学术算法层,大部分的人工智能从业公司差距都不大,基本上使用的都是公开的通用的算法。所以第二层,工程实现层是区分能力的一个关键分水岭,如何将算法实现的最优化,效率更高?工程能力很重要。


第三层,平台服务层:

    当业务被数字化后,我们发现,很多原来跨行业的场景其实在底层的算法层有很多类似的地方,比如异常检测的场景,在审计预警和预测检修这样两个跨行业的应用中有很大的趋同性,只是训练和处理的业务数据本身的差异。为了让人工智能技术能够更快,更高效的被业务所使用,就出现了AI as a Service的平台服务层。


    有公有服务平台,比如百度大脑,阿里云,腾讯,同时众多的大型企业也在构建自己的私有智能服务平台。平台服务层主要的作用是算法和模型服务化,更容易的被各种场景所调用。



第四层,业务应用层:

    所有的技术都是要为了业务去创造价值,人工智能一定要在适当的业务场景中才能发挥作用。这一层是可以直接由第二层工程实现层构建而来的,并不一定需要经过平台服务层。


    所有的企业都意识到智能时代的来临,希望用人工智能技术赋能自己的业务,加速数字化转型工作。

    

    结合上面的四个层次的总结,我们可以得出几个关键发现:


    ● 业务场景是人工智能产生价值的最重要的基础

场景选对了,就成功了一半。智能类项目拥有不确定性,有限投资要定位到合适的业务场景,那就是业务价值高,投入产出比高,数据和技术成熟的场景。而一点依赖于对企业战略的认知,业务的深刻理解,需要很强的业务能力和战略思考能力。所以在企业进行人工智能投资的时候,我们建议早期启动一个智能探索的敏捷规划项目,识别和定位业务场景,进行早期成熟度调研,效果预言,从而尽可能的保证投资的有效性和价值。


    ● 工程实现是将人工智能应用到场景的核心能力

选择对了场景是成功的第一步,最终,我们的人工智能的价值是需要通过软件服务,应用的方式提供给用户的。所以,这就意味着,这个软件需要具备顺畅的流程,用户体验要好,运行速度要快,系统要稳定安全,否则一个有缺陷,体验很差的应用是不会被用户所持续使用的,那么人工智能投资依旧是失败的。所以工程实现是将人工智能应用到场景产生价值的核心能力,这里就包括业务需求分析、用户体验设计、软件技术架构、开发测试上线部署,持续的运营和运维能力。我们的实践统计,一个人工智能的应用项目,智能算法部分一般只会占到总工作量的30%以下,大部分的工作都是软件工程的构建。


    ● 大型企业需要建设自己的智能服务平台

    在目前的阶段,数据是智能算法的原材料,如果企业调用公有智能服务,那就意味着,企业要将自己的数据贡献给外部服务商。这个对于部分大型企业来讲是不可接受的。而与此同时,我们会发现人工智能技术并不是以前想象的那么的阳春白雪,众多的开源工具,框架,算法的实现让我们更多的是需要去将智能技术应用到场景中,而非去重新开发一套算法。

    

    比如,我们团队的工程师,在GitHub上,依托一个开源的人脸识别模型,结合我们公司的内部员工图片数据,训练出来的模型也有一定的准确度,而这个过程,只用了2周的时间。


    所以,大型企业需要建设自己的智能服务平台,将数据,算法和模型实现成企业内部的智能引擎,有规划,有设计的逐步应用到各个业务场景中,业务场景会产生更多的应用数据,从而这些数据又能够增量训练和优化算法模型,最后真正实现智慧赋能。


最后总结一下本文的观点:

一、人工智能无用论和神话论都是不客观的

二、工程能力是人工智能发挥价值的核心生产力

三、合适的业务场景是人工智能发挥价值的前提条件

四、大型企业需要构建企业级的私有智能服务平台







    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存