让听得见炮火的人来做 AI
The following article is from AI科技评论 Author 陈彩娴
作者丨陈彩娴
编辑丨岑峰
2022年10月,工信部公示《国家人工智能创新应用先导区“智赋百景”》,涉及AI落地的9大领域、100个场景、8个先导区。
这个举动相当于官方泄题,把AI落地的重点科目和尖子生写在了表格上。
AI科技评论观察到,9大领域中,关于公共安全、交通运输的场景最多,这些场景的AI渗透率已经比较高,旨在发力向纵深探索,属于试卷中的必答题。而制造、农业、能源、金融、医疗作为我国的重要经济支柱,虽然经济贡献和战略地位极高,但尚属AI落地的处女地,是新考试中的新题型。
或许可以从农业中看到端倪:一颗草莓从生长到采摘,需要多少种算法?
草莓的生长过程中有20多种侵染性病害,10多种生理性病害,40多种虫害,要辅助人工准确识别它们,需要不同的AI算法。
在采摘中,确定草莓成熟度核心指标在于果面着色程度,一般分别在果面着色达70%、80%、90%时采收,但如果只有这个指标,机器很容易将草莓和同色系物品混淆,比如圣女果,所以往往还需要辅助纹理识别算法。在通过机器视觉识别成熟度前,需要先区分果与叶,对草莓进行定位并找出根茎部分,采摘后需要用托盘稳稳接住,这个过程对定位识别算法的要求很高。此外,坏果、烂果、小果、异形果也需要被区分。
这仅仅是一颗草莓的生命周期管理,就需要上百种AI算法。
而作为农业大国,仅新中国成立来孕育成功的新品种,就有3万个。近些年,农林牧渔业产值不断攀升,从2010年的67763.13亿元,逐年增长至2021年的147013.4亿元,近11年增量达79250.27亿元、增幅达116.95%。
从看护一颗草莓,到支撑起如此庞大的智能农业产业,AI能发挥的价值难以想象,所需要的算法种类更是浩如星海。
难度加深,题型变广,中国人工智能领域的官方定调已经明白无误:上一个十年,人工智能走出实验室扎根到少数几个头部产业,新十年要从头部产业走向千行百业。
当市场呼唤更多AI能量的观点进入官方文件时,新的故事就开始了。
在不确定性中寻找确定性
最先感受到水温变化的,是离客户最近的系统集成商。
“如今70%的集成项目中都有AI,是机遇也是挑战。”
刘先生所在的公司主做无人机巡检领域的系统集成,维护了大量优质的政府、园区客户,也同步对接算法公司、软件公司、硬件公司、工程团队等。
在智慧巡检的建设方案中,传统上靠人工肉眼查看,AI的价值多体现为车辆识别、人员聚集识别等。但今年,刘先生公司接到了更多新需求,最高频的是井盖丢失识别、游摊小贩识别,河道垃圾识别、火焰烟雾识别等;甚至很多算法需求,在市场上几乎找不到供应商,比如农田遥感、电网安全、河网监控等。
这些需求让刘先生很兴奋。人无我有,人有我优。传统的智慧巡检领域竞争激烈,如果能拿下新场景,不仅有利于单个项目的控标,还能抢占一块新高地。
行业数据佐证了刘先生的感知。根据IDC最新发布的《中国加速计算市场(2021年下半年)跟踪报告》,2021年全年,中国AI服务器市场规模达350.3亿元,同比增长68.6%——如果把算法比作是菜谱,那算力和数据则分别是厨具和食材,厨具消耗量的增加,必然与菜品的增加同步——AI市场的需求总量在快速井喷。
更重要的是,IDC报告还显示,AI算力市场规模前6大行业中,金融、服务、制造和能源等新进领域均表现出高达80%的涨幅。也就是说,不仅需求总量增加了,AI算法的多样性也增加了。
这种增加是市场自发行为。比如上海“一网统管”,在疫情发生后,开始使用人工智能来监测车辆违章停放、共享单车跌倒、垃圾抛洒等问题,从原先被动需要人力维护,变成主动进行智慧管理。又比如,人工智能在诊疗领域过去大量应用于人工智能读片,看肺部结节的效率要比人眼读片高很多,而今,人工智能读片则覆盖到了骨科、心脑血管、妇科等全新领域。
市场对人工智能的想象早已跳出了“人、车、非”老三样,能不能尽快占领新需求的高地,也成为集成商们能坐哪把江湖交椅的重要依据。
对于大集成商而言,一个项目中落地上百个AI算法是常有的事,这意味着巨大的潜在增值空间,也意味着不可控的交付风险。
以工业机器人领域为例,2014年系统集成商企业数量不到500家,到2021年数量已经超过3500家。但从财务上看,营收小于1个亿仍然是大部分集成商的命运,能做到5个亿已经是行业佼佼者。从单个项目上看,遇到好项目毛利率能到20%-30%,但大部分情况下,毛利润则低于20%,如果是陌生的全新场景,那么赔本也有可能。
刘先生想带领团队探索AI的未知之境。但是,把AI写进PPT很容易,落到项目里很难。
于是,冰火两重天成了AI行业的现状:一面,是肉眼可见的行业蛋糕变大了;但另一面,是从业者如履薄冰,闻定制而色变。
梦想照进现实
究其本质,AI算法无法成为标品。
一条流水线可以生产千万瓶农夫山泉,卖给无数消费者;但算法和场景的关系,却约等于《阿凡达》中纳美人和迅雷翼兽的关系,每一个算法都需要与具体的场景精准适配。
这项工作非常复杂。从数据环开始,算法工程师就需要分析场景的图像数据特点,依次设计对应的算法方案,并根据算法落地的硬件芯片大小设计模型结构,通过超参调节与训练得到一个 AI 模型,然后部署到摄像头、无人机等终端产品上。
而且,这不是一个走一遍就能完成的流程。深度学习是一个「黑盒子」,算法精度的提升可能取决于数据特点,也可能取决于模型参数规模与架构。由于视觉算法天生要与终边端结合,最终的算法调整还与终边端硬件的算力(即芯片)大小有关。牵一发而动全身,所以,算法工程师往往要来来回回走完整条流程,才能得到一个不错的 AI 算法。
计算下来,开发一个 AI 算法大概需要3个月,算法与硬件的适配调优又要耗时 3 个月左右,所以单个 AI 算法的平均交付时间大概 6 个月。AI 算法工程师的人力成本平均在年薪 50 万以上,一个算法项目的研发需要 5 到 10 人,加上图像数据的标注成本等,就构成了 AI 算法的尴尬局面:
「海量需求,精细定制,人力太贵,做不过来」。
图注:人工智能各职能岗位人才供需比
数据来源:工信部人工智能产业人才发展报告(2019-2020年版)报告编写组调研数据库、BOSS直聘
AI是无处不在的需求,也是不敢轻易接手的山芋。作为产业链的中间环节,集成商向上对接核心技术提供商,比如算法厂商、芯片厂商,向下对接终端客户和工程实施方。如果要探索新的算法应用,自然离不开产业链的上下游。
如果我们把视角放得宏观一些,会发现当下的AI产业链已经在慢慢走向成熟了。
最典型的体现是连接数。据 IoTAnalysis 研究数据, 2020年全球AIoT连接数达到117亿, 首次超过非物联网连接数——这个数据在2010年是8亿次,增长近15倍,而每一次连接,背后都有数次AI运算。
15倍速的增长,背后依靠的是数据和算力的循环增强,这些产业基础设施的完善让AI的梦想有了照进现实的条件。
以数据处理为例。吴恩达在“二八定律”中对数据之于AI的重要性有非常直观的描述:80%的数据+20%的模型=更好的AI。
充足的数据是算法模型成功的前提,但数据处理环节极为庞杂,即使是最成熟的人脸识别,训练一个模型也大概需要千万的样本量,整个数据处理工作则要占项目总成本的近60%,占项目开发周期的80%。
如今,随着产业分工的加速和技术的提升,专业数据处理机构和AI算法辅助标注平台,可以通过预识别模型的方式,先将数据处理一遍,尽可能识别物体,再交由标注员操作,就可以将效率提升近一倍。
除了处理效率外,数据处理质量也在提升。在传统数据处理过程中,主要通过人工抽查的方式对数据标注质量进行查漏补缺,但通过AI辅助质检,不仅可以变“抽查”为“遍查”,还可以将平均数据准确率提升5%以上。
除了数据之外,走向成熟和标准化的还有算力产业。
根据方舟评估委员会的研究,虽然过去十年,人工智能计算的复杂度每年飙升10倍(每秒千万亿次运算),但与此同时成本却每年下降10倍。比如, 2017年在公共云上训练像 ResNet-50这样的图像分类器,成本约为1000美元,到了2019年只需大约10美元。
究其原因,一方面是AI架构的升级,另一方面则是专用芯片的出现及其性能的提升,比如 Nvidia于2017年发布的 V100显卡,比三年前发布的 K80 快1800% ,还有一方面则是智能算力建设取得的成就。
据工信部数据,截至2021年底,全国在用智算中心超过20个;算力产业规模近五年平均增速超过30%,排名全球第二。预计到2023年,智能算力在总算力中的比重将超过70%,发挥核心拉动作用。
风云万变一瞬息,在短短几年间,智能算力从新生事物成为新基础设施。这让AI训练和落地更有底气了。
最直观的表现是,2012年前罕见使用GPU进行计算,2015年以后,大规模使用上百个GPU进行训练成为常事。而作为AI落地最常见的载体,智能摄像头的价格单位也早已从万元降至千元甚至百元。
市场需求催生专业分工,专业分工促进技术升级,技术升级导致性能迭代,性能迭代孕育成本降低,成本降低成就广袤的市场需求。
数据端和算力端大致走完了这样的闭环,这在行业层面让算法研发的类型更多元、周期更短、成本更低。但这依旧不足以实现“智赋百景”背后的期望,整个产业对算法生产能力的期待呼之欲出。
AI落地的新支点
如果说,变人力为机器,变复杂为标准,是数据和算力一日千里的秘诀。那么,算法有没有可能标准化?
2012 年,加拿大不列颠哥伦比亚大学的 Frank Hutter 教授等人提出自动选择模型与优化参数的 Auto-WEKA,是第一个 AutoML 点工具。之后,除了调参,也有针对网络结构、函数选择自动化的 AutoML 陆陆续续出现。
AutoML,即自动机器学习,是一种用AI训练AI的工具。
但单点上的突破,并不能真正改变产业模式。AI 算法的生产特性决定了,但凡还有一个环节需要算法工程师操作,包括算法在终边端的部署,就又回到了 AI 落地难的原点:离开算法工程师,算法开发就转不动了。
基于此,更多算法公司将AutoML当做专业算法工程师的提效工具。但只要AI的生产和应用还掌握在少数专业算法工程师手里,AI就像是一种奢侈品;其背后的巨大需求潜力,也就没法释放出来。
如果想让整个AI产业链的齿轮咬合紧密衔接丝滑,必须实现端到端的算法全链条自动化——这是新十年AI创业者的重要方向,「共达地」就是其中之一。
和单点自动化的AutoML不同,共达地要做的是AI算法生产全链路自动化的AutoML,是要将深度学习视觉算法开发的链条细细拆分,分成 13 个环节,从「数据分析」开始,一直到芯片适配,在算法开发的每个环节都设计不同的算法来代替 AI 工程师的工作。最终实现的效果是,数据上传后就能自动训练模型,训练好的模型可以像安装 APP 一样下载。
这个过程相当于把数据、算法与算力进行了拆分,分别自动化,每一个模块都用 AutoML 的算法来实现。例如,数据分析一环,AutoML 可以自动分析上传数据中的场景丰富度、物体类别、目标尺寸、有无遮挡、光照强弱等等。在芯片适配,用户自主选择模型想要适配的芯片,平台同样会通过算法来自动匹配和计算。
用户只需做两件事:一是定义好需求,二是数据迭代。而这两个环节可以由离业务场景最近的人来完成,如上述所说的产线工人、物业经理等等。
原本训练算法是个「黑盒子」,但这个过程被流水线化了。反复调参的前提不存在了,成本和周期自然也就消失了。想要什么样的算法,就喂什么样的数据。
这种能力对集成商来说,很有吸引力。
自建 AI 团队的成本太高,但产品经理与项目经理的人数永远是最多的。所以,如果他们仅仅需要上传数据,就能像安装 APP 一样得到解决自己问题的 AI 算法,那么 AI 的足迹就会迅速布满全国各地,真正促进数字化的转型。
不过,算法生产出的算法,精度能否与人类生产的算法相媲美;
没有专业算法团队的集成商,是否能熟练使用这项能力;
这两大前提,是验证 AutoML 平台是否行得通的试金石。
创立第二年,共达地得到了肯定的答案。一家视觉算法公司想用 AI 识别火焰烟雾。此前,该公司内部的算法团队花了半年左右的时间才做出一个算法。接触到共达地后,在试用他们的算法自动化生产平台时,他们将同一套数据上传到该平台,结果只用了 10 个小时就训练出一个模型,而且算法的精度更胜一筹。
这种震撼是难以名状的:回顾深度学习的历史,深度学习第一次引起人们的震撼,就是 2011 年 Hinton 与邓力在微软语音识别中应用深度神经网络,只用了几天时间就完成了整个团队花半年才做完的事情。而现在,AutoML 生产的算法也能实实在在地匹配人类工程师的工作——算法环节,终于也和数据、算力一样,走上了工业化道路。
生产力解放想象力
只有解决长尾匹配,才能完成技术的价值闭环。而在实际业务中,越来越多碎片化的场景证实了 AutoML 平台算法生产的意义。
今年年中,刘先生接到一个来自某地政府的智慧城市项目,需要用无人机+AI巡检的方式,对辖区内的车辆、人员、河道、商贩等进行管理,是刘先生从业以来遇到的覆盖面积最大、算法类型最复杂的项目。
项目试点初期,以河道漂浮物识别为切入点,对比多家供应商的技术实力。刘先生在某专业算法大厂的算法商城中购买了河道漂浮物识别算法,但测试时92%的精度,到应用到业务场景后竟然低于10%。主要原因在于:一是实际河网环境复杂,二是河面反光造成了极大的影响。
后来,刘先生在共达地的 AutoML 平台上通过采集到的视频流自主动手训练了河道漂浮物识别算法,应用到业务场景后,同样由于远距离、夜间识别的问题,精度只达到70%左右,但通过不断巡检,前端回传现场数据进行迭代,5 天迭代 3 个版本后,精度达到了95%。
速度带来质变。如果是之前靠人力迭代,相当于每次都要重新定制算法、重新走一遍上述十几个环节的流程,耗时往往以月计,成本也高。但 AutoML 平台自动生产、无需人力,机器 24 小时云运转,以天为单位迭代,效率更高,得到高精度的时间也更短,对实际落地带来了巨变。
AI 的生产力,解放了行业人士对「AI 能做什么」的想象力。
「过去不敢接的项目需求,现在敢接了;过去要倒腾半年的项目,现在一个月就可以交付妥当了。」这是刘先生最直观的感受。
这就好比汽车的发展:汽车最开始出现时,只有少数的富贵人家能拥有汽车,会开车的司机也很少;随着生产力的发展,越来越多中产阶级也能买上汽车;到乘车共享平台诞生时,普通老百姓即使没有汽车,也已经能通过平台享受到汽车出行的服务。
通过 AutoML 平台,AI不再是昂贵的产品,而是触手可及的服务。传统企业也能实现这样的梦想:没有 AI 团队,也能交付靠谱的 AI 产品。
但更具想象力的是,工具升级以后,产业链也有了重塑的可能性。
在AI产业链中,绕不开的无非“算法,算力,数据“三大要素。而项目落地,则又包括需求分析、系统集成、API对接联调、部署运维等细碎工作。
传统AI公司自己下场做总包项目,左手采数据,右手建算力,又用昂贵的人力和组织成本,去做系统集成商的工作。
于是,边际效应诚实的反应在财务报表上,摊子铺的越大,企业亏钱越多。
而共达地AutoML平台率先将算法生产能力抽离出来,变成标准化服务,同时打通数据厂商和芯片适配。让整个产业链回归合理分工,各家厂商专注自己擅长的事情。
标准化,是效率的开端,更是协作的开始。
到2021 年,共达地的 AutoML 平台已经打通了多家数据厂商,用户可以无缝实现数据的标注服务。同时,平台适配了超过 100款常见 AI 芯片,涵盖英伟达、英特尔、高通、寒武纪等主流厂商。
这个过程可以参考信息产业。当信息产业从一家独揽咨询、操作系统、CPU、硬盘、整机等所有环节,发展为每个环节都有大量玩家和独角兽时,信息产业生态便建立起来了。信息产业从烟囱林立,到树状相连,IT也在此刻成为各行各业的「基础设施」。也正是在这个基础上,中国经济大体上完成信息化,迈向数字化。
相应的,人工智能正在经历的这个阶段,或许可以称为「AI生态元年」。
共达地的AutoML平台,作为撬动AI生态的一个工具,只是革命的开始。随着越来越多人参与到这个赛道中,带来新的分工、新的标准、新的理解,共建人工智能的新生态。
在那里,才是AI真正的星辰大海。
更多内容,点击下方关注:
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
4.BBC纪录片《从太空看地球》
5. BBC纪录片 《中国新年:全球最大庆典》
10. BBC纪录片《护齿真相》
11. BBC纪录片《酒的真相 》
475.你以为这是对颈椎的爱?其实是害!
476.PNAS:压力大,加速免疫系统老化,增加多种疾病风险
948.纪录片《超大建筑狂想曲:三峡大坝》
949.有效性可疑,安全性堪忧,抗新冠口服药阿兹夫定是怎么上市的?
950.奥密克戎变异株再感染的危害有多大?
951.纪录片《神奇的森林》
952.纪录片《糖:新一代健康杀手》
953.电影《雨中曲》
954.BBC 纪录片《安慰剂试验》
955.BBC纪录片《神秘百慕大三角》
956.纪录片《奥黛丽·赫本》
957.纪录片《疾病的起源:脑中风》
958.BBC纪录片《蓝色星球II》(全7集)
959.纪录片《中国食文化》(全5集)
960.纪录片《刀叉下的秘密》
961.纪录片《纳米比亚的野性奇迹》
962.纪录片《骨骼:青春与活力之源》
963.BBC纪录片《蘑菇家族成员们的神奇魔法》
964.电影《成年人的谎言生活》(全6集)
965.电影《最后的城堡》
966.电影《万箭穿心》
967.石斑鱼:家族庞大的餐桌翘楚
968.记忆从何而来?
969.电影《致命困境》
970.欧洲食品信息委员会:不建议采用低碳水化合物饮食治疗糖尿病
971.电影《红色小提琴》
972.电影《生命因你而动听》
973.电影《撞车》
974.电影《忍者神龟:崛起》
975.纪录片《新冠:第一波》
976.电影《春夏秋冬的故事》
977.电影《铁血战士:猎物》
978.电影《金氏漂流记》
979.BBC纪录片《达芬奇的《最后的晚餐》》
980.纪录片《我从汉朝来》全6集
981.电影《肖申克的救赎》
982.我变老了,因为体内的古病毒复活了!
983.纪录片《美国大分裂:从奥巴马到特朗普》
984.阿托伐和瑞舒伐他汀降脂作用更强!有关他汀的 15 问 15 答
985.BBC纪录片《21世纪太空竞赛》
986.BBC纪录片《纳粹国防军》全5集
987.加利福尼亚大学:蓝莓可预防痴呆
988.纪录片《大汉帝国》全5集
989.电影《山怪巨魔 》
990.电影《为奴十二年》
991.电影《梦乡》
992.耶鲁大学:为什么说” 愁死人”
993.电影《大而不倒》
994.宇宙是否有内在的真实性?一个深层次的宇宙哲学问题
995.电影《血仍未冷》
996.BBC纪录片《奇妙的人类旅程》全5集
997.神药二甲双胍可能导致男婴出生缺陷
998.BBC纪录片《探究班诺克本之战》全2集
999.电影《吞噬》
1000.现代社会的元问题:为市场经济的灵魂及其敌人寻根
1001.“化圆为方”的几何证明有了新突破,不断发现前人无法想象的新数学
微信扫一扫
关注该公众号