查看原文
其他

不知道AI落地这三大痛点?小心未来被裁员!

羊习习 读芯术 2019-12-26


全文共2122字,预计阅读时长4分钟



AI落地难有多难?IBM都因此要裁员了!



据英国科技网站 The Register 报道,有 IBM 内部消息人士透露称,Watson健康部门即将解雇50% 至 70% 的员工。

 

Watson 健康是IBM“认知计算”计划中的标杆项目。如今,Watson健康大裁员,无异于宣告IBM这些年的努力基本失败。而IBM失败,正是因为遇上了AI落地的一些痛点。


AI医疗,怎么才看起来够靠谱?


Watson健康于2015年成立,主要是运用AI技术,助力医生应对癌症、慢性病、流行病等“健康杀手”。

 

这一年,AI这个概念还没有大火,大数据的强大实力才刚刚露出它的冰山一角。Watson便是通过这些对于人们来说还十分陌生的概念,席卷了全球医疗界。



但是,随着人工智能时代的到来,人们开始有了更多的思考。医疗数据的敏感和隐私、获取的难度、数据集的不准确和不完整、信息共享难以实现等问题,都逐渐暴露在了公众眼前。AI能否代替医生,也成为了一个公众性议题。

 

不仅如此,越来越多的资本玩家开始进入AI医疗市场,也让IBM遇到了前所未有的竞争压力。

 

这时候,摆在IBM面前的真正问题,是如何在万千AI产品中凸显自己的优势。而在这一点上,IBM显然搞砸了。


模型有效性缺乏市场认同

 

为了宣传自己的产品,IBM通过媒体、广告等手段,大肆渲染自己取得的成果,如市场占有量、数据集体量、公司并购等,却唯独没有对模型的有效性给出一个直观且能被市场认同的答案。



模型的有效性计算依靠的是测试集。而测试集有两类:一类是从既得数据库中单独划分出的一组数据;另一类则是由行业公认的、作为性能计算统一标准的数据集。

 

第一种数据集,在绝大多数模型训练中都会有所涉及。不过由于测试集要瓜分一部分既得数据集,在数据集体量不够之时就会显得十分尴尬。由此,也会有直接忽略测试集的情况。

 

而行业公认标准测试集,目前只在语音和图像领域存在,例如大家熟悉的ImageNet就是李飞飞教授所建立的图像测试集。由于这样的测试集被行业普遍使用,由此得出的性能参数也就有了可比较性。

 

更关键的是,如果模型始终在固定样本来源的数据集中进行训练,很有可能会出现过拟合的情况,从而无法适应普遍的应用场景。

 

因而,像医疗这样“人命关天”的领域,建立起行业公认的标准测试集,可谓是解决落地痛点的关键。


产品太贵,变现难


如今,数据搜集与数据交易的难度成为了AI产品生产成本高居不下的主要原因。但是,这也成为了一些用户体量大、用户行为数据丰富的公司的机遇。不过,Watson健康显然不属于这一类。

 

对于AI产品来说,研发成本高是一方面,后期迭代的费用更是难以预计,并且,在发展的初期,AI产品绝大多数还是辅助性产品,并不能解放大量人力物力。

对于一个开销巨大、还不知道有没有卵用的高科技产品,很多客户自然会望而却步。MD Anderson癌症研究中心就曾以3900万美元的价格购入了IBM的AI产品,却无法相信AI分析所带来的结果,导致和AI“合作”过的医生都苦不堪言。

 

那么,如何让AI产品能够顺利变现呢?目前对于大公司的解决方式是,放弃B2B,只做B2C。

 

所谓B2B,即根据企业的具体需求定制AI,或是研发功能全面、可适用于绝大多数企业应用场景的AI。

 

由于大公司人力成本高,如果为企业定制AI,就像Waston健康做的那样,价格非常容易超出企业的预算范围。而如果研发功能全面的AI,在如今市场细分化、长尾化的背景下,显然不具有商业竞争力。

 

而B2C,即开发适用广大消费者的AI服务,以大公司的品牌效应来说是十分容易的。

 

那么对于中小公司来说呢?B2B是唯一的出路。中小公司尤其是创业公司,受到数据体量的限制,根本无法保证AI的准确度。而B2B项目,数据一般由客户提供,因此能够避免数据不足而带来的尴尬。

 

另外,中小企业人力成本低,也能降低企业的投入,是B2B里较有竞争优势的群体。


数据窘境


虽然很多巨头的数据体量都比较可观,但是这种可观也只是在具体的领域上。目前的各大巨头,都是主要依靠自己之前所收集的用户数据进行模型训练。

 

而医疗数据,因为其隐私性、敏感性,并不属于各类软件可合法采集的用户数据。所以,就算是互联网巨头,在这方面的产品研发上,也会因为数据不足而处处掣肘。



不仅如此,由于医学的复杂性,其数据的处理也需要拥有医学背景的AI专业人士的参与,这就产生了人才真空的地段,也进而导致巨头们对医疗数据处理效率和能力的低下。

 

就以肺炎为例,如果要让AI通过X光片检测哪些病人是健康的,哪些有肺炎,哪些有比肺炎更严重的疾病……这就需要通过以下原则判断:肺叶清晰的是健康人,肺叶模糊的是肺炎,肺部有圆形对称阴影的是尘肺……所以,必须要有专业的人工来进行标记。

 

只是身体上的一个部位,就有无数种可能的诊断,AI医疗的难度显而易见。


 

福布斯就曾经报道称,为了AI研发,Watson不得不雇佣专业的医疗咨询团队对数据集进行改进整理,既费时又烧钱。


读芯君开扒


数据窘境,将来会更显著


任何商品的落地,都会从追求市场面积逐渐转为追求市场深度。AI产品也一样。随着市场被瓜分地越来越彻底,长尾市场将成为商业竞争的重点,这也就意味着,是否精准定位长尾市场进行研发,成为了一个企业尤其是新兴企业能否生存的关键。


但是,长尾市场虽然前景广阔,但数据体量却较之浅层市场小很多,也就为AI的训练带来了更大的难度。


不仅如此,许多长尾市场的数据处理对处理人员的专业程度有着更高的要求。比如,企业需要研发一个办理离婚诉讼的法官AI,那么对于法律条文的解释就必须要有专业的、富有经验的法官来进行。而这在理论上,是难以达成的。


为什么呢?首先,数据处理师目前在行业的地位还处于最底层,所以缺乏对人才的吸引力。其次,数据处理需要一定的AI背景知识,更是提高了人才进入的门槛。


留言 点赞 发个朋友圈

我们一起探讨AI落地的最后一公里


作者:羊习习

参考文献链接:

http://www.tmtpost.com/3273012.html

如需转载,请后台留言,遵守转载规范


推荐文章阅读


择业避开雷区,教你识别靠谱的AI创业公司

如何在业余时间学习数据分析?

都在学AI,未来人才饱和了咋办?

小米8是黑科技?No,五彩斑斓的黑在这些手机里

想成为顶会论文大佬?这些捷径需GET

回顾 | ACL2017 论文集:34篇解读干货全在这里

学AI,如何挑选学校和机构?

学这些,本科不用转专业也可以搞AI

AI时代,大学生如何选择实习机会?

搞科研OR创业?快看看你适合哪条路!

国外牛校的AI专业竟然是这样的!

图灵大会 | 青年说:青年学者都在纠结啥?

图灵大会 | 最前沿:独角兽公司的大佬们都在谈些什么?

图灵大会 | 新观点:AI盛世,其实我们离得还很远

图灵大会 | 大咖说:哪些技术即将改变世界?

图灵大会 | 黑科技:这几大亮点,我一次性给你说全了

图灵大会 | 百度高级副总裁王海峰:未来搜索将无处不在

想从事AI行业,读研还是工作?

不想被AI淘汰?毕业前你需要打造三种能力

从零开始,带你编写AI程序

不懂Python ,照样能入AI圈!

还好我长得安全,是这个世界最不该说的一句话

Siri 傻傻听不清?教你DIY提升TA的智商!

这份向母亲示爱(AI)的礼物清单,比康乃馨强一万倍!

机器学习第一步,从向量和矩阵开始!

你是否对区块链一无所知

这年头,你连吵架都吵不过AI了……

什么?这个大数据比赛既有奖金还能提供工作?!


长按识别二维码可添加关注

读芯君爱你

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存