查看原文
其他

商汤(现在)是一家怎样的公司?

2017-08-17 专注报道AI 量子位
李根 发自 清华科技园
量子位 报道 | 公众号 QbitAI

 刚完成B轮4.1亿美元融资的商汤科技

刚宣布4.1亿美元B轮融资的商汤科技,是一家令人熟悉又陌生的AI公司。

人们在他单轮巨额融资时议论,在他科研论文刷屏CVPR时议论,在ImageNet五项比拼三项夺冠时议论。但又鲜有“编外”人员准确贴切地给商汤一个定义,这真是一家“人尽皆知”而又距离感明显的公司。

为了讲清楚商汤现在是一家什么样的公司,薛音在北京清华科技园的办公室里耗费了半小时。在不超过20平的展厅内,这位代表商汤讲解业务的员工不仅需要“说”,还要“动”。

 薛音展示SenseAR应用

每一个小型业务展示台的相同标配是摄像头和屏幕,摄像头记录薛音的一言一行,屏幕相应做出实时反馈。

不同则是反馈的表现和目的,有的是为了识别,有的出于动态追踪,有的用于娱乐比颜值,有的则让直播网红们通过手机交互就能更炫酷一些,比如主播动手比个心,屏幕就真的出现了爱心——你或许不陌生,但多半不知道原来微博直播等背后的技术提供方是商汤。

所以商汤究竟是一家怎么样的公司?

从现有业务上看

在这场搜狐科技组织的观察活动来看,至少我们不难知道商汤正在做什么,每一个小展台都是一项具体落地业务的直观展示,可以归结为四大模块:

第一是软件的、系统的应用,如监控视频实现智能分析,主要应用在安防领域。

在目前落地的业务中,人脸布控、视图情报研判、人脸比对和视频结构化服务等成为落地重点。

商汤联合创始人杨帆还举例说,比如在成都太古里等密集商圈,商汤的智能视频分析技术,已经在帮助警察减轻反扒压力,并且具体作用不止于案发后对比追踪,更在于实时甚至是事前的研判预警。在此应用中,人脸识别、动作行为检测、人群分析,合理布控等技术被综合集成使用。

 商汤智能视频分析应用展示

第二是偏软硬件一体的智能前端设备应用,涵盖人脸识别闸机、身份验证一体机、商户娱乐营销使用的互动广告机之类的软硬件落地业务。

第三则基于智能手机,这也是目前商汤最容易被“视而不见”的落地业务。小米、OPPO、vivo,华为等智能手机中均已纷纷上马。比如拍照时的人脸监测、相册相片的智能归类、美肤美颜,以及OPPO等宣传广告中铺天盖地的双摄解决方案。

实际上,第四项业务与智能手机也密不可分。不过这项名为SenseAR(增强显示感绘)的技术之所以被单独列出,一方面原因是核心技术上,最近商汤把人脸关键点定位技术从106点,提高到240点;另一方面则是因为该技术最为“亲民”,在FaceU、美图、一直播、小咖秀,熊猫直播等火热的视频类App中,AR交互基本源自该方案。

此外,还有一些基于识别的身份验证和文字识别技术相关的业务,它们更多被落地在金融相关的业务场景中,构成商汤400多家B端合作方的一部分。

不过通过以上四大主要业务模块,只能定义商汤的此时此地此身,这或许还不是全部。

从即将进入的领域看

在B轮4.1亿美元的官宣消息中,商汤还宣布将进入自动驾驶领域,这无疑为已经火热不已的无人车行业又添了一把火,不过具体如何进入、进入多深,期望如何,商汤并未展开。

在此次采访中,商汤科技创始人及CEO徐立向量子位给出了回答。

徐立说,商汤在自动驾驶方面的开拓进展,会和OEM厂商合作来进行。

他解释了具体原因:首先,现今无人车行业可以大致分为三大群体——1)做地图,无论是3D地图还是高精度地图;2)整体运营车辆及其部署;3)OEM厂商。

在这三大方向上选择,徐立认为当前最稀缺的资源在于OEM厂商,他们拥有在数据收集方面的绝对优势。比如完全以商汤自主来做,造1万辆车,全部上路收集数据,不谈可能性可行性,也已经看到极限。但OEM厂商,比如上汽一年出货量400多万,每台车上收集一个数据,就已经相当于商汤1万台车做400年……

所以在徐立看来,与车厂的结合是更高效更现实的方案,商汤在自动驾驶领域会结合双方优势,采取与OEM厂商合作的模式,无论是ADAS还是L4以上的完全无人驾驶,只要OEM厂商想做、能做,商汤都会在技术方案模块上去参与。

徐立最后还强调,与OEM厂商的合作,可能是将来自动驾驶实现的必由之路。

另一新领域将是零售。

在商汤现有的展示中,已然可以看出他们利用智能视频分析,把宜家等商超里的视频变成结构化数据,形成了分析和辅助决策的方案模型。

商汤方面透露称,零售方面具体的、落地的合作将在不久后宣布,他们的目的非常明确,即利用视频分析能力,结合线下零售场景,让线下商超具备精准营销和定向挖掘反馈的能力。

这还不止于线下零售。

徐立以近期火热的电视剧《我的前半生》为试验,在视频画面中,每一个物体,不论是茶杯、衣服、西装,只要出现,都被识别。然后进一步赋予链接也变得顺其自然。

在这位商汤创始人看来,这会让整个电商增加一个全新的空间,诸如阿里京东一样的电商公司,会在现有的规模上发挥更大效应和累积。

当然,自动驾驶和零售也不会成为商汤的业务边界。在被问及商汤的计划时,徐立给出了答案。

这位商汤创始人说,商汤科技想要做的事情,本身在打造一个人工智能为核心的底层架构,可以和很多垂直行业进行结合,在结合过程中,需要结合各个合作伙伴,把应用场景定义清楚。

所以商汤科技未来会展现出怎样的业务?某种意义上是从个人的芯片到端,手机社交,再加上家居商业,再到整个城市的链条,提供驱动行业发展的AI方案及模块。

 商汤科技创始人及CEO徐立

商汤=1+1+X

除了直观表述,徐立甚至给还出了公式。他认为“1+1+X”就是商汤。

其中,“1”代表商汤科技本身,包含商汤的所有技术和能力;“+1”表示与产业进行结合,实现产研一体化;“+X”则意味着技术赋能。通过三者作用,实现产业的效率、效益和价值最大化。

如果按比喻来说,徐立认为商汤科技是卖深度学习的“乐高积木”,而且这个积木会通过与合作伙伴的联合,有更为明确的落地应用,可以搭无人车,可以搭人脸闸机,而商汤通过这套积木,就能卖很好的价钱,恰如特斯拉的自动驾驶模块——有需求就额外付费使用。

但说易行难,这种直接掏钱使用的价值模块,不仅要好用,还能持久,这对创立刚满3年的商汤不可谓不是挑战。

徐立回应称,这也是B轮4.1亿美元最核心的用途所在。他认为归根结底,商汤的核心竞争力现在基于三方面。

首先是垂直行业的结合与延伸,可以不断丰富产品线,实现公司的商业运转和进一步创新。

其次是基础核心应用平台。自创立以来,商汤出现在大众印象中的公司图片是一间服务器机房,这实际是商汤耗时费力后搭建起的深度学习专用的高性能GPU集群,也是商汤各类AI系统的基础层面的保障。

在这间机房里,拥有近3000块英伟达的GPU计算芯片,共有4个GPU集群。目前,如此规模的深度学习计算平台算得上全球罕见,也是商汤巨额融资背后的原因之一。

徐立告诉量子位,他们内部常调侃称,这样的平台上调整一次参数后出结果,就能耗费50万,而按照现在公司120名博士数目来计,每天按下的“按钮”——其实就是点击鼠标,都是大额支出,而且这也会是常态。不过徐立也表示,也是由于这些支出,保证了商汤跑得更快,技术护城河更深更厚。

最后也是最核心的竞争力,是人才。这位商汤创始人称,公司创立之初的18位教授和120位顶尖博士,正在产研结合中成为“导师”级人才,商汤未来更多会从学生中挑选,让导师带队,培养起自己的人才梯队,并打造真正的可持续的造血机制。

 商汤科技创始人徐立、联合创始人杨帆

OMT:商汤心得:从学术界到工业界的建议

最后,作为从学术界到工业界的创业代表,商汤也向我们分享了相关看法:(综合了商汤科技创始人徐立和商汤联合创始人杨帆的观点)

从学术圈出来,很多人喜欢做命题作文,学术圈一定要成为某个行业的世界第一,才能发表出好的文章。在学术的概念当中,你一定要解决现有存在的问题,然后来做。甚至可以从现有的问题,把这个范围不停的缩小,缩小到这个范围不能再缩小为止。

比如我们以视觉为研究对象,而视觉里一个比较有意思的就是跟踪,就是通用的物体跟踪,我跟踪一个物体,结果发现全世界有100名顶级学者,你要做到世界顶级第一,你相对比较难,因为你要超过100个人。

其中研究更细分的利用视觉技术把物体变形,也有50个人来做,要成为50个人里面第一还是很难。

于是更细分,可以解决半透明的物体跟踪,全世界只有十个人干,相对竞争少了一些,但是要做全球第一还是有难度。最后,你可能研究的论题就变成了一个热的、非钢体的半透明的物体,全世界只有你一个人能做,然后你发表一个论文。

最后不难发现,在命题情况下,只能缩小它的应用范围,使得这个应用范围在切实情况下最终落到一个实际的点来实现解决。

然而,工业界完全不是这样的,工业界要有一个实际运营场景,我要解决开水放在这个透明玻璃瓶里。我要解决我家猫的动作跟踪,而且这个猫的动作可能牵扯到非常多的变化——光线的变化,皮毛的变化,于是你需要重新定义这件事情,不管是从猫的四肢开始解决,还是猫的脸开始解决,或者是整个猫的部分开始解决,这个问题的重定义,会变得非常关键。

然后在解决过程中,还需要把问题拆解称若干步骤,最后再拼接、落地应用,而且要高效、性能消耗合理。

大家看商汤的很多产品,比如SenseFace,其实就是人脸识别——这可能只是表象。你光讲一个人脸识别,在非场景中怎么去做人脸识别?这个事情可不可行?在实际的抓逃中,就会产生场景问题,所以我们还需要对模糊增强、比对,最后一系列技术问题解决后,才能只展现一个人脸识别系统。

看起来简单直白的场景应用,背后可能牵涉到一个系统的工程,涉及无数小问题和小方案,在工业界,研究和工程是并行的,无法分割,而对问题的重新定义,优先且最关键。

活动预告

加入社群

量子位AI社群7群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot2入群;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进群请加小助手微信号qbitbot2,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存