查看原文
其他

高通855集成ISP是什么鬼?你真的了解计算机视觉吗?

木易 机器人文明 2020-01-17

关注我们,思考像钟摆,永不停歇

 

计算机视觉一直是AI最为热门的通用技术。如果不够了解其它技术,可能会误认为AI就是指计算机视觉。但即便如此火热,我们真正了解计算机视觉究竟是什么吗?

 

什么是计算机视觉?


当然不是百度百科上“研究如何使机器‘看’的科学”可以概括清楚的。下面,我们从它与人工智能的关系、构成,主要发展历史和技术等方面,来看看究竟什么是计算机视觉。

 

与人工智能的关系:计算机视觉和NLP一样,也是AI的核心通用技术之一。自然语言处理通过声音或者文字获取和处理知识,计算机视觉则是通过图像进行识别。就和人类对外界的学习需要看到一样,计算机视觉对于机器学习起到了“输入”的作用。

 

 

计算机视觉的构成:计算机视觉所涉及的学科,除了计算机科学,还包括模式识别、图形处理、心理物理学、神经生物学,以及人工智能。其中,在人工智能赋能下,计算机视觉初步具备了类似人类对图像的特征进行提取、分类识别等的感知和认知机理。

 


感知和认知的关系:感知和认知是两种技能,推理和决策是典型的认知过程,是认知的重要组成部分,它们之间是包含关系,不是平行关系。

 

硬件组成:一个典型的计算机视觉系统的硬件组成包括光源系统、图像捕捉、图象数字化模块、数字图像处理模块、智能判断决策模块,以及机械控制执行模块六大部分。

 

 

主要发展历程和技术:1982年,马尔《视觉》问世,标志着计算机视觉成为一门独立的学科。三十多年来,经历了四个主要发展阶段:马尔计算视觉、主动和目的视觉、多视几何与分层三维重建和以神经网络为代表的机器学习的视觉。主要理论包括:计算理论、表达和算法、多视几何,以及分层三位重建等。近年来,和深度学习的结合让计算机视觉得到了快速发展。

 


与深度学习的结合:与NLP被赋能一样,深度学习也被用来“取代”计算机视觉中的传统方法。具体呈现出以下特点。两者相互赋能后,呈现出如下特点。

 

 

基础层架构:计算机视觉赋能各个行业,包括华为海思、联发科、英特尔旗下Movidius、高通等纷纷推出了视觉芯片。视觉平台上,有Facebook、字节跳动、极视角等公司。

开源框架:计算机视觉需要完成的主要任务包括图像理解、三维视觉和动态视觉。随着该领域的蓬勃发展以及人员数量的快速增加,开源框架有从独立的算法实现向平台和社区化发展的趋势。

 

应用领域:目前,应用到计算机视觉技术的领域主要包括人脸识别、文字识别、医疗影像、三维图像视觉等识别类,以及在识别基础上进行的图片分析、图像及视频编辑、工业视觉检测等分析处理类。


落地场景:在落地上,主要有九大场景。其中,智能家居比较热门的应用包括智能门锁、智能机器人、智能摄像头等;智慧交通的应用主要包括车辆身份特征识别 、车辆的比对、交通视频的分析应用,以及无人驾驶和汽车辅助驾驶;在工业领域,计算机视觉的应用包括引导和定位、外观检测、高精度检测,以及识别等。目前,家居、交通、工业是计算机视觉落地最主要方向。

 

 

CV-ISP:高通最近发布的骁龙855,最大的宣传点是“内建高通Qualcomm Spectra 380 ISP”,集成了大量硬件加速的计算机视觉(CV)能力。什么是ISP呢?主要指图像信号处理,主要用来对前端图像传感器输出信号处理的单元,以匹配不同厂商的图象传感器。

 

 

通过以上功能,ISP可以处理出更好的图像效果,因此在智能手机特别是在高端手机上对ISP的要求很高,比如开始集成双通道甚至三通道的ISP。一般来说ISP是集成在AP里面,但是随着需求的变化也出现了独立的ISP。

 


计算机视觉独角兽


作为通用人工智能技术,计算机视觉也是盛产独角兽的领域。这波浪潮从2010年之后开始,在2012年ImageNet比赛获得极大进展后掀起高潮。无论是国际,还是国内公司,学院派、国家队、市场派都纷纷兴起。经过数年的发展后,当年的初创公司不少已经发展为如今的独角兽。它们的共同特征是:以技术为主基因,面对巨大蓝海市场,获得市场极大关注,吸引了大量融资,产品尚未成熟。下面我们分别从国际和国内了解下这些独角兽公司:

 

国际

 

Clarifai

  


Clarifai最初为业界熟知,是在2013年的ImageNet上。2012年,时任多伦多大学教授的 Hinton展示了DeepNet算法,超前的准确率引起了轰动。效应是显而易见的,2013年的该项比赛,前三名全部被深度学习方法的系统包揽,其中,Matthew Zeiler 和他刚成立的 Clarifai成为冠军。

 

就这样,Clarifai一直以高准确率保持着领先优势,并在2015年初宣布,自己的人工智能系统已经可以从视频中识别信息。目前,其产品应用包括图像识别、颜色识别、图像分析、图像检测等。

 

 

除了技术领先外,Clarifai和高通的关系颇为密切。其B轮融资的领投方之一便是高通。

 

Blippar


 

Blippar 最早是因为 AR 广告成名,通过与一些著名大品牌合作推广电影被外界熟知。用户在下载 Blippar 应用后,可将手机摄像头对准产品,就可以获取有关产品的更多内容并能与之互动。

 

此外,公司推出了多款基于视觉定位系统的导航应用,去年推出的AR City,原理是使用手机镜头识别用户的定位。据官宣,其定位结果比GPS还准确,而且支持三百多个城市。

 

 

尽管看似市场前景良好,成立七年来数轮融资过亿,最近一笔融资在今年9月,获得由Candy基金和高通基金投资的3700万美元。但因为一直处于烧钱模式,连连亏损,目前股东内部就是否投继续投资该项目出现争议,接下来的多轮谈判将决定公司存亡,如果股东最终决定不再投资,Blippar将不得不走向破产清算。

 

EYeEm

 


关注手机摄影的朋友大概听说过 EyeEm 摄影节,这是一个基于移动摄影平台的年度大赛,比赛主办方便是来自德国的视觉公司EyeEm。

 

公司主营业务包括可视化的搜索引擎,以及交易平台Marketplace。在可视化搜索引擎上,名为EyeVision的技术能够自动扫描图片,并根据每张图片中可感知到的人物情绪,给他们附上某些关键词,从而让网络搜索图片更加容易。

 

 

成立七年来,公司主要获得了两笔融资,分别是2013年获得Earlybird Venture Capital等投资的600万A轮,以及2015年获得由Valar Ventures1800万美元B轮。

 

Prophesee


 

在神经视觉系统设计上,Prophesee以革命领跑者自居。公司提出基于事件的方法进行传感和处理的仿生视觉技术,但该技术一直被认为与传统机器视觉有实质性差异,处于危险的“超前期”。

 

Prophesee的第一款参考设计用在VGA分辨率应用,由Prophesee提供基于异步时间的图像传感器芯片和软件算法。

 

 

据公司CEO Luca Verre介绍,像人的眼睛和大脑一样,Prophesee的视觉系统依赖场景动态学,基于新方案,可以让人与机器和谐共存,在自动驾驶的情况下可以100%的避免事故,在那些需要永远打开的监控系统上也可以实现很高的安全性和效率,无人机也可以以一种近乎直觉的方式避免碰撞,及时速度很高。”

 

过去四年,Prophesee获得了总计四千万美元的融资。


Magic Leap

 


Magic Leap是一个类似微软HoloLens的增强现实平台,主要研发方向是将三维图像投射到人的视野中,但是它的研发技术目前依然处于绝密状态。 

 

今年8月,Magic Leap首款产品Magic Leap One创造者版本发售,虽然售价2999元,低于微软的HoloLens,但也非常之昂贵。除此之外,2015年,Magic Leap还发布过一段增强现实第一人称射击游戏视频。

 

 

该公司比产品更为业界所知的,是多轮二十多亿美元的融资,2014年,Magic Leap获得由谷歌和高通领投的5.42亿美元B轮融。此后四年间,又分别获得了8.27亿、7.935亿,以及4.61亿。据公司创始人表示,筹集资金不仅是为了推出Magic Leap One,要打造一个完整的开发和工厂操作来构建空间计算系统。



国内

 

商汤科技



商汤科技和Face++都是计算机视觉界的学院派,成立之初,汤晓鸥实验室的多名博士加入商汤,成为最早的创始团队成员。目前,商汤科技的核心团队由两大部分组成:一部分是来自麻省理工学院、香港中文大学、清华大学、北京大学的博士、硕士;另一部分则是来自微软、谷歌、联想、百度等相关领域的从业者。

目前,商汤科技的主要产品包括人脸与人体分析技术、通用与专业图像识别、海量视频理解与挖掘、图像视频处理增强、SLAM与3D视觉、SLAM与3D视觉、无人驾驶系统,以及深度学习平台等等。

 

 

今年,商汤科技在六个月之内连获两笔巨额融资,分别是6.2亿美元和10亿美元,加上创立之后的数次融资,累计超过18亿美元,这些让其以60亿美元估值坐上视觉独角兽头把交椅。

 

旷视科技

 


去年,旷视科技联合清华大学、交叉信息研究院联合成立了新的人工智能研究算。同时,姚期智受聘旷视Face++研究院首席顾问。事实上,这次受聘并非巧合,旷世的几位创始人都从清华姚班毕业,创立Face++后,导师回聘。

 

目前,公司的产品主要分为云端和终端,其中云端包括人工智能开放平台、FaceID在线人脸身份验证平台。此外,推出端到端智能安防产品及解决方案、行业物联解决方案、移动端 AI 解决方案、零售行业 AI 解决方案,以及智能仓储物流解决方案。

 

 

虽然没有商汤科技融资额度和频次高,但到目前从天使轮至C轮也分别获得了四次。值得一提的是,2018年4月,旷视全资收购艾瑞思机器人,标志着除做视觉通用技术外,也开始进入智能机器人业务。

 

依图科技



虽然在名气低于商汤和旷视,但依图也是来势凶猛。创始人朱珑是UCLA博士,林晨曦则是前阿里云计算知名专家。不仅获得过阿里旗下云锋基金的融资,也携手华为共建智慧警务云解决方案。

 

 

 

目前,公司的产品解决方案主要基于视觉,应用于智能安防、医疗、金融等场景,客户包括公安部、中国边检、华西医院、同济医院、招商银行,以及京东金融等。除了视觉,今天公司猝不及防的宣布进军自然语言处理领域,NLP又增加一家独角兽分食。

 

成立六年来,依图总计获得了五轮融资,除了3.8亿元C轮人民币融资之外,今年6、7月分别获得2亿美元和1亿美元C+轮融资,被市场认可度可见一斑。


本文由“机器人文明”出品

转载请注明出处



长按二维码加公号,留言微信号,入群“AI大爆炸”


往 期 精 选 


中国未来二十年,就靠人工智能了?
一文尽观英伟达、谷歌… 2018 决战AI芯 !NLP黄金十年开启!一文了解最全产业图谱
AI薪酬起底:百万年薪被平均后还剩多少?AI+教育,你家Python从娃娃抓起了吗?


 

我是广告:欢迎给“机器人文明”投稿~

好文请投:tougao@gsi24.com

— 完 —


机器人文明 服 务 内 容


广告投放 | 政府招商 | 产业报告

投融资 | 专家咨询 | 人才服务 | 论坛策划

↙合作需求,请点击“阅读原文”联系我们

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存