AI顶赛屠榜王、行业落地推手,旷视Brain++走向台前【星特写】
真核往往低调,但总会一鸣惊人。Brain++之于旷视,就是这样的真核。相比让旷视闻名天下的Face++,同样由旷视自主研发的Brain++此前出镜并不多。而最近,作为旷视赖以发展的大脑、中枢,甚至是旷视一切业务的基石,Brain++被推到了聚光灯下。
当地时间10月27日,国际计算机视觉大会ICCV 2019(International Conference on Computer Vision)在韩国首尔开幕。COCO作为ICCV 2019的重头戏,也是人工智能领域最具影响力的通用物体检测挑战赛。2017、2018年,旷视曾两度问鼎冠军。今年,旷视再次拿下COCO物体检测(Detection)、人体关键点(Keypoint)和全景分割(Panoptic)三项第一,取得了COCO三连冠的骄人战绩。
值得一提的是,旷视还以最具创新性的算法,荣获今年新设立的Best Paper Award(最佳论文奖)。另外,旷视也拿下了Wider Challenge 2019行人检测冠军和VOS 2019视频对象分割冠军。
旷视获奖证书@COCO 2019
继全球22项AI技术评测冠军之后,旷视又在ICCV 2019学术顶赛中勇夺5冠。背后的最大功臣正是Brain++。Brain++从算法设计、算法框架和算法平台三个方面为AI竞赛保驾护航,成为旷视这支常胜军的有力后盾。
而在刚刚结束的第六届世界互联网大会上,Brain++荣获“世界互联网领先科技成果”。旷视联合创始人兼CTO唐文斌出席大会并向外界介绍了Brain++。
人工智能算法从研发到部署是一套庞大的系统工程,目前业界普遍把深度学习框架作为算法开发工具,但是学习和使用成本高,难以规模化。究其原因,只有深度学习框架是不够的,需要拉通从数据到算力再到框架的端到端解决方案,人工智能时代亟需一个满足产业需求的操作系统。
唐文斌表示,“为了解决这个问题,2014年我们开始研发Brain++,它是一套端到端的AI算法平台,目标是让研发人员获得从数据到算法产业化的一揽子技术能力,不用重复造轮子也可以推进AI快速落地。我们的Brain++还引入了AutoML技术,可以让算法来训练算法,让AI来创造AI。”
和PC拥有多个操作系统流派一样,深度学习框架在全球也有不少种类。
如早先一代曾广泛使用的框架Caffe,是由加州大学伯克利分校学生开发的深度学习框架;诞生于蒙特利尔大学LISA实验室的Theano,于2008年开始开发,一度是非常有影响力的Python深度学习框架,但现在已停止开发。
目前流行的深度学习框架转向以计算图(Computation Graph)为核心的设计方向。包括2015年Google推出的机器学习开源工具TensorFlow,已成为目前最流行的深度学习框架。2017年,Facebook人工智能研究院(FAIR)团队在GitHub上开源了深度学习框架PyTorch……
而Brain++是旷视自主开发的深度学习框架,Brain++打造并部署后,开始成为旷视全员用来训练、部署算法的深度学习框架,完全自主,无需依赖第三方。
主流的开源深度学习框架和旷视自有的Brain++
旷视联合创始人兼CEO印奇在提交给港交所的招股书、“给投资人”信函中谈到:“深度学习是旷视的核心竞争力,也是支撑人工智能革命的关键。我们是全球少数拥有自主研发的深度学习框架的企业之一。旷视的Brain++让规模化算法训练成为可能。生成一种具体的算法并不难,但要创建几乎能自动生成众多算法的引擎绝非易事。”
印奇对Brain++进行了着重介绍:“深度学习框架Brain++作为一个统一的底层架构,为旷视的算法训练及模型改进过程提供重要支持。Brain++使我们得以构建一条不断自我改进、不断更加自动化的算法生产线。Brain++使我们能够针对不同垂直领域的碎片化需求定制丰富且不断增长的算法组合,包括很多长尾需求。此外,我们能以更少的人力和更短的时间开发出各种新算法。”
概括来说,Brain++是旷视自主研发的端到端人工智能算法平台,是具备大规模算法研发能力的时代工具,也是AI公司核心竞争力所系的AI中台。
旷视自研人工智能算法平台示意图
Brain++涵盖了深度学习算法开发的全流程。从数据的获取、清洗、预处理、标注和存储开始,到研究人员设计算法架构、设计实验环节、搭建训练环境、训练、加速、调参、模型效果评估和产生模型,到最终的模型分发和部署应用,Brain++为旷视的研发人员提供了一站式全流程的AI工程解决方案。
总体架构上,Brain++由三大支柱模块构成,分别是深度学习框架 MegEngine、深度学习云计算平台 MegCompute 和数据管理平台 MegData。
MegEngine:极致性能
MegEngine是Brain++的核心组件,是为开发者和研究人员提供开发的深度学习框架。这一框架主要用于旷视内部进行计算机视觉领域的算法开发工作,包括大规模的人脸识别、图像分割、姿态识别等。
MegEngine的整体架构
相比开源的大部分深度学习框架,旷视的深度学习框架MegEngine具有多种优势:运算速度快、内存占用少、易用性好、支持多种硬件平台和异构计算、训练部署一体化。
MegCompute:高效灵活
有了性能极佳的深度学习框架和全面的数据平台支持,Brain++也需要强大的算力支撑才能发挥完全的能力。深度学习框架的基础之上,旷视开发出了支撑整个平台计算的系统MegCompute。
MegCompute平台的整体架构
这是一个包括了硬件基础设施、数据存储和计算调度的平台。用于协助研究人员部署训练环境、设计训练流程、提供算力和资源分配服务、监控实验进程、提供可视化效果展示、管理用户权限、存储数据等。
MegCompute 从功能上,真正将旷视自研的深度学习框架扩展到了企业级别的系统服务平台,通过连接硬件、数据和深度学习框架,将构建深度学习模型的所有环节串联了起来。MegCompute 有以下几大特点:性能强大、全流程覆盖、弹性部署、用户友好、支持多种深度学习框架。
MegData:数据综合处理
构建模型也需要大量数据支持。MegData负责提供数据方面的服务,主要包括数据管理、数据标注、数据处理、数据安全。
旷视Brain++的核心组件MegData
旷视在研发过程中需要使用大量的图像数据,因此需要一个综合平台提供管理、标注、处理和存储安全相关的服务。旷视介绍,MegData可以提供完整的数据服务,为用户提供全流程解决方案。
相比于其他同类平台,MegData在数据层面为 AI 模型研究提供了安全、高效的数据存储和处理方式。同时,由于它是基于云的,具有很高的灵活性。最后,MegData补全了 AI 算法研发中数据处理的缺失环节,使研发人员不必花太多精力在数据层面,很大程度上提升了效率,节省了时间和研发成本。
在多次全球AI竞赛屠榜后,旷视Brain++多次引起竞争对手感叹:刀不如人炮不如人,没有办法。
Brain++的实力通过一个个冠军和落地产品得到验证,为其提供了强有力的底座支撑。一方面,Brain++具备多机训练方案,支持完备的底层算法,确保算法的高效实现与快速验证,这是支持旷视获胜的关键因素。另一方面,Brain++针对计算机视觉定制优化,有着独特的部署优势,适合工业界的产品开发,为竞赛技术的应用转化铺平道路。
Brain++系统凸显了旷视在技术开发上的三个趋势。首先,Brain++完全是自主研发的深度学习系统,涵盖了 AI 业务的整体流程。这说明旷视能够完全掌握核心的研发工具和平台。旷视 Brain++是为计算机视觉场景而专门研发的,这是一个以业务为导向的专业 AI 服务系统,因此旷视可以拿出很多精力,针对业务中的需求提出专门的解决方案,而新方法可以快速在实际应用中得到测试和验证,通过业务驱动框架的发展。
旷视希望用端到端的人工智能算法平台打造人工智能产业的生态底座,让开发者和企业获得从数据到算法产业化的一揽子技术能力,从而推进技术快速落地。
在商业化落地方面,旷视开发出全栈的人工智能行业解决方案,已实现对个人物联网、城市物联网和供应链物联网三大场景的赋能。未来,Brain++将有望通过开源开放的形式,推动全球AI技术进步和创新,加速AI快速落地。
比如在个人物联网中,智能手机的超画质使用:借助AI算法,让手机仅通过软件就可以完成原始图像一系列优化,解决夜晚和低光照环境拍摄痛点,呈现高画质数码相机成像水平。能用算法解决的问题,就不再堆砌硬件。
而该技术方案从无到有再到落地应用,完全基于Brain++。
对于这样的AI中台,旷视首席科学家、旷视研究院院长孙剑博士评价:
Brain++让规模化算法训练成为可能,并且可以针对不同垂直领域的碎片化需求定制出多元算法组合,避免重复造轮子的资源浪费。
也就是说,在旷视这座生产灵丹妙药的王国里,Brain++就是保证仙丹源源不断被制造的炼丹炉。
当然,算法、数据和算力优化,还只是Brain++的基本盘,作为一路引领中国AI创业的独角兽,旷视在Brain++上倾注心血,还体现在独特优势上:
针对视觉任务定制化优化:Brain++针对视觉任务做出了定制化的优化,使处理图像与影像更高效。经过优化的Brain++特别适合大量图像、视频训练及完成复杂的视觉任务,如图像分类、物体检测、物体场景分割、影像分析等。
配备AutoML技术:Brain++将深度神经网络设计、参数调整及设备适配等过程自动化,可显著降低人力成本并大幅提高开发效率,帮助AI企业构建出一条不断自我改进、不断变得更加高效的半自动算法研发产线。
2019年8月,科技部宣布依托旷视建设“图像感知国家新一代人工智能开放创新平台”。未来,旷视Brain++将通过开源,推动建立完善的AI产业生态,为打造自主可控的人工智能操作系统奠定坚实的基础。
相关阅读: