查看原文
其他

阿里重磅发布首款芯片,性能高出同行40%,华为不再孤单!

1


9月25日阿里巴巴一年一度的云栖大会正式开幕,早上 8 点钟不到,会场外早已人头攒动。杭州市人民政府副市长柯吉欣表示,今年云栖大会的参会嘉宾超过八万人。进入主会场后,格子衬衫成了会前一道亮丽的风景线。



云栖大会现场,阿里巴巴集团CTO、达摩院院长张建锋向全场展示了含光800——阿里巴巴的第一款芯片,也是全球性能最强的AI芯片,主要用于云端视觉处理场景。


张建锋2004 年加入淘宝,担任首席架构师,此后一直在淘宝工作,阿里巴巴集团合伙人之一。现任阿里巴巴集团首席技术官(CTO)兼任阿里云事业群首席技术官(CTO)、中台事业群总裁、集团技术战略执行小组组长,2018 年 11 月 26 日阿里组织架构调整之后,张建锋兼任阿里云智能事业群总裁,向阿里巴巴集团 CEO 张勇汇报。



2


2017年云栖大会上,阿里成立达摩院,这是阿里在全球多点设立的科研机构,立足基础科学、颠覆性技术和应用技术的研究。达摩院由全球建设的自主研究中心、高校联合实验室,全球开放研究计划三大部分组成,涵盖量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、下一代人机交互、芯片技术、传感器技术、嵌入式系统等,涵盖机器智能、智联网、金融科技等多个产业领域。


平头哥得到达摩院和阿里云的软实力加持,基于达摩院的算法能力,才能打破了算法和硬件之间的鸿沟,基于阿里云飞天云平台的优势,得以快速推出芯片含光800。



含光之名,依然沿袭平头哥传统,为《列子·汤问》中孔周三剑之一,被誉为上古第二神剑,该剑含而不露,光而不耀,正如含光芯片作用方式——无形却强劲的算力。



在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。



在杭州城市大脑的业务测试中,1 颗含光 800 的算力相当于 10 颗 GPU。含光 800 已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要 40 颗传统 GPU,延时为 300ms,使用含光 800 仅需 4 颗,延时降至 150ms。



这也是平头哥在发布高性能玄铁910处理器和一站式设计平台无剑SoC之后,在AIoT领域的又一大动作。以数据横向对比,含光800展现性能,是英伟达最新T4 15倍,是应用最广的英伟达P4的46倍——超过去年设计之初吹下的“牛”。



这是阿里里巴巴第一次使用了自己的一套硬件架构,也是互联网公司研发的第一款大芯片。含光 800 的发布意味着,今天的阿里巴巴已经有能力做传统硬件工程师可以做到的。借助一直以来强大的软件能力,阿里巴巴进化了不到一年半的时间就完成了含光 800 的研发并成功流片。


平头哥的目的并非是卖芯片,平头哥还会延续了母体阿里巴巴集团“让天下没有难做生意”的愿景,开辟了全新的商业模式,即平头哥模式(以无剑平台为核心),为企业提供普惠算力。


另据介绍,针对AIoT市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难去适应未来的需求,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。


3


含光800也已经实现了大规模应用,应用于阿里巴巴集团内多个场景,例如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。同时,阿里云作为全球前三的云服务提供商,含光的能力将通过云服务对外提供。张建锋现场宣布,基于含光800的AI云服务也正式上线。


不仅如此,平头哥还在研发用于阿里云神龙服务器的SoC专用芯片。未来,阿里还将进一步完善产品形态,推出包括云端AI训练芯片和终端AI推理芯片,满足更多场景的算力需。


云栖大会现场演示了该芯片在交通状况识别及拍立得商品识别上的两个具体应用。


1.交通状况识别


以杭州城市大脑实时处理1000路视频为例,过去使用GPU需要40块,,单路视频功耗2.8W;使用含光800仅需4块,单路视频功耗1W;



上图是杭州交通状况的视频,含光可以在极短时间内对车的路况做出及时准确的识别,只需要用到以前1/10的硬件就可完成通用GPU能够完成的任务!


2. 拍立淘


拍立淘商品库每天新增10亿商品图片,为了让用户快速从海量图片中精准搜索到商品,需要强大的计算力支撑,使用含光800搜索效率可提升12倍,时间从传统通用GPU的1小时缩减至5分钟。



张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。



4


在杭州云栖大会期间,也谈到了阿里芯片的下一步。随着含光800发布,平头哥已集齐了全栈芯片家族:


  • 基础单元处理器IP,C-Sky系列、玄铁系列,为AIoT终端芯片提供高性价比IP;

  • 一站式芯片设计平台,无剑SoC平台集成CPU、GPU、NPU等,降低芯片设计门槛;

  • AI芯片,含光800通过AI云服务为AI场景提供高性能算力。



这三大产品系列,初步完成了平头哥端云一体的芯片生态。


而接下来,平头哥产品形态,重点将是云端AI训练芯片、端上推理芯片,以及用于阿里云神龙服务器的SoC专用芯片,以满足更多场景的算力需求。


此外,平头哥芯片初步软硬件闭环实现,阿里巴巴在芯片、云和AI三大业务之间的协同关系,也雏形初现。


从时代趋势而言,三者原本就是三位一体,AI算法逐渐集成到芯片,集成算法的专用芯片能为云服务提供了更强的性能,而云计算本身则加速了AI应用的大规模落地。


5


华为正在将自己的“备胎”转正,并宣布将生产更多的麒麟芯片出来时,阿里也在华为研发大规模主干道芯片之外开辟了另一条道路:从底层颠覆行业格局的路。


两家中国最伟大的公司在自研芯片领域分别用自己的方式有力地呼应着这个伟大的时代!



而阿里定制的RISC-V架构、华为研发的鸿蒙系统,如果都能适配到全国数以亿计的手机和电脑中,这本身就是全世界最大的、最丰富的生态系统。


到时候,ARM、英特尔、谷歌们不仅不能像之前那样随心所欲地卡我们的喉咙,还不得不跟着我们的节奏跳舞,融入到我们的生态体系之中。


最后平头哥由来的一些引申阅读:


有一句俚语,非洲乱不乱,平头哥说了算。平头哥是一种动物,学名蜜獾。由于脑袋是平的,并且头顶有一撮白毛,像极了一个剪了平头又做了挑染的人,所以又被叫做平头哥。


在生存竞争激烈的非洲大草原上,蜜獾属于无法被忽视的动物,其无所畏惧,虽然身材短小,但面对任何敌人,从来都是直接动手,并且主动攻击。


坚持与皮实,蜜獾在和对手进行搏斗的时候,持久力非常恐怖,打一整天是常有的事情,一定要打出一个胜负。


最后就是聪明和合作,蜜獾是少见的懂的利用工具以及和其他生物配合的动物。

﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌

免责声明:内容整理自网络,版权归原作者所有,如涉及作品版权问题,请及时与我们联系,谢谢!


你可能错过的往期精彩内容:

1、iPhone 11 Pro 拆解:4G LTE提速13%,用的却还是Intel基带

2、这年头做硬件工程师没前途?不存在的,那是你不懂硬件设计!

3、单片机or嵌入式,傻傻分不清楚?

4、华为基站拆解曝光:CPU、信号传输究竟用的是什么配置?

5华为Mate 30与iPhone 11狭路相逢,“浴霸”、“奥利奥”你选谁?

你和大牛工程师到底差了啥?

加入技术交流群,与高手面对面

添加发烧友小助手入群

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存