先获顶会冠军,再创数千万销售,湃方科技凭借自主边缘AI芯片创造工业物联网新机遇丨BV Family
以下文章来源于雷锋网 ,作者包永刚
创业从来都不是容易的事情,特别是芯片领域的创业鲜有成功者。不过,有这么一个创始成员都来自清华的创业团队,以Sticker AI芯片为核心,提供从硬件到算法到平台的全栈式AIOT解决方案,创立仅一年就获得了中国石油、中国石化、山东双轮等行业客户的支持,销售业绩达到数千万。这家公司名为湃方科技,BV在2018年对其进行了天使投资。 湃方科技还曾获2019低功耗电子与设计国际研讨会(ACM/IEEE International Symposium on Low Power Electronics and Design, ISLPED 2019)设计竞赛奖第一名。
内容转自雷锋网对湃方科技的报道:
01 2018年资本寒冬创立
湃方科技成立于2018年9月,从外部大环境来看,湃方的成立不仅没有赶上2015年左右的AI芯片创业热潮,还遇上了2018年的资本寒冬。这对于需要大量资金长期支持的芯片创业来说,并不是好消息。
虽然面临全球不容乐观的局面,但国内的局面对湃方的成立带来了机会。一方面,在经历了中兴和华为事件之后,国内对于芯片的关注度陡然升高,政策和资金都支持芯片产业的发展。同时,2015年左右创立的AI芯片初创公司们正面临芯片落地的挑战。另一方面,国内工业互联网的热潮也开始兴起,政策也在大力支持。
从2014年就开始研究AI芯片的湃方创始团队,到2018年已经迭代了7款芯片。显然,湃方成立就赶上了AI芯片落地的热潮,同时还遇上了工业互联网的广阔市场。
这样看来,湃方也创立在了一个好的时间点。湃方科技联合创始人、CEO武通达接受雷锋网专访时表示,“在2015年左右,AI芯片才刚刚起步,我那时候更多的注意力还是跟随我的导师,也是现在湃方科技创始人、首席科学家刘勇攀在探索技术上的深度。创业是一个探索技术和应用的结合的地方,那时候我还不够敏感。”
湃方科技联合创始人、CEO武通达
武通达以优异的成绩进入清华大学电子系,本科、研究生、博士都跟随清华大学电子工程系电路与系统研究所所长、博士生导师刘勇攀教授。刘教授团队从2014年开始AI芯片的研究工作,遵循“非规则化稀疏-规则化稀疏-稀疏量化协同”的技术路线,在2016年发布了Sticker系列的第一个研究成果。2018年又相继研发了Sticker-I、Sticker-T等芯片,在芯片推理的能效上实现了巨大突破。
到2018年他们已经连续迭代了7款芯片,并且每次都完成了流片测试和验证。
作为AI芯片的研究者,武通达显然更加深切地感受到了AI以及AI芯片的热潮。既然有了Sticker系列芯片,并且芯片不断取得突破,2017年又遇上了边缘端AI芯片的落地热潮,武通达开始思考如何把研究成果与实际的应用相结合。
他想到了AI芯片与工业的结合,作为黑龙江大庆人,武通达了解到我国传统油田的生产流程在很长的一段时间内存在设备管理困难、过于依赖人工、无法进行预测性维护等难题,这些问题不但导致企业运转效率低下,也使得运转成本异常高昂,大量国有资产被浪费。
有意思的是,生长于石油城辽宁盘锦的清华大学博士后的马君与武通达有着惊人相似的经历。马君有着7年的算法研发经验和4年的工业实践经验,曾任阿里巴巴达摩院决策智能实验室算法专家、中国石油地球物理公司数据科学家。
最终,2018年武通达、马君和刘勇攀以及一众清华大学电子系志同道合的战友,成立了湃方科技,目标是用AI技术推动我国工业智能化升级。虽然在资本寒冬成立,湃方受资本寒冬的影响并不是很大,因为那时候芯片在国内的热度不降反升,同时,政策也在推动工业互联网的发展。
成立仅两个月,湃方就完成了天使轮融资,由BV百度风投领投,经纬中国、策源创投、华控基石跟投。
02 核心竞争力——Sticker系列AI芯片
AI芯片的创业想要获得资本的认可,技术独特性非常重要。前面已经提到了湃方的AI芯片技术路线,从这个技术路线,也就能容易理解Sticker系列芯片的优势。“量化是一个早期的神经网络芯片优化技术,后来我们发现其实神经网络有很高的稀疏性,这意味着很多计算的可以约减,这样可以提高性能并降低功耗。但我们最早采用的是非规则稀疏的技术,这种方法可以识别网络中不同零的位置,然后进行加速。”武通达解释。
“这种方法虽然提高了性能,但硬件复杂度比较高。我们继续对这个算法进行分析,发现可以牺牲一部分不那么规则的稀疏,实现结构化稀疏的同时不降低计算精度,这样就可以大大减少硬件的复杂程度。”
经过不断地深入研究和迭代,2018年Sticker-I神经网络加速器芯片发布,用统一的芯片架构高效支持了不同稀疏度的神经网络运算。Sticker-I通过动态配置人工智能芯片的运算和存储电路,实现了对不同稀疏度神经网络的自适应处理,大幅提升了人工智能加速芯片的能量效率,也是首款全面支持不同稀疏程度网络,且同时支持片上网络参数微调的神经网络加速芯片。
如何理解?用图像处理来做一个容易理解的解释,神经网络的第一层输入的图像,包含大量的信息,没有办法进行剪枝,为了保证性能不下降,就需要用稠密的方式计算网络,在稀疏的网络层,再采用稀疏的方式计算网络。这其中的突破在于,Sticker-I能够根据输入情况灵活的配置芯片,灵活调整计算方法以及用高效的接口设计去适应这种调整,这也正是湃方的核心技术。
武通达介绍,Sticker-I芯片在65nm工艺下,取得62.1TOPS/W的峰值核心操作计算能效,并发表在2018年国际超大规模集成电路峰会(Symposia of VLSI Technology and Circuits)。
Sticker-I之后,研究团队针对具有规则化稀疏特点的神经网络,利用算法-架构-电路的联合优化,提出了基于变换域的通用神经网络计算芯片Sticker-T。Sticker-T提出了一种全部并行局部串行的高效FFT处理器架构,这种方法有点类似传统的FFT,将时域变到频域,经过一次变换域后,计算的复杂度和存储的复杂度下降了,但需要考虑如何让变换域计算架构更适合深度学习的神经网络,所以还需要进行更精细的设计。
当然,团队还提出了一种二维行列可交换的数据复用计算阵列架构,这种架构能够增加数据计算并行度以及数据动态位宽的支持。另外,在做变换域计算的时候,输入和输出的行列并不统一,正常应该有一个矩阵转制的操作,团队研发了一种基于6T SRAM的行列可交换的存储器,可以极大降低转置操作的资源和时间开销。
经过联合优化,Sticker-T 相比于之前的Sticker芯片在能效和面积两个方面都有着显著的提升,该芯片的峰值能效 140.3TOPS/W 为之前工作的 2.7 倍,而 7.5mm^2 的面积仅为前者的 60%。此外,Sticker-T 的通用架构可以同时高效支持包括 CNN,RNN 和 FC 在内的主流网络结构,满足了不同应用场景的需求。
还值得一提的是,Sticker-T的研究工作入选了年初在美国旧金山举办的ISSCC 2019,这也是中国大陆首篇发表的人工智能芯片ISSCC论文。Sticker系列人工智能芯片基于算法-架构-电路的联合创新,受到了学术界和产业界的广泛关注。
03 如何一年创造数千万销售业绩?
瞄准万亿级市场规模的工业互联网
湃方成立之后,基于Sticker打造了两款芯片产品,一款是面向工业终端应用的AI芯片Tritium 103,另一款是工业视觉边缘计算平台Reactor。Tritium 103在今年7月份已经流片,面向低功耗嵌入式视觉应用,采用台积电65nm工艺,平均功耗不到40mW,平均能效达3.7 TOPS/W,支持卷积神经网络、全连接网络等主流模型,可支持设备振噪分析、人脸识别、设备检测、目标识别、介质泄漏等常用一维或二维信号处理方法,支持与Arm Cortex M系列以及A系列MCU。
边缘计算平台Reactor可对常见工业视觉需求进行处理,在实际应用中,Reactor可以作为数据的汇集点进行数据融合,也可以支持工厂中基于摄像头的泄漏检测、入侵检测等图像处理场景。
虽然武通达一直在强调湃方不以片面追求AI芯片、算法等技术的高指标为目的,但Tritium 103相比英特尔Movidius芯片,功耗较之减少约80%,同时芯片能效提升3-4倍。
在芯片具备优势的前提下,找到合适的落地场景非常关键。据了解,湃方创始团队自2017年就开始前期筹备工作,用了一年余的时间调研客户的市场信息、实际痛点。武通达透露,他们也探索过汽车的胎压监测、3D结构光识别、无人机视觉智能仪表等,但最终主要做的还是旋转设备的数据采集、预测性维护和节能增效业务。
这主要有两方面的原因,一方面,创始团队的两位成员对包括石油在内的传统工业有很深的理解,特别是马君还有丰富的工业实践经验。经过探索,湃方发现传统工业制造与运营企业面临着三个层面的痛点:
设备运维成本高、依赖人工,效率低下;
设备厂站各类数据形成数据孤岛,无法进行数据的整合分析和预测性维护;
工厂生产过程可控性差,依赖人工干预,计划排程不合理。
另一方面,工业互联网今年来热度很高,特别是在国内,工业互联网平台的数量已经有400多家,这是一个非常巨大的市场。
至于为什么选择工业互联网的设备运维?武通达表示,运维市场是万亿级的市场,我们罗列了9-10个行业,去估算设备运维费用,大概就有7-8万亿的水平。其中,旋转机械是工业中的动力核心,包括泵、电机、压缩机等设备每年消耗全国超过23%的电量。以泵为例,2018年全国新增1.15亿台,这个数量与国内智能手机一年的销量相当。虽然泵的价格从几百到几十万不等,但值得监测的泵机大部分处于无人监管的状态。因此,旋转机械的智能化管理成为了一个庞大的待开拓市场。
全栈式解决方案降低落地门槛
既然市场已经选定,接下来需要思考的就是如何满足市场的需求。在AI还不成熟的当下,全栈式的端到端解决方案能够最大程度降低用户的使用门槛。武通达表示,在市场上如果只做硬件或者只做软件,都会面临局限性,因为中间的接口目前还没有一套标准来实现理想的软硬融合。因此,湃方提供的是全栈式的方案,而这其中又贯穿了融合。
“这种融合首先是芯片和算法的融合,让一个无线无源的电池供电传感器就可以做边缘计算。再上一层就是端和边缘的融合,我们部署了算法管理平台。因为我们看到算法对数据提出了需求,数据对硬件提出了需求。如果只做其中的一部分,就意味着得不到另外一部分的输入,也就不知道对面要什么,不可能把这个东西做得足够的好。所以湃方最关键一条主线,最核心的芯片、传感器、算法和软件都是自己做。”
他还进一步表示,要提供全栈的解决方案,每一个技术模块的打磨都很难,但最核心的是技术模块之间的融合,我们在这一年中解决的最核心的问题也是模块之间的融合。虽然我们是初创公司,提供全栈的解决方案需要在软件、硬件和算法都进行投入,但因为我们所有核心模块都是在内部打磨,而且知道客户的需求,有明确的目标的情况下,整个系统也更容易做到最优。
武通达还透露,满足客户需求是我们的第一要务,我们会把80%的资源放在用户上,20%的资源放在核心技术以及未来3-5年主流技术的研发,我认为这样的分配可以让公司有一个健康的发展。
最终,湃方提供的全栈式解决方案包含湃方星核、湃方星象、湃方星尘、湃方星云。也就是通过湃方星尘的采集设备采集振动、温度、磁场强度、流量、压力、电参数等数据,采集的数据可以基于湃方星核做本地计算,把状态检测出来,如果有异常,再将信息发送到云上,这样可以大大节省硬件部署的成本,帮助设备运营方实现更好地和智能化运维。
值得强调的是,湃方的芯片工具链产品Axon也在全栈式解决方案中扮演了非常关键的角色,Axon是将基于主流框架的算法重新训练一遍,这样能够在几乎不降低神经网络算法精度的前提下,让算法能够应用到Sticker芯片上,发挥出最高的能效比。与此同时,当湃方星尘部署之后,湃方星象自动学习AI算法平台能够根据设备所处的环境,通过4-5天的自动学习就能够完成算法部署,不仅周期短,这种标准化的方法也具备非常强的迁移能力。
湃方的全栈解决方案既可以用在前装市场,也能应用于后装市场。比如湃方科技为国内某传统泵机厂商提供的以AI芯片为核心技术的LIMS全生命周期智能管理系统,使客户将产品的制造,销售信息数据化、设备运行智慧化,达到快速,有效的产品供应,产品监控,产品维护,甚至利用平台的反馈数据,指导新产品的研发。在后装市场,中石油某场站长期被高昂的设备管理成本困扰,湃方科技为其精心打造的设备智能管理系统,最终让客户的设备管理成本比之前减少了近30%。
湃方的全栈解决方案在推出之后就迅速获和华为云、英伟达、兆易创新、树根互联、东方国信、海尔COMOSPlat以及中国移动oneNET等行业前沿工业互联网、集成电路企业达成战略合作意向。武通达透露,湃方作为一家从创立之初就追求落地的公司,今年的营收额已经做到了数千万的水平。
未来几年,湃方的营收仍将会以工业互联网为主。
武通达表示,我们现在所处的市场已经很大,这一市场的公司都还处于小范围重叠,大范围有自己的赛道的状态。未来,我们会做向跨品类(泵机、电机、通风机、鼓风机、压缩机),跨行业(工业,石油、石化、冶金、钢铁、煤化工、电力、水利)的方向拓展。
湃方作为一家成立才一年的初创公司,已经获得了数千万的销售业绩。这个成绩首先是得益于清华创始团队多年在芯片领域的研究成果,这也是湃方的核心技术。Sticker芯片作为核心为神经网络算法提供算力支撑,但因为AI技术还处于初级阶段,无论是硬件还是软件都不够成熟,特别是Sticker芯片又有其独特性,在这种情况下,想要实现芯片的落地,解决用户的痛点,全栈式的解决方案是一个最优解,湃方也是这么做的。
湃方取得的成绩也很好地说明,除了安防和自动驾驶市场,工业也是AI芯片落地非常好的方向。也就是说,只要能够解决用户的痛点,打动用户,AI芯片就能够落地,当然这其中技术也起到了关键作用。随着工业互联网和AI的落地,湃方还有非常广阔的市场空间。