查看原文
其他

摩尔定律的新动力:矿机芯片江湖背后的“全定制方法学”

芯智讯浪客剑 芯智讯 2019-05-15


一边是比特大陆蚂蚁矿机的停滞不前,一边是比特微电子的神马矿机的异军突起;一边是芯片制程工艺逼近物理极限,摩尔定律逐渐失效,一边是比特微电子的基于全定制方法学的芯片,在能效比上的持续的成倍提升。这一切的变数的关键却都是因为清华工程物理系博士杨作兴和他的力推的全定制方法学。而这个年轻人,改变的不止是矿机芯片市场,或许还将影响半导体芯片行业的未来。


“全定制方法学”背后的矿机芯片“江湖”


2017年3月,深圳比特微电子科技有限公司(以下简称“比特微”)在成立8个月之后,就推出了基于“全定制方法”设计的矿机芯片的神马M3,上市一个月就售出了1000台,销售额近千万,全年销售额超过5亿。


比特微董事长、总经理兼CTO杨作兴告诉芯智讯:“我们去年的销售是五个亿,净利润是七千多万,今年上半年也已经有了十几个亿的销售额,好几个亿的净利润,交了将近一个亿的税。”随着新的神马M10的即将上市,杨作兴更是信心满满:“M10目前的算力指标是33T到35T,这是目前市面上最好的。”杨作兴预计今年比特微的销售额将会突破30亿元。


虽然今年以来比特币价格持续走低,矿机市场景气度大幅下滑,但是从比特微公布的销售额数据来看,其矿机销量仍处于快速增长当中。


相比之下,比特币矿机市场老大——比特大陆的蚂蚁矿机的销量却遭到了重挫。目前蚂蚁S9矿机的现货价相比高峰时已跌去了近80%。而且,根据比特大陆2018年一季度公布总资产数据显示,存货为12.4亿美元,超过了2017年销售额的一半。这么大的库存量,显然,矿机销量确实出现了下滑。而且今年二、三季度矿机市场更是低迷,比特大陆的矿机销量进一步下滑。


一边是比特大陆矿机的销量的大幅下滑,一边是比特微的神马矿机的异军突起,冥冥之中,杨作兴和他的全定制方法学,成为了其中的关键。


什么是“全定制方法学”?


下面这张图上半部分的流程,就是我们目前大家比较熟悉的芯片的设计流程,用高级语言写一个代码,还有代工厂单元库,综合成一个门级网表,做好以后再产生时钟,再布线,形成GDS。这就是传统的芯片设计的流程。



众所周知,目前的芯片设计公司乃至芯片代工厂,在芯片设计上制造上基本都是依赖于EDA(Electronic Design Automation,电子设计自动化)工具来进行电路设计与仿真、自动布局布线,网表文件自动生成等等。


而杨作兴提出的“全定制方法学”则打破了原有的芯片设计流程和方法。


首先,其针对自己的芯片应用范围和场景,采用了自己设计的单元库。因为代工厂的单元库是面向所有的客户,做出来的东西要考虑各种应用范围,所以在一些局部特殊的场景的时候,可能在面积、功耗、功能方面不是最优的。


第二,采用手动布局。在芯片内部每一个地方都是寸土寸金,如果能够将版图里面的空余地方都利用起来,必然有助于提升性能。


第三,是时钟优化,传统设计方法是时钟相位离散性越小越好,但是在全定制里面却是反过来的,所有的计算单元不要再同一个时间工作,要按照一定的规划,错峰执行,这样的话在功耗和速度方面会有很大的好处。


最后是手动门级网表,传统的芯片设计是逻辑设计和物理设计分开做,写代码的人不知道单元库是什么东西,不知道长什么样,不知道自己的作品是什么样的。工程师也不知道这个功能怎么一回事,中间有很大的隔阂。而全定制设计在这方面则是需要前后端耦合一起设计的。即在写代码的时候要求你必须要知道你所写的器件的面积、功耗,速度,是不是唯一的,如果不是唯一的,要问一下有没有更好的选择。在设计一个库的时候,你需要知道你跟谁连,线有多长,它的速度是多少,它的功耗多少,会不会不平衡。


这个事情很多人会觉得比较疯狂,因为在芯片里面,几千万个器件的情况下,用手动去布效率将会非常低下。但是比特微还是这样干了。


“有一些时候,不可能的事情它其实是有可能的,我们做了一个手动的布局,用自己的库手动写门级网表,手动布局,这就是全定制设计。”在8月31日的2018第二届集微半导体峰会上,杨作兴针对其“全定制方法学”解释称:“当然,我们并不是真的所有的都是一个个手动去布局,一些对性能影响很小的接口逻辑也可以自动布局。一般芯片的器件面积利用率能做到50%-70%,我们一般是做到50%-70%的手动,在我们全定制里面最好的记录是能做到97%。同时我们有一些自己的设计脚本,我们也在慢慢做自己的设计工具来加速这个过程。”


实际上,用通俗易懂的话来说,全定制方法学就是根据芯片的具体应用领域和需求,在各方面都进行定制化的设计,使得芯片内部的每一个晶体管都能够发挥出最优的效果。


那么,同样一个芯片,采用全定制方法学的设计周期,相比传统采用EDA软件设计的周期大概要差多久呢?


杨作兴表示:“对于小芯片是差不多的,基本上3-6个月就可以完成,如果没有做过的话大概需要6个月,对于比较大和复杂的CPU、AI芯片会慢一些,这需要一个积累过程。一个是IP积累,以前没有这块的IP,未来把这些编码、简码积累起来;第二是会全定制方法的人很少,不是自己看个书就可以,要师傅带徒弟,不能像以前看一下书就好了。这块人才的积累更是需要时间的。”


初入矿机芯片江湖,“全定制方法学”大放异彩


时间拨回到2011年,当时还在清华工程物理系读博的杨作兴开始接触全定制方法学,并且实验性的做了一款主频900MHz的RFID  TAG芯片,它有一个重要的特点,是无源的,所有的电能来自电磁波,从空中吸收电磁波,虽然这并不是全定制设计,只是采用手动门级网表,把几千门的逻辑手动地写了一下,但是效果非常不错,功耗优化了五倍,功耗×面积优化比例达到了11倍。经此一役之后,坚定了杨作兴采用全定制方法学来设计芯片的决心。



2013年基于定制型ASIC芯片的比特币矿机市场开始兴起。2013年2月,比特币矿机领域传奇人物“烤猫”——蒋信宇成立的深圳比特泉信息科技有限公司推出了第一代比特币矿机芯片和矿机,并很快获得了成功。


2014年中,杨作兴进入矿机芯片设计领域,加盟了比特泉公司,希望通过自己“全定制的方法学”来帮助“烤猫”优化其第三代矿机芯片BE300的能效比。


因为对于矿机芯片来说,除了矿机硬件之外,最大的成本就是电费成本,所以单位算力下的能耗是矿机芯片极为关键的指标。


很快,杨作兴利用全定制方法完成了自己针对BE300的优化设计,但是随后发生的事情却让杨作兴始料未及——“烤猫”失踪了,比特泉公司解散了。这也使得基于杨作兴全定制方法学设计的优化版的BE300没能流片。


面对自己的心血付诸东流,杨作兴非常的不甘。2015年杨作兴带着其“全定制方法学”与比特大陆技术负责人詹克团进行了交流,并很快以兼职的工作形式帮助比特大陆研发了蚂蚁S7矿机的芯片——基于28nm工艺的BM1385。



根据杨作兴公布的数据显示,基于其全定制方法学设计的28nm矿机芯片(即比特大陆S7矿机搭载的BM1385)与传统APR方法设计的矿机芯片相比,功耗优化比例提升了1.71倍,成本优化比例提高了2.5倍,功耗×成本优化比例高达4.28倍。杨作兴的全定制方法学第一次得到了成功验证,随着S7的大卖,成功帮助比特大陆在2015年开始一枝独秀。


随后,杨作兴为了拿到比特大陆的融资来做自己感兴趣的无源摄像头芯片,再度帮助比特大陆设计了蚂蚁S9矿机所采用的16nm的BM1387芯片,当BM1387流片成功后,杨作兴希望全职加入比特大陆,结果遭到了拒绝。双方于是便一拍两散。


自立门户,“神马”问世


在8月31日集微半导体峰会之后的,杨作兴接受芯智讯采访时也透露,当时希望加入比特大陆,但是经过5轮谈判,股份一直没有谈妥。无奈之下,杨作兴选择带着自己的全定制方法学自立门户,于2016年7月创立了深圳比特微电子科技有限公司,很快“神马矿机”也横空出世。


杨作兴接受芯智讯采访


2017年2月,杨作兴研发的新的28nm矿机芯片BT1000成功投片,2017年3月,基于该矿机芯片的矿机——神马M3正式量产。


从前面那张图上的数据对比我们可以看到,得益于杨作兴的全定制方法学设计,比特微电子推出的神马M3相比同样采用28nm工艺、同样由其采用全定制方法学设计的蚂蚁S7,在功耗×成本优化比例上,提升了近2.7倍。


今年5月,比特微电子的第二代16nm矿机芯片BT1800也正式投片,而基于这款芯片的神马M10矿机也将于9月19日正式发布。



根据杨作兴公布的数据(上图)显示,神马M10与同样由其采用全定制方法设计的矿机芯片比特大陆的蚂蚁S9相比,功耗×成本优化比提升了超过2.5倍。


杨作兴表示:“神马M10将是目前市面上最好的比特币矿机!”


比特微的“起”与比特大陆的“落”


在比特币价格持续低迷的当下,单位算力功耗更低、硬件成本也更低的矿机产品的价值将更加凸显,自然也成为了矿工们继续“生存”的首选。


因此,我们也看到,去年全年销售额只有5亿的神马矿机,今年上班半年销售额就已经猛增到了近十几亿,全年销售额预计突破30亿元,相比去年暴涨了600%。


值得注意的是,在杨作兴与比特大陆分手之后,比特大陆除了有推出基于S1387进行改进的蚂蚁S9i矿机外,到目前为止仍未推出新的矿机芯片和新的矿机。而之前处于研发当中的比特大陆16nm BM1X89芯片、12nm BM1X90芯片、10nm BM1X93芯片设计都似乎以失败告终,即便比特大陆的7nm的矿机芯片获得了成功,但是在此之前,其主要竞争对手嘉楠耘智已抢先推出了7nm矿机芯片和矿机。这也使得比特大陆进一步丢失了竞争优势。


更为要命的是,比特大陆的莱特币矿机L3、以太坊矿机D3、Zcash Z9等技术指标也被竞争对手所超越。而去年比特大陆推出的全新AI芯片Sophon BM1682在能效比上也远低于竞争对手。



从上面的财报数据也可也看到,今年一季度的时候,比特大陆的S9、L3、D3矿机都出现了毛利率的大幅下滑。虽然今年一季度S9的销售数据还不错,但是,因为此前比特币市场火爆,导致比特大陆的矿机销售大都是全额预售,大部分在2018年Q1记录的收入实际上是来自2017年Q4的订单。 而随着今年以来,比特币价格的暴跌,比特大陆蚂蚁矿机价格大幅下滑,矿机销量也出现了暴跌。据自媒体陶石资本研究表示,“比特大陆2018年Q1起码有10亿美金的收入来自于2017年,2018年的真实销售最多11亿美金左右,环比下滑65%以上”。 


那么为何比特大陆在与杨作兴合作了两款芯片之后,仍未掌握“全定制方法学”,成功推出新一代的基于全定制设计的矿机芯片呢?


对此,杨作兴解释称:“之前的芯片都是我自己做的。全定制方法学,对设计人员的要求很高,需要一流设计工程师,经过项目磨炼后,才能够掌握。在做的过程中,其实有一种说法比较好,叫做极致,其实就像乔布斯一样,要做到极致和变态,把每个细节都做到极致。可以说全世界目前能够完全掌握全定制方法学的不超过10个人。我们公司大概有1.7个,有一个(杨作兴自己),有半个,还有一个算是三分之一个。”


一边是神马矿机的异军突起,一边是比特大陆的沉寂。而这一切的变数的关键却都是因为杨作兴和他的全定制方法学。而这个年轻人,改变的不止是矿机芯片市场,或许还将影响整个半导体芯片行业的未来。在8月底的2018第二届集微半导体峰会上,杨作兴还信心满满的表示:“全定制方法学将完全能够继续推动摩尔定律前行5-10年。”


“全定制方法学”将成“摩尔定律”前行新动力?


早在20世纪70年代,英特尔公司创始人之一戈登·摩尔就提出著名的“摩尔定律”,即“当价格不变时,集成电路上可容纳的晶体管的数目,约每隔18-24个月便会增加一倍”。与此同时,计算机性能通常也将提升一倍。


自摩尔定律提出之后的几十年,整个半导体产业也确实按着摩尔定律在持续快速的前进,但是自28nm之后,摩尔定律便开始呈放缓态势,其所带来的经济效益也开始降低。


2014年上半年,英特尔的14nm工艺才正式发布(二季度末才量产),而此时,距其22nm发布的时间,已经过了近2年半。一直在奋力推动摩尔定律的英特尔首次出现了时间点上的推迟。随后英特尔从14nm走向10nm的过程中,再度遇到了困难,量产时间一拖再拖,预计2019年才能正式量产。


虽然今年上半年台积电的7nm工艺已经量产,但是台积电的7nm工艺实际上与英特尔的10nm工艺相近。而接下来的5nm、3nm甚至是1nm,或许仍然还有路可以走,但是这毫无疑问将会更加的困难。


而更为令人悲观的是,虽然随着工艺的提升,晶体管密度还可以进一步增加,但是能够带来的性能提升或功耗的降低却越来越少。比如从28nm到16nm,面积缩小了40%,速度提高了30%-40%,但是如果选择提升速度,那么功耗就没法降低多少。而在28nm之前,每一代制程工艺的升级,功耗都能够降一半多,面积降一半多,速度提升一倍多。但现在,这样的好事情已经一去不复返了。


除此之外,随着工艺制程从10nm向5nm、3nm、1nm的继续演进,所需要付出的代价也更具高昂。摩尔定律所带来的经济效益可能也将会不复存在。



此前,国外Semiengingeering网站曾发布过一篇工艺和芯片开发费用的文章。文中指出28nm节点的芯片开发成本为5130万美元;16nm节点则需要1亿美元;7nm节点需要2.97亿美元;5nm节点,开发芯片的费用将达到5.42亿美元;由于3nm还处于最初期的开发阶段,所以其开发成本至今还难以确定,3nm的开发费用有可能超过10亿美元。此外,晶圆厂建设同样需要大量的现金支持,这将进一步拉高芯片的制造成本。



显然,随着制程工艺的不断逼近物理极限,芯片开发成本也急剧增长,如果芯片厂商没有足够的实力,芯片出货没有足够的出货量,将很难承担高昂的成本。


在“摩尔定律”的推进越来越困难,甚至“摩尔定律已死”的说法越来越被外界所认可的当下,包括英特尔在内的众多半导体企业和专业也纷纷寄希望于“架构创新”来实现“超越摩尔”。


而所谓的“架构创新”此前芯智讯在《联电/格芯相继放弃7nm,后摩尔时代如何超越摩尔?》一文当中就指出,主要有以下三个方面:1、芯片工艺由原来的2D转向2.5D/3D堆叠;2、内核架构上的创新,比如采用非冯·诺伊曼系统架构。主要包括ASIC(寒武纪1A、谷歌TPU等)、FPGA和部分新型GPU(Nvidia的Tesla系列等),以及类脑芯片(IBM的TrueNorth、英特尔的Loihi等);3、异构的SoC片上系统。


而杨作兴提出的“全定制方法学”则似乎成为了以上三种方式之外的一种全新的“架构创新”方向。


可以看到,由杨作兴采用全定制方法学设计的S7、S9、神马M3、神马M10,每一代产品的推出,与同样制程工艺的采用传统APR方法设计的矿机芯片相比,在功耗×成本优化比例上,都提升了4倍以上。这远超出了单纯依靠先进制程工艺所带来的提升。


而且全定制方法学并不仅仅适用于ASIC矿机芯片,也同样适用于CPU、GPU和AI芯片。同样,杨作兴也希望将全定制方法学从比特币矿机芯片领域,进一步扩展到其他芯片领域。杨作兴表示:“全制定方法学,会先在虚拟货币和AI领域成为主要方法学,然后逐步扩展到手机、PC、服务器和IoT领域。全定制设计目前虽然是手动,但是也进入到模块化的概念,只是跟以前模块不一样的地方,以前的模块只有逻辑信息,没有物理信息,现在除了逻辑信息,还有物理信息,这样一层一层垒出来。”


“之前我们做芯片基本都是要依靠EDA软件,但是以后的芯片设计可能更是要精雕细刻去做,每个细节都要恰到好处。未来设计芯片是要做艺术品!”在杨作兴看来,全制定方法学带来了芯片设计上的创新,将有望继续推动摩尔定律前行5-10年。


“近几十年以来,一直是我们的芯片代工厂,是他们带动我们这个行业迅猛发展,但是他们现在累了,现在轮到我们做芯片设计的工程师为这个产业作贡献的时候到了。在半导体产业遇到瓶颈的时候,我们设计师应该扛起这个大旗继续前行。我认为这个里面有很大的空间,这个空间能够使摩尔定律再前行五年十年,我觉得是有希望的。”在杨作兴在讲台上慷慨讲完这段话之后,台下的瑞芯微董事长励民率先鼓起了掌。


作者:芯智讯-浪客剑

相关文章

奥比中光陈挚:3D视觉技术趋于成熟,2020年市场将全面爆发!

假如没有林本坚,就没有今天的台积电!

手机跑分作弊被3DMark除名!华为回应:其他厂商也有类似行为!

对大疆发起337调查申请,背后竟是这家中国公司!

vivo小米5G工程机相继曝光,华为祭出麒麟980+巴龙5000方案欲拔头筹!

深度解析麒麟980:“六个全球第一”到底有多少含金量?

高端芯片制造到底有多难?看完你就明白了

4年3款自研芯片!独家揭秘奥比中光幕后的芯片研发团队

联电/格芯相继放弃7nm,后摩尔时代如何超越摩尔?

中国集成电路产业的4大亮点、5大机遇、6大挑战!

行业交流、合作请加微信:xintiyan001
投稿请发至:yj@padnews.cn
芯智讯官方交流:221807116

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存