查看原文
其他

CCCF卷首语 | 算力能不能为王

刘云浩 中国计算机学会 2022-12-23


从科学角度讲,从大型机到微型机,再到云计算和边缘计算,计算模式的演进给人工智能技术的应用带来了层出不穷的机遇,同时也带来了挑战。增加算力是人工智能通向下一个台阶的正确途径吗?


这些天科技领域有不少吸引眼球的事件,最高亮的可以算是特斯拉公司的AI日活动。特斯拉推出了一款正在研发的Tesla Bot——一个高1.75米左右,56公斤重的人形机器人,大家不禁期待明年制作完成后,它与波士顿动力公司的机器人Atlas一较高下。活动现场还展示了一款自主研发的人工智能芯片D1,在我看来这比大多数号称人工智能的计算加速芯片更有资格被称为“人工智能”芯片。根据活动发布会上提供的数据,D1芯片的浮点数性能与英伟达RTX 3070不相上下,标志着特斯拉在AI芯片的研发能力上已经处于世界第一梯队。除了大家都关注的单颗芯片算力,特斯拉还特别考虑了片外带宽,可以将25块D1芯片组成一个Dojo超级计算机的计算单元,而这一单元很可能采用了台积电的晶圆单系统(System-on-Wafer,SoW)封装技术,直接把整个晶圆做成一个超大芯片。这意味着什么呢?


自动驾驶的实现路径一直众说纷纭,即使是采用深度神经网络技术,很多厂商还是打算用视觉、激光雷达、毫米波雷达等多个维度的信息作为输入。但马斯克不这么想,他觉得实现自动驾驶就要以视觉为主,这就不可避免地需要超大规模的算力进行训练。如何解决这个问题?特斯拉给出的回答是:我自己研发AI芯片;走的路子呢?主打可扩展性(scalability)。且不论能干成什么样,马斯克倒真算是拿着问题找方法,比拎着锤子找钉子显得更有勇气。 


从科学角度讲,从大型机到微型机,再到云计算和边缘计算,计算模式的演进给人工智能技术的应用带来了层出不穷的机遇,同时也带来了挑战。图形处理器(GPU)甚至神经网络处理器(NPU)、张量处理器(TPU)乃至视觉处理器(VPU)日渐普及,如何把这些设备用好以及变得好用,是当前学界和业界必须面对的问题。除了计算模式的变化,很多研究机构选择了继续增大模型、增加参数,这使得现有的体系结构显得捉襟见肘。怎么办?特斯拉走的scalability之路,会不会是一个好的解决方案呢?可是话又说回来,增加算力是人工智能通向下一个台阶的正确途径吗? 


本期专题的7篇文章总结了CCF学科前沿讲习班(ADL)“人工智能的计算机系统观”的主要内容,从硬件加速、系统结构、语言框架和编译器、计算机网络以及分布式系统等方面对人工智能系统进行了全面的介绍。来自清华大学、上海交通大学、中科院计算所、阿里云和字节跳动的一线专家学者从不同的维度探讨在应用人工智能技术中所遇到的计算机系统问题,为大家全方位展示了人工智能系统的魅力。本期还刊登了获得2020年“CCF杰出贡献奖”的清华大学教授陈文光的专访,陈教授一直担任CCF计算机软件能力认证(CSP)技术委员会主席,还担任了一届ACM China主席,除了分享CSP的相关内容外,他还给博士生和青年科研人员提出了很多有价值的建议,值得我们一起学习。



刘云浩

CCF高级会员,CCCF主编,ACM Fellow。清华大学教授。ACM Transactions on Sensor Network 主编。


特别声明:中国计算机学会(CCF)拥有《中国计算机学会通讯》(CCCF)所刊登内容的所有版权,未经CCF允许,不得转载本刊文字及照片,否则被视为侵权。对于侵权行为,CCF将追究其法律责任



CCF推荐

【精品文章】



点击“阅读原文”,查看更多CCCF文章。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存