一文看懂倚天云实例|科普漫画
云布道师
2022 云栖大会上,阿里巴巴宣布自研 CPU 倚天 710 已大规模应用。
编解码场景实现了 80% 的性价比提升,数据库场景、AI 推理场景、大数据场景也都分别有着 30%、70%、50% 的有效性价比提升。
天猫双 11 核心交易系统平滑迁移至倚天 710 云实例,算力性价比提升 30%;汇量科技广告推理业务使用倚天 710 云实例,性能和网络带宽双双提升,性价比提升 40% 以上。
今天就来说说,这些蹭蹭蹭的性价比提升,阿里云 ECS 倚天实例是怎么实现的呢?
第一个秘密武器是平头哥自研的倚天芯片本身。
倚天 710 芯片采用无超线程的设计,让计算性能更高。
无超线程设计,是不是有点懵?我们先来了解一下计算机的“大脑”CPU 芯片平时是怎么工作的。CPU 里面有两个比较重要的分工:
计算,主要 CPU 核里面的执行单元负责,数量越多往往算得越快,主频则是影响计算速度,越高算得越快;
于是,就有厂商设计了超线程概念,也就是把一份物理核变成 2 个 vCPU(虚拟CPU),就可以“同时”运行两个应用进程。传统架构的 CPU 就是这样。
这两个 vCPU,因为是在共用一个物理核和缓存,就会导致来自不同 vCPU 的计算指令要排队被“计算”,同样的缓存里面等待的时候也是一样的。
无超线程的设计意味着 ECS 倚天实例采用的是独享物理核心方式,这可以让算力密集的计算指令不必排队、不必争抢,计算速度更快。
倚天芯片的 ARM 架构与生产工艺让功耗更小,运算速度更快、更稳定。
倚天处理器采用的是 ARM 架构,采用更精简的指令集,本来功耗就比传统架构低,加上先进制程工艺,倚天 710 的功耗是主流架构的 1/6,优势十分明显。
一般来说芯片制程越小,功耗越小,性能越高。
除了算得快,倚天还功耗低,意味着成本低。功耗大不仅意味着成本,可能还会影响计算性能的平稳。传统 CPU 架构功耗大,导致计算负载过重时温度上升,为了避免高温造成的功能失效,会主动降低主频,进而影响了性能。倚天就没有任何降频问题。
倚天云服务器性价比高的第二个秘密武器,就是阿里云的数据中心处理器——CIPU。
CIPU 开创了不同的硬件架构,让服务器以 CIPU 为中心。
CIPU 连接 2 颗或者更多倚天的芯片,让多个芯片共享一台服务器,这样降低了成本,使得倚天实例更有竞争力。
依靠 CIPU 实现双单路设计,低成本+高可用
最后,CIPU 将虚拟化与 IO 转发等数据面卸载到专用硬件上进行加速,消除了原来虚拟化损耗与性能争抢,并大幅加速了 IO,也会使得整体性能更高;VPC 环境下支持弹性 RDMA 加速能力,相比 TCP 时延降低 70% 以上。