TensorFlow 2.4 Mac 优化版:在 Mac 上实现加速的 CPU 和 GPU 训练
文 / Pankaj Kanwar 和 Fred Alcober
采用 ML Compute 时 Mac 上的性能
Mac 一直是备受开发者、工程师和研究人员欢迎的通用平台。Apple 近期发布了搭载全新 M1 芯片的系列 Mac 产品,如此一来,Apple 针对 Mac 优化的 TensorFlow 2.4 版能够充分利用 Mac 的强大功能并在性能上大幅提升。
ML Compute 是 Apple 的新框架,可以在 Mac 上训练 TensorFlow 模型,现在,您可以在搭载 M1 和 Intel 芯片的 Mac 上实现加速的 CPU 和 GPU 训练。
例如,M1 芯片搭载功能强大的新型 8 核 CPU 和多达 8 核 GPU,均针对 Mac 上的 ML 训练任务进行了优化。在下图中,您可以看到针对 Mac 优化的 TensorFlow 2.4 如何在搭载 M1 和 Intel 芯片的通用型号 Mac 上实现巨大的性能提升。
在搭载 M1 和 Intel 芯片的 13 英寸 MacBook Pro 上使用 ML Compute 时对常见模型训练影响,以每批秒数显示,数字越小表示训练时间越短
在搭载 Intel 芯片的 2019 Mac Pro 上使用 ML Compute 时对常见模型的训练影响,以每批秒数显示,数字越小表示训练时间越短
开始使用针对 Mac 优化的 TensorFlow
用户无需对其现有的 TensorFlow 脚本进行任何更改即可使用 ML Compute 用作 TensorFlow 和 TensorFlow 插件的后端。
首先,请访问 Apple 的 GitHub 仓库,了解如何下载和安装 Mac 优化的 TensorFlow 2.4。
在不久的将来,我们会将该版本集成到 TensorFlow master 分支中,使用户能更轻松地进行此类更新,从而获得这些性能数据。
您可以在 Apple 的机器学习网站上了解 ML Compute 框架细节。
注:
由 Apple 于 2020 年 10 月和 2020 年 11 月使用预量产的 13 英寸 MacBook Pro 系统(配备 Apple M1 芯片、16GB RAM 和 256GB SSD)以及量产的 1.7GHz 四核 Intel Core i7 13 英寸 MacBook Pro 系统(配备 Intel Iris Plus Graphics645、16GB RAM 和 2TB SSD)进行测试。在预发行版 macOS Big Sur、TensorFlow 2.3、预发行版 TensorFlow 2.4、具有微调功能的 ResNet50V2、CycleGAN、Style Transfer、MobileNetV3 以及 DenseNet121 上进行测试。性能测试是使用特定计算机系统进行的,反映了 MacBook Pro 的大致性能。
由 Apple 于 2020 年 10 月和 2020 年 11 月使用量产的 3.2GHz 16 核 Intel Xeon W Mac Pro 系统(配备 32GB RAM、带 64GB HBM2 的 AMD Radeon Pro Vega II Duo 显卡以及 256GB SSD)进行测试。在预发行版 macOS Big Sur、TensorFlow 2.3、预发行版 TensorFlow 2.4、具有微调功能的 ResNet50V2、CycleGAN、Style Transfer、MobileNetV3 以及 DenseNet121 上进行测试。性能测试是使用特定计算机系统进行的,反映了 Mac Pro 的大致性能。