查看原文
其他

DIY GPU系统:打造自己的深度学习平台

2018-02-07 翻译 肖力 云技术实践


打造你自己的GPU服务器并不难,并且要比使用云端的深度学习平台便宜不少。


现在这个时代,许多深度学习的实践者,渴望建立自己的深度学习机器,摆脱云的束缚时。云计算是深入学习的理想选择,通常是培养大规模深度学习模型的最佳答案。但是,拥有自己的深度学习平台,有一个宽广的范围可以显著提高成本效益。


而且,它是便宜的。你将花费1500美元到2000美元或更多的钱在一台电脑和高端的GPU上,可以反复练习深度学习模式。但是,如果你在一段时间内做大量的模型训练,那么你的专用机器可以在3到4个月的时间内收回成本,特别是当你考虑到云存储和计算时间的时候。


在本文中,我将介绍在早些时候构建的深度学习机器,描述在构建这样一台机器时遇到的一些选择,以及可能会遇到的成本。价格是亚马逊在2017年12月的直接报价。


如果你想深入学习,论是对大数据集的研究,还是进入Kaggle竞赛,或者建立自己的深度学习系统,这都是很有意义的。在自己的机器上运行模型可能是最好的方法,直到你开始在庞大的数据集上进行工作,并且需要为培训提供数十个gpu。


一旦你到达那个点,云就会再次成为你的朋友。你可能还需要一个有钱的朋友来支付所有的计算时间。


构建深度学习PC:GPU和CPU。


你购买那种GPU,很可能是在构建自己的机器时做出的最重要(也是最昂贵的)决定。但是现在,这个选择相当简单。如果你不畏惧700到900美元的价格,你应该购买Nvidia GeForce GTX 1080 Ti,Nvidia 1080 Ti不像新的Nvidia Volta GPU 那样有能力,它刚刚出现在主要的云供应商中,但它很可能足够满足你所有的Kaggle需求。


1080 Ti是基于与Nvidia的最前沿的泰坦X卡相同的Pascal架构,但是它更快更便宜。大量的核心(3584)和大量内存(11GB)意味着你可以运行更大的神经网络,并且在1080 Ti上更快地训练它们,而不是今天市场上的任何其他消费类卡。如果你想要在你的深度学习盒的任何部分推动这个信封,你可以使用最好的$1000 的系列CPU。


1080 Ti选择创始版本(卡片是Nvidia参考设计)或者显卡制造商的自定义版本。他们通常会有多个风扇,并且(泄露他们的游戏来源)是一个用来覆盖GPU的设备。就我个人而言,我对经济过热有点偏执狂,所以我选择了一张895美元的卡片,有3个风扇,但是你可以选择一张创始版本的卡,这样你就可以省下100美元。


如果你不能承担1080Ti的高价格,那么Nvidia GeForce GTX 1080是一个不错的退路。它比1080 Ti慢,内存少(8GB和11GB),但它将节省大约200美元。我希望能够推荐AMD的新GPU线,但是对于像PyTorch和Tensorflow这样的主要库的支持还没有完全实现。这可能会在2018年发生变化,AMD继续在工作,在这一点上,Radeon RX Vega的方向和路线将会非常吸引人,特别是如果Nvidia忽略将其张量核心从Volta平台引入到它的消费者线上。


尽管GPU将成为你的系统的主力,但您也需要一个有能力的CPU来运行应用程序和处理数据工程任务(例如,增强)。如果你想在将来扩展你的机器来包含多个CPU,那么你应该得到一个能处理多达40个PCIe快速通道的CPU。你不必大出血,第7代英特尔酷睿i7-7700K是一个不错的选择。你也需要一个冷却器,但同样,你不需要发烧级的水冷或类似的东西。从Cooler Master购买30美元的Hyper 212 EVO是很不错的选择。


构建深度学习PC:存储和内存


现在,你可以孤注一掷,花500美元买一个1TB的SSD M.2卡,ssd是不错的选择,对吧?但想想,当你训练一个数据模型时,你不会使用所有的快速存储。更有效地使用你的资金将是将“热”(SSD)存储用在在当前训练,“冷”(磁盘)用于非活动项目。一个2TB的硬盘将花费你70美元和一个250GB的SSD大约130美元,给你超过双倍的存储费,并且用少于一半的价格。


至于内存,我推荐32GB,未来有可能进一步扩展到64GB,所以买16GB的大条。你将看到的大多数主板都需要DDR4内存,两根16GB的内存会让你少花300到400美元。


构建深度学习PC:主板、电源、机箱


现在你已经拥有了所有这些精美的组件,你还需要一些相对枯燥的部件来将所有东西整合在一起。如果你听从我的建议,购买了第7代英特尔处理器,那么你应该去找一个z270系统主板。如果你购买了第8代CPU,因为你喜欢闪闪发光的新东西,那么你就需要一个基于z370的主板。不要把它们搞混了,因为第七代CPU不会在Z370板上工作(确保你的主板和CPU一起工作)。如果你认为将来你可能会得到另一个GPU,请检查你选择的主板是否可以支持它。我没有按照我的建议去做,所以如果我决定添加第二个GeForce GTX 1080 Ti,我需要升级我的主板。


电力供应也许是建造你自己的盒子中最不令人兴奋的部分,但要记住的一点是,你需要相当大的能量。一个850W的电源花费85美元,并且会给你一些扩展的空间。


现在,我最后一次组装台式电脑是在十多年前,所以我完全没有准备好面对新的案例。我并不期待闪闪发光的LED灯、赛车曲线或球迷们能看到的东西。我是保守的英国人,我选了一个相当乏味的白塔设计,但它确实在旁边有一个玻璃窗户。确保你有足够的空间把箱子里的东西都装进去。冷却器和显卡都比你想象的要高。如果你坚持使用标准的ATX机箱或中型机箱,也不错。


构建深入学习PC:组装和软件安装


因为多年我没有组装电脑可,所以我担心在组装时会迷失。但是,所有你需要的是一个不错的螺丝刀,防静电带和YouTube。对于系统的几乎每一个部分,都会有一个在线视频教程,向你展示如何进行。视频真的帮助我通过SSD卡和内存安装,在那里我需要保证,我没有打破内存芯片,相当难以把它们放到主板。


一旦你拥有了所有的东西,所有的灯都亮着,你将需要一个操作系统。随意与Windows双启动,方便玩游戏,但你可能应该与Linux的深入学习工作。在撰写本文时,我建议使用Ubuntu 17.04,因为它的Nvidia驱动程序设置很简单(Nvidia的下载页面还没有更新到Ubuntu 17.10)。在安装Linux之前要记住的一件事是进入你的机器的BIOS,确保它使用的是集成显卡,而不是1080Ti,否则在安装过程中会遇到问题。


按照Ubuntu指南设置Nvidia驱动程序。另外,因为Tensorflow在Tensorflow 1.5之前不支持CUDA 9,所以从CUDA网站上获取CUDA 8库。


对于Python,我推荐使用Anaconda。使用Anaconda安装Tensorflow和Keras就像这些命令一样简单:


conda install -c anaconda tensorflow-gpu 

conda install -c anaconda keras


和PyTorch几乎一样简单:


conda install pytorch torchvision -c pytorch      


加上Anaconda默认安装了Jupyter,所以在这一点上,你可能需要使用自定义的深度学习机器。


构建深度学习PC:总成本

最后,让我们来看看这些成本有多少, 我从亚马逊买了我所有的设备。 你可能能够使用Newegg或TigerDirect等网站找到更好的交易,或者通过eBay查找使用过的零件。再次,你可以通过选择一个Nvidia的创始或普通的GTX 1080卡在GPU上节省100美元或200美元。


ComponentCost
GPU: EVGA GeForce GTX 1080 Ti, 11GB$880
CPU: Intel 7th Gen Intel Core i7-7700K$290
CPU cooler: Cooler Master Hyper 212 EVO $30
SSD: Samsung 960 EVO Series 500GB NVMe M.2 SSD$245
HDD: Western Digital Blue 1TB SATA 6 Gb/s 7200 RPM 3.5-inch HDD$49
Memory: Ballistix Sport LT 32GB Kit (16GBx2) DDR4 2400 MT/s$330
Motherboard: MSI Pro Series Intel Z270 CrossFire ATX$115
Power supply: Rosewill Glacier Series Continuous 80 Plus 850W $85
Case: NZXT S340 Mid Tower, White$70
Total$2,094


只要不到2100美元(在任何销售税生效之前,记住),深度学习电脑绝对是一项重大投资。但是,如果你开始对每月云账单上的成本上升感到沮丧,那么就值得研究一下,构建自己的机器是否比在AWS、谷歌云或微软Azure上运行GPU实例更好地利用你的时间和金钱。这对我是有好处的。


原文链接:

https://www.infoworld.com/article/3244124/hardware/diy-gpu-server-build-your-own-pc-for-deep-learning.html


↓↓↓ 点击"阅读原文" 【加入云技术社区】

相关阅读:

高端私有云项目交流群,欢迎加入!

六款开源路由器比较

基于Kubernetes和Docker构建微服务之路

2017年云市场十大热词,展望2018年

RightScale:2017年云计算调查报告|附下载

Forrester:混合云评测报告

Gartner:2018年基础设施和运营的十大技术趋势

云管理平台实践指南

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存