Lukas:在数据中心里,似乎应用机器学习的比例越来越高,而且数据中心在全球能源使用中的比重也在不断增加。这会对环境造成什么影响?Luis:基本上,每次在同一硬件上提高运算速度,都是在降低二氧化碳排放量,降低资源压力。性能优化是这种奇妙的事情,可以从很多方面受益。如果使其速度更快,那么用户将会很开心。不过,即便他对延迟并不敏感,财务人员也会更加开心,因为减少了在云计算服务上的开销。但是到最后,所消耗的能源就会减少。这真的非常重要。正如你所指出的,世界上有越来越多的能源被用于计算。我不打算谈论加密货币,我们现在没有涉足加密货币的计划,这是一个完全不同的话题,需要考虑到它的能源成本。训练和大规模部署模型在内的机器学习基础设施所需要的能源成本不可低估。可以这么说,在当今的机器学习典型应用中,大多数时钟周期都是用来进行机器学习计算和访存的,而维持这种活动必须需要能量。无论是在用户体验方面还是在能源效率方面,任何能让硬件更高效、让模型更高效,或是通过编译和优化特定于模型的硬件来实现的事情,都是一场胜利。通过提高能源效率,可以大大降低对环境的影响。这是毋庸置疑的。尤其在大规模应用的情况下,要抓紧每一次机会来降低模型消耗的能量。尽管从用户体验来说,这无关紧要,但我们还是要这么做,因为这是正确的事情。Lukas:在机器学习领域,你觉得哪些研究主题没有引起足够的重视?Luis:我的大部分研究都是关于机器学习和机器学习自动化系统设计方面。我认为,目前已经有更多人在关注这个问题。TVM就是一个范例,它利用机器学习来更好地进行模型优化和编译。但是,如果要同时进行硬件设计和FPGA编程,就实在是太困难了,机器学习在这方面可能会有很大的发展空间。我要的是一个真正的“输入模型,自动化输出硬件和软件”,而且随时可以部署。这就是我最感兴趣的事情,这会有很大的影响力,人们也能从很多方面受益。当你开启新的应用时,你将获得新的体验,同时也让它变得更为节能。所以,我想我们应该一直在思考,如果要进行大规模部署,我们的能源成本是多少。富裕国家不会考虑这些,即便是价格高昂,你也要为能源买单。不过,如果认真想想,大规模运行这些设备会给环境带来什么后果,那就应该注意这个问题。Lukas:也就是要用机器学习来对模型进行优化?Luis:利用机器学习,不仅要优化模型,还要优化运行模型的系统,这样你就能得到更好的行为。它们可以做到更快,每美元的吞吐量更高,能耗也更低。这简直太让人激动,也太有希望了。所以这只是其中一方面。我想讲一个以前不太受重视,但最近却受到越来越多的重视的话题,那就是机器学习在分子生物学中的影响。作为我个人研究的一部分,在过去六年左右的时间里,我一直致力于设计使用DNA分子进行数据存储和简单形式计算的系统。其中一些实际上与机器学习有关。比如,我们最近演示了直接用化学反应进行相似搜索的能力。这不仅很酷,而且绝对是一种新设备技术的替代品,非常可行,而且经过了时间考验。它可以节省能源,并且从根本上讲,分子系统的设计是如此复杂,我无法想象除了使用机器学习来设计这些模型之外,还有什么其他方法。我们一直这样做。去年年底,我们在Nature Communications上发表了一篇关于Porcupine的论文,我们用机器学习的方式来设计 DNA 分子,使它们在DNA测序仪上看起来如此不同,它们不会是天然DNA,你可以用这个来做标记。我们设计了这些分子去标记“艺术”或“衣服”,诸如此类。基本上可以快速采集样本,运行测序仪,然后根据这些分子痕迹来鉴定。这之所以成为可能,要归功于设计分子的机器学习,以及从DNA测序仪中解读信号等等。这个领域现在得到的关注越来越多,我发现这难以置信地令人感到兴奋,我在研究和工业领域所做的事情的很多高级动机就是促成这样的用例。但那些需要大量计算的事情,没有一个非常有效、非常快速的系统是不可能实现的。Lukas:今天让机器学习在现实世界中发挥作用的最大挑战是什么?或者当你与客户交谈,在他们优化模型,把模型部署并用于最终用例时,遇到的挑战是什么?Luis:我人生中的很大一部分时间都投入到部署中,但我不想说这是最大的问题,这听起来太自私了。在技能方面,因为它要求人们了解软件工程,了解底层系统软件,并了解机器学习,这是一个巨大的障碍。还有其他的一些方法,就是确保你的模型在部署后能按照预期方式运行。比如可观察性,确保没有意外输入来使模型表现失常,出现故障安全行为等等。我觉得这并不新鲜,某些应用需求或者是由于模型做出重大决策时,这样做是对的。你希望知道它们是如何完成的,并且确保它们在意外的输入中确实成立。所以我认为这是一个比较困难的问题,像任何一个考虑整个系统的工程师一样,你要考虑系统故障中最薄弱的环节。(本文已获得编译授权,原文:https://wandb.ai/wandb_fc/gradient-dissent/reports/Luis-Ceze-Accelerating-Machine-Learning-Systems--Vmlldzo4MDA3OTk?galleryTag=gradient-dissent) 其他人都在看