AIDC | 大数据、物理学、开源、计算……这些干货不容错过

Original 英特尔知IN 2022-05-12

11月14日至15日，英特尔人工智能大会（AIDC）在北京举行。大会第二天，英特尔软件和服务事业部高级首席工程师、大数据技术全球CTO戴金权，英特尔人工智能产品事业部全球研究负责人Casimir Wierzynski，英特尔人工智能产品事业部全球数据科学负责人刘茵茵、英特尔中国研究院院长宋继强分别发表主题演讲。以下是精彩观点摘录。

戴金权：

人工智能和大数据的变革

英特尔软件和服务事业部高级首席工程师、大数据技术全球CTO戴金权发表演讲

数据定义未来，戴金权认为：一方面，物联网、智能设备、流处理、机器学习等应用场景极大地推动了数据规模和数据需求的飞速增长；另一方面，越来越多的需求亟待我们使用大数据分析、人工智能这样的技术创新，来挖掘更多知识、预测、智能，从而推动各行各业的变革。

在这个过程中，没有一种方案能够解决所有问题。英特尔致力于构建统一的大数据分析和AI平台，支撑各种软硬件技术，并与合作伙伴一起应用到实际场景中。

英特尔构建了Analytics Zoo作为统一的大数据分析和人工智能的平台，它能够将Spark、TensorFlow、Keras等不同的软件框架，无缝集成到一个端到端的数据处理流水线中，并且可以对用户透明的分布式地运行在大规模的集群上。

英特尔Analytics Zoo介绍

基于这些领域的创新，已经有很多实际的应用场景。美的集团需要消除由于表面划伤、螺栓缺失、表面标签未对齐等问题造成的产品缺陷，而人工检测无法满足质量指标或检测率方面的需求。他们与英特尔的Analytics Zoo团队紧密协作，构建了一款高度优化的缺陷检测解决方案。

世界银行团队需要实现众包图片确认流程的自动化，即确保从15个国家/地区的手机所收集的众包图片能够准确地按照食品类目进行分类。而通过采用英特尔的 Analytics Zoo平台以及在英特尔至强处理器上运行的 AWS Databricks平台，可以在将数据集与公众共享之前对超过100万幅众包图片进行分类。

高性能计算厂商Cray希望通过对超过1 TB的原始雷达扫描数据进行快速处理，从而实现短期降水预测。他们携手英特尔的Analytics Zoo团队，成功地为TB级训练数据构建了短期降水预测模型，同时确保了极佳的可扩展性。

Casimir Wierzynski：

人工智能研究——物理学、隐私和大脑

英特尔人工智能产品事业部全球研究负责人Casimir Wierzynski发表演讲

Casimir Wierzynski的团队专门负责识别下一代AI系统当中的重要技术，并着力孵化它们。他表示，物理学、隐私和大脑，将根本性地塑造人工智能的未来。

有数据表明，AI对于计算的需求每3.5个月便会翻倍，在过去六年当中增长了约300000倍。由此，人工智能对于算法、架构以及所有的硬件乃至整个产业来讲都是一个巨大的挑战，这是物理学能够帮助AI的地方，只有物理学突破才能满足AI计算的爆发式增长需求。

“AI的一个重大挑战是确保我们释放能力的同时，不违反我们的价值观。其中一个重要的价值观就是隐私。”Casimir Wierzynski反复强调隐私在AI发展中的重要性。他认为，机器学习和隐私之间存在矛盾，机器学习总想要读更多的数据，而隐私天然地想要去隐藏数据。Casimir Wierzynski的团队正致力于使同态加密及其他私有的机器学习技术变得更加强大和实用。

Casimir Wierzynski表示，大脑是终极的人工智能机器，深度神经网络就是由大脑所启发。不断推动AI的前沿发展，需要了解人的大脑是如何运转的。英特尔所兴奋的不仅是能够更好地开发人工智能系统，而是解密全人类最大的神秘——大脑的机理。

刘茵茵：

数据科学实现的开源工具

英特尔人工智能产品事业部全球数据科学负责人刘茵茵发表演讲

“如果你是AI研究人员，开源工具可能作为研究室用；如果你是数据科学家，开源工具可以帮助解决应用案例；如果你是云服务提供商，可以考虑把开源工具整合到机器学习平台上；如果你是AI领域里的软件硬件工程师，可以看到开源工具作为能力层如何架构在AI的软件框架和硬件基础上。”

在刘茵茵看来，数据科学应当与AI研究紧密结合，并通过开源工具与社区建立了联系，一起打破模型到现实的障碍，用AI解决更多的实际问题。

开源的RLCoach集合了19种最新的RL算法，并整合了8种最新的训练环境以实验这些算法，其中值得提到的是中间的自动驾驶训练环境Carla，它来自英特尔的研究部门，是一个开源仿真器，可以更充分地显示出CPU在提供增强学习中的计算优势。

NLP Architect是整合很多模型和算法的能力层工具库，深度学习的很多算法自然构建了不同抽象层的模块，从底层的硬件、框架、拓扑到上层的应用例子，自然而然地变成这样的产品组合，很多模块在不同的层面上可以重复使用，甚至加入自己的变化。

Distiller作为模型压缩，最大的优势是作为模型压缩的框架，开发人员和工程师可以任意组合很多最新压缩模型的变化，将它们组合在一起，而且提供很多最新的压缩算法。

宋继强：

人工智能时代的计算

英特尔中国研究院院长宋继强发表演讲

未来的人工智能会带来怎样的变化？宋继强认为，首先是一个多样性的未来，未来的AI发挥的一定是多样性的功能。

过去近60年，人工智能的发展分为两个阶段，而第三波刚刚开始，很多学术界的前沿在关注，目的是让AI能够在场景里自己学习、自己适应。目前的研究重点，则是把第二波人工智能中比较好的技术能力应用到商业场景，产生真正的社会与经济价值，由此形成一个正循环，从而推动下一波人工智能的发展。宋继强强调说，人工智能是一种工具，而不是目标。

宋继强表示，人工智能应用领域的多样化、计算负载的多样化、计算部署的多样化，其中共性的需求是：多样化的硬件选择、统一的软件工具、应用SDK、自定义功能。

谈到未来的人工智能，宋继强指出离不开四个要素：算法，硬件，这些都要由理论来做指导，在应用中检验。

硬件层面，宋继强特别介绍了英特尔的神经拟态芯片。

宋继强表示，异构的计算和架构是解决人工智能多样化计算需求的重要方式。这其中，英特尔已迈出重要步伐。

在演讲的最后，宋继强表示，随着人工智能的发展，跨学科合作将产生1+1＞2的成果。我们可以开始将心中的构想化为现实，用人工智能创造美好未来。

点击“阅读原文”，观看AIDC主题演讲视频回放。

往期精彩

AIDC | 英特尔Jonathan Ballon：边缘的计算机视觉是AI落地的重要机会

AIDC | 一图速览英特尔人工智能大会

AIDC | 英特尔Naveen Rao：突破理论践行AI

AIDC | 英特尔发布全新神经计算棒，构建更智能的AI边缘设备

AIDC | 英特尔杨旭：AI，在实践中前行