2021年SAIL奖榜单TOP30系列二：AI通用技术平台赋能千行百业

AIII研究院

2024-09-03

2021世界人工智能大会将于7月8日—10日在上海举办。作为世界人工智能大会的最高荣誉，SAIL奖一直坚持“追求卓越、引领未来”的理念，秉持“高端化、国际化、专业化、市场化、智能化”原则，从全球范围发掘在人工智能领域中具有高度认可和美誉、并具有提升人类福祉意义的项目，激励全球范围内在技术上做出方向性突破、应用创新，正在或将要改变未来生活的人工智能项目。
SAIL奖设置大奖，并形成年度榜单。我们对2021年度SAIL奖TOP30榜单入选项目进行系列专题报道以飨读者。

系列二：AI通用技术平台

亮点展品

/ OneFlow新一代深度学习框架

公司名称

/ 北京一流科技有限公司

OneFlow是面向大模型大数据打造的人工智能计算框架，也是专为深度学习打造的异构分布式流式系统，代表了深度学习框架的发展方向，是新一代分布式深度学习框架的代表性产品。OneFlow独创了自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术，完美地解决了大数据、大模型、大计算所带来的异构集群分布式扩展挑战，技术水平世界领先。

近几年来，深度学习的研究和应用的热潮持续高涨，最新的算法模型的参数规模和训练运算量呈指数级增长，“算力”成为了深度学习的“阿喀琉斯之踵”。OneFlow深度学习框架是基于横向扩展的思想，为了从软件架构层面解决算力问题而诞生的创新性产品。在更宏观的层面，将多台服务器通过高速网络连接起来组成集群来实现更高算力，具备更好的扩展性和灵活性，不管底层实际使用了多少松散耦合在一起的芯片，在上层用户眼里就像在一个专门为当前任务打造的巨大单体芯片一样，编程简单而且任务运行时能把底层每一个独立的芯片都利用充分。

最重要技术创新

1. 静态编译机制实现面向异构架构的并行数据处理；

2. 执行体（actor）异步消息机制实现去中心化调度和流式并行；

3. 逻辑张量的分布式签名机制（SBP）实现大数据大模型的自动分割并行。

OneFlow新一代开源深度学习框架有望因其卓越的性能优秀的分布式易用性及其中立的属性获得广大AI开发者的青睐，从而围绕开源框建立起广泛的开发和使用生态，最终通过使用者和贡献者的互动和规模化效应形成事实工业标准和产业生态，占据人工智能产业的主导地位，获得巨大的经济效益。

亮点展品

/ 飞桨深度学习平台

公司名称

/ 北京百度网讯科技有限公司

在人工智能时代，深度学习框架和平台起到承上启下的作用，下接芯片，上承各种应用，是“人工智能时代的操作系统”。

飞桨以百度多年的深度学习技术研究和业务应用为基础，集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。

飞桨是开源开放、技术领先、功能完备的产业级深度学习框架和平台，集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体，曾获世界互联网大会领先科技成果、中国电子学会科技进步一等奖等众多奖项。在硬件适配上，飞桨适配芯片或IP达到31款，对于国产硬件的支持处于业界领先地位。

飞桨在业内率先实现了动静统一的框架设计，兼顾科研和产业需求，具备开发便捷的深度学习框架、超大规模深度学习模型训练、多端多平台部署的高性能推理引擎、产业级开源模型库四大领先技术。在硬件方面，飞桨与芯片厂商深度优化，适配芯片或IP达到31款，对国产硬件的支持处于业界领先地位，持续打造软硬一体的AI技术底座。

依托飞桨，百度牵头建设了国内前沿的深度学习技术及应用国家工程实验室。目前，飞桨已凝聚开发者320万，服务企业12万家，基于飞桨产生了36万个模型，遍布能源、金融、工业、农业等多个行业。飞桨助力开发者快速实现AI想法，快速上线AI业务，帮助越来越多的行业完成AI赋能，实现产业智能化升级。

亮点展品

/ 盘古与训练大模型

公司名称

/ 华为技术有限公司

授课方式

/ 名师直播互动

/ 辅导老师督学

/ 无限次回放

/ 学习礼包

盘古大模型旨在建立一套更易用的人工智能开发工作流，以赋能更多的行业和开发者，实现人工智能工业化开发。其核心为预训练大模型，通过收集大量数据，利用深度学习技术将这些数据的分布和特征整合在一个具有巨大参数量的神经网络之中。

盘古大模型包括大规模数据收集和索引、大模型预训练、大模型微调和部署、大模型迭代四个主要模块。

1. 数据收集：盘古大模型共收集了超过100TB的图像数据和超过40TB的中文文本数据，并以分布式的形式存储在华为云和鹏城实验室的服务器端，支持高效访问和存取。

2. 大模型预训练：设计了具有超过30亿参数的图像预训练模型和超过1000亿参数的中文文本预训练模型。同时，盘古还设计了盘古多模态预训练大模型和盘古图网络预训练大模型，扩大在实际应用中的覆盖范围。

3. 大模型微调和部署：支持按需抽取和隐性知识蒸馏方法，确保将大模型的知识最大限度地传递给子模型。在盘古模型的微调和部署阶段，我们设计了大量配套算法，如小样本学习和终身学习等，满足不同用户的需求。

4. 大模型迭代：盘古大模型具备数据挖掘、增量训练和模型进化功能。我们研发了监督学习、双向自步学习等算法用于增量学习，并且设计基于图网络的模型融合算法，加速盘古大模型的迭代。

本项目提出具有巨大参数量的《盘古预训练大模型》，包含计算机视觉和自然语言处理两个分支，并支持跨模态语义理解。团队提出了兼顾判别与生成的预训练算法，训练得到超过30亿和1000亿参数的视觉和自然语言预训练模型。盘古大模型在超过100个实际场景中取得了应用，平均节省超过80%的研发成本。

盘古大模型突破性地实现了AI模型通用、泛化和复制，开创了AI工业化开发新模式！相对于作坊式开发，开发效率提升10~100倍，同时具备更佳的性能。

亮点展品

/ 超大规模深度语言模型体系

AliceMind

公司名称

/ 阿里巴巴达摩院（杭州）科技有限公司

预训练语言模型是当前自然语言处理（NLP）领域的研究热点之一，“预训练+精调”已成为NLP任务的新范式。AliceMind, Alibaba's Collection of Encoder-decoders from MinD (Machine Intelligence of Damo)是阿里巴巴达摩院机器智能技术实验室倾力打造的具有领先性和系统化的深度语言模型体系。AliceMind在自研通用语言模型StructBERT基础上，拓展到多语言、生成式、多模态、结构化、知识驱动等方面，从技术研发、平台建设、业务应用、生态影响等方面进行超大规模深度语言模型的体系化建设。

1. 技术研发：AliceMind体系包括自研通用语言模型StructBERT、多语言VECO、生成式PALM、多模态StructVBERT、结构化StructuralLM、知识驱动LatticeBERT、机器阅读理解UED等，相关工作论文被AI/NLP顶会接收，并在主要国际评测比赛榜单上均排名领先，包括GLUE、CLUE、XTREME、VQA Challenge、DocVQA、MS MARCO等。

2. 平台建设：AliceMind体系内模型均上线到语言模型平台。目前支持：继续训练，精调，蒸馏，测试，部署五大功能，用户只需简单操作即可完成语言模型从训练到部署的完整链路。日均调用量超过50亿次，已有超过200个活跃场景。

3. 业务应用：对内赋能，AliceMind已在阿里巴巴集团内数十个核心业务应用落地；对外行业应用，AliceMind已广泛运用于医疗、电力能源、海关、金融以及智能客服等多个行业；产品建设，以AliceMind为底座建设针对非结构化文档的企业知识库产品，落地国家电网公司，实现数千万的营收。

4. 生态影响：AliceMind体系模型和代码已经开源，和国内外合作伙伴共建深度语言模型核心能力。科技日报（中国科技网）于新华社平台发布报道，阅读量近百万；工信部机关报《中国电子报》专访；权威社会媒体和技术媒体等进行原创解读报道。

AliceMind是目前业界具有核心技术竞争力，为数不多涵盖技术、平台、业务、生态等较完整的超大规模深度语言模型体系化建设。

亮点展品

/ MindOpt优化求解器

公司名称

/ 阿里巴巴达摩院（杭州）科技有限公司

优化求解器是求解优化问题的软件，广泛应用于电力能源、工业制造、交通物流、零售、金融、云计算等领域。

MindOpt优化求解器项目聚焦于通用的高性能优化求解器的研发，补充国内这个领域空白。阿里达摩院是国内最早投入优化求解器研发的机构之一，最初的需求来自云计算资源的调度，后应用于金融、电商零售、供应链、工业制造、电力等领域。

MindOpt优化求解器项目研究的优化技术方向分为数学规划求解、黑盒优化、在线优化三大类。数学规划求解用于求解数学规划问题，即目标、变量、约束可用量化的公式来定义的数学规划问题，如线性规划、非线性规划、混合整数规划等。黑盒优化用于目标函数不可解析或者约束等不好量化描述的优化问题，如复杂的仿真系统，通过获取不同控制参数(输入变量)对应的系统表现，来推断和搜寻优化解。在线优化面向包含未知信息的现实世界系统，在系统运行中进行优化。

各项技术在阿里集团内外成功落地，并带来降本增效，每年在阿里云计算场景为阿里云节省成本数亿元。2020年MindOpt参与了国际权威评测榜单，获得了两次榜首。

2020年8月和12月MindOpt参与了国际权威评测榜单，获得了两次榜首。2021年伊始，达摩院MindOpt通过阿里云天池平台向全社会开放线上免费使用，成为中国第一个免费开放的商用求解器。

亮点展品

/ 基于多模态智能交互技术的

智能客服解决方案

公司名称

/ 京东科技集团

如今，政务热线已经成为提高数字政府建设水平的“最前线”，众多热线在多线归并后，接待能力不足问题凸显，此外，相关部门联动较弱，存在“数据孤岛”现象，难以为预判施政提供支持，智能升级迫在眉睫。

山西省大同市于2021年2月引入京东智能政务热线，服务覆盖了市民、话务员、管理者，形成了包括接听、办理、管控的全栈式智能化解决方案。升级前，日均受理量约2500件，升级后，日均呼入电话总量超过5000通，高峰呼入电话总量超7000通，溢出部分全部由机器人接待，呼入电话接起率提升至100%，单次服务时长缩短31.2%，排队等候现象基本消失。

当前大同12345政务热线已经构建起覆盖市、县、乡、村的“四级联动”体系，覆盖全市125家单位，建成了一个高效便捷的为民服务机制。基于多轮对话、语音语义理解技术，准确理解海量个性化需求，情绪细化建模感知用户情绪，并通过方言识别和情感识别，提供有温度的热线服务；利用语音转写、知识话术推荐、工单进行预填写等功能，提升话务员工作效率，单次服务时长缩短 31.2%；提供可视化平台，帮助管理者全面了解市情民情，实时做出科学决策，还可以从海量公众诉求数据提取诉求高频词，纳入民生实事，做到“未诉先办”。

京东智能政务热线基于多轮对话、语音语义理解技术，准确理解海量个性化需求；情绪细化建模感知用户情绪，提供有温度的热线服务；利用语音转写、知识话术推荐、工单预填写等功能，缩短单次服务时长；提供可视化平台，帮助管理者全面了解市情民情，科学决策；从海量公众诉求数据提取诉求高频词，纳入民生实事，做到“未诉先办”；构建起覆盖市、县、乡、村的“四级联动”体系，覆盖全市125家单位，建成了一个高效便捷的为民服务机制。

结语

SAIL奖评选不仅是世界人工智能大会打造的一个具有全球影响力的奖项，更是上海加快汇聚卓越的人工智能研究成果、创新产品、金融资源、应用场景的重要载体。SAIL大奖的最终评选结果将于7月揭晓，敬请期待。

热门报告，重点推荐

2021年中国上市公司百强排行榜正式发布

2021年中国上市公司百强排行榜

2021年中国（全球）上市公司百强排行榜

2021年中国（创业板）上市公司百强排行榜

2021年中国最具成长性上市公司排行榜

李德毅院士《探索新一代人工智能产业发展》

RPA+AI 赋能制造业数字化转型

2021年SAIL奖榜单TOP30芯片专题——让全球“芯”动的前沿技术

2021世界人工智能大会7月8日开幕！本届亮点一图抢先看