2021年SAIL奖榜单TOP30系列二:AI通用技术平台赋能千行百业
SAIL奖设置大奖,并形成年度榜单。我们对2021年度SAIL奖TOP30榜单入选项目进行系列专题报道以飨读者。
系列二:AI通用技术平台
亮点展品
/ OneFlow新一代深度学习框架
公司名称
/ 北京一流科技有限公司
OneFlow是面向大模型大数据打造的人工智能计算框架,也是专为深度学习打造的异构分布式流式系统,代表了深度学习框架的发展方向,是新一代分布式深度学习框架的代表性产品。OneFlow独创了自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,完美地解决了大数据、大模型、大计算所带来的异构集群分布式扩展挑战,技术水平世界领先。
近几年来,深度学习的研究和应用的热潮持续高涨,最新的算法模型的参数规模和训练运算量呈指数级增长,“算力”成为了深度学习的“阿喀琉斯之踵”。OneFlow深度学习框架是基于横向扩展的思想,为了从软件架构层面解决算力问题而诞生的创新性产品。在更宏观的层面,将多台服务器通过高速网络连接起来组成集群来实现更高算力,具备更好的扩展性和灵活性,不管底层实际使用了多少松散耦合在一起的芯片,在上层用户眼里就像在一个专门为当前任务打造的巨大单体芯片一样,编程简单而且任务运行时能把底层每一个独立的芯片都利用充分。
1. 静态编译机制实现面向异构架构的并行数据处理;
2. 执行体(actor)异步消息机制实现去中心化调度和流式并行;
3. 逻辑张量的分布式签名机制(SBP)实现大数据大模型的自动分割并行。
OneFlow新一代开源深度学习框架有望因其卓越的性能优秀的分布式易用性及其中立的属性获得广大AI开发者的青睐,从而围绕开源框建立起广泛的开发和使用生态,最终通过使用者和贡献者的互动和规模化效应形成事实工业标准和产业生态,占据人工智能产业的主导地位,获得巨大的经济效益。
亮点展品
/ 飞桨深度学习平台
公司名称
/ 北京百度网讯科技有限公司
在人工智能时代,深度学习框架和平台起到承上启下的作用,下接芯片,上承各种应用,是“人工智能时代的操作系统”。
飞桨以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。
飞桨是开源开放、技术领先、功能完备的产业级深度学习框架和平台,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,曾获世界互联网大会领先科技成果、中国电子学会科技进步一等奖等众多奖项。在硬件适配上,飞桨适配芯片或IP达到31款,对于国产硬件的支持处于业界领先地位。
飞桨在业内率先实现了动静统一的框架设计,兼顾科研和产业需求,具备开发便捷的深度学习框架、超大规模深度学习模型训练、多端多平台部署的高性能推理引擎、产业级开源模型库四大领先技术。在硬件方面,飞桨与芯片厂商深度优化,适配芯片或IP达到31款,对国产硬件的支持处于业界领先地位,持续打造软硬一体的AI技术底座。
依托飞桨,百度牵头建设了国内前沿的深度学习技术及应用国家工程实验室。目前,飞桨已凝聚开发者320万,服务企业12万家,基于飞桨产生了36万个模型,遍布能源、金融、工业、农业等多个行业。飞桨助力开发者快速实现AI想法,快速上线AI业务,帮助越来越多的行业完成AI赋能,实现产业智能化升级。
亮点展品
/ 盘古与训练大模型
公司名称
/ 华为技术有限公司
授课方式
/ 名师直播互动
/ 辅导老师督学
/ 无限次回放
/ 学习礼包
盘古大模型旨在建立一套更易用的人工智能开发工作流,以赋能更多的行业和开发者,实现人工智能工业化开发。其核心为预训练大模型,通过收集大量数据,利用深度学习技术将这些数据的分布和特征整合在一个具有巨大参数量的神经网络之中。
盘古大模型包括大规模数据收集和索引、大模型预训练、大模型微调和部署、大模型迭代四个主要模块。
1. 数据收集:盘古大模型共收集了超过100TB的图像数据和超过40TB的中文文本数据,并以分布式的形式存储在华为云和鹏城实验室的服务器端,支持高效访问和存取。
2. 大模型预训练:设计了具有超过30亿参数的图像预训练模型和超过1000亿参数的中文文本预训练模型。同时,盘古还设计了盘古多模态预训练大模型和盘古图网络预训练大模型,扩大在实际应用中的覆盖范围。
3. 大模型微调和部署:支持按需抽取和隐性知识蒸馏方法,确保将大模型的知识最大限度地传递给子模型。在盘古模型的微调和部署阶段,我们设计了大量配套算法,如小样本学习和终身学习等,满足不同用户的需求。
4. 大模型迭代:盘古大模型具备数据挖掘、增量训练和模型进化功能。我们研发了监督学习、双向自步学习等算法用于增量学习,并且设计基于图网络的模型融合算法,加速盘古大模型的迭代。
本项目提出具有巨大参数量的《盘古预训练大模型》,包含计算机视觉和自然语言处理两个分支,并支持跨模态语义理解。团队提出了兼顾判别与生成的预训练算法,训练得到超过30亿和1000亿参数的视觉和自然语言预训练模型。盘古大模型在超过100个实际场景中取得了应用,平均节省超过80%的研发成本。
盘古大模型突破性地实现了AI模型通用、泛化和复制,开创了AI工业化开发新模式!相对于作坊式开发,开发效率提升10~100倍,同时具备更佳的性能。
亮点展品
/ 超大规模深度语言模型体系
AliceMind
公司名称
/ 阿里巴巴达摩院(杭州)科技有限公司
预训练语言模型是当前自然语言处理(NLP)领域的研究热点之一,“预训练+精调”已成为NLP任务的新范式。AliceMind, Alibaba's Collection of Encoder-decoders from MinD (Machine Intelligence of Damo)是阿里巴巴达摩院机器智能技术实验室倾力打造的具有领先性和系统化的深度语言模型体系。AliceMind在自研通用语言模型StructBERT基础上,拓展到多语言、生成式、多模态、结构化、知识驱动等方面,从技术研发、平台建设、业务应用、生态影响等方面进行超大规模深度语言模型的体系化建设。
1. 技术研发:AliceMind体系包括自研通用语言模型StructBERT、多语言VECO、生成式PALM、多模态StructVBERT、结构化StructuralLM、知识驱动LatticeBERT、机器阅读理解UED等,相关工作论文被AI/NLP顶会接收,并在主要国际评测比赛榜单上均排名领先,包括GLUE、CLUE、XTREME、VQA Challenge、DocVQA、MS MARCO等。
2. 平台建设:AliceMind体系内模型均上线到语言模型平台。目前支持:继续训练,精调,蒸馏,测试,部署五大功能,用户只需简单操作即可完成语言模型从训练到部署的完整链路。日均调用量超过50亿次,已有超过200个活跃场景。
3. 业务应用:对内赋能,AliceMind已在阿里巴巴集团内数十个核心业务应用落地;对外行业应用,AliceMind已广泛运用于医疗、电力能源、海关、金融以及智能客服等多个行业;产品建设,以AliceMind为底座建设针对非结构化文档的企业知识库产品,落地国家电网公司,实现数千万的营收。
4. 生态影响:AliceMind体系模型和代码已经开源,和国内外合作伙伴共建深度语言模型核心能力。科技日报(中国科技网)于新华社平台发布报道,阅读量近百万;工信部机关报《中国电子报》专访;权威社会媒体和技术媒体等进行原创解读报道。
AliceMind是目前业界具有核心技术竞争力,为数不多涵盖技术、平台、业务、生态等较完整的超大规模深度语言模型体系化建设。
亮点展品
/ MindOpt优化求解器
公司名称
/ 阿里巴巴达摩院(杭州)科技有限公司
优化求解器是求解优化问题的软件,广泛应用于电力能源、工业制造、交通物流、零售、金融、云计算等领域。
MindOpt优化求解器项目聚焦于通用的高性能优化求解器的研发,补充国内这个领域空白。阿里达摩院是国内最早投入优化求解器研发的机构之一,最初的需求来自云计算资源的调度,后应用于金融、电商零售、供应链、工业制造、电力等领域。
MindOpt优化求解器项目研究的优化技术方向分为数学规划求解、黑盒优化、在线优化三大类。数学规划求解用于求解数学规划问题,即目标、变量、约束可用量化的公式来定义的数学规划问题,如线性规划、非线性规划、混合整数规划等。黑盒优化用于目标函数不可解析或者约束等不好量化描述的优化问题,如复杂的仿真系统,通过获取不同控制参数(输入变量)对应的系统表现,来推断和搜寻优化解。在线优化面向包含未知信息的现实世界系统,在系统运行中进行优化。
各项技术在阿里集团内外成功落地,并带来降本增效,每年在阿里云计算场景为阿里云节省成本数亿元。2020年MindOpt参与了国际权威评测榜单,获得了两次榜首。
2020年8月和12月MindOpt参与了国际权威评测榜单,获得了两次榜首。2021年伊始,达摩院MindOpt通过阿里云天池平台向全社会开放线上免费使用,成为中国第一个免费开放的商用求解器。
亮点展品
/ 基于多模态智能交互技术的
智能客服解决方案
公司名称
/ 京东科技集团
如今,政务热线已经成为提高数字政府建设水平的“最前线”,众多热线在多线归并后,接待能力不足问题凸显,此外,相关部门联动较弱,存在“数据孤岛”现象,难以为预判施政提供支持,智能升级迫在眉睫。
山西省大同市于2021年2月引入京东智能政务热线,服务覆盖了市民、话务员、管理者,形成了包括接听、办理、管控的全栈式智能化解决方案。升级前,日均受理量约2500件,升级后,日均呼入电话总量超过5000通,高峰呼入电话总量超7000通,溢出部分全部由机器人接待,呼入电话接起率提升至100%,单次服务时长缩短31.2%,排队等候现象基本消失。
当前大同12345政务热线已经构建起覆盖市、县、乡、村的“四级联动”体系,覆盖全市125家单位,建成了一个高效便捷的为民服务机制。基于多轮对话、语音语义理解技术,准确理解海量个性化需求,情绪细化建模感知用户情绪,并通过方言识别和情感识别,提供有温度的热线服务;利用语音转写、知识话术推荐、工单进行预填写等功能,提升话务员工作效率,单次服务时长缩短 31.2%;提供可视化平台,帮助管理者全面了解市情民情,实时做出科学决策,还可以从海量公众诉求数据提取诉求高频词,纳入民生实事,做到“未诉先办”。
京东智能政务热线基于多轮对话、语音语义理解技术,准确理解海量个性化需求;情绪细化建模感知用户情绪,提供有温度的热线服务;利用语音转写、知识话术推荐、工单预填写等功能,缩短单次服务时长;提供可视化平台,帮助管理者全面了解市情民情,科学决策;从海量公众诉求数据提取诉求高频词,纳入民生实事,做到“未诉先办”;构建起覆盖市、县、乡、村的“四级联动”体系,覆盖全市125家单位,建成了一个高效便捷的为民服务机制。
结语
SAIL奖评选不仅是世界人工智能大会打造的一个具有全球影响力的奖项,更是上海加快汇聚卓越的人工智能研究成果、创新产品、金融资源、应用场景的重要载体。SAIL大奖的最终评选结果将于7月揭晓,敬请期待。
热门报告,重点推荐
2021年SAIL奖榜单TOP30芯片专题——让全球“芯”动的前沿技术
2021 WAIC 世界人工智能大会最高荣誉——SAIL 奖TOP 30项目出炉
国家统计局副局长鲜祖德解读《数字经济及其核心产业统计分类(2021)》
工信部发布《“5G+工业互联网”十个典型应用场景和五个重点行业实践》
上海市经信委主任吴金城:政府在城市数字化转型当中有四个“新思维”
《中国数字经济就业发展研究报告:新形态、新模式、新趋势(2021年)》发布
工信部印发:《工业互联网创新发展行动计划(2021-2023年)》
“城市数字化转型”:经济数字化转型+生活数字化转型+治理数字化转型
第三届中央企业熠星创新创意大赛新一代信息技术赛道复选顺利收官
全球数字经济新图景(2020年)——大变局下的可持续发展新动能(附全文下载)
上海市人工智能行业协会(以下简称“协会”)一届二次理事会暨上海人工智能发展联盟(以下简称“联盟”)一届三次理事会胜利召开
世界知识产权组织(WIPO)发布了2020年全球创新指数报告(GII 2020)中文版
“《人工智能从业人员能力要求》等五项人才培养行业标准启动会”在北京召开
2020 WAIC上海AI会客厅年度论坛——智领产业数创未来
中国工程院院士陈左宁主旨演讲:《人工智能进展对算力需求分析》
加快新一代信息技术与制造业融合发展:大力发展工业互联网、全面加速数字化转型
政务数据安全国家标准《信息安全技术 政务信息共享 数据安全技术要求》正式获批发布
浙江省数字赋能促进新业态新模式发展行动计划(2020—2022年)
2020世界人工智能大会云端峰会总结会 暨2021年世界人工智能大会筹备启动会举行
《2020年面向人工智能“新基建”的知识图谱行业白皮书》附全文下载
李飞飞对话斯坦福神经生物学教授Bill Newsome : 人工智能和自然智能能否交汇?
上市公司百强论坛主席沈晗耀主题演讲《拥抱第四次产业革命将中国经济推向世界最前沿》
上市公司百强论坛主席季晓南主题演讲《把握新发展阶段国企改革的总体布局、重点任务和精神实质》
顺应国内国际双循环新发展格局,布局“十四五”时期智慧城市新机遇
2020世界互联网大会:数字赋能 共创未来 携手构建网络空间命运共同体
《大脑之美》序言——蒲慕明:对美丽大脑结构的探索,卡哈尔的图谱是起点,终点还在遥远的未来。
《智能体白皮书2020》:共建智能体,共创全场景智慧(附全文下载)
2020全球智慧城市大会(SCEWC)正式发布上海获得最高殊荣——世界智慧城市大奖
第二十届中国上市公司百强高峰论坛将于11月底在上海举行
第三届中央企业熠星创新创意大赛闪亮来袭!抓紧报名参赛!
毕马威发布《人工智能无处不在》研究报告:人工智能在五大行业的成就与挑战
GMIC与投中研究院联合发布:《中国5G产业发展与投资报告》
国家工业信息安全发展研究中心与埃森哲(中国)联合发布《2020中国企业数字转型指数研究》
阿里研究院报告 《数据生产力崛起:新动能 新治理》全文177页
中国信通院、人工智能产业发展联盟联合发布《人工智能治理白皮书》(附PPT解读)
2020世界人工智能大会最高荣誉SAIL奖及Top30榜单高光回顾
《2019上海人工智能与实体经济融合发展研究报告》重磅发布(附全文下载)