查看原文
其他

刚刚,华为正式开源AI框架MindSpore,还带来了业界最快自动网络架构搜索技术

冬梅 AI前线 2020-10-04

作者 | 冬梅

2020 年 3 月 27 日至 28 日,华为开发者大会受疫情影响选择以线上直播的方式呈现。会上,华为 MindSpore 首席科学家陈雷博士宣布全场景 AI 计算框架 MindSpore 正式开源。
全场景 AI 计算框架 MindSpore 正式开源

3 月 28 日上午,华为 MindSpore 首席科学家陈雷博士宣布:全场景 AI 计算框架 MindSpore 正式开源!

在去年华为举办的昇腾 910 AI 处理器和 MindSpore 计算框架发布会上,华为曾承诺将在 2020 年 Q1 季度开源 MindSpore。

今天,华为兑现承诺,MindSpore 正式开源,四月份即可试用,代码将托管在码云上。这标志着华为已完成全栈全场景 AI 解决方案(Portfolio)的构建,也意味着华为将与所有开发者共建 MindSpore 生态。

会议现场,陈雷博士介绍,当下学术界 AI 研究持续升温,今年 AI 顶会论文的投稿量达到了近 9000 篇,各种模型算法层出不穷,工业界 AI 应用层出不穷,例如平安城市、智慧医疗等,我们需要模型能做到大、全、多,也就是数据集大、功能完备,适应多场景。兼顾多方诉求,正是华为设计 MindSpore 的意义。

MindSpore 为数据科学家及研究人员提供了全新的工具,使理论探索和创新变得更加简单高效。相比 TensorFlow,MindSpore 可降低 AI 开发者门槛,为开发者提供全场景 AI 的模型开发、模型运行、模型部署端到端能力,从而更好地促进 AI 的应用。

MindSpore 模型特性

据介绍,MindSpore 具备三大特性:一是开发友好,做到了 AI 算法即代码,代码量相比之前减少 20%,效率提升 50%;二是运行态高效,面向深层芯片优化,通过图、算子、边缘加速以及神经网络并行,协同深层芯片算力达到 1.6 倍的性能优化;三是部署灵活,通过自适应的部署技术实现从 IoT 设备到云的灵活部署。针对不同的运行环境,MindSpore 框架支持可大可小,适应全场景独立部署。

在 AI 模型训练中,由于数据量大、数据复杂,分布式训练尤为重要。为了实现分布式训练,开发者首先要设计算法逻辑,然后再训练分布式并行策略,这之中的混合并行尤为重要。为此,MindSpore 实现了混合并行功能,一行代码自动混合并行,无需关注系统细节,而且能保证性能。

为了方便开发者调试,MindSpore 利用一行代码即可完成BPT调试和运行切换,既方便用户调试,又保证运行时性能。开发者都知道,模型的黑盒给模型调试和调优带来了极大困难,MindSpore 可视化工具可以方便开发者快速、高效进行算法调优。利用 MindSpore 的可视化工具,可以实现训练过程可视化、数据可视化、模型溯源和模型对比等功能。

MindSpore 模型比较简单,可以通过 Python 脚本实现定义,实现整个训练代码的生成。在软硬件协同加速方面,MindSpore 也做了很多工作。在框架层,MindSpore 采取了 Pipeline 并行和跨内层复用的方法来进行加速,Pipeline 并行被应用到数据加载和梯度更新两方面。梯度更新方面采用梯度数据驱动的自适应、图切分同步方式进行梯度更新。

MindSpore 框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而不是数据本身,以此实现在保证用户隐私数据保护的前提下跨场景协同。除了隐私保护,MindSpore 还将模型保护 Built-in 到 AI 框架中,实现模型的安全可信。在原生适应每个场景包括端,边缘和云,并能够按需协同的基础上,通过实现 AI 算法即代码,使开发态变得更加友好,显著减少模型开发时间。

MindSpore 框架社区地址:

https://support.huaweicloud.com/modelarts/index.html

业界最快自动网络架构搜索技术来了

计算机视觉的目标是机器拥有人类感知视觉信号的能力,但是如何从海量数据中挖掘有效信息,比如如何利用生成数据训练模型以及如何对齐不同模态的数据都存在问题。华为提出知识蒸馏与自动数据扩增结合的方法,也是当前业界弥补自动数据增强技术劣势的有效方法。

在多模态学习层面,大部分开发者面临多模态信息表示、模态间联合映射、模态对齐、模态融合、多模态协同学习等挑战。作为未来机器视觉的主流模式,华为在多模态层面推出多模式对话系统,该系统可依据用户需求生成不同模态相应,使用统一模型编码不同形式领域信息。

在网络架构搜索层面,手工网络模型设计发展进入瓶颈、而自动网络架构搜索尚存在一些问题,比如搜索空间需要人工经验定义、待搜算子需要人工设计、较手工涉及网络可迁移性差。针对这些问题,华为推出当前业界搜索速度最快的自动网络架构搜索技术,其算法细节是局部连接的思路解决网络冗余问题;边正则化思想解决局部连接带来的不稳定性。

Darts 系统方法首次在 ImageNet 数据集上完成搜索,相较于之前在 ImageNet,搜索速度快了近一倍,且取得了更好的性能。

在模型加速方面,业界提出了大量模型小型化解决方案,然而这些方案在实际应用中存在各种问题,比如低比特量化精度受限、混合比特网络对硬件不友好、新型算子没有获得充分验证等。对此,华为提出新型算子加速卷积网络 AdderNet,使用曼哈顿距离取代夹角距离,卷积无需乘法计算,使用 8 比特整数计算,对硬件更加友好,功耗更低。

在通用视觉模型层面,监督学习需要海量样本、数据拟合无法泛化到不同子任务;强化学习需要海量试错,缺少可重复性、可复用性以及鲁棒性。演讲中,田奇表示,学会推理预测是从感知走向认知的关键步骤,自监督学习逐渐成为常识学习必经之路,缺乏有效的预训练任务,在视觉领域的应用仍不成熟。对此,华为推出拼图游戏,拼图任务改进自监督模型,使网络能够处理任意拼图布局,从而更好地学习空间上下文提供的语义信息。

演讲最后,田奇宣布华为视觉研究计划——数据冰山计划、数据魔方计划、模型摸高计划、模型瘦身计算、万物预视计划以及虚实合一计划。让数据生成真正替代手工标注;多模态数据量化,对齐,融合策略研究,构建下一代智能视觉;云测大模型,刷新各类视觉任务性能上限;端侧小模型,助力各种芯片完成复杂推理;定义预训练任务,构建通用视觉模型;在虚拟场景下,不通过数据标注,直接训练智能行为本身。

此外,华为正式宣布推出业界首款企业级 AI 应用开发专业套件 ModelArts Pro,华为方面表示这是一种行业 AI 落地方式。华为云通用 AI 服务总经理、语音语义创新 Lab 主任袁晶 表示,当下,我们还处于弱人工智能的阶段,机器无法解决所有问题,所以需要确定边界,然后进行分步实施,让行业知识和算法有效结合,让结果有价值,最终形成整体闭环。ModelArts Pro 就是把上述核心理念具化成了产品。

活动推荐

面试季重磅强推图书:《剑指面试》剖析了 80 个典型的编程面试题,系统整理基础知识、代码质量、解题思路、优化效率和综合能力这 5 个面试要点。结合多家国际名企的从业经验,从面试官的视角,剖析考题构思、现场心里、题解优劣与面试心得。从谷歌、微软等知名 IT 企业海量面试题中精心选出精华题目,提供多角度解题辅导。系统总结如何在面试时写出高质量代码,如何优化代码效率以及分析解决难题常用思路方法......

👇👇👇立即扫码,送给刚刚入门 & 面试在即 & 已经工作的你我他。

今日荐文

点击下方图片即可阅读

GitHub pages、WHO 被攻击,最大暗网托管商被黑,黑客疫情下动作频繁


你也「在看」吗?👇

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存