查看原文
其他

微软亚洲研究院2020技术精选集

The following article is from 微软研究院AI头条 Author 微软亚洲研究院


丹棱君有话说:不平凡的2020年已经结束,充满希望的2021年刚刚开始。在这个回顾过去、展望未来的时刻,微软亚洲研究院推出了2020年度技术精选专辑。先让我们一起通过专辑的 “MV”,来看一下这张技术精选集都收录了哪些黑科技。看完请移步正文,检测一下你的学习成果吧!

作者: AI 群星

流派: 未来/创新

介质: 图文问答

发行时间: 2020-12

出版者: 微软亚洲研究院

特别收录:MV




无法识别图像真假?用"X光"照一下


丹棱君 OS:”我这5.0的眼睛都没看出来是假照片,它竟然还指出了合成边界。“

随着 AI 换脸算法的精进,如今“眼见也不一定为实”,因此换脸鉴别技术变得愈发重要。Face X-Ray是微软亚洲研究院鉴别换脸图像真假的最新突破。研究员们发现图像都有其特殊的噪声标记,被替换过的图像会留下更换边界。透过 Face X-Ray,即使再天衣无缝的合成图像,也能看到合成的痕迹,让换脸图片难逃其法眼。

Q:以下对于Face X-Ray描述错误的是:


Face X-Ray 只在一种算法合成的图像上训练,然后在其他三种数据上测试都可达到95%以上的识别率!

A:与业内主流换脸鉴别算法相同,Face X-Ray 采用了四种换脸算法生成的人脸图像进行分别训练。

×请注意审题哦,是选择错误的一项。

B:无论换脸图像是采用已知还是未知的换脸算法,Face X-Ray 都可以有较高的识别率,平均达到95%以上。

×每张图片都独一无二!

C:每一张图像都有一个来自于硬件或软件的特殊噪声标记,这些噪声就像指纹一样独一无二。


Q:下面哪张图片是合成图片?

A

天呐,你真是慧眼如炬!


B

×哈哈,被眼睛欺骗了哦。

C

×哈哈,被眼睛欺骗了哦。


焕新老照片,回忆更清晰

丹棱君 OS:“一张充满回忆的泛黄照片,竟然可以修复得像刚拍下来一样!”

周杰伦在《上海1943》里唱到 “夕阳斜斜映在斑驳的砖墙,我对着黑白照片开始想象爸和妈当年的模样…”也许你也曾从橱柜里翻出家人压箱底的老照片,但画面已泛黄,甚至有些褪色。虽然我们无法控制时间流逝,但 AI 技术却可以帮助我们“翻新记忆”。微软亚洲研究院基于纹理 Transformer 模型的图像超分辨率技术,和以三元域图像翻译为思路的老照片修复技术,可以让老照片重现光彩。

Q:下列哪张图片是用微软亚洲研究院图像超分辨率技术修复的?


A

×这可是送分题,不如再看看?

B

×这可是送分题,不如再看看?

C

送分题一道,当然是最清晰的这张啦。


雀神在手,赢牌非我莫属

丹棱君 OS:"这可是让日本麻将大神都频频感叹强大的 Suphx 老师呀!"

麻将,可谓家喻户晓,但若要真正打好,达到精通水平却十分困难。不过,有了麻将 AI 系统 Suphx 的“陪练”,想成为雀神指日可待。微软亚洲研究院研发的麻将 AI系统 Suphx 是首个在国际知名专业麻将平台“天凤”上荣升十段的 AI 系统,是目前 AI 系统在麻将领域取得的最好成绩。2020年,Suphx 研发团队发表相关论文揭秘了技术细节,让你从内而外透彻了解 Suphx。

Q:下面关于Suphx描述中错误的一项是:


×流泪了,Suphx 怎么可能不会这个!

A:Suphx 的打牌策略包含5个需要训练的模型,以应对麻将复杂的决策类型——丢牌模型、立直模型、吃牌模型、碰牌模型以及杠牌模型。

×为了得到最终点数,Suphx 可能会策略性地输掉一些局(战术后仰)。

B:Suphx 还有一个基于规则的赢牌模型,决定在可以赢牌的时候是否赢牌。

×Suphx 可是个小机灵鬼,当然会调整战略啦。

C:初始手牌不同时,Suphx的策略也会有很大的不同。

平平无奇麻将小天才 Suphx 可是个多面手,不止限于进攻哦!

D:Suphx 特别擅长进攻,它的4位率和点炮率尤其低。

Q:麻友请就位,现在要打出哪张牌?



恭喜!你具有和 Suphx 一样超前的策略头脑,牌桌上的常胜将军!

A:北风

×官方鉴定,你就是牌桌上的点炮王!七条和八条都是好牌,丢掉会使得胡牌进度变慢。


B:七条

×官方鉴定,你就是牌桌上的点炮王!七条和八条都是好牌,丢掉会使得胡牌进度变慢。


C:八条


玩乐队一缺三?快来认识一下PopMAG

丹棱君 OS"这么魔性的伴奏,配个什么样的主唱好呢?彭磊?彭坦?还是阿茂?不要打断,让我再YY一会儿。"

乐队是将不同乐器、不同声音汇聚,最终形成的一个和谐的整体。而这个和谐整体中的默契是由乐队成员们朝夕相处地练团培养、磨合出来的。现在,只需给出一段主旋律,微软亚洲研究院和浙江大学联合研究的PopMAG也可以自动生成由“虚拟乐队”默契配合的伴奏效果,解决了不同乐器之间和谐“相处”的难题。研究人员希望 PopMAG 能够拓展音乐人的创作空间,加速和谐乐曲的生成,也帮乐迷朋友圆一个“乐队梦”。


Q:下列关于 PopMAG 如何提升伴奏“和谐”的方法描述正确的是:


×这种方法会受限于数据规模,准备参加复活赛吧!

A:将多轨音乐视为一张二维图片,以横轴表示时间,纵轴表示不同轨道的音符音高,然后再将多轨音乐当作图片来生成。

×这样会使音乐整体不够和谐,等着参加复活赛吧!

B:采用不同的 AI 模型去生成不同的音轨,再将各音轨整合在一起。

恭喜你,快来加入乐队吧!

C:将多轨音乐当成单个序列生成,利用机器学习模型生成所有伴奏音轨。


爱写作,爱上英语写作

丹棱君 OS“谁也别跟我提爱写作,怎么总能找出那么多错误。”

今年4月,微软“爱写作”公众号正式上线,“坐拥”四大功能:语法检查、高级词汇推荐、分类作文打分和手写图片识别。随后的几个月,“爱写作”不断升级,批改和打分的速度、准确率以及专业度方面都有大幅提升。它不仅是学生学习的好帮手,也是老师的“智能助教”。根据不同年级的作文标准,“爱写作”可以从语法到用词、文章结构,全面且便捷地帮助使用者提升英文写作水平。

Q:下列关于“爱写作”功能描述正确的是:


妈妈再也不用担心我的词汇储备量不够了!

A:高级词汇推荐功能,“爱写作”可以针对某个特定的词或短语,自动关联三个同义词作为备选,并结合上下文语境,选出合适的替换词。

ד爱写作”可以支持小学、中考、高考、四级、六级、考研、托福、雅思共八大英语考试类型哦!

B:“爱写作”可以对所有文章进行评分,但无法测试同一篇作文在不同考试类型中的得分状况。

×太小看“爱写作”了,有微软亚洲研究院研发的微软新一代 OCR 引擎支撑,文字识别小意思啦!

C:“爱写作”可拍照上传,轻松将图片转换成可编辑的文字,但还无法识别学生们各不相同的手写字体。


在 COVID Insights 上,直观了解疫情传播特性和病毒学分析

丹棱君 OS“透过数字表面,更深入、多角度地分析新冠疫情。”

抗击新冠疫情是一场持久战,人类与病毒的斗争仍在继续。2020年4月,微软亚洲研究院的研究人员基于在计算生物学、数据分析等领域的专业知识和研究经验,构建了新冠数据分析网站 COVID Insights(covid.msra.cn),希望利用先进的技术挖掘疫情数据背后隐藏的规律和洞察。该网站主要包含流行病学、病毒学和研究趋势三大板块,以可视化和互动的方式直观展现了疫情在不同国家和地区的传播特性、引起疫情的病毒 SARS-CoV-2 的病毒学分析结果,以及全球最新的相关研究热点。

Q:通过COVID Insights网站分析,想要查看与COVID-19感染相关的高危活动,应该去以下哪个板块?


在流行病学板块的感染数据分析中可以查看,同时在这里还能获取感染趋势分析。

A:流行病学

×关于病毒的蛋白质结构以及最新信息和分析可以在病毒学板块找到。

B:病毒学

×研究趋势板块呈现了多个学科视角下的新冠病毒相关的热门论文和主题变化趋势。

C:研究趋势


AI助力治理空气污染,精细刻画“排放-污染物浓度”关系

丹棱君 OS:“AI 真的可以帮助解决环境问题?别问,问就是成本减少90%以上。”


控制和减少污染物排放是治理空气污染的重要手段。微软亚洲研究院与清华大学联合提出的DeepRSM 模型,能够精细地刻画空气污染物浓度,帮助决策者快速找到减排效果更好、成本更低的方案。该研究已在环境科学顶级期刊《环境科学与技术》上发表。

   Q:以下对于DeepRSM模型描述正确的是:


×这是耗时且耗力的大气化学传输模型(CTM)。

A:需要采样多种不同减排方案并使用模型模拟,才能对响应曲面有一个较准确的近似。

×这是耗时且耗力的大气化学传输模型(CTM)。

B:完成一次减排方案模拟需要使用超算集群运行1-2周完成。

Deep RSM 就是这么优秀!

C:在多个数据集上,DeepRSM对所需采样次数和数值模拟成本均减少90%以上。


代码智能新基准数据集,多角度衡量模型优劣

丹棱君 OS“能让机器‘写代码’已经很不易了好伐,它还设置了十个测试关卡!

微软亚洲研究院联合 Visual Studio 和必应搜索发布了代码智能领域首个大规模多任务的新基准——CodeXGLUE,可覆盖 code-code、code-text、text-code、text-text 四个类别,包含10个任务及14个数据集,且每个任务和数据集均提供了基线系统。

Q:什么是代码智能?


代码智能的目的就是这个!

A:使计算机具备自行编程的能力

×目前真的做不到啊!

B:代码能够根据数据集做智能化调整

×额,不少 AI 系统已经有了某种程度上的智能,但那不是代码智能干的。

C:让某段代码拥有智能


Q:CodeXGLUE的出现可以干啥?


以上答案均正确,小孩子才做选择,成熟的基准数据集当然是全都要!

A:将大幅度推动 AI 在软件开发场景的落地。

以上答案均正确,小孩子才做选择,成熟的基准数据集当然是全都要!

B:能够覆盖多种任务,以便从不同角度衡量模型的优劣。

以上答案均正确,小孩子才做选择,成熟的基准数据集当然是全都要!

C:在GitHub上开源,让学术界和工业界同行了解与使用。


集“百家”之长,成一家之言

丹棱君 OS“取他人之长补己之短,我需要好好学习一下这些技能。”

微软亚洲研究院继2019年面向自然语言生成任务推出预训练模型 MASS 之后,在自然语言理解任务上推出全新预训练模型MPNet。它在自然语言理解任务 GLUE 和 SQuAD 中,超越 BERT、XLNet 和 RoBERTa 等预训练模型,取得了更好的性能。

Q:全新预训练模型MPNet是在()和()的基础上扬长避短?


BERT 采用的 MLM 和 XLNet 采用的 PLM 都为 MPNet 提供了很好的“养料”。

A:PLM/MLM

×看来你还没有 get MPNet 的厉害之处哦。

B:XLNet/PLM

×看来你还没有 get MPNet 的厉害之处哦。

C:PLM/UNILM

Q:MPNet如何能够同时吸收以上二者的优点,而不引入各自的缺点呢?

以上描述均正确,为了取长补短,MPNet 可是花了大工夫呢!

A:借鉴双流自注意力机制进行自回归预测。

以上描述均正确,为了取长补短,MPNet 可是花了大工夫呢!

B:在非预测部分增加被预测单词的掩码及位置信息。

以上描述均正确,为了取长补短,MPNet 可是花了大工夫呢!

C:对比分析不同预训练目标对于输入信息的利用。


开源平台:“微矿 Qlib”和“群策 MARO”

丹棱君 OS:“整合跨界经验,探索 AI+行业的更多可能!”

微矿 Qlib”和“群策 MARO”是微软亚洲研究院推出的两个开源平台。其中微矿 Qlib 是业内首个 AI 量化投资开源平台,覆盖了量化投资的全过程,可以帮助实现量化投资流程的 AI 闭环。群策 MARO 则是针对不少行业都存在的资源调度优化问题,而构建的多智能体资源优化平台,可用于涉及资源供需匹配和调度优化的绝大部分业务场景中。目前,两大平台均已开源,欢迎大家关注和使用。

Q:MARO可用于资源优化调度的场景包括:


不要小觑MARO的应用能力,以上场景它均可大展拳脚。

A:共享单车中自行车与站点、人的匹配

不要小觑MARO的应用能力,以上场景它均可大展拳脚。

B:物流运输中集装箱与港口、船只、货物的匹配

不要小觑MARO的应用能力,以上场景它均可大展拳脚。

C:电信领域无线基站与用户流量的匹配

不要小觑MARO的应用能力,以上场景它均可大展拳脚。

D:制造企业的生产与排程


Q:相比传统量化投资开源平台,Qlib的创新点在:


以上均是。Qlib聚齐数据、算法和算力三大 AI 要素,帮助用户实现量化投资流程的 AI 闭环。

A:Qlib 完整的投资流程框架不仅让分析人员可以拥有更加整体的视角,而且工具齐全。

以上均是。Qlib 聚齐数据、算法和算力三大 AI 要素,帮助用户实现量化投资流程的 AI 闭环。

B:Qlib 提供了一个高性能的基础平台,从算力支撑到数据存取,都能够满足金融 AI 对于性能的高级别要求。

以上均是。Qlib 聚齐数据、算法和算力三大 AI 要素,帮助用户实现量化投资流程的 AI 闭环。

C:Qlib 的计算性能比传统 IT 平台快数十倍,可以让用户的 AI 模型更轻松地驾驭更多的数据。

以上均是。Qlib 聚齐数据、算法和算力三大 AI 要素,帮助用户实现量化投资流程的 AI 闭环。

D:Qlib 提供了专门的模型管理器模块,可以帮助用户更加系统化地管理自己的 AI 模型。


这些题你都答对了多少,又对哪些技术最感兴趣呢?快在评论区告诉我们吧!


对所有人来说,2020年是充满挑战的一年,希望崭新的2021年可以对大家都好一点,焕发新的生机,诞生更多可以让世界变得更美好的黑科技!



解更多:



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存