Microsoft Forms:小调查问卷背后的大AI
编者按:Microsoft Forms是由微软提供的一项在线调查问卷服务,旨在帮助用户创建调查问卷、测验和投票,并自动收集和分析回答数据。近期,Microsoft Forms又新增了两个功能:Forms design intelligence和Forms data ideas,这不仅能让它智能分析用户设置的问题并给出建议,还能进行多种数据分析,帮助用户挖掘数据背后的价值。本文就将为大家详细介绍这两项新功能,并揭秘背后的AI技术。
调查问卷大家都不陌生,即使你没制作过,但一定填写过。制作调查问卷的工具也越来越多,Microsoft Forms便是这样一项在线调查问卷服务,可以帮助用户轻松创建调查、测验和投票,并自动收集和分析回复结果,一经推出便获得了企业和教育用户的青睐。不过今天的主要目的不是讲这款产品,而是要跟大家聊一聊Microsoft Forms背后的研发故事,因为智能化制作一份看似简单的调查问卷,背后的过程却暗藏玄机,而且跟如今最火热的人工智能(AI)也是密切相关。
Microsoft Forms最近新增了两个功能,一个是Forms design intelligence,另一个叫做Forms data ideas。前者使用NLP(自然语言处理)及相关技术让问卷设计更加智能、简便;后者通过数据挖掘和智能分析,可以从问卷中获取更多洞察。微软亚洲研究院与产品部门的紧密合作,让最新的AI技术和算法得以第一时间应用到了微软产品中。
之所以叫做Forms design intelligence,就是让问卷的设计过程更加智能,背后融入了来自微软亚洲研究院知识计算组的自然语言处理技术。这里的智能主要体现在以下几个方面:
首先,能够智能分析问卷的关键词。例如时间、地点、事件,其中的技术关键便是NLP里面的实体识别技术,这在标题判断中起到了很大作用,因为标题长度普遍较短,所含的信息量极少,没有可以利用的上下文,通过实体识别,系统可以标识出最关键的实体,从而更充分地利用调查所涉及的背景与内容,生成高度相关的问题,供设计者选择。
如下图,当你设定的调查问卷的标题是“Contoso event feedback”时,系统将通过识别实体“event feedback”,自动生成一系列与活动意见反馈相关的问题,你可以选择全部,快速生成调查问卷。
其次,可将问卷中的句子拆分成不同的词语,进行标注、分类,从而用于不同的目的。这里的关键技术是NLP中的一般序列标注,由于在真正的领域中应用时,精度存在问题,在Microsoft Forms中研究员们对这类技术做出了工程上的修正和优化,使之在问卷设计时候表现更佳。
第三,可以根据上一个问题自动生成下一个问题,根据一个问题答案生成其它的答案选项。例如,当第一个问题是“你的工作职位是什么?”,系统生成另一个问题“你的性别是什么?”当输入的第一个答案选项是“销售”时,系统会自动生成其它的推荐,如“市场调研”、“HR”、“法务”等。这项能力与前两个技术的使用息息相关,因为NLP让Forms design intelligence能够更好地“理解”问卷制作者的想法。
此外,Microsoft Forms系统还会判断问题的类型,针对不同类型的问题,自动推测问卷制作者可能会设计的选项。例如问题是“你是否还是学生?”系统会给出“是”、“否”、以及“不确定”三个答案供选择。
在问卷设计过程中,Forms design intelligence通过不断地推断、提供选项,让用户只需要敲几个单词、单击几次鼠标,就可以在5分钟之内雕琢出一份完美的调查问卷,马上就可以发送给目标用户。
Forms design intelligence的着力点是在问卷设计阶段,Forms data ideas则针对问卷收回后的数据分析问题。调查问卷的目的就是为了收集具有代表性的回答数据,并希望从中分析得到隐藏的价值和洞察,得出有用的结论或预测,进而指导下一步的计划和行动。但是大部分问卷制作者并非数据分析专家,想要挖掘出数据中隐藏的信息,并不是一件容易的事。
微软亚洲研究院数据、知识、智能领域的研究员们将关联规则挖掘、相关性分析、聚类分析等常见的数据挖掘方法和情感分析等自然语言处理技术融入了实际产品中。利用Forms data ideas,普通用户也能变身为数据专家,快速发现数据的洞察。Forms data ideas的此次功能更新,便主要基于以下几个来自微软亚洲研究院的技术转化。
交叉分析:例如,在“对此次活动是否满意”的问题问答中,发现来自于人力、法务、销售等部门的满意度要远远高于金融部门。那就意味着,你可以针对人力、法务、销售这三个领域沿用现有策略来组织将来的活动;但针对金融部门将来的活动需要改进一下方案以提高参与者的满意度。
关联规则分析:该方法能够发现调查问卷中问题之间蕴含的关联规则。例如,市场营销案例中的经典案例“啤酒和尿布”——上世纪90年代,美国一连锁超市通过分析销售数据,发现了“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一购物篮中,原因是年轻父亲在超市购买尿布的同时,会顺便为自己购买啤酒。而类似这样的不易发现的规律往往能帮助归纳出潜藏在问卷回答中的宝贵结论。
相关性分析:其作用是帮助发现两个问题之间存在的相关密切程度。例如有两个问题“活动前你了解多少该活动的信息?”和“你是否愿意将该活动推荐给朋友?”这两个问题看似没有关联,但是通过数据分析,你却发现活动前了解信息越多的人,越倾向于将活动推荐给其他人。Forms data ideas正是通过这样的相关性分析,帮助用户发现不易发现的信息。
文本情感分析:对于问卷中的主观问题,过多的反馈信息可能会让分析者眼花缭乱,无从下手。Forms data ideas可以将参与者的带有情感色彩的主观反馈信息进行分析、处理,并将结果归纳为三类:消极、中立和积极。通过这样归纳、推理,避免了人工一条一条检查的工作,方便分析者把更多的精力用来更深入地挖掘和了解问卷反馈。
此外,Forms data ideas还会随着反馈数据的变化,不断更新数据分析的见解洞察。将多种分析方法、多角度分析相结合,即使对数据分析一窍不通,你也可以快速地获得问卷回答数据中的隐藏价值。
对于微软亚洲研究院的研究员来说,Microsoft Forms功能改进背后的这些算法和技术并不算复杂,只是平时诸多研究成果的一角。但AI算法和技术的小小提升,却可以给实际产品的功能带来质的飞跃。当然在研究领域,这些都是通用的算法和技术,如果直接使用,其性能表现可能会很差,要让它们能够在特定应用领域发挥更好,让应用体验达到甚至超出用户的预期,那就需要更多地打磨算法,从工程角度与产品部门紧密合作。
为了确保将最新的AI技术融入到微软产品中,微软亚洲研究院的研究员与产品部门之间设立了固定的沟通机制,双方并肩作战,深入了解用户的实际需求。来自微软Office团队的孟思表示:“微软亚洲研究院在自然语言处理、数据分析等领域的领先技术为Microsoft Forms以及其它Office产品提供了AI核心。研究团队和产品团队每周都会进行日常沟通,以确保用户的声音和反馈能够及时被研究院同事听到。这样的工作模式确保整个团队是围绕用户实际问题来研究解决方案。”而这样的合作经历也让研究员们能够了解更多实际问题,从而反馈到他们的日常研究中去,启发新的研究思路。
微软AI讲堂2019校园行
3月18日,“微软AI讲堂2019校园行”首站将在中科院计算所开启!我们请到了超强嘉宾阵容,扫描二维码查看首站活动信息及报名,获得与嘉宾们面对面交流的机会。
期待与你,在此“预见”!
你也许还想看:
感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:msraai@microsoft.com。