查看原文
其他

科学匠人丨ACM杰出会员谢幸:让你的每一项工作都经得起时间的考验

微软亚洲研究院 微软研究院AI头条 2020-09-13



编者按:在刚刚过去的10月底,一年一度的 ACM 杰出会员评选结果正式揭晓,微软亚洲研究院首席研究员谢幸因在计算机科学领域的突出贡献成功入选,而在上周五开幕的 ACM SIGSPATIAL 2019 国际会议上,谢幸与研究团队在十年前发表的论文“Map-Matching for Low-Sampling-Rate GPS Trajectories”又获得了“十年影响力论文奖”。

 
微软亚洲研究院首席研究员谢幸
 

又是一个快乐的周末,北四环海淀人民小明准备与好友相约打卡国贸三期的一家网红餐厅。为了防止拥堵,小明提前用手机导航 APP 查了查路线和交通状况,并像以往一样通过出行 APP 叫了车。到达餐厅附近后,小明打开“位置共享”与好友顺利碰头。


今天,便利的出行服务已经极大地改变了我们的出行方式,这些生活服务都离不开我们的位置信息,而十年前,科技公司们还在对“用户在哪儿”一筹莫展。“当时记录定位信息还要用 GPS 轨迹记录仪,有些旅行爱好者会专门用 GPS 设备记录自己的路线,然后晒到社交媒体上,大家都觉得特别‘极客’。”这让微软亚洲研究院首席研究员谢幸印象深刻,“那时已经有不少关于车辆轨迹的研究,对人类轨迹的数据挖掘才刚刚起步。”

直到手机 GPS 普及,用户定位数据才开始大量涌现。随着数据越来越多,谢幸发现,人类的 GPS 轨迹和车辆轨迹有很大的差异。车辆的 GPS 轨迹通常是连续而稠密的,但人们的 GPS 数据和手机使用有关, “当你打开 APP,手机会记录一个点,你拍下一张照片,手机再记录一个点,用户的 GPS 轨迹是一个个离散的点,再加上民用 GPS 的误差,很难真正定位到用户的具体位置,也就难以进一步挖掘数据中的价值。”

于是,谢幸与研究团队提出以地图匹配的方式,把一个个不连续的点映射到地图中拥有具体语义的位置上,并结合人类运动轨迹的特有属性,来更精确地定位用户的位置信息。在空间信息领域的顶级会议 ACM SIGSPATIAL 2009 上,他们的研究成果“Map-Matching for Low-Sampling-Rate GPS Trajectories”收获了大量关注。十年后,SIGSPATIAL 2019 大会颁布“十年影响力论文奖”*,这篇在2009年发表的论文经历了整整10年的检验,证明了它在学术和应用领域的价值。



“这篇工作能够获奖,我认为有两个原因。十年前,很少有人关注用户定位数据和位置分享应用,”谢幸回忆,“我们在早期就发现了这个问题,提出了一种解决方法,此后的研究都可以应用或改进我们的工作。”论文发表后,日益丰富的数据催生了相关研究的大幅增长,用户轨迹数据的地图匹配成为了这个领域的经典问题之一,也曾作为数据比赛的主题吸引了大量参与者。“另一个原因是,它处于计算机科学和空间信息科学的交叉点,是一个由数据和应用驱动的研究。”正因如此,跨领域的研究者能够率先注意到这个问题。

在刚刚过去的10月,一年一度的 ACM 杰出会员评选结果也正式揭晓,谢幸由于在时空数据挖掘和推荐系统领域的杰出科研成果成功入选


自然语言处理与推荐系统的“联姻”


从多媒体、移动搜索,到数据挖掘、用户画像和推荐系统,随着领域前沿的发展,谢幸带领着微软亚洲研究院社会计算组适时微调着研究的航向。

“很多人问我怎么看追热点。其实当一个问题成为热点时,通常这个方向会有很多新的突破,而且突破速度会非常快,这时你有能力并投入大量的时间和努力,就可以在这个‘快车道’上把已知的边界更快地向前推进。同时,当某一个领域比较成熟后,我们又可以找到一个和新兴问题的结合点。”

社会计算组正是从十年前开始了对用户数据挖掘的研究,“我们的研究兴趣源自人类本身。我们通过数据来了解人们如何做出决定,预测人们的行为,并根据预测为人们提供个性化服务,让人们获得更多便利。”

有着20多年历史的推荐系统在今天依然热度不减,身影遍布 WWW、SIGIR、KDD、ACL 等不同领域的顶级计算机学术会议,因为各个领域的技术都在推荐系统中具有用武之地。谢幸与他的研究团队也正在将最新的自然语言处理技术应用到推荐算法中,并在新闻推荐、可解释推荐等方面取得了许多新的进展。

新闻推荐的特别之处在于,传统的商品推荐都是基于已有的用户访问历史,但新闻每天都是新的。如果换一个视角,将新闻推荐作为自然语言理解领域的问题来研究,那么新闻推荐要研究的就是用户过去浏览的新闻和今天推送的新闻之间的关联度,本质上是一个文本匹配问题。自然语言理解领域在过去几年中发展迅速,涌现出了很多新方法、新模型,传统的关键词匹配也已经被向量匹配所替代,这些自然语言理解技术的进步让新闻推荐变得更加精准。

“我们发现,近年来广告中大量的技术进展,也是得益于自然语言理解技术的发展我们把可解释推荐、文本生成的技术用于生成推荐的解释,得到了一些有趣的结果。”过去的商品推荐通常不会向用户解释具体的推荐理由,而如果推荐算法能够自动生成推荐理由,为用户展示“买它的 N 个理由“,推荐的效果将能大大提高。“我们和微软必应搜索的广告团队有非常多的合作,我们的许多算法给必应搜索的广告带来了切实的商业价值。在微软亚洲研究院‘创新汇’中,我们也与中国外汇交易中心合作完成了相关研究,期待未来有更多的应用。”

知识图谱和推荐系统的融合也是谢幸关注的方向之一,知识图谱能够提供原有数据之外的大量推荐线索。微软亚洲研究院社会计算组在 WWW 2018 发表的一篇论文探索了将知识图谱特征学习引入推荐系统的思路与实现方法,获得了非常大的反响。“这会是一个持续的热点,还有很多可以挖掘的地方。”谢幸表示,他们将持续关注和引领跨领域技术的融合。

用户兴趣在知识图谱上扩散的过程
 

一个研究员的成长路径,不仅仅是做研究


在中国科学技术大学读博时,谢幸成为了1999年的首届“微软学者奖学金”得主,2001年博士毕业后,谢幸就来到了微软亚洲研究院。近20年的时间里,他见证了微软亚洲研究院的成长。“微软亚洲研究院里的生活比较纯粹,有很多时间可以不受干扰地做研究,所以最开始我们都在公司里埋头钻研。后来我们不仅大量地与学术界合作,也越来越重视我们的研究对微软核心产品的影响力,这给我们带来了很多新的收获。

1999年,谢幸(中)荣获首届“微软学者奖学金”

在微软亚洲研究院,各大研究组和学术合作部一起与学术界开展了多样的合作项目,从合作研究、访问学者,到联合课程和“明日之星”实习生项目等等,微软亚洲研究院与中国乃至亚太的许多高校都建立了深入的合作关系,共同交流和分享学术研究成果,培养人才,也相互学习和进步。而与微软的核心产品团队合作,既让研究能借助微软产品和数据的优势脱颖而出,更让产品能直接从最新的科研成果中受益,让研究真正经过应用的检验。

“今天我们和产品团队的合作已经非常深入、全面和多元化了。产品团队的同事会经常主动与我们交流最新的技术趋势,探讨有哪些新算法能用在产品里。此外,微软亚洲研究院‘创新汇’的成员企业也会和我们讨论他们遇到的应用痛点。这说明你不仅研究做得好,对产品或者工业界也有影响力,而这些能力都是需要时间来锻炼的。”

18年光阴如梭,从独立做研究,到带团队做研究,从中国计算机学会(CCF)杰出会员到 ACM 杰出会员,从学术成就到引领微软核心产品,谢幸坦言在微软亚洲研究院的多年经历让自己有了非常大的改变。

然而,始终不变的是做研究的乐趣。一次次梳理和分析,一次次头脑风暴,将复杂的问题深入挖掘,这个过程为谢幸带来源源不断的研究乐趣。“做过研究的人都知道,有很多好的想法和理解其实没法完全写在论文里,更多的是会在平时的组会讨论和私下交流里,大家一起把问题想得非常清楚和透彻,真的非常有意思。”在微软亚洲研究院这个汇聚了众多优秀研究者的地方,不同领域的研究爱好者们在分享和交流中寻求灵感的迸发,也在这样的研究氛围中相互感染。

”一个研究员的成长路径,绝不仅仅是做研究,”回顾自己在微软亚洲研究院一路走来,谢幸感到很幸运,“除了提高学术研究能力,培养自己对学术界、对产品和工业界的影响力和领导力,这些都是必经的步骤,这样才能够全方位地成长。”

Q&A:怎样做有影响力的研究?


Q:在您看来,什么是有影响力的研究?

谢幸通常大家会用一些指标来衡量影响力,比如我们这次的获奖论文有超过600个引用,一般超过500个引用,绝对算是一篇有影响力的论文了。但我认为衡量研究影响力的方式不是唯一的,有影响力的研究可以是几种类型。

第一种是定义了一个新的问题怎样找到这样的问题?有时候是站在不同领域的交叉点,有时候是某个应用场景刚刚兴起,也有可能是数据、应用、计算能力各方面的变迁,导致一些新的问题产生了。如果你在早期就看到这些问题,并投入去做,往往会比较有影响力。第二种是解决了长期存在的难题,这种研究可能会更难,但也更有影响力。第三种工作虽然没有定义新问题,但标准化了某个问题,比如某一个数据集成为了这个领域非常重要的基础,后人都可以在这个数据集上进行算法的比较。还有一种是提出了非常实用的方法,能高效的解决工业界中的实际问题。

总之,研究影响力应该有很多种,分别对应着在研究的不同阶段做出自己的贡献,并不能以唯一的标准来衡量。

Q:对于如何做有长久影响力的研究,您有什么建议?

谢幸首先选择研究问题是非常重要的,对于怎么选择研究问题,我们总结出三个标准:第一当然是兴趣,如果研究者没有兴趣,那么就很难深入。第二是个人在相关领域的基础和研究能力,这是需要长期积累的,只有兴趣而没有能力,只能做出非常肤浅的研究。第三,选择有实际应用价值和社会需求的研究问题,这些问题往往非常受关注,进展比较快,而且有很多人能和你讨论。但受关注不等于追热点,只要是真正感兴趣的点,都可以坚持去做。

另外,我觉得要始终高标准要求自己有的学生自我要求不高,一些小想法就想发论文,没有想过这篇论文在后人看来有多少价值。十年前我们不会想到当时的工作能获得“十年影响力论文奖”,ACM 杰出会员也是要求15年以上的专业经验,这些都需要日积月累的高标准工作。我经常跟学生和组里员工说,你正在做的这些工作,都会成为未来对自己研究成果进行总结的基础,你要让每一项工作都经得起时间的考验

* SIGSPATIAL 2019颁布“十年影响力论文奖”
https://www.sigspatial.org/people/award-recipients/



你也许还想看



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存