查看原文
其他

兰艳艳:理想温暖10年科研路,女性可以柔和,更要自信、专业 | 妇女节特辑

Isabel、李梦佳 智源社区 2023-01-22

她力量

近年来,“她”力量正在科学家群体中快速升温。


在一年一度的妇女节到来之际,智源社区选取了五位颇具代表性的女性科学家,进行了深度访谈。在她们中,有人选择食物图像识别,对选择的科研方向热爱到底;有人享受不确定的科研乐趣,在统计+生物学研究上更向前一步;有人也曾在读博和带娃的困难中迷茫,用理想温暖10年科研路;还有人从Facebook大厂回国,做更有温度的AI研究。


从她们的故事里,我们得以一览当代女性科研工作者的独特风采。



导读:数学博士,在美国加州伯克利大学担任访问学者,还有近十年的中科院计算所研究员经历……见面前,我在脑中为兰艳艳描绘出了一幅“学术、忙碌、雷厉风行”的精英女科学家形象。但当长发的她,身穿着淡紫色的毛衣微笑地走进采访间时,我感受到了扑面而来的知性气息。

 

“我觉得可能很多时候我们女性要自信一些。”她神采奕奕地说道。兰艳艳教授的采访,安排在一个2月末的下午。此时北京的气温已经开始回暖,和煦的午后阳光与智源大厦的红砖墙体相得益彰。关于女性科学家独特的风采,从与兰艳艳的访谈中便能窥探一二。


撰文:Isabel、李梦佳

 

01


从数学到人工智能:优美算法背后是应用的价值
 

做数学方向,辛苦吗?

 

在回顾自己的学生生涯时,兰艳艳坦言,迷茫是有的,“但我一直遵循着自己的兴趣,这让我时常感到自己做的事情是有意义的,令自己快乐的。”

 

出于从小就对数学保有的浓厚兴趣,兰艳艳本科就读了山东大学的数学院。

 

“其实高考是有一点小失利的,但很幸运大学在山大数学院打下了比较坚实的基础。”她笑着说,“大三开始,我们有了方向的细分。数学的每个小领域,差异都还是很大的。比起数学理论,我更对应用感兴趣。我想未来的金融、科技等领域会有越来越多的数据,那么统计学应该会很重要。那是我第一次接近与人工智能或者数据科学有关系的方向。


学生时代的兰艳艳


于是,带着对人工智能的朦胧认知,兰艳艳踏进了统计学的大门。

 

同年,兰艳艳得到了保研的机会,师从中国科学院数学与系统科学研究院的马志明院士,马院士做的方向是概率统计。随着学习的深入,到了研二进一步细分领域时,兰艳艳的再一次审视了自己的兴趣。“我还是对概率统计的应用比较感兴趣。”

 

凑巧的是,当时马志明院士正在与微软亚洲研究院的刘铁岩老师合作互联网搜索方面的研究,用机器学习的方法来研究搜索引擎上的网页排序问题。2006年年底,兰艳艳带着她对这个方向的兴趣,开始进入微软亚洲研究院实习。

 

彼时正值机器学习浪潮初见倪端,二十出头的她或许也没想到,此后的十几年,她就一直聚焦在这个领域,从信息检索、自然语言处理开始,从硕士到博士,直到现在。

 

“读博士期间,也有那种很辛苦、迷茫的时候。我记得我们当时小组里的六七个人,每天晚上11点多从中科院数学院自习教室离开,回自己的寝室。在微软亚洲研究院的时候,因为又涉及到刚进入一个学科,需要学很多新东西,早晨可能也要很早起床。但我觉得这个蛮正常的。”

 

数学的魅力让她不觉得累。每次看到一个个应用问题,用数学语言描述出来,再用相应的机器学习模型进行建模,并在实验数据上获得性能的提升,是让人很兴奋的一件事情。

 

“我一直很喜欢逻辑推理,数学那种理性思考的魅力让我一直对学习充满了兴趣。”

 

对后来的兰艳艳来说,学生时代掌握的数学,成为了后来开启她从事机器学习数据挖掘的一把密钥。

 

“我觉得数学更多的是培养逻辑思维这种能力,一旦掌握了这项能力,那么在实际问题建模的时候就会触类旁通,得心应手。所以很多数学系学生在接触到一些实际应用的问题时,他会习惯性的从数学的角度去理解和建模,把复杂的事情简单化,找到其中的关卡,有理性的解决,这跟多年的数学思维的培养离不开的。”

 

除了数学学科的启发,导师马志明院士是博士期间对兰艳艳影响最大的人,“在学术的规范和严谨方面,他对我们学生进行非常严格的要求和培训,这是一个非常重要的熏陶。”


博士毕业答辩,兰艳艳与导师在一起


“他有非常重要的一条原则,他说你们做应用数学的,并不是展现给别人你的数学有多强,这样就不是一个做应用数学的态度。做应用,就是要让数学在应用当中产生价值,推动的是应用问题的解决。”在理论之外,马老师会给她一些应用问题的原则性指引,这让她受益匪浅。

 

“其实很多应用问题,背后有很多美妙的算法。比如说我们做互联网搜索,背后是无数数学理论,比如马尔可夫链这样的算法在做支撑,是算法推动了技术。因此我对应用背后的这些算法的研究有了天然的好感。虽然很难直接change the world, 但我可以做很多本质的事情。


02


计算所的10年,用理想温暖10年科研路


如今,从兰艳艳2011年加入中科院担任助理研究员,也有了10年的光阴。

 

“回看这10年,我觉得确实是人工智能发展最为迅猛的10年。但有时候回过头去看看初心是什么,能给我一些启示。”

 

她提到加入计算所后做的第一项研究成果:机器学习算法都要依赖于标注数据,有时候大家会懒的去想标注,只拿已经标注好的Benchmark数据去做算法,提升性能。但是跳出这个思维定式想一想,这些标注一定可靠吗?一定是最合理的方式了吗?这其实有时候需要依靠对这个研究方向一个更深入的思考和了解。

 

凭借对互联网搜索这个领域的研究积累,她敏锐的发现传统用于排序机器学习的标注方式,即绝对式的相关度标注,标注准确性差,很容易产生噪声,这就导致建立在这些噪声标注上的算法难以刻画精准的查询文档匹配度。

 

为了解决这个问题,她和她的合作者提出了Top-k的排序学习框架,采用Pairwise “这个工作由于跳出了传统框架的惯性思维,提出了一个新的排序学习框架,从而获得了信息检索顶级国际会议SIGIR2012的最佳学生论文奖”,这也是来自中国内陆的研究机构第一次在SIGIR国际会议的舞台上获得重量级的奖项(注:微软亚洲研究院在08年获得该奖项)。


兰艳艳获得SIGIR2012最佳学生论文奖


“科研就是站在前人的肩膀上去解决问题,遇到一个难题没解出来的时候,会有痛苦,有困惑,也有抓狂,但是在不断摸索的过程中,那种抽丝剥茧,一点一点的进步,只到最后的豁然开朗,是一种很爽的感觉。而这种好奇心又会不断的驱使你再去解决新的问题,这就是衣带渐宽终不悔,为伊消得人憔悴吧,呵呵。”

 

沿着这样的好奇心,从排序机器学习,到提出Neural IR,探索文本生成,兰艳艳在信息检索和自然语言处理的基础研究上一直在耕耘。“我觉得科研很重要的不是和别人比,你做的怎么样,就是做你自己想做的事情,沉醉在里面,忙忙碌碌的,很纯粹,也很投入,这是一个真正的科研人员的状态。”

 

“在这个过程中,除了要感谢我的合作者,最享受的就是和学生们在一起的时间了。”

 

“刚毕业就开始和学生一起工作,大家一开始亲切的叫我兰姐,后来我老了,学生们越来越年轻,大家只能称呼我兰老师了。但是无论是兰姐还是兰老师,我的心态其实没有太大的变化,我希望他们能从我身上学习一些做研究的技巧,但更重要的,是希望他们找到自己的路。”


兰艳艳和学生在一起
 

现在,兰艳艳的学生们有的在高校和科研机构继续做研究,有的则在互联网大厂做应用,“老师这个职业一个非常大的收获就是看到学生一直在成长,这是除了研究,能带给我很大成就感的事情。成就是相互的,我也要特别感谢他们,过去的这些年我的每一次成长也离不开他们的帮助和陪伴。在我离开计算所的时候,我过去指导的学生们一起给我制作了纪念册, 他们整理了我这些年一些有意义的照片,并且每个人都写了祝福语,真的让我很感动……”


学生为兰艳艳做的纪念册


这也是兰艳艳成为科学家摸爬滚打的10年。作为团队里为数不多的女研究员,10年间,她从助理研究员,到副研究员,再到研究员,如果把女性、职称、晋级联系在一起,结合自身的经历,兰艳艳又有哪些经历?

 

03


女性可以柔和,但日常科研更要professional

 

乍一看,对于这样的晋升路径,10年并不算长。但兰艳艳表示,“不能说在女性中晋升很快的,把大家都看作一个整体,我可能算偏快的吧。”

 

纵观各个高校,女性走到正高的比例还是低的。

 

兰艳艳回忆道,“的确有一段时间,没有女性获得正高职称,或者偶尔只有一个。但我那一年比较特殊,6个正高中有4个是女性。”

 

“我觉得可能很多时候我们女性要自信一些。”兰艳艳表示,还是成果说了算的,这样才有机会。

 

她谈到了对她有很深影响的一位女性导师。2018年,学术上遇到瓶颈的兰艳艳到伯克利大学访学,与美国科学院院士郁彬教授合作交流。郁彬教授主要做数据科学方面以及医学的交叉应用。

 

“我从她身上学到了一点。柔和是我们女性一个天然的特点,这的确可以用到团队的管理中,比如说与学生的讨论,内部成员的协调等等。但同时,它可能也会带来一个劣势,那就是你会不好意思说难听的话。但是我跟郁彬老师讨论的时候,我发现很多时候大家都比较怕她,她会很直接地跟你讲你科研中的问题是什么,这种直接的方式经常会让学生觉得很难接受。但私底下她又回到了那种彬彬有礼的柔和女性。她的度掌握得非常好。”

 

“我学到的是,专业、职场上,这样的方式很高效。女性在管理以及日常科研上,你要 professional.”


  兰艳艳和同事活动
 

04


从儿子的教育中领悟AI:从亲子游戏到计算思维的碰撞

 

众所周知,女性科学家在科研道路上,有很多不得不面对的问题,特别是家庭,如何兼顾家庭与事业,一直是个难题。

 

在这方面,兰艳艳有一套特别的“方法论”

 

“我儿子是12岁,因为我爱人在外地工作,所以主要是我一个人照顾家里面的所有的东西,要带好儿子,然后还要搞好我的工作。所以这件事情对我还是我就挺挑战性的一个工作,但是我觉得也正常。


兰艳艳和儿子在一起
 

要说点小tips的话,我觉得可能提高效率,第一个是尽量不加班,就尽量你白天的工作的时间全部注意力都放上去,效率更高一些;第二个就只能带着小朋友干,他会感觉妈妈很超人,他也能也会想有自己的事业的发展,我觉得这对小朋友是一个好的事儿。

 

所以一般情况下,我们家客厅里面一张大书桌,一头就是我的地方,一头就是我儿子的地方,经常是我左边他右边就一起干,你就是一边处理自己的事情的时候,同时还能够兼顾到他的学习。”

 

有意思的是,兰艳艳这种方法还成了一番小事业。2019年,她同计算所的卜东波、包云岗老师,一同策划了“SIGMA数学特别兴趣小组”


SIGMA数学兴趣小组


“我们三个人的小孩一样大,他们两家是女孩,我们家是男孩。”

 

于是,西格玛小组就这样如火如荼地展开了,在科研的间隙,包老师和卜老师带着几个孩子学编程,兰艳艳则带着他们学数学,这场三个老师六个娃的亲子游戏俨然成为了数学和计算思维的融合与碰撞。

 

而她本人也在这个小组中,有所收获。

 

兰艳艳发现,人的学习跟机器学习可能是有很大的差异的,虽然算法的背后可能都在模拟人,但从自己与小朋友的这种互动成长中,她发现人的成长又有自己很多独特的东西。

 

05


Q&A:站在宇宙的维度思考生命的时间,不要给自己设限

 

1. 您刚才说的女性在团队里可能更柔和,但是又有一些缺点,这种问题应该如何对待?

 

相比于男性,并不是说站在性别对立的角度,怎么去让女性在科研团队里更加自信,然后更加的能够说出自己的那种想法,是很重要的。

 

这可能是个挺个性化的问题,因为每个人都可能都有自己不同的个性。但是我觉得至少有一句话是对的:女性一点都不比男性差,我碰到了好多的女科学家都非常厉害。

 

2. 日常生活中,时间分配、家庭教育上的挑战是如何解决的?

 

35岁以后,身体机能上可能有点下降,再加上确实家庭事业各方面事务繁多,能够让你聚焦沉下心来的时间可能不太够用,所以这个阶段就需要我们做好时间管理,哪些事情更优先级,家庭和工作怎么平衡。但我暂时没有年龄焦虑,我还觉得自己蛮年轻的,重新出发。


兰艳艳参加智源大会
 

3. 2022年的国际妇女节即将到来,女科学家也是女性团体重要的一部分。您对在校或者刚毕业的从业者、学妹们有什么样的寄语?尤其在学术和职业选择方面有什么样的建议?

 

我特别欢迎有更多的女性来学术界,虽然现在也不少。

 

我经常听到一些人对计算机女生的刻板印象:戴着厚厚的大镜片,每天就只会捧着书。我说你们这也太古板了,为什么搞研究的女生就什么都不能干了?我们也照样有多样的兴趣爱好,爱笑爱闹。所以我觉得女生不要给自己设限。

 

其实不管是什么年龄,或者是说你现在在做什么,是你已经在做学术还是没有,我觉得都不要给自己设限,因为你都有很多的可能性。

 

比如说我,从数学然后又到了计算机,我现在又做一些其他的事情,我觉得不用给自己设限,你只要一直保持一个学习的状态,然后你有很多个人机会的,这个过程当中,我觉得也会有一些志同道合的人跟你在一起做,也会有一些老师去帮助你去引导你。

 

女生可能会有比较明显的年龄焦虑,读完博士之后马上要结婚、生小孩,要如何如何,我觉得我自己而言的话,当时我生小孩的时候,在我博士的最后一年还休学了一年,我当时觉得这是个天大的事情,太受不了了,可能会影响很大,但是事情过去之后,你会觉得可以把时间拉长一点再去想。

 

如果我们从整个宇宙的维度来看,把宇宙的时间换算成一年,我们人类整个历史就才占十几秒,整个人类都非常渺小,所以我想说如果女性把整个生命的时间拉长,你有几十年的时间,那么其实你就不用care当下简短的一两个月或者是说几年的时间,不要给自己设一个时间和空间的限制,但更重要的是说你在当下这个时间点你在做什么。

 

你只要当下有一个目标,不管你的目标是什么,只要一直是在往前、往上,我觉得这个都是好的。



目前,兰艳艳已经加入清华智能产业研究院。在与智源的合作上,兰艳艳目前有两个项目。一个是她作为智源青年科学家日常的研究;另一个则是智源悟道的预训练项目,是关于药物小分子的一个预训练,希望在新的场景下,去尝试预训练的任务或者是目标是否适宜,她希望,有了这样的工具,将来为业界开放更好的应用。

  


复旦陈静静 | 把握当下,坚持热爱,与食物图像识别结缘的科研之路

  


UCLA李婧翌:女性最不需要做的就是「怀疑自己」| 妇女节特辑

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存