科学匠人 | 宋謌平:探寻科研,当如三岁之翁,百岁之童
科学研究任重而道远,有很多人为此贡献了一生。今天,“科学匠人”故事的主人公是这样一位年过花甲但仍然享受科研创新的一线前辈——微软亚洲研究院首席研究员宋謌平博士。已从事语音研究工作近四十年的他,在加入微软亚洲研究院之前,已在贝尔实验室工作了二十年,而今他在微软亚洲研究院也已十余年。
如何能数十年如一日地坚持保持如初的热忱?是否遇到过中年危机,如何度过35岁+的迷茫与彷徨?又如何突破自我,不断寻找新的研究方向?在这里,让我们一起来听一听宋謌平博士的经验分享。
宋謌平,微软亚洲研究院首席研究员
宋謌平博士从来都不认为自己是所谓的“大师”,他只是一个学习者,一个一直都在学习中的老学生。强大的好奇心驱使他不断探索未知领域,学习新事物,而这正是他在创新研究工作中永葆激情的秘诀。
玩儿好,才能学得开心
明末清初的大学者顾炎武是宋謌平最钦佩的学人。他是杰出的思想家、经学家、史地学家和音韵学家,也是明末清初的“三大儒”之一。最具影响力的代表作品为《日知录》,其中不乏许多名言警句,他在书中说:“保天下者,匹夫之贱,与有责焉”,后来梁启超将其精简为“天下兴亡,匹夫有责”。受当时的政治影响,顾炎武决定周游全中国,将每天看到的新事物、新知识记录下来,经过三十余年编成了《日知录》。
受顾炎武的影响,宋謌平发现,如果能每天找到一两件事让自己保持积极乐观的状态,对于一个人长期坚持投入某项工作将非常有帮助。换句话说,你要学会“自己逗自己玩”。
而“自己逗自己玩”的前提是“独立与独处”,这里并非指社交或物理意义上的隔离,也不是大家常说的经济独立,而是精神上的独立。在宋謌平看来,作为一名治学者,保持着好奇心,不断追寻,需要有自己独立的人格,在精神层面能够坚持,对外与人沟通顺畅,对内怡然自得。
反观周遭,有些人在专业层面、宏观大势层面都相当有见解,但能够用心向内观察自己的时候并不多,甚至不少人对娱乐自己存有误解。宋謌平所提倡的“娱乐”自己,不是简单的吃喝玩乐,而是挖掘自己的兴趣点。这个兴趣点可大、可小、可雅、可俗,但总能看到让自己欣喜的新知识,总能去做让自己愉悦的兴趣之事,在无形当中,其实就形成了自己的学习模式,宋謌平将其称为“细水长流模式”,很多新事物、新知识就像海绵吸水一样,不经意间就渗入了个人的血液中。
宋謌平表示,自己的这一模式可能得益于小时候的经历。宋謌平的父亲是一位书法爱好者,所以从小学开始他就跟随父亲学习书法,尽管表现不错,但也只是一个初级玩家。不过这样的经历,却让宋謌平体会到了“在玩耍中学习”的乐趣,并将这个习惯不经意间扩展到了工作、生活的所有领域,让他总是能够以放松的心态面对一切:学习、坚持、面对挑战…… 所以,有人可能会疑惑那么枯燥而单调的科研生活,他怎么能够坚持几十年不变?不会乏味吗?不会有瓶颈么?但在宋謌平而言,这些都不是问题。
另类思考,探寻事物隐藏的本质
1965年诺贝尔物理学奖获得者 Richard Feynman 曾受邀到贝尔实验室进行量子计算的演讲,宋謌平便从 Feynman 身上学到了另一种思维方式。Feynman 在加州大学任物理学教授时,就曾尝试不使用微积分来教大一物理,他用简单的数学和更直观的方式,让学生感受学习物理的快乐所在。当 Feynman 来贝尔实验室做演讲时,宋謌平对演讲内容不甚理解,却自此爱上了 Feynman 的演讲方式——用最简单的语言去描述一件事物的本质。
“不要被传统的习惯和思维所束缚,在了解新事物、学习新知识的时候,其内在的本质比名词更重要,在字面之后隐藏着更多知识与内涵。就像水一样,表面来看它是流动的、不能根据容器来定义形状,但如果探究其背后的本质会发现,水能够以液体、固体与气体形态出现,所以不要被表象所迷惑,”宋謌平说道。
因此宋謌平认为,成为科学家本身就是一件很有趣的事,无论是科学家、研究者还是工程师,都是在努力发现本质、再创新,使之为人类所用和提升人们的认知水平。“如果我们能够以放松的心态去追寻科研的本质,做研究就最让人开心,”宋謌平表示。这也是为什么他在这个年纪仍然选择做研究的原因,“三岁为翁,百岁为童”学习当与年龄无关,才是他想要的状态。
很多人都会认为做研究、写论文非常高深,但在宋謌平眼里,它们与日常生活密切相关,生活中看到的规律,在科研中一样存在,不要把他们割裂,工作和生活完全可以融为一体、互相促进。
技术研究:发现其与生活的内在联系
目前,宋謌平所在的微软亚洲研究院语音组正在研究序数回归算法,并将其转化用于微软小英这个辅助英语学习的 AI 产品以及微软 Azure 与语音相关的服务中。而在第一次看到序数回归时,宋謌平其实并不完全了解它,不过在学习之后他发现,关键不只是一个回归问题,还伴随着另一个有趣的话题——作为算法的创造者,研究员们一直在想方设法找到相关度量或方程式,以期望通过最简单的方法实现最好的优化,但在生活中,不是所有东西都是客观、可测试的,还存在了主观感受。
例如,日常的英语演讲比赛需要评委打分,从1-5分中给出分数。评委可能会今天给3分,一觉醒来又变成2分或4分,主观评价会随心情不同而有所变化。同时,还要考虑新评委、新评分加入的可能。这种情况下,就需要改变方法,对评委进行偏好测试。而如果将平均意见分数和偏好测试都应用于序数回归算法中,那么语音编码、语音合成就容易得多,之后再将不同的编码或合成样本放到语句中,组合成不同句子,再次进行评分排序,复杂度就降低了很多,计算机将可以更好地完成这项工作。
其实无论是语音合成的发音,还是图像、视频好坏的标准评判,都存在主观的判断。早年在美国的中文学校教孩子们学中文时,宋謌平就对此深有体会,现在将这些生活中的体会运用到研究中,探索将主观指标转换成数字上可优化的方法,他觉得非常有意思,这也成为微软小英将想法变成现实的最好的训练过程。
写论文就像做中国菜和写菜谱一样
总能从生活中获得灵感的宋謌平还发现,写论文与做饭的本质很类似,尤其是做中国菜、写中国菜谱。他分享了这样一则故事:
上个世纪30-40年代,时居美国的现代著名学者、语言学家、音乐家赵元任先生,他的妻子杨步伟非常擅长厨艺,久而久之便萌生出写菜谱的想法,教外国人学做中国菜、点餐或是选择食材。最初食谱是用汉语写的,后由赵元任和女儿翻译成书,在文字的翻译中,也可以一探做菜的讲究。
例如,“滚刀块”,是指滚动原材料,如茄子、土豆,通过斜刀的方式将其切成大致相同的块状,因此翻译成英文应该是“Rolling knife ingredients”;中国烹饪中的“炒”,赵元任却给出了一长串的翻译,“Big fire, shallow fat, continuous stirring, and cut up material with wet seasoning,quick frying”,也就是大火、少油,持续搅拌,然则将食材切块加入酱汁快炒。最终他用了很别致的两个英文词 “stir fry”。
在宋謌平看来,写论文与做中国菜有异曲同工之妙,就如自创菜式。想要写一篇论文,首先需要收集其他相关论文,可以认为是食材,所处年代、研究方向都无所谓,然后进行筛选,最后再钻研自己的烹饪方法。
“筛选食材”的过程,宋謌平给大家提供了一种方法——猜答案法(Guesstimate)。看到一篇论文,不要着急阅读全文,先只查看标题,看是否可以猜出论文的大概内容;再读摘要,查看是否漏掉了哪些信息,然后根据摘要继续猜测;最后再仔细阅读全文,验证此前的猜测是否正确。有了这个猜测的过程,猜错的话也不要紧,你可以获得一个新的想法或新的算法;而猜对了就表示你能顺藤摸瓜直奔答案,尤其是作为编者,你的二次产出将会在思想上获得新的认知,同样的问题解决不会再照搬复制,更有可开辟的新的方法。
在今天碎片化信息过剩的时代,研究人员都要研读成千上万篇的论文,如果用上述方法去做自己的论文,则可以事半功倍。宋謌平还强调,在遵循“猜答案法”时,也要像做序数回归研究一样的优先级设置,从而做好时间管理,进一步提高效率。
追求极简主义,就是一个创新的过程
“在画布上,任何东西的存在,如果没有建设性,一定有破坏性。”画家林风眠的这句话宋謌平一直记在心里,虽然这是在谈艺术,但对于科学研究,这个道理也是相通的。
宋謌平在美国教中文时就有过类似的体会。对于母语是汉语的宋謌平来说,教中文他本来信心满满。最初,他先教孩子们注音符号,不用汉语拼音,但过了一个暑假,孩子们通通忘光;痛定思痛,他改为教汉语拼音,并发现孩子们非常喜欢,而且因为汉语拼音与英文字母更相近,所以孩子们容易记忆,即使长假过后仍然能够记住。
无独有偶,宋謌平在日本交换研究访问时,沟通中也看到了类似的现象。一方面,日本的汉字与中文相似,意思也很相近,另一方面,日语中很多的外来语,由其它语言简化而成,例如,“ パソコン(个人电脑)”就是 “Personal Computer” 的简化,“ テレビジ(电视)”就是 “Television" 的简写。基于这些发现,再结合上文提到的猜答案法,宋謌平很快就适应了这门异国语言,可与日本朋友无障碍交流。
宋謌平于1987-1988 年在日本 NTT-EC 研究所交换访问时,与接待主人古井贞熙博士合影
这种贴近事物本质的学习方式,宋謌平称之为极简主义。“大道至简,追求极简主义的过程本身就是一个创新与归纳的过程。如何用最少的原则、定理,解释最多的现象,这在人工智能研究的多个领域都十分重要,”宋謌平说,例如机器学习和模型算法的训练,就在研究如何使用少量的参数来整理与记忆大数据集,减少过度的训练和计算资源的消耗,以找到更高效、低成本的训练方法,让 AI 系统更加强大,而不是无限堆叠算力或数据。
你也许还想看: