华师第一人!定ISO国际标准!
前段时间
计算机学院郝天永教授
组织编制的一项ISO国际标准正式获批
这是华师历史上
首个牵头制定的ISO国际标准
经过第5轮超过20个国家参与的正式国际投票,华师计算机学院郝天永教授牵头制定的国际标准项目ISO 24617-11 SemAF-MQI(语义标注框架-可度量数量信息)最终于2021年8月由国际标准化组织(ISO)正式获批发布。这是我校历史上第一个牵头制定的ISO国际标准,也是我校“两高两化”工作开展以来取得的重要国际化成果突破。该国际标准对提高我国参与国际竞争影响力和话语权、契合提升国际市场竞争力的国家战略具有重要意义。
历时5年,披荆斩棘
早在2014年,郝天永就在自然语言处理领域发表过语言资源管理相关的论文研究成果。之后,在一次与中国标准化研究院研究员交流的过程中,郝天永和对方一致认为语言资源管理是未来数字资源的重要基础,涉及范围广泛并能产生较大的社会效益。
于是,在2016年,郝天永率领科研团队,联合中国标准化研究院团队,围绕国际社会和国家发展热点需求,以大数据、人工智能技术为基础,提出了面向自然语言分析与理解的数量信息语义表示框架的标准项目构想。
在国际标准申请过程中,很多事情并非一帆风顺。郝天永团队面临着分别来自荷兰与德国资深团队所提方案的激烈竞争。团队顶着强大压力,克服人员少、经费少、国际沟通要求高等困难,稳扎稳打不断优化技术路线,持续联合多国专家组进行解释与沟通,以追求更大程度的协调和优化。
为进一步完善该国际标准,郝天永带领其科研团队共同前往日本大阪,参加自然语言处理的顶级会议COLING,又先后于20场国际学术会议和ISO会议上进行宣讲。团队于2017年到奥地利维也纳参加国际标准化组织技术研讨会议,于2019年在加拿大渥太华向各国专家介绍标准内容与方案,以及在微软亚洲研究院进行专门报告等。
即使面临着重重考验,郝天永团队仍然以追求高水平为目标:“我们的标准是盯着IS走的!”国际标准有IS、TS和TR三类,IS即International Standard,是国际标准这三类中含金量最高、级别最难的基础性标准。这项国际标准对时间周期的要求非常严格,郝天永团队需在24个月内完成从新提案(NP)到委员会草案(CD)、国际标准草案(DIS)、最终国际标准草案(FDIS)、正式国际标准(IS)的关键步骤,每一步都需要国际投票通过,否则,该国际标准将作废处理。每轮投票结束后,郝天永团队都会收到来自法国、德国、奥地利以及伊朗等不同国家的建议,有时甚至在一日之内收到数百条信息。
“宁坐板凳十年冷,咬定青山不放松。”即使在投票通过后,郝天永及其团队仍然一刻不停,有一次,他们甚至把自己“关在酒店”,不舍昼夜,“针对每一个字逐条回复”。就这样凭借坚持不懈的执着努力以及实力过硬的专业水平,最终,该项目从早期预立项(PWI)到成功立项(NP),并被国家市场监督管理总局列为2018年中国牵头研发的36项国际标准之一。
ISO国际标准申请过程艰辛,协调工作耗时耗力,但这些并没有打消郝天永团队坚持科研的热忱。2021年8月最终一轮国际投票活动通过,该ISO国际标准正式获批并出版。
一分耕耘,一分收获
经历重重考验的ISO国际标准
未来将发挥重大作用
初级应用,发挥社会效益
ISO即International Organization for Standardization的缩写,中文名为国际标准化组织,是标准化领域中的一个国际性非政府组织,也是全球最大最权威的国际标准化组织。据悉,经国家标准化委员会推荐,郝天永教授已正式成为国际标准化组织技术工作组注册专家,并任命为全国语言与术语标准化委员会副秘书长。
郝天永团队负责编制的ISO国际标准编号ISO 24617-11,全称Language resource management - Semantic annotation framework(SemAF)- Part11: Measurable quantitative information (MQI),简称SemAF-MQI,以表示自然语言文本中大量存在的数量信息为研究对象,构建了描述实体对象、测量关系、比较关系、数值、量等元素的元模型,给数量信息语义表示的一般形式化定义,提出了通用语义表示框架。
从医院的电子病历文本数据,到上市公司的各种文本报告数据,都包含着大量的非结构化数据,即自然语言文本。郝天永表示,自然语言文本的分析和理解是目前数字资源利用的基础,其中包括对大量蕴含的可度量信息的表示和抽取。“我们关注的是可度量的数量信息,即能够数值化的数据。”但该国际标准并不止步于自然语言处理。郝天永认为它的真正目的在于辅助计算机处理以及大规模大数据分析,并形成智能化辅助决策。“以区域教育治理为例,我们需要把各种教育文本中的指标信息数值化,形成可度量数量信息,从而利用计算机进行自动处理以得出有效决策辅助。”
该国际标准可以广泛应用于教育、金融、医疗等行业的数据抽取表示和数据分析。以中外标准对接为例,此标准可以解析国际市场中国外商品的参数数据,让国内企业了解到国外相关产品的技术标准,从而促进商品领域的中外标准对接,推动我国制造业转型升级,为我国企业走近“一带一路”提供基础支持。
目前,该国际标准的技术已应用于美国哥伦比亚大学医学中心对全球临床试验文本数据大规模分析、美国梅奥医学中心(Mayo Clinic)患者用药数据分析以及中国人民银行下属中国电子化金融公司牵头的科技部金融风险防控重大项目。毋庸置疑,该国际标准将在多方面领域做出战略性贡献,并契合我国建成支撑国家治理体系和治理能力现代化的具有中国特色的标准化体系,助力于推动中国标准与国际标准的接轨,同时推动中国标准走出国门,共同完善国际标准体系。
科研无边界,人生不设限
取得重大成就的背后
是刻苦钻研的故事
丰富人生经历,步步踏实
郝天永在计算机领域的研究兴趣主要包括自然语言处理、智能问答、信息抽取、医学数据挖掘等方向。“骐骥一跃,不能十步;驽马十驾,功在不舍。”郝天永目前取得的科研成果是在长期的求学和工作过程中逐渐探索和积累得来的。
郝天永本科就读于北方一所高校的计算机科学技术专业,之后获得了中国计算机领域顶尖学府——中国科学院计算机研究所的硕士联合培养资格,参与了领域知识库相关的课题项目研究,主要负责语言资源处理等工作。
在完成了硕士阶段的学习研究后,郝天永前往香港城市大学继续深造,主攻“智能问答”研究方向,参与语义大数据机器学习等相关研究,并于2010年获得计算机科学博士学位。“智能问答”类似人机问答,其背后的技术原理包括对非结构化文本的自然语言处理。读博期间,郝天永曾两次出国交流,一次是2008年到加拿大约克大学学习,另一次则是2009-2010年在美国埃默尔大学进行访问研究。
博士毕业后,郝天永曾有一段时间留任香港城市大学担任研究人员,但其内心关于自我提升的想法激励和引导着他选择踏出自己的舒适圈。2012年,他前往澳大利亚新南威尔士大学进行访问研究,2013-2014年在美国哥伦比亚大学全职担任博后型研究科学家。在哥伦比亚大学任职期间,郝天永在医学中心从事医学和信息学交叉学科相关的研究工作,例如进行临床试验文本的自然语言处理等。
2014年,郝天永毅然选择回国发展,加入广东外语外贸大学的“语言工程与计算” 省级重点实验室,获聘“云山学者”,并被认定广东省海外高层次留学人才,任职四年先后获得国家自然科学基金青年项目和面向项目。2018年郝天永作为“青年拔尖人才”引进到华南师范大学计算机学院,获聘正教授,之后开启了在华师的教学与科研生活。
“有时候职务也意味着一份责任。”除了丰富的海外访学经历,郝天永还担任了中国中文信息学会医疗健康与生物信息处理专委会副主任、中国计算机学会自然语言处理专委会委员、中国中医药信息学会人工智能分会常务理事、中国计算机学会广州分部秘书长、省级工程研究中心技术委员会主任、省教育厅科研创新团队“面向文本大数据的自然语言处理”带头人等多项学术兼职,并于2020年入选科技部外专青年人才计划。
他坦言,能够通过层层严格的正式筛选最后获得这些身份认证是极不容易的,但是通过职务身份参与到和专业同行的交流研讨之中能够了解和认识到很多不一样的研究视角,也能够更好地承担起专业和社会发展的责任。郝天永表示,做科研首先需端正学术态度,注重学术道德和严谨性,既要勇攀学术高峰、追求学术高度,也要承担社会责任,使自己成为“有用之士”,为社会提供力所能及的服务。
亦师亦友
既严格要求学生
又与他们作伴
炽热科研心,浓厚师生情
对于郝天永来说认真严谨不仅是一种态度,更是一种能力,亦是一种习惯。郝天永认为从事科研,容不得半点的马虎疏忽,于是他对学生们做科研也有着同样严格的要求。
郝天永曾在中国计算机学会青年计算机科技论坛广州分论坛担任主席,并举办“如何指导本科生进行科研创新”的观点论坛。他认为,学生面对科研时,容易产生迷茫和畏惧的心态,所以在做科研前可以多向师兄师姐及老师请教。“总结前人的经验,站在巨人的肩膀上,会达到事半功倍的效果。”
此外,郝天永根据科研与教学的经验,总结出做科研必备的“三心二意”。所谓“三心”是指专心、细心、耐心;“二意”则是指意愿和意志。“做科研就像挖石油,每个方向都能挖,只不过,有的地方石油深一点,有的则浅一点。但是,只要能坚持挖到底,总会挖到的。”他希望他的学生能饱含科研热情坚定地走下去。
郝天永曾两次带领学生团队获得中国大学生计算机设计大赛国赛二等奖。其中广东外语外贸大学信息科学与技术学院2015级软件工程本科生张淑锦,于2018年8月作为他带领的学生团队一员参加比赛。作为郝天永带领的广外自然语言处理实验室中的成员,张淑锦回忆,“郝教授工作非常认真,不管是工作日还是周末,他都会在实验室。”当学生遇到难题时,郝天永以指导为主,注重对学生自主学习能力的培养,并且能提出针对性的建议。
“郝教授对我们参加国赛的项目最熟悉。”,从零开始,郝天永带领学生团队走过一个又一个春秋,攻克一个又一个难题。2017年,他带领学生团队前往河源,参加由CCF YOCSEF举办的人工智能技术交流暨科研成果对接大会,并组织学生在该会议上展示计算机设计项目科研成果。张淑锦表示,在展示过程中,面对部分专家提出的疑难问题而不知如何回答时,郝天永会主动带领比赛团队应对处理。
然而实验室生活并不像一般人想象中的沉闷,除了有埋头苦干的身影,同样少不了成员间的欢声笑语。张淑锦表示:“郝老师每年都会组织实验室成员进行团建活动。”学生团队曾在郝天永的带领下参观喷泉灯光秀和恐龙博物馆,涉猎有趣知识;也曾共同夜游珠江,领略广州夜晚风光。
在学生眼中,郝天永平易近人,亦师亦友。他用热情潜移默化地温暖、感染着身边的每位学生,使他们终身受益。
每年教师节,在浓厚的节日氛围中,学生们都会为郝天永献上诚挚的祝愿,传达对老师的敬意和感谢。中秋之际,郝天永与学生们共同品尝月饼。他希望学生们即使由于各种原因无法归家也同样可以感受到家的温暖。临近年末,郝天永曾带领华南师范大学文本分析与挖掘团队(简称TAM)的研究生、博士生一同去野外自助烧烤,美丽的大自然中充满了欢声笑语。
这样的师生聚餐不仅缓解了大家平时学习、生活的压力,放松了心情,也增强了感情交流。回忆起与郝天永一起野外烧烤,计算机学院2021级软件工程专业博士研究生胡凯荣笑道:“老师会把烤好的东西先给我们吃。跟老师出去,就像是跟同学出去一样,不会感到有压力。”
长期的学习与科研生活从来都不会一帆风顺,但郝天永总会陪伴在学生左右,帮助他们攻克难题。2020级计算机学院电子信息专业研究生谢燚表示:“郝老师指导论文时,会在我们身边一字一句地教我们修改,包括每一个标点符号的标准与否。”
有时,面对学生做的不好的地方,郝天永也从来不会发脾气。他严肃、耐心地指出他们的错误,让他们印象深刻,确保今后不会犯同样的错误。计算机学院2020级软件工程专业研究生罗昱煜认为:“郝老师从来不会把自己放在师者的高度来对待我们的懵懂和不足之处。他平常给我们的建议都带有指导作用,却不会让我们觉得是块强压到我们身上的石头。”
此外,郝天永经常和学生们讲起他曾经在硕士、博士期间就读的故事,向他们谈论出国留学的选择和一路求学的心路历程,像朋友一样分享着自己的经历。在学期结束时,郝天永会找团队里的每一个同学单独谈话,引导学生对过去一学期的工作进行总结并做好接下来的计划的安排。郝天永经常鼓励学生在做实验的过程中遇到困难不要气馁。“跳过一个石头后说不定之后都是宽敞的道路。”
未来
郝天永亦将秉承科研初心
追求学术高峰
让我们共同期待
华师涌现更多突破性成果
#往期回顾#
摄影丨郭大豪
部分图片由受访者提供
执行编辑丨黄以可 江丽虹 辛瑾源
责任编辑丨郑宇云 杨柳青
标星晚安华师
可以第一时间
看我们的推送哦
后台回复关键词即可获取
校历丨PPT丨招生丨转专业丨网费丨水电费