查看原文
其他

牛!阿里数据库掌门人李飞飞获选ACM杰出科学家

阿里妹 阿里技术 2019-03-28

11月8日,美国计算机协会(ACM)公布2018年度的杰出科学家名单,全球数据库领域领军人物、达摩院数据库首席科学家、阿里巴巴数据库事业部负责人李飞飞教授入选。

 

ACM是国际上历史最悠久、规模最大、最权威的计算机专业学会,著名的图灵奖即由该组织评定颁布。ACM杰出科学家必须是对计算机领域做出重大成就和影响的研究人员。


美国计算机协会杰出科学家

达摩院数据库首席科学家李飞飞

 

此次获得ACM殊荣的达摩院科学家李飞飞,与斯坦福大学的著名人工智能学者李飞飞同名,但这位“男版”李飞飞在计算机领域取得成就却毫不逊色。

 

此前,作为美国犹他大学计算机系的终身正教授、世界级的数据库系统专家,他曾屡次获得电气和电子工程师协会( IEEE)与ACM数据库领域的最具影响力论文奖。

 

2018年,李飞飞教授放弃多家跨国公司和知名高校的工作邀请,正式加入阿里巴巴达摩院,带领团队投入到具有自主知识产权的研究当中,包括新一代分布式数据库、非结构化数据管理、数据安全、智能化数据库等关键技术,并致力于将中国数据库技术水平提升至国际前沿,打破寡头企业对数据库核心技术的垄断。

 

此次ACM向其颁发杰出科学家,也是对达摩院研究水平和成果的认可。

 

目前,李飞飞教授带领的阿里巴巴数据库事业部所研发的新一代分布式数据库系统,支撑了阿里巴巴集团的复杂业务、海量数据和双11交易洪峰的挑战,已经被应用于多个城市的智能城市交通网络管理,实现城市内数千万智能终端数据的瞬间调取与分析。此外,中国气象的国家气象大数据分析平台也应用其技术,实现了毫秒级的气象数据查询与分析,该数据库存储了1957年建站以来,6万多气象站的分钟级数据。


数据对于数字经济社会的价值不言而喻,近年来,阿里巴巴达摩院孵化出了世界级的数据库技术。阿里巴巴CTO、达摩院院长张建锋曾表示,阿里巴巴数字经济体已经沉淀了海量的应用数据。为更好地挖掘、利用海量数据的价值,阿里已经构建了世界级的基础设施,并展开了一系列自主创新。



附:李飞飞老师专访


Q:恭喜飞飞老师获得ACM杰出科学家大奖。许多人很好奇,作为学术圈大神级别的人物,您为什么会选择从学术界转向工业界?又为何独独看中了阿里?


数据库系统是核心基础软件系统之一,随着硬件技术的快速发展,上层应用的不断演进,和数据量以及数据形态的爆发式增长,系统方向的研发越来越需要大规模的集群部署,海量数据下的高并发高可用测试,和复杂的业务逻辑来验证,迭代,和推进。工业界在这些方向处在战斗的最前沿,有第一手和第一线的挑战和场景,阿里丰富的业务场景和双11这样的技术挑战,以及对核心基础技术的坚定投入是阿里最吸引我的地方。 


Q: 双11即将到来,在您看来,从学术上的“读书”到企业中的“读人”,带领团队从学术前沿走向工程技术(双11)的巅峰,有什么不一样的地方?


学术前沿科研挑战的是单兵作战和尖刀连突破的能力,大规模系统的工程技术攻关考验的是集团作战规划和冲锋的能力,取得最后的胜利一定需要两者有机的结合。”读书”和”读人”有共同的地方也有不同的地方,读书和读人都需要用心去体会,而书的内容是固定的,需要读的人去结合实践情况消化理解并灵活应用;人的状态和心里是不断动态变化的,需要读的人去不停的交流,沟通,和配合。


Q: 阿里非常注重与学术界的合作,近些年在产学研生态圈也动作频频,后续达摩院实验室与高校计划在哪些方向拓展合作?您如何在学术和产业之间寻找平衡点?


小到数据库系统,大到计算机产业都是一个应用性非常强的领域,同时又是一个有很深的基础科学问题挑战的领域,这就决定了核心技术的攻关和突破一定是需要产业界和学术界形成良性的互动和互补。达摩院实验室从成立之初就积极拓展与高校和科研院所的合作,从青橙奖的设立到推广AIR计划到建立联合实验室到接待访问学者计划,阿里巴巴达摩院在推进产学研合作方向是不遗余力的,为中国的计算机科研事业添砖加瓦,贡献一份力量。学术和产业之间的平衡点在于如何有效的将产业界的应用和系统里面的核心挑战问题抽象化,然后如何让科研解决方案与系统和实际应用有机整合并落地,这个是一个需要因地制宜的过程。


Q: 如今云计算企业“跨界”数据库已不是新鲜事,未来阿里数据库产品主要会往哪些技术方向探索?


云数据库是一个快速发展的市场,吸引客户上云的一个核心路径就是云端数据库系统。相比较于传统的数据库系统,云数据库系统对高可用,服务水平协议,兼容性,弹性计算和弹性缩扩容,数据库管理工具,计算存储分离,及数据库安全(例如加密数据库以及数据隐私保护查询技术)都提出了新的挑战。


除此之外,存储计算资源和数据库实例的智能化调度,以及智能化管控也是云端数据库需要探索和突破的方向。


Q: 从实际应用考虑,阿里所面对的庞大数据量和复杂的业务场景是很多企业级用户无法触及的。针对非极端场景的应用条件,阿里数据库有哪些优化?


阿里巴巴数据库系统除了在为了应对电商应用在高并发、高可用、分布式等核心技术点上进行了突破,也针对常态化应用所需要的简单易用,高效可靠,以及兼容性上做了很多工作,比如软硬件一体化设计,存储计算分离等。除了支撑双11这种极端技术挑战的企业级分布式数据库系统X-DB之外,阿里巴巴数据库产品也包括了像POLARDB这样的云原生数据库系统,其特点就是高效可靠以及高度兼容现有数据库生态系统。


Q:在今年的SIGMOD 2018上,“机器学习/机器智能与数据库的结合”成了最热门的主题之一。在您看来,未来数据库和机器智能/机器学习技术将如何相互渗透?


智能化数据库内核和智能化数据库管控运维平台一定是下一代数据库系统核心竞争力的主力战场之一。随着数据库系统设计向精细化和复杂化演进,用户数据的不断增长和用户工作负载的多样化变化,传统依赖于基本统计学原理和简单成本模型的数据库内核优化技术已经不能高效的适应于这些高纬度的调优挑战。


同时,随着上层业务逻辑和应用的复杂化以及应用规模的成倍增长,数据库实例数不断增加,系统参数不断增长,数据库系统的运维管控和监控越来越需要智能化和自动化。机器学习技术的迅猛发展为解决这两类问题提供了有力的武器,结合DBA的领域知识和经验,以及数据库系统的运行数据,机器学习/机器智能技术可以有效进行有监督或无监督的学习和建模,从而实现智能化的数据库内核以及智能化的自治数据库运维平台。


Q:每次见到飞飞老师,都能感受到满满的阳光和热情。我非常好奇,在工作研究之余,您有哪些兴趣爱好,让您一直这样充满活力和激情?


在美国的时候,我在盐湖城,地处高原,四面环山,周围有许多美国的国家公园例如黄石公园,拱门公园等。我平常非常喜欢爬山,跑步,和野外徒步,特别是在那种原生的没有人为营造或修建的自然环境里面探险。


我也喜欢读历史书和时政,历史和政治永远是一对孪生双胞胎。


Q:感谢飞飞老师接受采访,再次恭喜您,也祝老师和团队再攀数据库技术新颠峰!


非常感谢,也希望以后和大家多交流、探讨,一起推动中国数据库技术进步。



你可能还喜欢

点击下方图片即可阅读


阿里基础架构如何扛住全球最猛的流量洪峰?


阿里数据库十年变迁

那些你不知道的二三事


双11大队长霜波:

从手忙脚乱到胸有成竹,我们如何走过这十年?


关注「阿里技术」

把握前沿技术脉搏

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存