达摩院加持,阿里云数据库前沿技术研究获三大国际顶会认可
中国数据库前沿研究再获国际认可。2022年度阿里云数据库团队共有15篇论文被数据库三大国际顶级会议SIGMOD、VLDB、ICDE收录。这些高质量的顶会论文是阿里云数据库前沿技术研究与产品商业化服务形成“飞轮效应”的最新例证。SIGMOD、VLDB、ICDE被公认是数据库领域具有最高学术地位的国际性会议,收录论文代表了数据库相关技术的最高水平,也是未来技术发展的重要风向标。
2022年,阿里云数据库团队被收录的15篇论文成果覆盖云原生、分布式、智能化、安全可信、时序时空等数据库前沿研究方向。其中,8篇来自于阿里云和达摩院的独立研究,7篇来自于阿里云与北京大学、浙江大学、香港科技大学等高校紧密合作的联合研究。
阿里云自成立以来就十分重视数据库前沿技术研究,并为此成立专门的研究机构——达摩院数据库与存储实验室。过去几年,达摩院的前沿技术研究与阿里云数据库的产品商业化服务形成相互促进的“飞轮”,前沿技术研究保证了数据库产品技术的领先,带给客户更多价值,同时大规模服务客户遇到的丰富场景推动达摩院不断在前沿技术研究领域获得突破。
这种良性互动的“飞轮效应”体现在阿里云数据库自研产品PolarDB的云原生数据库技术创新中。
PolarDB是阿里自主研发的云原生关系型数据库,采用存储计算分离架构和软硬一体化等创新设计,成本只有传统商用数据库的1/10。正是在大量客户要求持续降低成本的背景之下,PolarDB在业内率先实现了一种全新的架构——计算、内存和存储的三层解耦,首次实现内存池化。这种架构创新能够帮助下一代云原生数据库显著提升性能和弹性,大幅降低成本。
在自研技术和业务驱动下,以PolarDB-X为代表的云原生分布式数据库增长式爆发。ICDE 2022收录的一篇论文全面介绍了PolarDB-X的特性:支持将数据动态分布至多个数据节点,提供快照隔离的分布式事务,并具备多数据中心强一致同步、计算存储分离下的弹性扩缩容以及多副本隔离下的HTAP等。PolarDB-X已于2021年10月全内核代码开源。
同时,在达摩院技术的加持下,PolarDB的产品能力边界取得进一步突破。今年被VLDB和SIGMOD录用的多篇论文分别介绍了达摩院自研的全加密数据库和空天数据库引擎Ganos背后的系统设计,以及数据库性能自动调优的智能化能力。阿里云成为全球仅有的两家实现了全加密数据库产品商业化输出的云厂商之一,空天数据库引擎Ganos的加持更是让PolarDB数据库可以高效管理多维、动态、场景化的空间/时空/网格数据,更好地支持数字孪生城市等复杂3D多模态数据管理场景。并且,达摩院丰富的智能算法在数据库领域的深度应用,也让PolarDB等数据库产品拥有了“自动驾驶”能力,方便客户简便、智能、高效地使用。
事实上,在类似良性互动中,阿里云数据库收获颇丰。在学术论文方面,过去几年阿里云数据库团队在国际顶级会议上发布的论文数量不断创下新高,从2018年的2篇增长到2022年的15篇;在技术产品化方面,阿里云数据库获得了近千项专利,实现自研数据库拥有存储计算分离、三层解耦、多主架构、HTAP、Serverless、一体化分布式、全加密、智能与自治化等创新能力;在商业化落地方面,阿里云数据库经受住了双11最严苛的检验,PolarDB创造峰值1.4亿次/秒数据库处理峰值(TPS)纪录;PolarDB、AnalyticDB、RDS等云原生数据库产品深度服务国家医保信息平台、自然人税收管理系统等重大国计民生项目。
阿里云数据库产品事业部和达摩院数据库与存储实验室负责人李飞飞表示:“阿里云数据库是达摩院加持的产品技术团队。这种独特的创新机制,保证阿里云数据库在技术上的前瞻性和创新性,同时阿里云数据库团队强大的产品化能力,也保证了创新技术能够实现大规模落地,为客户带来越来越多的价值。”
公开资料显示,阿里云拥有国内最强大和丰富的云数据库产品家族,自主研发了云原生关系型数据库PolarDB、云原生数据仓库AnalyticDB、云原生多模数据库Lindorm等云原生数据库产品技术,可以为企业提供一站式全链路数据管理与服务。2020年和2021年,阿里云作为中国唯一的科技厂商连续两年成功进入Gartner全球数据库领导者象限。目前已服务互联网、政务、零售、金融、电信、制造、物流等多个领域的15万客户。IDC最新数据显示,阿里云位居中国关系型数据库市场第一。
2022年阿里云数据库顶会论文列表
(标重点为阿里云 & 达摩院独立研究成果)
Remus: Efficient Live Migration for Distributed Databases with Snapshot Isolation. SIGMOD 2022
ESDB: Processing Extremely Skewed Workloads in Real-time. SIGMOD 2022
Towards Dynamic and Safe Configuration Tuning for Cloud Databases. SIGMOD 2022
PreQR: Pre-training Representation for SQL Understanding. SIGMOD 2022
Towards Practical Oblivious Join. SIGMOD 2022
Operon: An Encrypted Database for Ownership-Preserving Data Management. VLDB 2022
Ganos: A Multidimensional, Dynamic, and Scene-Oriented Cloud-Native Spatial Database Engine. VLDB 2022
Tair-PMem: A Fully Durable Non-Volatile Memory Database. VLDB 2022
CloudJump: Optimizing Cloud Database for Cloud Storage. VLDB 2022
VRE: A Versatile, Robust, and Economical Trajectory Data System. VLDB 2022
Facilitating Database Tuning with Hyper-Parameter Optimization: A Comprehensive Experimental Evaluation. VLDB 2022
PolarDB-X: An Elastic Distributed Relational Database for Cloud-Native Applications. ICDE 2022
PinSQL: Pinpoint Root Cause to Resolve SQL Performance Issues In Cloud Databases. ICDE 2022
A Comparative Study of in-Database Inference Approaches. ICDE 2022
Ubiquitous Verification in Centralized Ledger Databases. ICDE 2022