中国人民大学教授杜小勇:One Size Does not Fit All?
2019数据技术嘉年华于11月16日在京落下了帷幕。大会历时两天,来自全国各地上千名学术精英、数据库领袖人物、数据库专家、技术爱好者在这里汇聚一堂,围绕“开源 • 智能 • 云数据 - 自主驱动发展 创新引领未来”的大会主题,共享"开源自研,云和数据,智能运维,智能业务,数据前沿,用户实践"六大主题盛宴。
在此小编为大家精心准备了“2019数据技术嘉年华——大咖演讲系列整理”,没来参会的朋友们,可以通过我们的系列报道,了解在本次大会中最新的数据行业资讯。爱好技术的朋友们不可错过哦~
中国人民大学教授,博士生导师,工学博士杜小勇老师
非常高兴有机会来到“2019数据技术嘉年华”的会场。我在四年前就有一个设想:想要加强学术界和应用界、企业界的交流。所以每年在数据库的学术会议上,都会有一个来自企业界的报告,每年大会上我都听了,我个人觉得还是很有收获的。比如有一年报告特别谈到在互联网企业运维,包括数据库在内的众多的开源数据库存在巨大的压力。但是我们很多学生不敢尝试实践,他觉得和写一篇论文差得很远,这样的问题他解决不了。
我们来看看这两个趋势,第一个方向,在2017年VLDB题目上叫“Failed Aspirations in Database Systems”。这说明学术研究和产业不太一样,但是不能说探索没有意义,实际面向对象很多特性在我们关系数据库里也有体现。
第二个方向,Stonebraker研制的专用系统。Stonebraker为代表的开放了一系列的数据库系:c-store(后改名Vertica)column store系统,适用于OLAP,后被HP收购;h-store(后改名VoltDB)行存储数据库,适用于事务OLTP;StreamBase,流数据库,被TIBCO收购;SciDB,科学数据库,支持数组(array),呈现出一个很混乱的状况。
谷歌的三件套彻底改变了非结构化数据管理的生态。
确实这样做完以后,数据库界的批评声音是很大的,认为是严重的倒退。Stonebraker对Hadoop的批评之声特别大:丢失了大多数DBMS的特性;不支持事务或者只支持简单的事务;较低级的程序设计范型;缺乏应用开发工具和环境;没有索引等等。
我想让大家看到的是,一个是红字的部分,他说的是数据管理和模型管理应该结合起来,不要把这两个子集分离开来。最好是在数据库平台上结合,因为数据库是一个平台。我建议大家可以把文章拿来读一读,我觉得还是有很多启发的。
支撑OLML的新型数据库长啥样?支持多数据模型、支持存算分离、支持自优化自适应自管理、支持混合架构。
多数据模型。这个需求很自然,因为你可能有各种各样的数据,对于用户来说,他不需要知道这个数据是怎么组织的,这个数据是怎么存的,可以使用,怎么在一个系统里支持不同数据类型.。
存算分离。存储与计算分离,这已经是大家公认的方向了。对于数据库来说,有更深刻的挑战。
自适应优化。现在这个话题谈得比较多,实际查询优化这件事情是支撑关系数据库成功的重要的支柱之一。以前我们做的比较简单,Rule-based、Cost-based...现在我们横向扩展问题解决了,因此ML-based驱动的方法在未来数据库管理里面会有很大的用法。
混合架构。我们都知道,现在高速网络比IO都快。计算芯片也一样,不再仅仅是CPU了,GPU、FPGA各种各样人工智能芯片都在出现,在这样的数据管理过程中,模型训练的负载下,这是学术界或者产业界都很清楚的,你对于不同类型的负载用不同的计算器需要模式差异很大,比如规则的数据放在GPU处理比较好,如果说很杂乱无章的说不定CPU更好。所以这种差异,存在有优化的空间。所以我觉得这方面还是有很大的空间可以去扩展。
最后展示一张照片,这是潘院士在我们科学大讲堂做报告时,他给我们人工智能学院院长赠了一幅字。现在确实到了一个时代的变化,不管是别人有我们没有,还是说别人没有我们也没有,我们都面临着一个“无人区”状态,在这样的情况下,高校天生的拥有创新的基因,要敢于“秀”出来,接受全世界“品头论足”。而企业在踏入无人区的时候,我觉得有一条很重要的路就是创新。
在计算机大会上我们邀请了阿里、华为、腾讯数据库老总一块坐下来探讨 中国国产数据库发展道路探索 的时候。其中有一点让我印象很深刻,不管走什么样的道路,创新是最重要的,如果没有创新,也就没有未来。所以我也借着今天的主题,我代表中国数据库学术界表达这样一个愿望,愿意和我们在座的企业界进行全方位的合作,当然我们也在成长中,我们也知道我们的力量还很薄弱,我们希望我们的数据库企业帮助我们一块去招揽人才。我们也和其他领域面临人才的竞争,只要我们一块努力,提供更多的机会,我相信我们有更多的老师、更多的学生会活跃在数据库的研究平台上。
谢谢大家,这是我的报告!
出处:墨天轮(https://www.modb.pro/doc/topic/11536,复制到网页中打开或者点击“阅读原文”)
扩展阅读
数据和云
ID:OraNews
如有收获,请划至底部,点击“在看”,谢谢!
资源下载
关注公众号:数据和云(OraNews)回复关键字获取
help,30万+下载的完整菜单栏
2019DTCC,数据库大会PPT
2018DTCC , 数据库大会PPT
2018DTC,2018 DTC 大会 PPT
ENMOBK,《Oracle性能优化与诊断案例》
DBALIFE,“DBA 的一天”海报
DBA04,DBA 手记4 电子书
122ARCH,Oracle 12.2体系结构图
2018OOW,Oracle OpenWorld 资料
云和恩墨Bethune X 企业版,集监控、巡检、安全于一身,你的专属数据库实时监控和智能巡检平台,漂亮的不像实力派,你值得拥有!
云和恩墨zData一体机现已发布超融合版本和精简版,支持各种简化场景部署,零数据丢失备份一体机ZDBM也已发布,欢迎关注。
云和恩墨大讲堂 | 一个分享交流的地方
长按,识别二维码,加入万人交流社群
请备注:云和恩墨大讲堂