查看原文
其他

VLDB和数据库三大会

2017-08-28 飞总 飞总聊IT


VLDB和数据库三大会

点击上方蓝字关注


飞总最近在慕尼黑开会。会议简称是VLDB,全称是International Conference on Very Large Databases。这个会议是整个数据库领域的两大最顶级会议之一。这个会议属于一个叫做VLDB Endowment的组织管理。第一届VLDB是1975年召开的 。


其实我不太知道要不要写篇文章普及一下这些知识。但是我想本着传播知识传播八卦的宗旨,介绍一下这个在数据库领域久负盛名的会议,可能对于我的粉丝们是一件不无裨益的事情。所以我还是努力的来写一写这篇文章。当然在我写这篇文章的时候,我发现自己作为圈内人士很久了,很多东西都默认是知道的了,所以写起来有种非常累的感觉。写得不好大家见谅。


数据库领域传统意义上来讲有三大会的说法。分别是SIGMOD, VLDB 以及ICDE。 一旦我们开始介绍VLDB,就不可避免的会和另外两个会议做一些比较,所以我们先简单介绍一下SIGMOD和ICDE。


SIGMOD属于ACM旗下。有一个比较非官方的说法是ACM下面最著名的三大会议是SIGGRAPH, SIGMOD,以及SIGCOM,分别代表了计算机图形学,数据库和网络三个领域。这种说法到今天百家齐放的局面可能有些偏颇了。SIGMOD第一届会议是1975年召开的。SIGMOD传统意义上是个北美会议,但是近年来面对VLDB的竞争,也越来的越往国际发展。提起SIGMOD,就必须提一下PODS,这个诞生于1982年的数据库理论会议,被誉为是数据库理论的第一大会。它在1991年开始和SIGMOD同时召开。这样一来1991年以后的SIGMOD也常常以SIGMOD/PODS的方式出现。


ICDE则属于IEEE旗下。ICDE作为数据库领域的三大会之一,在不同的人心目里有不同的想法。有些人认为SIGMOD/VLDB是数据库领域两驾马车,而ICDE则是1.5的档次的,不能喝SIGMOD/VLDB并驾齐驱。ICDE的组织者们则认为ICDE和SIGMOD/VLDB是同样档次的会议。然而就我个人的观察来说,有前者想法的人还是大多数。这其中的原因一方面是因为ICDE的到来比其他两个会议晚了10多年,另外一方面可能还是数据库领域学者们的心态问题吧。比如说我导师就很喜欢把论文先投VLDB或者SIGMOD,两者都被拒了才考虑ICDE。所以最近我导师有一篇ICDE最佳论文。但是这篇论文之前被SIGMOD据了。虽然我们不能以此来说明SIGMOD的每篇论文都比ICDE最佳论文好,但是这个极端一点的例子反映了很多做数据库研究的人的想法。既然大家都这样想了,这个会议的档次也就很难提高上去了。


最后我们重点讲讲VLDB。VLDB和SIGMOD诞生于同一年。和SIGMOD或者ICDE比起来,VLDB最大的特点是没有干爹。它不隶属于ACM或者IEEE这两大国际计算机组织。它的成立主要是当年一些数据库领域的先驱者们为了自由独立的支持这个新诞生的数据库而创建的。所以这个组织标榜的独立性也就显得非常的有自己的特色。


VLDB相对于SIGMOD的不同有很多,但是最最重要的一点是VLDB自诞生之日起,就非常明确的要把国际化的普及数据库的研究作为自己的使命之一。因此,相对于SIGMOD这个很长一段时间里都只是关注北美的会议,VLDB很早的就开始在世界各地开会。举例来说,SIGMOD知道2004年才第一次离开美国和加拿大在巴黎召开,而VLDB自诞生起第二年就开始在世界各地开,1976年在欧洲,1977年在日本,1979年在巴西等等。可以这样说,今天数据库的研究能够在全世界各地遍地开花,离不开VLDB几十年如一日的努力。从这个角度来看,SIGMOD的贡献,作为数据库领域的两大会之一,就存在着很多的先天不足。也因为这个原因,在欧洲,亚洲,南美等诸多的地区,VLDB的受欢迎程度,一直远远的超过SIGMOD。


SIGMOD和VLDB经常合作,也经常联合忽略ICDE。所以这里其实SIGMOD和VLDB互相都觉得ICDE是不能喝它们并立的。而ICDE则自己一直叫唤着我是数据库领域三大会之一。差不多就是现在的格局了。


对于我个人来说VLDB是很有特殊意义的一个会议,因为我的第一篇成功发出来的论文发表于2007年的维也纳VLDB上,和今年的慕尼黑会议的距离不是特别远的一个城市。这之前我投的PODS和SIGMOD都相继被拒。虽然此后我在SIGMOD和VLDB上发表的文章数量差别并不是特别大,但是我想第一次发表论文的激动心情,可能不是后来几次所能代表的。因此,如果说一年里面我只能选择出来开一个会议的话,VLDB通常是我的首选。


SIGMOD和VLDB对于数据库领域的贡献都很巨大。很多时候我觉得很难说到底哪个比哪个更巨大。但是我觉得它们的影响方式有所不同。我们选择两件各自有深远影响的事情来说一说。


SIGMOD历史上最大的事件是在2000年前后决定把论文的审稿从单向盲审转为双盲。单向盲审的意思是作者不知道审稿人是谁,但是审稿人知道作者是谁。而双盲则是互相都不知道。这次变动在数据库领域引起了很多的争议。有一些数据库研究者是这个变动的积极推动者。也有很多数据库研究者则反对这个推动。其中最著名的的事件则是Michael Stonebreaker这个数据库领域最具影响力的人之一在SIGMOD Record上的一篇文章。SIGMOD Record是圈内的一个杂志。文章的主题是单盲比双盲更有利于对数据库领域年轻工作者发表论文。这个论文开了有理有据的胡说八道的先河。文章有理有据的分析,得出来的结论却是和大家的常识大相径庭的。一般来说双盲受益者肯定是没有太多名气的年轻学者。但是这篇文章的结论却是相反的。一段时间以后新加坡国立大学的教授Anthony Teng发表了 他自己的研究分析,使用同样的数据,同样的方式。唯一的改变是把Mean换成了Median。结论完全相反了。我觉得其实这个从统计上可以解释。Median比Mean会更准,尤其在数据分布不是很均匀的情况下。所以到今天SIGMOD依旧是双盲而VLDB依旧是单盲。


这并不是说VLDB就没有什么创新。VLDB在2010年的时候,做了一件对整个学术圈都有深远影响的事情。会议论文通常是有固定的投稿和截止日期的。这就使得很多论文没有足够的时间去好好准备,也让很多论文失去了修改再发表的机会。VLDB在2010年的时候决定彻底改变这种做法,对VLDB的投稿变成一年每个月都有一次截止日期,总共12次。同时,投稿的论文允许进行一次修改的机会。这个制度的推出,很快的受到了广大研究者的欢迎。以至于在一段时间内,VLDB很快超越SIGMOD成为新论文最喜欢的投稿场所。SIGMOD也被迫做了改变,把一次投稿时间变成了两次,并且增加了修改的机会。虽然说SIGMOD并没有VLDB那样月投稿,但是这种变化对于SIGMOD这样一个机构依然是巨大的。


飞总打算尝试在小密圈对这个会议做一些直播。


打赏专用二维码


欢迎加飞总小密圈




飞总聊IT

IT八卦,大数据风云,职场风波

长按二维码订阅

合作垂询:feizongitworld@gmail.com

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存