查看原文
其他

ClickHouse 将会是 OLAP 最亮的仔!

InsideMySQL InsideMySQL 2022-10-13
点击卡片,关注 InsideMySQL
上次的文章(Oracle、 PostgreSQL DBA们,你们过得还好么?)发出后,后台有小伙伴问姜老师现在最看好哪些国产数据库。
国产数据库的话题,因为某些原因,到不方便说,但姜老师可以谈谈哪些数据库是自己比较看好的。
OLTP领域,MySQL数据库一骑绝尘,相应的码农收入业界都算相对较高,一线城市平均薪资50个W,相信大家不会有太大的质疑。
但今天姜老师想来吹捧一下 ClickHouse 数据库,这货应该会是未来 OLAP 的一哥。

不好意思,放错图了,应该是他:

OLAP领域数据库众多,各自有各自的优势和应用场景,如:Hive、SparkSQL、Impala、麒麟等。
但随着 ClickHouse 的诞生,以及在互联网业务中不断地使用,已基本奠定 ClickHouse 未来 OLAP 一哥的位置。
从整体架构来看,ClickHouse 貌似也没有什么特别的,列存、多核、分布式计算、向量计算、多存储引擎支持、压缩等,这在其他 OLAP 数据库中,多少也都能看见。
所以,ClickHouse 真正能火的原因是什么呢?
是技术么?不是,因为你同样可以说出他的很多缺点。
所以,一款数据库能火,最重要的原因是:用户有需求,产品体验好
MySQL 数据库为什么能火?因为他很好满足了当时互联网时代用户创建电商、社交等平台的需求,而且使用足够简单,基本几分钟就能搭建一个主从集群。
Redis 缓存数据库为什么能火?因为他解决了用户对于互联网各种数据结构快速存取的需求,方便业务快速完成需求开发。
MySQL 不支持复杂查询,Redis 只能跑在单核上,这都是初期产品劣势,但其实用户并不需要 MySQL 跑复杂查询,单实例 Redis 性能要求 50W QPS。
说到底,数据库也是产品,产品一开始是用来满足用户需求的,需求决定了未来市场的占有率。
那么为什么最终 ClickHouse 会脱颖而出呢?
因为现在的业务都有用户画像,用户行为分析的业务需求啊。而且这些需求已经在俄罗斯最大的搜索引擎Yandex得到过生产环境的严格验证。
貌似用户画像,用户行为分析这些业务需求 Hadoop 的大数据系统也能做啊?
没错,但是 Hadoop 生态的产品用户体验做的极差。
首先是 Hadoop 用了 Java 语言去做一个基础设施软件,这注定了系统运行较慢,再怎么优化,这也无济于事。
对于 T+1 的数据查询,或许 Hadoop 是一种选择,但是现在对 OLAP 的要求也变得越来越高,甚至是准实时。
另外,Hadoop 生态的产品太多,到底使用 Hive、HBase、SparkSQL、Presto 哪个呢?
最后一点呢,相互依赖太多,比如 Hive 要用 HDFS,但HDFS 又是可以是一个单独的组件提供服务。
所以,Hadoop 的大数据产品总给我有一种可以使用,但是集成度不高的感觉。
ClickHouse 就没这些问题。
他用的是 C++ 语言,底层运行速度就不是一个级别。所以看跑分,ClickHouse 这块的优势会很大。
此外,他没有加入 Hadoop 这个生态,存储采用的本地存储,而不是HDFS分布式存储。
也因为是独立的产品,没有加入 Hadoop 生态,上手 ClickHouse 对于初学者来说是一件非常简单的事情。

所有这些都表明 ClickHouse 这块产品的集成度比较高,用户体验非常好,能快速帮助用户完成业务的需求工作。
所以,回到最初的问题,为什么姜老师看好ClickHouse?
因为当前业务都有类似用户画像,行为数据分析的需求,而 ClickHouse 从性能,易用性等角度能很好满足用户的需求。
一个 ClickHouse 就能满足用户大部分的OLAP查询需求。所以,为什么不用 ClickHouse 而去用 Hadoop 产品呢?
最后的最后,回到国产数据库的话题,首先要清楚定义你的数据库用户是谁?解决他什么样的业务需求呢?
如果看 TiDB 数据库,你会发现他号称什么都可以做,分布式数据库,动态扩缩容,Raft 数据一致性,但这些都不是真正的业务需求,而是码农自己 YY 的用户需求。
任何一款数据库,要成功的话是很快的,解决用户的真正痛点,基本都是出道即巅峰,如 MySQL、Redis、ES、MongoDB、Snowflake、ClickHouse、Aurora等。
如果超过5年还没有占据细分市场的统治地位,这款数据库基本就没戏了,比如 PostgreSQL、TiDB、Cassandra等。
你基本也就是在一些技术社区会看到是XXX公司有在用XX数据库,问题你也不清楚他是不是拿着融资的钱,去买通XXX公司的DBA,硬塞个无关痛痒的业务在使用,亦或是买了个广告位。
要么出道就巅峰,要么一辈子也红不了,数据库和娱乐圈一样的残酷啊!!!

BTW,3月18日(周五)晚上21点,姜老师将在抖音直播,欢迎关注抖音号:破产码农

END



全文完,感谢你的耐心阅读。

微信平台改变了推送规则,如果你还想看到我的文章,请一定给本文“点赞”、“在看”、“分享” 三连,新文章推送才会第一时间出现在你的微信里。认识这么久,我可不想丢掉你。

每周五、六,不定期直播,分享技术干货



IMG群是码农的交流社区,IMG微信群交流内容包括但不限于技术、经济、军事、八卦等话题。欢迎有态度的码农们加入IMG大家庭。

IMG目前有少林群、武当群、峨眉群、华山群、M悦会(高端VIP群)

仅限码农入群,猎头或其他行业勿加,入群请加姜老师个人微信 82946772,并备注:码农入IMG群


往期推荐



Oracle、 PostgreSQL DBA们,你们过得还好么?

来试试这道 MySQL 面试题吧,比 Leecode 好玩多了~~~

从职高到麻省理工计算机博士,他是传奇!

MySQL Group Replication Multi-Primary 模式,你真的理解么?

震惊!MySQL 3.23 版本跑在 96 核 CPU ,性能竟不输最新 MySQL 8.0 ......


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存