新一代云原生数据平台的几个关键思考
传统大数据平台的困境
普通云原生大数据平台的技术架构和优势
新一代的云原生大数据平台的技术架构和优势
01
—
传统大数据平台的困境
首先,新的组件往往只支持特定的版本。如果你想引入一个新的组件,但它不兼容你当前使用的Hadoop版本,你就不得不升级Hadoop。然而,升级Hadoop可能会导致其他组件和应用程序失效,因为它们可能依赖于特定版本的Hadoop。这就造成了整个平台的兼容性问题,增加了运维的复杂度。
其次,由于传统的大数据平台通常是静态的,即在部署时需要事先确定好各个组件的版本和配置,这限制了平台的灵活性和可扩展性。当你希望引入一个新的计算或存储组件时,可能需要重新设计技术架构、重新部署和迁移大量的数据,这是非常耗时和复杂的过程。
总体而言,这些问题使得传统的大数据平台在集成新的计算和存储技术时面临挑战,增加了运维的复杂度,限制了平台的灵活性和可扩展性。
问题三:Hadoop集群的存算紧耦合架构导致了资源利用率的低下。这是因为在Hadoop集群中,存储和计算是紧密耦合在一起的,即数据存储在HDFS中,计算节点通过读取和处理HDFS中的数据来执行任务。
1、硬件准备:扩容和缩容需要新节点的硬件设备就绪,包括服务器、存储设备等。
2、软件安装配置:新节点需要安装和配置Hadoop的相关软件,这包括操作系统、Hadoop组件等。
3、网络配置:新节点需要加入到Hadoop集群的网络拓扑中,并与其他节点进行通信。
4、数据同步:扩容和缩容时,需要将数据从现有节点迁移到新节点上或从新节点迁移到其他节点上,这个过程可能需要较长时间,特别是数据量较大时。
5、重平衡:扩容和缩容后,集群需要重新平衡数据和任务的分布,以保持负载均衡。
以上几个步骤中,软件安装配置、网络配置和数据同步都是比较耗时的操作,而且这些步骤都需要人工干预,所以整个扩容和缩容的过程比较繁琐且需要较长时间。
因此,传统的Hadoop集群的扩容和缩容过程一般需要花费较长的时间,可能需要几天甚至一周的时间完成。这就导致了无法快速响应业务需求,限制了资源的弹性使用和利用率的提高。
02
—
普通云原生大数据平台的技术架构和优势
基于以上分析的困难,大部分数据平台的厂家基于k8s组件的研发,将大数据平台容器化、标准化后形成了基于云原生的大数据平台用于解决以上问题,那么他们的架构主要有哪些优势了?
云原生大数据平台,将hadoop组件容器化,并且利用k8s的弹性伸缩能力,快速扩容和缩容,利用k8s的容器化能力实现多租户,资源隔离的能力。主要的优势体现在如下几个方面:
一、提升集群资源使用率
传统大数据平台对于实时分析和离线分析作业是分开部署,各自采用独立的调度系统,资源利用率低,而利用k8s可以将所有的资源形成一个共享的资源池,由统一的调度系统分配资源,提高资源的利用率。
二、容器化大数据组件,降低了组件集成、升级,扩容、难度。
传统大数据平台的运维工程师需要了解和掌握10-20种大数据组件,才能完成大数据平台的各种运维操作,且都是需要手动操作,一方面这种运维大佬薪资很高,而且难以招到,另外每次扩容升级都需要几天到一周的时间。
云原生的大数据平台在k8s和可观测性运维功能的加持下,降低难度和节省时间,提升了运维的效率,通过标准化的容器化的大数据组件,升级和扩容一般几个小时就可以完成。
三、减少了大数据平台的运维成本。
一个拥有两百个节点的传统大数据平台往往需要5~6个全职的大数据运维工程师进行运维,而云原生大数据平台,在这样的一个集群规模,需要1-2个懂k8s和稍微懂大数据组件的运维工程师既可以完成。
目前国内市面上大多数的云原生大数据平台都是基于这种架构,这里我就不多详细说明了,这种架构在hadoop组件的基础上利用k8s的组件的能力,解决了传统大数据平台的一些问题,例如解决多租户问题、解决兼容性问题、降低了运维难度和成本。但是还是存在一定的问题,
一、存算耦合,虽然资源利用率提升了,但是任然解决的不彻底,需要从架构上调整成为存算分离的架构,才能提升更多的资源利用率。
二、架构复杂,开发成本高,大数据团队的开发人员/架构师需要掌握10-20个组件的能力才能比较好的完成开发,因为最终开发完成之后,代码上线出问题了,解决这些问题,需要懂这些组件的人通过定位问题解决,通常一个问题可能要2-3天解决。
三、服务器利用率低,因为hadoop集群本身的特性导致一个完整的大数据平台需要比较多的组件依赖,也导致需要比较多的服务器才能完成部署一个大数据集群。
03
—
新一代云原生大数据平台的技术架构和优势
普通大数据平台的问题,在新一代的大数据平台中如何得到解决,主要体现在,采用轻量级的计算引擎,以及存算分离的架构,架构简单,降低了大数据团队的开发成本。
新一代云原生大数据平台,将spl/doris/flink等组件容器化,并且利用k8s的弹性伸缩能力,快速扩容和缩容,另外存储和计算分离的架构,进一步提升集群中计算资源和存储资源的利用率。
欢迎加入【数据行业交流群】社群,长按以下二维码加入专业微信群,商务合作加微信备注商务合作
往期历史热门文章:
基于DataOps的数据开发治理:实现数据流程的自动化和规范化