DolphinScheduler 在绿瘦的实践成果,开启了我的开源之路!
点击上方
2021 年,Apache DolphinScheduler 社区又迎来了新的蓬勃发展,社区活跃度持续提高。目前,项目 GitHub Star 已达 6.7k,贡献者达 250+,fork 数 2.4k+。仅在过去一个月内,社区就发布了两个新版本,并迎来 33 位作者向 dev 提交 85 次 commits,向所有分支提交 161 次 commits。在 dev 上,有 504 个文件发生了变化,共计新增 10,421 行代码,删除 12,376 行代码。此外,27 人 merge 了 113 个 Pull Request,102 个 issue 得到解决。
为了让更多活跃参与者的贡献被看到,社区特推出《社区星力量》专栏,分享他们挥洒汗水所得的开源成果,以及在参与开源过程中发生的小趣事。如果你也想让大家看见闪闪发光的你,欢迎投稿告诉社区你的故事,都有可能会得到刊登报道,优秀故事还会获得社区提供的走心奖品和纪念品哦!
投稿请发邮箱:xiyan@whaleops.com 或加微信(Leonard-ds)。
今天,我们故事的主人公是来自绿瘦数据中心的大数据开发工程师张柏强,以及大数据开发工程师唐勇。
大家好,我是来自绿瘦数据中心的张柏强。我在今年初接触到 DolphinScheduler,起初只是了解学习,正式使用是今年 10 月份。使用 DolphinScheduler 的契机,源于当时公司内部部门合并,另一个部门需要将原来 CDH 默认的调度系统 Oozie 替换掉。于是我推荐了 DolphinScheduler。
个人介绍
张柏强
大数据开发工程师
主要研究方向为实时计算、元数据治理、大数据基础组件。
唐勇
大数据开发工程师
主要研究方向为实时计算和基础组件开发
替换 Oozie 的原因
之所以要替换掉 Oozie,是因为虽然 Oozie 作为 CDH 原生支持的调度系统对 Hadoop 生态的组件调度支持很多,但是使用起来也特别麻烦。首先,Oozie 的任务是需要通过配置文件来生成的,即使配合了 Hue 使用起来也不是很方便,而且 Hue 经常卡顿。同时,Oozie 基于 MR 启动任务,极其容易造成队列卡死,也不支持多租户的模式。所以,从使用者角度来看,它明显不符合我们预期的使用体验。此外,我们也为该部门进行了调度系统调研,对比了 AirFlow、Azkaban 和 Hera 等调度系统。结果从使用体验上来说明显都是不太符合我们的要求。而 DolphinScheduler 是天然分布式架构,支持拖拉拽完成 Workflow,可视化完成所有 Workflow 任务以及调度,支持多租户以及指定 Worker,同时Task 支持也足够多,所以我们最终决定选型 DolphinScheduler。
总的来说,这些踩到了我们的痛点的特性和功能包括:
天然支持分布式,支持 HA; 支持可视化完成任务部署上线,可支持指定机器执行; 支持 Task 较多,同时采用 Java 语言,扩展和 BugFix 都比较方便; 对任务执行的状态展示、图表都做的比较好,比较细; 支持资源中心,支持全局的资源引用。
因迁移过程受阻,达成提交PR成就!
UI 优化
HiveClientTask
HiveClientTask
ClickhousePushTask
在社区,我的技能点不断 UP
参与开源
参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:
贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/docs/development/contribute.html
来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手
微信(Leonard-ds) 手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。添加小助手微信时请说明想参与贡献。
来吧,开源社区非常期待您的参与。
https://dolphinscheduler.apache.org/
(Leonard-ds)
☞最佳实践 | 联通数科基于 DolphinScheduler 的二次开发
☞DolphinScheduler 荣获 2021 中国开源云联盟优秀开源项目奖!
☞议题征集令 | Apache DolphinScheduler Meetup 2021 来啦,议题征集正式开启!
☞重构、插件化、性能提升 20 倍,Apache DolphinScheduler 2.0 alpha 发布亮点太多!
☞巨变!a16z 关于新一代数据基础设施架构的深度洞察
点击阅读原文,加入开源!
点个在看你最好看