继 Blink 之后,阿里重磅开源机器学习平台 Alink
Editor's Note
阿里在FFA2019大会上宣布正式开源的机器学习平台 Alink。它是由阿里巴巴计算平台 PAI 团队基于新版本的 Flink 而重新开发的通用算法库,是 PAI 算法平台的一部分,支持 Kafka、HDFS、HBase 等一系列开源数据存储平台。
The following article is from SegmentFault Author 羽飞
上周四,阿里巴巴在 Flink Forward Asia 2019 大会上公布了新版本大数据处理引擎 Apache Flink 的部分信息,并宣布正式开源其基于 Flink 研发的机器学习平台 Alink。
据官方介绍,新的 Flink 1.10 版本已经收纳了基于 Flink 搭建的阿里巴巴内部自用的实时计算平台 Blink 的全部功能,预计将于明年 1 月正式发布。除了完成合并所带来的好处之外,Flink 1.10 的特点还包括 Hive 集成兼容性提升,更好的 Python 支持,原生 Kubernetes 集成支持,以及新增多个主流机器学习算法库等等。
阿里巴巴从 2015 年开始基于 Flink 而建立了内部版本 Blink 平台,长期服务于阿里巴巴内部的搜索、推荐、广告等核心实时业务。经过三年时间的实践与打磨,再加上 Blink 与开源版本 Flink 之间差距越来越大的原因,阿里巴巴于去年 12 月在 Flink Forward China 峰会上宣布将开源 Blink。
实际上,这已经是 Blink 自今年 1 月正式开源尚不足 1 年时间内的第二次并入 Flink 正式版,上一次并入是 3 个月前的 Flink 1.9 版本发布。阿里巴巴在较短的时间内投入了大量人力与资源,多位 Apache 社区项目管理委员会成员与代码提交者贡献了超过 150 万行代码。
Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算,并部署在各种集群环境中,针对各种大小的数据规模进行快速计算。
Apache Flink 最初源于由德国柏林工业大学、柏林洪堡大学、哈索·普拉特纳研究所共同发起、合作的一个名为「StratoSphere:云上的信息管理」的大数据批计算研究项目,之后核心开发者从 StratoSphere 中将 Flink 分离了出来,目的是尝试通过流式计算来进行所有的大数据计算工作。2014 年 3 月,Flink 进入 Apache 孵化器,并于同年 12 月成为 Apache 顶级项目。至今,包括腾讯、华为、网易、小米、滴滴、顺丰等在内的大量企业均已成为 Flink 用户。
Flink 的核心是流计算数据处理引擎,其针对数据流的分布式计算提供了数据分布、通信、容错机制等功能,可同时支持流处理与批处理。基于流计算引擎,Flink 可提供更强的计算能力与更易用的编程接口,以便开发者创建分布式任务。此外,Flink 还针对特定的应用领域提供了不同的库,比如机器算法库 FlinkML,可提供具有扩展性的机器学习算法以及直观的 API 和工具。
更多精彩
欢迎加入数据BI技术交流群。进群方式:请加小助微信(微信号:iom1128),回复:数据,审核通过 会自动拉你进群。
今日荐文
点击下方文字即可阅读
▼ 福利时刻 ▼
01. 后台回复「经典」,即可领取大数据数仓经典书籍。
技术大佬们在等你,各种资源定期分享~
Q: 关于大数据,你还想了解什么?
欢迎留言区与大家分享
觉得不错,请把这篇文章分享给你的朋友哦
入群请联系小助手:iom1128『紫霞仙子』
更多精彩,请戳"阅读原文"到"数仓之路"查看
更多精彩,请戳"阅读原文"到"数据分析"查看
!关注不迷路~ 各种福利、资源定期分享!