Hadoop和大数据正式走到头了:13个相关的Apache开源项目宣布报废
The following article is from 云头条 Author 小云
点击上方“开源社”关注我们
光荣榜
Apex:这个统一的平台面向大数据流和批处理,基于 Hadoop YARN。
Chukwa:这个数据收集系统用于监控大型分布式系统,基于 Hadoop 分布式文件系统(HDFS)。
Crunch,它提供了一套框架,用于编写、测试和运行 MapReduce(包括Hadoop MapReduce)管道。
Eagle:这种分析解决方案用于立即发现大数据平台(包括 Hadoop )的安全和性能问题。
Falcon:这种面向 Hadoop 的数据处理和管理解决方案,为数据移动、数据管道协调、生命周期管理和数据发现而设计。
Hama:这种用于大数据分析的框架在 Hadoop 上运行,基于 Bulk Synchronous Parallel 范式。
Lens:提供统一分析界面,将 Hadoop 与传统数据仓库集成起来,如同一个整体。
Marmotta:一种面向链接数据的开放平台。
Metron:专注于实时大数据安全。
PredictionIO:这种机器学习服务器用于管理和部署生产就绪的预测服务。
Sentry:这种系统用于对 Apache Hadoop 中的数据和元数据执行细粒度授权。
Tajo:Hadoop 上的大数据仓库系统。
Twill,使用 Hadoop YARN 的分布式功能以及类似运行中线程的编程模型。
房间里的大象
官方说法
不妨注意点
用 Apache 软件基金会的 Khudairi 的话来说:“每个项目背后的社区确保其代码的活力(‘代码不会自行编写’),因此社区在某个项目上改变步伐的情况并不少见。”换句话说,先进技术令人兴奋,但早期采用者要提防:先进技术也存在着变数。要小心,管理好风险。
开源社简介
开源社成立于2014年,是由志愿贡献于开源事业的个人成员,依“贡献、共识、共治”原则,所组成的厂商中立、公益非营利的开源联盟,是最早以“开源治理、国际接轨、社区发展、开源项目”为使命的开源组织。开源社积极与支持开源的社区、企业以及政府相关单位紧密合作,旨在共创健康可持续发展的开源生态,并推动中国开源社区成为全球开源体系的积极参与及贡献者。
相关阅读 | Related Reading
我们需要什么样的开源教育?
GitHub Insights from 860 Million Event Logs of 2020
源来是你第四期发布啦
欢迎大家点击阅读原文,查看原文!