先睹为快:大数据领域的十大新品
作者简介:自2006年11月以来,Rick Whiting就一直是The Channel Company(旗下包括CRN和CRN.com)的资深编辑。在那之前,1998年到2006年,他在CPM集团的《信息周刊》杂志任职资深编辑,后来任职新闻编辑。他在多家出版物担任过撰稿人/编辑职位,其中包括《软件杂志》、《电子商业杂志》和《计算机系统新闻》。在进入商业出版行业之前,1980年到1986年,Rick是马萨诸塞州戴达姆《Daily Transcript》的报社记者。他持有马萨诸塞大学达特茅斯分校的英语和政治学文学学士学位以及巴布森学院的工商管理学硕士(MBA)学位。
导语:信息为王
大数据领域仍是IT行业发展速度最快的领域之一,老牌公司在迅速更新和改进产品,不甘示弱的初创公司也在不断推出一批创新产品。
大数据领域的许多最新动向围绕Hadoop平台和彻底改革大数据处理方式的Apache Spark引擎,包括访问和使用Hadoop中存储的数据的更好的解决方案。基于云的业务分析炙手可热,用来集成来自不同数据源的数据的新技术同样很热门。
下面是解决方案提供商应该留意的十大新产品和产品升级版。
1.Hortonworks DataFlow
Hortonworks DataFlow为用户提供了一种方法,以便收集和筛选“动态数据”,即来自众多物联网设备(比如传感器、地理位置设备、机器、甚至社交网络)的实时信息流,然后将这些数据装入到Hadoop或其他数据管理系统,以便实时分析。DataFlow基于原先由美国国家安全局(NSA)开发的技术,现在是Apache软件基金会旗下的一个项目:Hortonworks最近收购了Onyara,后者销售这项技术的商业版。
2. Alteryx Analytics 10.0
Alteryx Analytics数据集成和高级分析软件为业务部门的分析人员提供了评估、融合和分析数据的工具,他们不需要数据科学家或IT部门的帮助。新版本支持一系列广泛的数据库系统,能够将数据的融合和处理转交给数据库,而不是转交给计算机内存,从而加快了数据处理速度。
3. Birst Networked BI
Birst Networked BI 技术是在Birst的多租户云架构上开发而成的,它构建了一个商业智能实例组成的网络,这些实例共享统一的分析架构,可以跨部门和多个地区共享这个分析架构――这实际上是用户们可以用来处理本地数据的一种虚拟化商业智能系统。Birst的方法为用户们提供了自助服务功能,同时符合企业的数据治理政策。它还消除了本地商业智能项目带来的数据孤岛和报告混乱。
4. Platfora Big Data Discovery 5.0
Platfora的Big Data Discovery是一款Hadoop和Spark原生分析平台,可帮助业务用户和数据科学家以可视化方式处理拍字节(PB)级数据,以便分析客户、安全和物联网设备。该公司新的Big Data Discovery 5.0版本包括了高级的自助服务式数据准备功能,因而缩短了业务团队准备数据集以便分析所用的时间。它为需要Excel格式的用户支持SQL语言数据转换和微软Excel。
5. Arcadia Data Enterprise
Arcadia Data Enterprise是一种统一的数据发现、可视化分析和商业智能平台,它直接在Hadoop中运行。软件可以处理成千上万个并发查询,让业务分析员和信息工作者可以在Hadoop里面分析数十亿个数据记录。有了Arcadia,从此不需要充当中介的数据堆栈技术和专用设备,比如数据仓库、联机分析处理(OLAP)服务器和数据集市。该公司已在6月份开始提供免费、可以下载的可视化分析产品组件版本。
6. Talend 6
Talend 6在新的Talend实时大数据软件中引入了对Apache Spark和Spark Streaming的原生支持。这提升了该平台面向实时分析应用的集成功能的速度:Talend表示,将MapReduce作业转换成Spark作业,性能提升了5倍。版本6还有一个内置的Lambda架构,它构建的单一环境可用于统一处理成批及批量数据、实时数据、流式数据和物联网数据。
7. Tableau 9.1
新版本的Tableau业务分析软件提供了一款完全重新设计的移动应用软件,因而让用户更容易查找、处理和管理来自移动设备的商业智能内容。另外新添了一个Web数据连接件,广大开发人员可以用该连接件将Tableau连接到数量更多的数据源,其中包括Facebook、Twitter和Google Sheets。Tableau 9.1还提供了原生连接件,可连接至谷歌云SQL、亚马逊Aurora和微软Azure SQL数据仓库。
8. Looker Blocks
Looker基于Web的商业智能平台提供了访问驻留在数据库或云端的数据这一功能。新的Looker Blocks是可重复使用、可定制的业务逻辑组件,比如客户流失预测或生命周期价值度量指标,它们可以组合起来,构建成完整的业务分析查询,并加快业务分析过程。比如说,Blocks可用来分析企业的销售漏斗(sales funnel),监控客户关系状况,优化在线店铺或进行复杂的Web分析。
9. Trifacta v3
Trifacta开发的软件用于“数据管理”( data wrangling),公司杜撰的这个术语是指将原始的复杂数据转换成采用结构化格式的干净数据,以便分析。Trifacta v3提供了经过改良的功能,以满足安全、元数据和数据族系等方面的企业数据治理要求。该版本改善了产品的用户界面,包括新的“转换建议卡”,这种建议卡以可视化方式直观地显示了数据转换建议。Trifacta v3还增强了连接功能,可以连接至额外的数据源,比如亚马逊网络服务(AWS)S3、XLS文件和Hive。
10. Altiscale Data Cloud 4.0
Altiscale为数据科学家和应用程序开发人员提供了基于Hadoop平台的大数据即服务。Altiscale Data Cloud 4.0包含对Hadoop的核心组件(比如HDFS和YARN)所作的重大升级。另外新增了一项全面的Spark即服务功能,可以支持Apache Spark集群计算框架的所有主要版本,以便处理大量数据。
新闻来源:CRN|云头条编译(未经授权谢绝转载)