其他
终于有人把云计算、物联网和大数据讲明白了
导读:本文带你了解大数据及人工智能时代的3项关键技术。
作者:高聪 王忠民 陈彦萍
来源:大数据DT(ID:hzdashuju)
按需自助服务(on-demand self-service) 广阔的互联网访问(broad network access) 资源池(resource pooling) 快速伸缩(rapid elasticity) 可度量的服务(measured service)
软件即服务(Software as a Service,SaaS) 平台即服务(Platform as a Service,PaaS) 基础设施即服务(Infrastructure as a Service,IaaS)
私有云(private cloud) 社区云(community cloud) 公有云(public cloud) 混合云(hybrid cloud)
大数据技术描述了技术与体系结构,其设计初衷是通过实施高速的捕获、发现以及分析,来经济性地提取大量具有广泛类型的数据的价值。
规模超出了典型数据库软件工具的捕获、存储、管理和分析能力的数据集。
大数据是指数据的数量、获取的速度以及数据的表示限制了使用传统关系数据库方法进行有效分析的能力,需要使用具有良好可扩展性的新型方法来对数据进行高效的处理。
数据的规模成为问题的一部分,并且传统的技术已经没有能力处理这样的数据。
数据的规模迫使学界和业界不得不抛弃曾经流行的方法而去寻找新的方法。
大数据是一个囊括了在合理时间内对潜在的超大数据集实现捕获、处理、分析和可视化的范畴,并且传统的信息技术无法胜任上述要求。
大数据的核心必须包含三个关键的方面:数量多、速度快和多样化,即著名的“3V”。
McAfee公司在2012年估算:在2012年的每一天中,全球都产生着2.5EB的数据,并且该数值约每40个月实现翻倍。 2013年,国际数据公司(IDC)估算全球所产生、复制和消费的数据已经达到4.4ZB,并且该数值约每两年实现翻倍。 到2015年,全球产生的数据将达到8ZB。根据IDC的研究报告,全球产生的数据将在2020年达到40ZB。
想象(vision),这里的想象是指一种目的; 验证(verification),这里的验证是指经过处理后的数据符合特定的要求; 证实(validation),这里的证实是指前述的想象成为现实; 复杂性(complexity),这里的复杂性是指由于数据之间关系的进化,海量数据的组织和分析均很困难; 不变性(immutability),这里的不变性是指如果进行妥善管理,那么经过存储的海量数据可以永久保留。
数量(Volume) 速度(Velocity) 多样化(Variety) 准确性(Veracity) 价值(Value)
更多精彩👇