查看原文
其他

【解析】一文读懂大数据产业链构成

2017-01-09 钱塘大数据

导读:大数据的产业链构成大致可分为数据标准与规范、数据安全、数据采集、数据存储与管理、数据分析与挖掘、数据运维及数据应用几个环节,覆盖了数据从产生到应用的整个生命周期。

建议阅读时间:5分钟

上期回顾:工业4.0落地战略:一个网络、两大主题、三项集成

 



  (一)数据标准与规范

  大数据标准体系是开展大数据应用的前提条件,没有统一的标准体系,数据共享、分析、挖掘、决策支持将无从谈起。大数据标准包括体系结构标准、数据格式与表示标准、组织管理标准、安全标准和评测标准。在标准化建设方面,参与单位主要包括中国电子技术标准化研究院、各个数据库公司、数据拥有部门以及各个行业的标准化组织。


  (二)数据安全

  随着海量数据的不断增加,对数据存储和访问的安全性要求越来越高,从而对数据的访问控制技术、加密保护技术以及多副本与容灾机制等提出了更高的要求。


  另外,由于大数据处理主要采用分布式计算方法,这必然面临着数据传输、信息交互等环节,如何在这些环节中保护数据价值不泄露、信息不丢失,保护所有站点的安全是大数据发展面对的重大挑战。


  在大数据时代,传统的隐私数据内涵与外延有了巨大突破和延伸,数据的多元化与彼此的关联性进一步发展,使得对单一数据的隐私保护方法变得极其脆弱,需要针对多元数据融合的安全提出。


  在数据安全环节上主要参与单位包括中国电子科技集团公司第30研究所以及奇虎 360、瑞星等杀毒软件公司。


  (三)数据采集

  政府部门、以 BAT 为代表的互联网企业、运营商是当前大数据的主要拥有者。除此之外,利用网络爬虫或网站公开 API 等途径对网络数据进行采集也是大数据的主要来源。


  现实世界中的数据大多不完整或不一致,无法直接进行数据挖掘或挖掘结果不理想,需要对采集的数据进行填补、平滑、合并、规格化、检查一致性等数据预处理操作,并且往往需要大量的人工参与,因此数据采集和清洗成为大数据产业链的一个重要环节。


  (四)数据存储与管理

  大数据存储与管理的主要参与者以传统数据库企业为主,国际上主要有 IBM、Oracle、Intel、Green-plum、infor Matri Cloudera 等;国内主要有中兴、华为、用友、浪潮、托尔思、数据堂、九次方、亿赞普、达梦等。各家企业针对大数据应用开展各具特色的数据库架构和数据组织管理研究,形成针对具体领域的产品。


  (五)数据分析与挖掘

  大数据分析与挖掘的意图主要集中在两方面:

   一是从大量的机构结构化和半结构化数据中分析出计算机可以理解的语义信息或知识;

   二是对隐性的知识,如关联情况、意图等进行挖掘。常用的方法包括分类、聚类、关联规则挖掘、序列模式挖掘、时间序列分析预测等。

  数据分析与挖掘的核心算法与软件主要掌握在大型数据库公司及高校的手里,国际上主要参与者包括 IBM、甲骨文、微软、谷歌、亚马逊、Facebook 等,国内主要参与单位包括数据库企业、高校、以 BAT 为代表的大型互联网企业等。数据分析与挖掘的能力直接决定了大数据的应用推广程度和范围,是大数据产业的核心。


  (六)数据运维

  由于数据的重要性得到普遍认可,除政府部门不具备数据运维服务条件外,数据的采集者通常就是数据运维者。各地政府方面则通常利用大数据平台建设来推动政府大数据的公开与共享,如云上贵州,吸引个人和企业用户开展创新与创业,积极推动大数据的增值服务。


  (七)数据应用

  大数据对传统信息技术带来革命性挑战,正在重构信息技术体系和产业格局。国内以阿里巴巴、百度、腾讯、人大金仓、浪潮、曙光、南大通用为代表的互联网企业、云计算和数据库厂商纷纷加大应用推广力度,在国际先进的开源大数据技术基础上,形成独自的大数据平台构建和应用服务解决方案,以支撑不同行业不同领域的专业化应用。


  虽然这些企业在平台构建上有着得天独厚的优势,但是在某些具体业务领域,并不擅长或者关切。传统企业以及从事大数据的微型企业是具体业务领域上大数据应用的主力军。应用是大数据价值的体现,是大数据发展的原始推动力。


  当前大数据的应用正倒逼软件技术、数据架构、数据共享方式的转变,在转变思维过程中需要积极转变思维,明确出数据共享的方式是什么,数据拥有者的利益如何平衡,商业模式如何开展等。


  目前来看,许多企业在大数据产业链里仅拥有一项或两项能力是完全不够的,只有将大数据产业链融合连通才能催生更大的市场和利润空间。在大数据推动的商业革命浪潮中,只有打通数据流通变现的商业模式,才能创造商业价值,从而在大数据驱动的新生代商业格局中脱颖而出。





往期PPT、报告下载:

【10G新年大礼包】大数据热门干货报告汇总,赶快领取!

【PPT下载】企业级大数据平台实践之路

全球人工智能发展报告(2016)

【PPT】2016智能硬件行业洞察报告

【PPT】中国互联网发展趋势报告2016

【干货】全套大数据工程师必备技能图谱

《2016中国大数据市场年度综合报告》

钱塘干货 | 大数据标准化白皮书(2016版)

H5干货 | 智能制造之传感器数据分析报告

往期干货:

钱塘干货 | 数据收集和处理工具一览

五个技巧教你用编程实现数据可视化

【干货】全套大数据工程师必备技能图谱

干货 | 28页PPT详解腾讯数据挖掘体系及应用

全球大数据领域顶级开源工具汇总【推荐收藏】

钱塘干货 | 你要的“大数据”学习资料介绍这里都有

往期可视化阅读:

两化融合  | 3D打印  |  大数据投资  |  大数据应用 

VR/AR  | 工业机器人  | 物流   |  智能硬件

往期热文:

大数据  |  工业4.0  |  云计算  |  人工智能 

AR   | 物联网  |  可视化  |  报告


钱塘数据坚持“激活工业数据资产,完善工业发展生态”的核心理念,以“产业+金融+大数据”协同发展为主攻方向,积极打造工业领域最全面、最强大垂直搜索平台和用户工具平台,并逐步演化为国内最大的“工业大数据中央厨房”,成为推动企业大数据应用和产业金融应用加快发展的“核心动能”,从而真正实现企业大数据资产化,激活企业传统要素资产和新型数据资产。

阅读原文,咱静下心来一起聊聊大数据。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存