查看原文
其他

如何吃好数据分析这碗饭?干货在这里!

神州数码集团 神州数码集团 2022-07-03

艾瑞巴蒂!

让我看到你们的双手!


上周五(9月18日)

由神州数码集团数据战略咨询部总经理李盛

为大家带来的超级云讲堂第三讲

《如何吃好数据分析这碗饭》

各位小伙伴

都有按时收看了吗!


在近一个小时·满满干货的课程里

真·大数据专家李盛老师,

与各位“后浪”激情分享了

其基于自身近十年的从业经历

从累计服务的、逾百家客户实际案例中

提炼出来的方法论

希望以此帮助小伙伴们

在数据分析领域

夯实基础 筑牢根基 踏实成长

 什么是数据分析?

首先,李盛老师认为:数据分析,即“从数据里提取有用、有效的数据,建立相应的决策模型”


在目前的数据分析团队里

大部分人员学统计学出身,

而今年开始,随着运筹逐渐发展成熟,

团队内新加入了大量的有运筹学背景的技术人员,

以支撑相关工作,

更好地为客户提供专业化服务。


为了帮助大家更好地理解大数据 ,

李盛老师对目前过热的大数据

与各个不同领域概念之间的关系进行了拆解。


经常与大数据一同被提及的AI

其重点在于:

通过对相关技术的完善应用,

帮助机器模拟人类进行决策。

大数据的有效挖掘与开发 ,

正是基于AI技术的不断成熟而实现的。


所谓Learning,

“为了达成某种特殊目标、结果

运用机器,

从数据中学习特征

并将特征进行量化,后期实现复用”


Deep Learning 更进一步,

通过与神经元网络相关模型结合,

机器可以更好地挖掘数据 ,

释放数据背后的价值。


职业化的数据分析


输入

现阶段,属于数据行业分析范畴内的工种,

并不仅仅限于数据分析师,

更囊括了算法程师、数据科学家等多个工种。


同时,按照模型的类别来看,

常用的数据分析模型可分为:

有监督模型-无监督模型 两部分。


过去我们常用的有监督模型,

需要明确分析对象及预测目标。

只能对给定的某一或某些对象,

进行类型及数值方面的预测。

我们所熟知的分类、回归模型都属于此种。

除预测外,有监督模型

也可以被用作归因分析处理。


而现在越来越被多使用的无监督模型,

则能够自动抽象某些规律

进行数据探索及结构的挖掘。

将类似变量整合为一组进行分析,

对具体变量及细分指标的依赖程度更小。


数据分析的行业流程

面对虚心求学的后浪,

李盛老师继续分享了

真实的数据分析行业的运行逻辑、

市场上数据分析从业者的工作流程。


通常,一个完整的数据分析行为包括:

数据采集、数据诊断、数据汇总、

数据分析、模型开发、系统策略 六个阶段。


数据采集

输入

与传统认知不同,李盛老师认为

真正数据分析师的工作中,

最难的部分就是实现有效的数据采集。


为了达到目标 ,

我应该采集哪部分数据、采取什么手段采集目标数据、

如何保证采集而得数据的有效及可用······

是否能实现以上目标,

 正是衡量一个数据分析师、

数学科学家是否优秀的重要指标之一。


数据诊断

输入

谈及下一阶段,李老师认为

数据诊断的重要性,目前是被严重低估了的。

很多公司目前都并未将其作为流程的一部分进行处理,

合格、乃至优秀的数据分析师

必须具备强大的数据诊断能力。


从两个维度上来看:

首先,分析师只有非常了解数据质量 

才能从海量数据中筛选出符合条件的对象进行处理、

有效把控数据整体指标。


同时,通过数据诊断,

分析师也可以进一步理解客户业务、

完成客户所处行业的Know How积累。 


一名优秀的数据分析师,

不光要具备基本的数据分析、统计学知识  

还需要业务知识为建模支撑。


数据汇总

输入

按照分析思路 ,

根据不同维度、指标、客群,对现有数据进行汇总 ,

是对于分析师最基本且最简单的要求之一。

李老师强调 

各位仍在学习阶段的后浪

必须踏踏实实、稳扎稳打,

尽快夯实个人的数据汇总能力。


能否如何快速找到我们要分析的主体 、

选取合适的指标 、

是否需要在现有基础上进行延伸······

这一阶段的工作

直接决定了后续模型的效果。


数据分析

输入

真正优秀的分析师,可以基于客户的具体场景,

应用具体、成熟的分析方法、

快速找到相关因素、解决客户实际需求的。


模型开发


同时,李老师再次强调

后浪们一定要夯实自身的模型开发能力。

实际市场环境下

想要成为一个合格的数据分析从业者

需要有能够针对不同模型、理解不同参数

解决不同领域业务问题的能力


系统策略

输入

完整的数据分析流程并非结束于开发

你以为,只要完成建模

通过训练集、验证集的应用

验证效果不错,就happy ending了?

Too Young Too Naive!


真正模型开发完只是第一步 ,

模型是否有价值、能够应用,

必须通过系统内部署进行检验。


开发能力是基础 ,

更重要的是应用能力。


快速更新的时代,

号召着更加优秀的后浪

为在瞬息万变的市场环境下

实现未来市场行为预测、释放企业主体业务价值

添薪续力!



到这里

我们超级云讲堂的,三场技术相关讲座,

就告一段落了。


下一讲,即将由我们的帅(?)气(?)码哥真人出镜,

为各位进入复赛的初阶大神介绍下关于

《神州数码云上数据开发大赛的那些事儿!》


有点遗憾,错过满满干货?

戳这里↓



回顾李盛老师“吃饭全指南”!


我是选手,得快快上车?

戳下方二维码,

预约第四讲↓



能不能成为技术大神

顺利通关

就看下一讲听不听得懂了嘿!




延展阅读


· 开学第一课!一小时让你理解云计算和大数据

· 独家暗访,简历中不能说的秘密


.

.

.

.

.

.


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存