查看原文
其他

教你零基础入门“数据科学”,学会用数据创造更多利润!

冷芸时尚圈 冷芸时尚 2019-04-10


时尚公益课堂

第十二课

教你零基础入门数据科学,用“数据”创造更多利润!           


【讲师】

Cliff Tsung


Cliff Tsung

我是Cliff Tsung,人工智能-语义学博士。 在新加坡和西班牙生活。曾任西班牙内政部项目科学家、德国国家人工智能中心研究员(欧盟第七框架计划)。目前在马德里经营一家小画廊和一家数据科学咨询企业;同时还是社区福利食堂厨师和乐队鼓手。 


我相信我在以下方面的经验可以帮到大家:


*我是一名热爱艺术的科学家,多年的人工智能、语义学研究经验让我有信心能够将数据科学与时尚行业相结合,深入浅出地为大家讲解相关的基本知识;

*我目前同时经营一家数据科学咨询企业,因此我能够从企业经营和管理者的角度出发,提供更宏观的视角,并且更加关注课程的实用性,避免陷入细节的技术讨论和“噱头词”的堆积。


 联系方式




数据科学的基本概念


1.需要明确的概念和定义

数据:有关事实的原始记录,如数字、表格、数据库和文字记录等。

 

信息:经过处理的事实。如排序后的数据,过滤后的数据,各种统计学指标,各种图表等。 


知识:事实发生的内在原因。可用于未知:如变量之间的数学关系,相似个体的聚类边界等。 


2.数据科学在商业中的定义 

“数据科学”并不是一门独立的学科,只是一种利用数据得到知识的手段 ,以及一种包含数学、统计学和人工智能等多个领域/学科的技术与工具。


简单来说,数据科学在商业上指的是一种通过数据创造及提高利润的手段。 


3.与数据科学有关的角色 

部门专员 :熟知公司业务并了解公司需求的人员。


决策人员 :并不仅仅企业高层才是决策人员,公司中每个员工都可以是决策人员。


数据科学家:采用科学方法,运用数据挖掘工具对大量的数字、文字和符号等信息进行数字化重现与认识等方面的专家。



需要注意的是,数据科学不能直接应用于企业。因为数据科学家不了解业务知识及各部门的需求,所以它需要各职能部门的积极参与,同时也需要决策人员根据个人经验、法律法规和行业规范等进行决策后使用。 




小结:

数据科学是通过数据产生知识的一系列措施;需要职能部门的积极参与;不是唯一的决策辅助工具。



4.数据科学的工作流程数据采集-数据整理-知识发展-知识表达


1.数据采集

在成本允许的情况下采集任何可能的数据比如采集用户的年龄、性别、购物习惯、对时尚的观点等,采集的维度越多越好。 


数据来源包括内部数据和外部数据。内部数据包括销售数据和客户数据等,外部数据包括天气数据和城市人口分布等。 


2.数据整理 

数据整理是对所搜集到的资料进行检验、归类和数字编码的过程。其目的一方面是为了提高数据质量;另一方面也是为了降低数据储存、载入及运算的成本


3.学术型数据学家与商业数据科学家的区别 

学术型数据学家和商业数据科学家都能进行知识发掘,而商业数据科学家更应该注重知识的有效表达



数据科学的手段


1.分类分析 

即基于已知数据对未知数据进行分类。一般分类的对象为客户、产品、雇员、供应商和服务商等。 


2.聚类分析 

即将相似的个体链接起来。比如:应该将本季的黑色cashmere毛衣优惠二维码发给哪些客户? 一般聚类的对象为客户、产品和客户意见。


3.回归分析 

即发现属性之间的关系。比如:客户身高与消费金额是否有关?衬衫的白色与畅销程度之间的关系?一般分析以“额”“率”“值”结尾的各种属性。


4.关联规则 

一般用于发掘可能同时被购买的产品 。在实际的应用中,关联规则主要应用于商品购买的关联行为。


比如针对一个卖场,可以通过对大数据的关联分析发现面包与牛奶之间的购买行为,从而可以有针对性地进行促销或是适当调整商场的物品摆放位置。所以关联分析是大数据分析中一个特别有效的模型,针对性比较强。



小结:

当企业遇到问题时,企业家可以把遇到的问题按照以上四类进行分类,这样能和数据科学家进行更加有效的沟通。 



最佳实践案例和应用技巧


1.关于时序回归的一点闲话 

数据科学是为决策服务的。时序回归所预测的是在所有其它因素不变的情况下,我们可以预测的结果。 时序回归结果最大的作用是判断我们的过程是否失控(实际观察与预期偏差过大)。可以通过时序回归反思是否对于过程理解不足,或变量出现了我们不知道的变化。


比如:实际销售额比预测的结果高出来很多,看到这个结果,人们很容易因为开心而忽略真正的问题,虽然销售额提高是值得高兴的事,但同时需要反思预测结果为什么出现那么大的误差,有什么因素是之前没有考虑到的。


2.中小企业是否需要数据科学部门?还是雇佣外部顾问?

首先这两种方案都有各自的优势和劣势。比如企业中的数据科学部门会比雇佣外部的顾问更了解本企业从而能为企业做出符合企业自身情况的分析,并且节省了沟通成本。但是企业需要投资一定数额的软硬件成本。雇佣外部顾问的优势主要是人力成本较低、合约类型灵活和软硬件投资成本较低。 


综上所述,企业可以选择一个折中方案。因为数据科学部门不是紧急的需求,并且中小企业的数据量和复杂度不高,所以可以雇佣一位具有较好统计学基础和一位具有较好计算机科学基础的雇员进行培训,另外企业的管理者也应该学习数学优化和决策工程学的知识。


3.中小企业的预算应该“大人力,小硬件 

企业其实不需要购买非常昂贵的电脑, 因为中小企业的数据量并不是很多,一般的电脑足以进行处理。建议投资重点应放在人才招揽、培训和知识结果的部署上。 



小结:

雇佣一个数据科学家是最划算的人力投资,可以首先挖掘企业内部的潜力人才加以培训。让知识辅助决策,因为数据科学不是算命。同时不要高估软硬件成本,也不要低估人力成本。一切从简单开始 。



本文为课堂直播精华,配合讲师讲解使用更佳哦!

点击文末“阅读原文”即可回看。


往期回顾

(点击标题即可跳转)


第一课  为什么我们都要关注可持续时尚?

第二课  这些基础服装技术资料你都了解吗?一节课为你扫清困惑!

第三课  如何与国外influencer合作共赢?来,让我为你揭开这层神秘的面纱

第四课  服装面料大揭秘,一节课让你轻松成为“面料专家

第五课 教你亲自DIY做检测,对服装“质量陷阱”说再见!

第六课  当时尚遇上“黑科技”,未来服装业将会怎样?

第七课  关于服装行业你有什么困惑?或许这里有你想要的答案

第八课  面料的色彩是如何形成的?“老司机”带你参观面料染色工艺

第九课  姿势!你一听就懂的针梭织服装工艺大全

第十课 来看看这些高大上的“进口面料”有着怎样不为人知的内幕?

第十一课 你穿过那么多花衣裳,可曾真正懂得“服装印花”?

第十二课 教你零基础入门“数据科学”,学会用数据创造更多利润!

第十三课 如何利用“领英”链接到更多的职场资源和商业机遇?

第十四课  服装质量好不好,原来是“它”说了算!

第十五课  为何你的零售业绩总是上不去?赶紧看看货品管理做对了吗?

(点击👇“阅读原文”回看直播)


冷芸时尚圈已经成立。本群是开放群,主要是为了让时尚产业相关的从业人员和时尚爱好者通过此平台相互认识、学习和成长。若想加入冷芸时尚圈,请加微信zhs_dqqz,并务必注明“冷芸时尚圈+姓名及职业+具体入群理由”并说明入群希望得到的收获。本群只关注时尚行业内容,严禁发送广告、低俗、社会、政治等不相关内容。违者将被退群及拉黑


冷芸时尚专注于时尚行业

服装商业培训(买手、创业、职业规划)时尚读书会、服装零售分析

长按,识别二维码,关注本专栏


冷芸也开设以下培训课程,欢迎报名!点击图片查看详情。

如想了解课程内容,请点击“试听”




冷芸时尚 

QQ:1667844581

微信:lengyun_fashion


加友者请务必写“实名+自我介绍+加友理由”,否则加不上。


此号不做任何义务咨询、解答问题。仅供加友。


参加冷芸培训的人,请另外发送“报名”或者“培训”到冷芸时尚微信公众号,了解报名方法。


本公众号所有文章均为诚意原创。如果您阅读后感觉有所收获,感谢您至少能做以下1件事:点赞,转发,关注,打赏。感谢您对知识的尊重!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存