突发!员工跳楼!只拿低保工资!央企设计院集体罢工!

突发!北京某院集体罢工!

淄博向东,惠泊向西:在人民与人民币之间,惠泊停车选择了人民币

【少儿禁】马建《亮出你的舌苔或空空荡荡》

10部适合女性看的唯美情色电影

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

秋收:回首过往,微笑前行

herain 数据指象 2022-07-01

点上方 “趣味数据周刊”,关注公众号

文章期号:20190901

向每一位读者致敬,一起砥砺前行


温馨提示:请先喝一杯水,因为内容太干。


俯仰之间,铜壶滴漏,恍惚间又到9月之初

依稀记得2019年01月15号,开通了个人微信公众号,感谢关注公众号的每一个小伙伴,谢谢一路有你


秋收复盘,明确下一步的目标,砥砺前行。


1,回头放眼

累计发布文章69篇,字数破100,000字,关注人数破2000

单篇文章最高阅读量破1000 

参入贡献的作者人数5人:herain,挖数,李璐,陈力硕,陈苟

相信越努力越幸福.....



2,文章索引归档

为了学习数据分析的小伙伴们,方便阅读,由浅入深的汲取知识,下面将对历史文章进行索引编排。

2.1,统计学基础篇 :

统计学是围绕数据主体的一门学科,它是现在人工智能的基础,我们能够借助统计学知识,从海量的数据层层抽取,不断抽象和发现数据背后的价值规律。

发现普适于大多数人的行为选择,符合大多数人的价值判断,就是数据背后的最大价值。


数据分析第一步就是掌握 数据可视化的能力,以图的形式彰显数据的潜在性,规律性,价值性,让一切一目了然,图胜过千言,掌握常用的作图方法,快速学习看这里《R语言,制作常用图表

统计学需要掌握统计描述和统计推断两部分,描述是为了发现数据本身的特征,推断是发挥数据预测判断的价值,可以通过阅读《是否,是否,总是富肥穷瘦?》初步了解实际的运用技巧。

需要记住两个概念:“期望”,“方差”,构成了概率分布的主要概念。“期望”可以理解为一件事的引力基准线,牵引着不同的事态的发展,“方差”可以理解为事态的脱准力,方差越大事态就更难把握,也更难预测。期望是统计工作者期望的,方差是统计工作者失落的。

阅读《概率分布:掌握事态谋定千里外》,《一个公式缓解 你99%的蕉绿》掌握常用的分布,开启巧妙的统计学之旅。

描述统计多涉及数值型变量的分析,当时在客观生活中,也常常充满这文字的类别型数据,掌握类别变量的分析《类别变量的分析》,可以弥补数值型分析的空缺,丰富自己的技能树。


一件事物的出现,都是多种因素共同作用的结果,分析多因对事物的影响大小,从而抓住主要因,提高对事物的掌握度是重要的《方差分析:单因子和双因子分析


可以说一元线性回归是入门数据挖掘的必备课程,也是需要熟练掌握的技能,学习从这里开始《一元线性回归模型的销售预测》,更进阶的多元线性回归也不容忽视《经营之道:怎样经营好一家餐馆?

时间序列的简单探索:《探索时间序列,预测未来


2.2,多元统计进阶篇:
多元统计是数据分析能力的一步提升,运用更加复杂的数学模型和计算方法深入挖掘潜藏着数据中的价值,掌握多元统计是提升自我能力的必不可少的一个环节。


定性变量可以说是一种类别变量,比如男女,优良差,真假,黑/白等,因变量的结果集是有限的,可预设的,定性变量的回归模型,就是基于历史数据训练出来一种数学表达式,来判断新数据的属于哪一种定性因变量的概率大小。为日常的常见的是否类决策,提供准确度的数值度量。比如《年入15万,买私家车的概率


简而言之,聚类分析就是将研究对象(若干个个集合)按照某种标准分成若干类。相似性的度量,参考多种距离计算公式:欧式距离,绝对距离,切氏距离,明氏距离,马距氏离,兰距氏离。你也可以根据研究对象特征自己定义出一种度量相似度的距离公式。《聚类,其实就是近朱者赤》,《客户分类是精细化运营的第一步

“数据时代的到来了,一个数据小白也可以炼成动植物学家” :动植物数据的收集,动植物数据的整理,动植物数据的观察,种族内部相似特征的抽取,种族间差异特征的归纳,然后结论的检验,在重新整理数据,不断迭代的研究过程。判别分析《技能跨界:小白炼成动植物学家?

主成分的概念由Karl Pearson在1901年提出,考察多个变量间相关性一种多元统计方法。研究如何通过少数几个主成分(principal component)来解释多个变量间的内部结构。即从原始变量中导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关,《主成分分析,为什么选择单身?


其他多元分析方法,因子分析,对应分析,典型相关分析,多维标度分析可以参考下列文章:
因子分析和对应分析干货实践
典型相关分析:科研投入与产出
多维标度分析:城市距离与省市消费


2.3,数据挖掘高级篇:

你周围的大多数人的选择,影响着或主导着你的选择;你周围的大多数人的色彩,渲染着和体现着你的色彩;你周围的大多数人的品行,反映着和彰显着你的品行;近邻就是你周围的人, 大多数就是K个人或物中具有的普遍的大多数的属性,大概率的预判你也拥有这种普遍的多数的属性。《K近邻,最简单的预判“你买了吗?”

眼下最热门的技术,绝对是人工智能。人工智能的底层模型是"神经网络"(neural network)。许多复杂的应用(比如模式识别、自动控制)和高级模型(比如深度学习)都基于它。学习人工智能,一定是从它开始。《见山之门:神经网络


2.4,趣味分析篇:
趣味的数据分析文章结合热点,参杂一些哲学思辩和个人生活体悟,看见有趣的世界,读懂生活的道理。

《哪吒之魔童降世》:异化让人成魔

小统计,牵出“徽州丝绢大案”

戏谈《长安十二时辰》的大案牍术

数据分析师,你是什么段位?

贵?水果怎么吃最划算

众生相:两性择偶标准分析报告

2019-2023年:房价何去何从?

人口红利褪色,知识力量崛起

嘘,听:数据在说谎

都挺好,怎么好?

数据揭秘:凭什么登顶富豪榜?

天命难违:人为什么喜欢转圈圈?

看一看:亮眼的趣味图

春天:谁是最得意的诗人?

纳闷:啥是佩奇?


3,  初心不忘

坚持持续写作,不仅能够沉淀和巩固自己的知识。

也希望可以通过知识分享帮助别人快速成长,少走弯路。

我始终相信:“完成大于完美”,我会在持续的写作中不断的完善自己,希望输出更加优质的内容,成就更多优秀的人。

这里衷心的感谢:每一每读者,谢谢你们的鼓励支持。

向每一位读者致敬,一起砥砺前行。

如果文章有价值,你可以点右下角 “在看

这里推荐一个公众号:演员的自我修养,从典籍中品读人生道理

扫码,关注看看,也许你喜欢

推荐阅读:

《哪吒之魔童降世》:异化让人成魔

一个公式缓解 你99%的蕉绿

大浪淘沙,让数据发光是一种能力

文章有问题?点此查看未经处理的缓存