查看原文
其他

【新书速递】金融商业数据分析入门、实战、进阶,一本书全掌握

华章科技 华章计算机 2022-10-26

随着现代信息技术的不断发展,以大数据为基础的各类金融科技应用成为市场热点。近年来,随着数据治理不断被强化及数据资产的热度不断升温,各金融机构已经有了一定的数据基础。基于数据挖掘手段开展精准营销、风险管控、运营优化,已经成为数据应用的必然趋势。未来,随着物联网等技术的不断推广,数据量的增速将更为迅猛,大数据应用势不可挡。在大数据转型趋势下,各企业也在思考如何不被市场淘汰,如何使数据的价值最大化。 


大数据应用一方面需要有数据可挖掘,另一方面需要数据分析专家。赋能金融企业内部人员,使之成为业务感知能力强、分析技术过硬的双料人才,是培养数据分析专家最快捷、最实际的途径。《金融商业数据分析:基于Python和SAS》就是一本金融业务与数据分析技术相融合的参考书。


虽然数据分析已经不是新概念,但是市面上系统地讲解金融行业数据分析师如何成长的书不多。本书在业务方面涵盖用户画像、客户价值预测、精准营销预测等,在方法论方面涵盖描述统计、假设推断、预测性建模等。同时,本书贴合金融行业的分析软件环境,将新兴的Python与传统的SAS相结合,以便于读者快速掌握相关技术。

另外,市面上Python的编程基础和机器学习图书众多,但是鲜有从数据分析角度进行讲解的,而且Python本身的数据分析软件包也不完善。在本书中,笔者结合多年的数据分析咨询经验,提供了常用的函数,便于读者在实际工作中快速上手。



本书共14章,分为3篇。

  • 分析工具篇(第1~4章):介绍SAS EG的菜单操作和Python的入门知识。

  • 数据处理篇(第5~9章):从构建统计指标和数据可视化开始讲解,将数据查询、数据整合、数据清洗相结合,构建出满足分析需求的数据集。

  • 统计分析篇(第10~14章):从假设检验开始,介绍如何从业务洞察中获取灵感,然后用数据验证灵感,并且根据得到的灵感构建统计模型,以便预测客户的未来价值或者营销响应的概率。

其中,统计分析篇通过实例讲解数据分析应用,相比于前两篇更独立。如果你是一名有编程经验的高手,可以直接阅读这部分内容。如果你是一名初学者,请一定从第1章的基础理论知识开始学习。



目录

前言

分析工具篇

1章 数据科学与数理统计2

1.1 数据科学的基本概念2

1.2 数理统计技术5

1.2.1 描述性统计分析5

1.2.2 统计推断与统计建模6

2章 SAS EG数据操作基础8

2.1SAS EG入门8

2.1.1SAS EG简介8

2.1.2SAS EG的窗口及菜单9

2.2 访问数据10

2.2.1SAS EG实现方式11

2.2.2SAS程序实现方式13

2.3 定义SAS数据集13

2.3.1SAS数据的相关概念13

2.3.2SAS EG实现方式16

2.3.3SAS程序实现方式18

2.4 导入其他格式的数据文件19

2.4.1SAS EG实现方式19

2.4.2SAS程序实现方式21

3章 Python编程基础22

3.1Python概述22

3.2Anaconda的安装及使用方法23

3.2.1 下载与安装23

3.2.2 使用Jupyter Notebook24

3.2.3 使用Spyder25

3.2.4 使用Conda管理第三方库27

3.3Python的基本数据类型29

3.3.1 字符串29

3.3.2 浮点型和整型29

3.3.3 布尔类型30

3.3.4 其他数据类型31

3.4Python的基本数据结构31

3.4.1 列表32

3.4.2 元组33

3.4.3 集合33

3.4.4 字典34

3.5Python的编程结构35

3.5.1 三种基本的编程结构简介35

3.5.2 顺序结构35

3.5.3 分支结构36

3.5.4 循环结构37

3.6Python的函数与模块40

3.6.1Python的函数40

3.6.2Python的模块42

3.7 使用Pandas读写结构化数据43

3.7.1 读数据43

3.7.2 写数据46

4章 在SAS EG中使用程序47

4.1 如何在SAS EG中使用程序47

4.2SAS程序49

4.2.1SAS程序分析简介49

4.2.2DATA50

4.2.3PROC51

数据处理篇

5章 描述性统计分析与制图54

5.1 描述性统计分析54

5.1.1 变量度量类型与分布类型54

5.1.2 变量的统计量56

5.1.3 连续变量的分布与集中趋势56

5.1.4 连续变量的离散程度58

5.1.5 数据分布的对称与高矮59

5.2 制作报表与统计图60

5.3 制图步骤及统计图适用场景64

5.4 利用SAS EG进行统计分析67

5.4.1 连续变量描述性统计分析67

5.4.2 单因子频数统计分析69

5.4.3 汇总统计分析72

5.4.4 绘制条形图进行统计分析76

5.4.5 绘制地图进行统计分析79

6章 表数据的行处理82

6.1 数据筛选82

6.1.1SAS EG实现方式82

6.1.2SAS程序实现方式84

6.2 排序与求秩87

6.2.1SAS EG实现方式87

6.2.2SAS程序实现方式94

6.3 抽样95

6.3.1 抽样理论介绍95

6.3.2SAS EG实现方式97

6.3.3SAS程序实现方式99

6.4 数据分组和汇总100

6.4.1SAS EG实现方式100

6.4.2SAS程序实现方式102

7章 表数据的列处理103

7.1 构造列变量103

7.2 拆分列105

7.3 堆叠列107

7.4 转置列110

7.4.1SAS EG实现方式111

7.4.2SAS 程序实现方式113

7.5 对列重编码114

7.5.1SAS EG实现方式114

7.5.2SAS程序实现方式119

7.6 变量标准化119

7.6.1SAS EG实现方式120

7.6.2SAS程序实现方式122

8章 数据集的操作124

8.1 纵向连接124

8.1.1SAS EG实现方式125

8.1.2SAS程序实现方式127

8.2 横向连接131

8.2.1SAS EG实现方式131

8.2.2SAS程序实现方式135

8.3 数据集的比较138

8.3.1SAS EG实现方式138

8.3.2SAS程序实现方式141

8.4 创建格式142

8.4.1 相关理论介绍142

8.4.2SAS EG实现方式143

8.4.3SAS程序实现方式146

8.5 删除数据集、格式和视图147

8.5.1SAS EG实现方式147

8.5.2SAS程序实现方式148

9章 利用Python处理数据149

9.1 数据整合150

9.1.1 行操作和列操作150

9.1.2 条件查询152

9.1.3 横向连接155

9.1.4 纵向合并157

9.1.5 排序159

9.1.6 分组汇总160

9.1.7 拆分与堆叠列163

9.1.8 赋值与条件赋值165

9.2 数据清洗167

9.2.1 重复值处理167

9.2.2 缺失值处理168

9.2.3 噪声值处理170

9.3 实战175

9.3.1 提取行为特征的RFM方法175

9.3.2 使用RFM方法计算变量176

9.3.3 数据整理与汇报177

统计分析篇

10章 数据科学的统计推断180

10.1 基本的统计学概念180

10.1.1 总体、样本和统计量180

10.1.2 点估计、区间估计和中心极限定理181

10.2 假设检验186

10.2.1 理论介绍186

10.2.2 利用Python实现单样本t检验189

10.2.3 利用SAS EG实现单样本t检验189

10.2.4 利用SAS EG实现双样本t检验189

10.2.5 利用Python实现双样本t检验191

10.3 方差分析193

10.3.1 利用Python实现单因素方差分析193

10.3.2 利用SAS EG实现单因素方差分析198

10.3.3 利用Python实现多因素方差分析202

10.3.4 利用SAS EG实现多因素方差分析204

10.4 相关分析207

10.4.1 相关分析理论207

10.4.2Python实现方式210

10.4.3SAS EG实现方式210

10.5 列联表分析与卡方检验211

10.5.1 利用Python实现列联表分析212

10.5.2 利用SAS EG实现列联表分析213

10.5.3 利用Python实现卡方检验215

10.5.4 利用SAS EG实现卡方检验216

11章 构造连续变量的预测模型219

11.1 线性回归模型介绍219

11.1.1 简单线性回归220

11.1.2 多元线性回归224

11.2 模型的构建226

11.2.1 多元线性回归模型的构建226

11.2.2 将连续变量和分类变量同时作为解释变量来构建模型228

11.3 线性回归模型的诊断230

11.3.1 残差230

11.3.2 强影响点234

11.3.3 共线性236

11.4 建模流程238

11.5 利用SAS EG实现客户价值预测239

11.5.1 单连续变量下建模239

11.5.2 多连续变量下建模242

11.5.3 加入分类解释变量建模243

12章 构造二分类变量的预测模型245

12.1 逻辑回归入门245

12.2 模型表现优劣的评估251

12.3 多水平值分类变量的逻辑回归253

12.4 关于构造因果关系模型的讨论255

12.5 利用SAS EG实现贷款违约可能性预测257

13章 描述性数据分析方法266

13.1 客户细分266

13.1.1 客户细分的意义266

13.1.2 根据客户利润贡献细分268

13.1.3 根据个人或公司的生命历程细分269

13.1.4 根据客户的产品偏好细分269

13.1.5 根据客户的多维行为属性细分270

13.1.6 根据客户结构细分271

13.1.7 综合应用272

13.2 连续变量间关系探索与变量压缩273

13.2.1 多元变量间关系统计基础273

13.2.2 多元变量压缩的思路276

13.2.3 主成分分析278

13.2.4 因子分析288

13.3 聚类分析293

13.3.1 基本逻辑293

13.3.2 层次聚类294

13.3.3 快速聚类301

13.3.4 两步法聚类308

14章 时间序列分析314

14.1 时间序列及其分析方法简介314

14.2 利用效应分解法分析时间序列316

14.2.1 时间序列的效应分解316

14.2.2SAS EG实现方式316

14.2.3Python实现方式318

14.3 平稳时间序列分析322

14.3.1 平稳时间序列简介322

14.3.2AR模型、MA模型、ARMA模型简介323

14.3.3Python实现方式324

14.4 非平稳时间序列分析328

14.4.1 差分与ARIMA模型328

14.4.2SAS EG实现方式330

14.4.3Python实现方式336

上下滑动查看



本书姊妹篇




点击以上链接了解详情并购买





扫码关注【CSAPP】视频号



更多精彩回顾



书讯 | 12月书讯(上) | 冬夜寒冷,读书暖心,华章科技上新啦!书讯 | 12月书讯(下) | 冬夜寒冷,读书暖心,华章科技上新啦!
资讯 | 科普两个著名人工智能思想实验:图灵测试和中文房间书单 | 为什么 Rust 是编程的未来?干货 | 多角度展现 Linux 集群之美收藏 | 测试开发必备技能,你达标了吗?上新 | 【新书速递】龙芯开源LoongArch版,学会造计算机!赠书 | 【第84期】对话智能风控


点击阅读全文购买

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存