查看原文
其他

【新书速递】深入浅出Pandas,用好Python必备

华章科技 华章计算机 2021-10-18

     

近年来,国内掀起了一股学习Python的热潮。但用Python来干什么却成了很多人的问题:我们学习Python是在学什么?虽然听说Python什么都能做,但普通学习者在学习了Python的语法、数据类型、流程控制、函数、类等内容后,还是不知道Python能解决什么问题。



Python在全社会最常见、最广泛的使用场景就是收集数据、处理Excel表格、做数据分析,简单来说就是代替Excel的复杂操作,实现高效办公。而Pandas正是解决这方面问题的专业数据科学库。Pandas既能完成上述这些基础操作,又能在数据建模、机器学习等更高层次的领域发挥重要作用。


所以,对于Python的初学者,都建议直接学Pandas,因为一来它能应对上述真实需求,学完就能解决问题;二来随着学习的深入,你会发现不论哪个领域都需要一个数据结构来承载数据,而Pandas提供的Series和DataFrame结构正好解决了这个问题。


要用好Python,必先学好Pandas,它是数据科学武器库中的“瑞士军刀”。今天为大家介绍初学者的系统学习入门书,资深Python工程师的案头速查手册《深入浅出Pandas:利用Python进行数据处理与分析》





读者对象


如同Python在诸多领域有广泛应用一样,Pandas处理的是数据问题,同样在各行各业都能展现其魅力,因此本书没有预设读者的行业和职业。阅读本书需要掌握一点Python的语法、数据结构和函数方面的基础知识,不过零基础的读者也完全可以理解本书的内容,本书会介绍Python环境的安装和Python的数据结构,方便初学者入门学习。阅读本书也不需要有专业的线性代数和概率统计学知识,只需具备基础的数学知识即可。

不过,还是强烈推荐以下人群阅读本书:

  • Excel中度、重度使用者,如文秘、公关人员、教师,从事行政、人力资源、市场和销售等工作的人员;

  • 数据分析师、商业分析师、数据科学家;

  • 互联网运营人员、数据运营人员;

  • 互联网产品经理、项目经理;

  • 开发人员、测试人员、算法人员;

  • 财务、会计、金融从业者;

  • 企业决策者、管理人员。




本书特色


不同于市面上众多由开发人员编写的Python图书,本书作者非技术人员出身,更能从用户体验角度入手解决学习者的痛点。本书有以下特色:

  • 聚焦Pandas常用场景和痛点;

  • 非技术思维,语言通俗易懂,面向应用;

  • 不需要相关背景知识,不引入 Python 高级用法;

  • 减少变量的传递,代码短小精练;

  • 知识全面,几乎囊括 Pandas 所有函数和方法;

  • 较少使用数学和统计学知识;

  • 案例使用极简数据集,方便理解;

  • 使用流行的链式方法,代码简洁,逻辑清晰,可读性强;

  • 有大量实用案例;




内容简介



本书共17章,分为七部分,全面介绍了如何利用Pandas进行数据处理和数据分析。


第一部分(第1~2章) Pandas入门

主要介绍了Python和Pandas是什么,它们有哪些数据结构和数据类型,以及Pandas开发环境的搭建,此外还介绍了Pandas的快速入门。


第二部分(第3~5章) Pandas数据分析基础

主要介绍了Pandas读取与输出数据、索引操作、数据类型转换、查询筛选、统计计算、排序、位移、数据修改、数据迭代、函数应用等内容。


第三部分(第6~9章) 数据形式变化

主要介绍了Pandas的分组聚合操作、合并操作、对比操作、数据透视、转置、归一化、标准化等,还包括利用多层索引对数据进行升降维处理。


第四部分(第10~12章) 数据清洗

主要介绍了缺失值和重复值的识别、删除、填充,数据的替换、格式转换,文本的提取、连接、匹配、切分、替换、格式化、虚拟变量化等,还介绍了分类数据的应用场景和操作方法。


第五部分(第13~14章) 时序数据分析

主要介绍了Pandas中对于时间类型数据的处理和分析,包括固定时间、时长、周期、时间偏移等的表示方法、查询、计算、格式处理,以及时区转换、重采样、工作日和工作时间的处理方法。本部分还讲解了在时序数据处理中经常使用的窗口计算。


第六部分(第15~16章) 可视化

主要介绍了Pandas的样式功能如何让数据表格更有表现力,Pandas的绘图功能如何让数据自己说话,如何定义不同类型的数据图形,以及如何对图形中的线条、颜色、字体、背景等进行细节处理。


第七部分(第17章) 实战案例

介绍了从需求到代码的思考过程,如何利用链式编程思想提高代码编写和数据分析效率,以及数据分析的基本方法与需要掌握的数据分析工具和技术栈。本部分还从数据处理和数据分析两个角度给出了大量的应用案例及代码详解。




本书作者



李庆辉

数据产品专家,某电商公司数据产品团队负责人,擅长数据治理、数据分析、数据化运营。

精通Python数据科学及Python Web开发,曾独立开发公司的自动化数据分析平台,参与教育部“1+X”数据分析(Python)职业技能等级标准评审。


中国人工智能学会会员,企业数字化、数据产品和数据分析讲师,在个人网站“盖若”上编写的技术和产品教程广受欢迎。


 


专家推荐



作为Python数据科学的核心力量之一,Pandas是学习大数据、人工智能的基础工具。本书从理论到实践、深入浅出地对Pandas做了全面介绍,是非常合适的学习材料。

——张军平  复旦大学计算机科学技术学院教授

 

本书是一本全面讲解Pandas的优秀著作,不仅详细介绍了Pandas的数据采集、处理、展示等常见实践场景,而且给出了丰富的代码示例和运行效果,是理论和实践相结合的典范。

——陈运文  博士/国家“万人计划”专家/达观数据CEO

 

本书全面系统地介绍了Pandas的各种方法,并结合简洁、清晰的代码片段,辅以大量的应用案例,使我们能够深刻理解Pandas的设计理念,并掌握其使用方法,非常值得阅读。

——耿杰森 美国数据工程与科学协会主席

 

本书覆盖了日常工作中的主要数据处理场景,详细介绍了众多的功能和方法,且内容深入浅出,简单易懂。本书既可以作为初学者的Pandas入门书,也可以作为Pandas高手随手查阅的工具书。

——宋天龙   触脉咨询合伙人/《Python数据分析与数据化运营》作者

 

Pandas是Python中用来处理数据的核心库,我们十分有必要掌握它。本书深入浅出地介绍了Pandas的常见用法,推荐给想要系统学习Pandas的读者。

——张俊红 《对比Excel,轻松学习Python数据分析》作者

 

 

 

实拍图









点击链接了解详情并购买




扫码关注【华章计算机】视频号

每天来听华章哥讲书




更多精彩回顾



书讯 | 7月书讯(下)| 读书开启下半年书讯 | 7月书讯(上)| 读书开启下半年资讯 | 《数据安全法》表决通过!最新解读来了书单 | 2021半年盘点,不想你错过的重磅新书干货 | 详解数据资产的8大重要特征收藏 | 一文了解滴滴与蚂蚁金服开源共建的SQLFlow上新 | 【新书速递】打通数据科学三要素——数据科学实战性手册赠书 | 【第65期】你和世界上顶级的程序员差几个等级?点击阅读全文购买
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存