查看原文
其他

Pandas中常见的18个数据统计函数,65张图详解 | 图解Pandas-图文第7篇

我是阳哥 Python数据之道 2022-09-07

01写在前面

大家好,我是阳哥,欢迎来到「Python数据之道」。

本次是《图解Pandas》系列图文内容的 第 07 篇,主要介绍 Pandas 中常见的数据统计

本文是付费阅读文章,付费阅读内容包括《图解Pandas》图文干货内容、可以在电脑端观看的视频以及配套的源代码等。

此外,为避免各种不必要的麻烦,微信没有退款机制,付费前请谨慎。

Pandas 是 Python数据分析中用的最多的工具,为了大家能够更好地学习 Pandas,阳哥开始制作一系列 《图解Pandas》 的内容。

《图解Pandas》 最主要的目标,是以视频图解、动态图片等方式呈现,拆解 Pandas 在数据处理过程中的主要知识点,以便大家能进一步了解 Pandas 的使用,形象地介绍 Pandas,进而使大家喜欢上 Pandas 这个工具。

《图解Pandas》图文专题,最新的内容可以点击下面的图片进行查看。

在本文编写时,《图解Pandas》系列已发布的图文如下:

图文链接对应的视频编号
《图解Pandas》内容框架介绍-
图文01-数据结构介绍001
图文02-创建数据对象002
图文03-读取和存储Excel文件003、004
图文04-常见的数据访问005
图文05-常见的数据运算006、007、008
图文06-常见的数学计算009、010

本次主要介绍 Pandas 中常见的数据统计 ,内容框架如下:

主要内容

该主题包括 5 期视频,在微信视频号「Python数据之道」中发布的对应视频编号为 011015,大家可以前往观看:

注:本文发布时,在视频号中可以观看视频 011012,后续将发布 013015

在本文后面内容中可以同时观看视频 011015

扫描下面的二维码,关注视频号,可以观看《图解Pandas》已发布的所有视频以及及时推送最新的视频:

02常见的数据数据统计

Python环境

开始之前,按照惯例先介绍下本次内容涉及的Python环境,如下:

  • Python 3.8
  • Pandas 1.4.1
  • numpy 1.22.3

我是在 jupyter notebook 中运行代码的,首先引入相关 Python 库:

import pandas as pd
import numpy as np

print(f'pandas version:{pd.__version__}')
print(f'numpy version:{np.__version__}')

# pandas version:1.4.1
# numpy version:1.22.3

创建数据

咱们先来创建一个dataframe,也就是“数据框”。

关于创建数据对象的详细介绍,大家可以观看 「图解Pandas」系列的第2期视频

创建 df 如下:

d = {
    "a": [809060,73,89],
    "b": [807580,85,83],
    "c": [707580,73,62],
}
df = pd.DataFrame(d)
df

来看看数据框 df 的数据结构,为 5 行 3 列,为了简化计算,数值类型都是整型,没有字符串、NA值等数据类型。后续,会根据需要在该数据框的基础上,创建其他的一些数据框。

这里汇总了 Pandas 中比较常见的数据统计函数:

微信扫一扫付费阅读本文

可试读13%

微信扫一扫付费阅读本文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存