查看原文
其他

Dtale,一个神奇的 python 库

程序员小寒 程序员学长 2023-09-22

大家好,我是小寒。

今天给大家分享一个神奇的 python 库,Dtale

https://github.com/man-group/dtale

D-Tale 是一个 Python 库,为数据探索、分析和可视化提供了交互式且易于使用的界面。它构建在流行的数据操作和可视化库(例如 Pandas、Plotly 和 Flask)之上。
借助 D-Tale,你可以快速将数据加载到 DataFrame 中,然后使用基于 Web 的界面以表格格式探索数据集

它允许你对数据执行各种操作,例如过滤、排序、聚合和转换列。

此外,D-Tale 还提供统计摘要、相关性分析和缺失值处理功能。

D-Tale 的主要功能之一是它能够自动生成可视化。它提供了一个交互式绘图界面,允许你创建图表、直方图、散点图等。
你可以自定义可视化效果、调整参数并轻松将其导出为图像或 HTML 文件。

初体验

库的安装

在使用该库之前,我们需要做的第一步是使用 pip 安装该库。
pip install dtale

加载数据集

这里我们以 Gapminder 数据为例。

Gapminder 提供全球每个国家的人口数量、人均 GDP 和预期寿命等数据。

https://www.kaggle.com/datasets/tklimonova/gapminder-datacamp-2007?resource=download

要使用 dtale 访问数据,你可以编写以下代码。‍
import dtale
import pandas as pd
df = pd.read_csv('your_data_path')
d = dtale.show(df)
d

通过这样做,它将显示这样的界面。


探索性数据分析

使用 dtale,你可以进行不同类型的可视化

如果你想分析每一列,你可以使用库中的 “描述” 功能。要访问该功能,你可以将鼠标悬停到界面顶部,然后选择“可视化”>“描述”,如下所示:

在页面中,你可以对每一列进行查看和分析。

我们来看看预期寿命一栏。在顶部,你可以看到显示不同可视化效果的选项卡

在下面,你可以看到诸如唯一值、离群值以及列内值之间的差异等信息。以下是描述页面的预览:

现在让我从顶部向你解释每个选项卡。

第一个选项卡是描述选项卡,其中包含所选列的统计摘要。它还显示列中的箱线图。
第二个选项卡是直方图选项卡,它可视化列的直方图。你可以通过更改箱数或根据特定列对数据进行分组来调整直方图可视化。
第三个选项卡是分组选项卡,它可视化一个条形图,该条形图根据分类列聚合列值。
最后一个选项卡是 QQ 图。该图基本上告诉我们列的分布情况。你可以看到一条直线及其内部的数据点。数据点越接近直线,分布就越正态。

数据可视化

除了分析列之外,我们还可以使用该库进行更多可视化。

你需要做的就是将光标悬停在界面顶部,然后单击“可视化”>“图表”,如下所示:

使用此功能,我们可以创建折线图、散点图,甚至使用地图创建可视化效果

更多有趣的功能期待大家去探索。


最后



今天的分享就到这里。如果觉得不错,点赞,转发安排起来吧。接下来我们会分享更多的 「深度学习案例以及python相关的技术」,欢迎大家关注。最后,最近新建了一个 python 学习交流群,会经常分享 「python相关学习资料,也可以问问题,非常棒的一个群」

「进群方式:加我微信,备注 “python”」



往期回顾


Fashion-MNIST 服装图片分类-Pytorch实现

python 探索性数据分析(EDA)案例分享

深度学习案例分享 | 房价预测 - PyTorch 实现

万字长文 |  面试高频算法题之动态规划系列

面试高频算法题之回溯算法(全文六千字)  

    



如果对本文有疑问可以加作者微信直接交流。进技术交流群的可以加微信拉你进群。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存