查看原文
其他

Lux,一个强大的 python 库

程序员小寒 程序员学长 2023-09-17

大家好,我是小寒。

今天给大家分享一个超强的 python 库,Lux

https://github.com/lux-org/lux

Lux 可通过自动化「可视化和数据分析过程」来促进快速、轻松的数据探索。

Lux 推荐了一组可视化效果,突出显示数据集中有趣的趋势和模式

可视化效果通过交互式小部件显示,使用户能够快速浏览大量可视化效果并理解其数据。

初体验

库的安装

可以直接使用 pip 进行安装。
pip install lux-api
pip install lux-widget

导入库

要开始使用 Lux,只需在 Pandas 导入中添加额外的导入语句即可。
import lux
import pandas as pd

Lux 可以在不修改任何现有 Pandas 代码的情况下使用。

在这里,我们使用 Pandas 的 read_csv 命令加载数据集。

如果需要数据,可以私信我获取。
df = pd.read_csv("college.csv")
df

打印数据框后,Lux 会自动推荐一组可视化效果,突出显示数据集中有趣的趋势和模式。


‍‍‍‍‍‍
瞧!这是一组可视化效果,你现在可以使用它们来进一步探索你的数据集!

基于用户意图的下一步建议

除了可视化数据框之外,你还可以向 Lux 指定你感兴趣的属性和值。‍

例如,假设你对属性AverageCostSATAverage感兴趣。
df.intent = ["AverageCost","SATAverage"]
df
如下图所示,左侧显示当前的可视化效果,即根据用户感兴趣的内容生成的当前可视化效果。

‍‍‍‍‍‍

在右侧,Lux 生成三组推荐,在小部件上组织为单独的选项卡。

  • Enhance

    向当前选择添加一个附加属性,本质上突出了附加变量如何影响 AverageCost 和 SATAverage 的关系。我们发现,如果我们按 FundingModel 细分关系,公立大学(以红色显示)和私立大学(以蓝色显示)之间存在明显的区别,公立大学的入学成本更低,SAT 平均分低于 1400。

  • Filter

    向当前选择添加过滤器,同时保持属性(在 X 轴和 Y 轴上)固定。这些可视化显示了不同数据子集的 SATAverage 和 AverageCost 关系的变化。例如,我们看到「提供学士学位作为最高学位的大学」在两个变量之间表现出大致的线性趋势。


    ‍‍

  • Generalize

    AverageCost直方图中,我们看到许多大学的平均费用每年约为 20000 美元,与我们在散点图视图中看到的凸起相对应。


轻松以编程方式访问和导出可视化

现在我们已经通过 Lux 找到了一些有趣的可视化效果,我们可能有兴趣进一步深入研究这些可视化效果或与其他人分享。
可以将 Lux 中生成的可视化保存为静态、可共享的 HTML,或者在 Jupyter 中以编程方式进一步访问这些可视化。
选定的Vis对象可以转换为 Altair、Matplotlib 或 Vega-Lite 代码,以便可以进一步编辑。


借助自动编码实现快速、按需可视化

用户还可以通过与指定意图相同的语法创建自己的 Vis。

Lux 的理念是,用户应该始终能够可视化他们想要的任何内容,而不必考虑可视化效果应该是什么样子。
Lux 根据一组最佳实践自动确定标记和通道映射。

from lux.vis.Vis import Vis
Vis(["Region=New England","MedianEarnings"],df)

用于处理可视化集合的强大语言

Lux 提供了强大的抽象来处理基于部分指定查询的可视化集合。

用户可以「提供列表或通配符来迭代过滤器或属性值的组合,并快速浏览大量可视化效果」
例如,我们感兴趣的是不同 Regions 之间  AverageCost 的分布有何不同。
from lux.vis.VisList import VisList
VisList(["Region=?","AverageCost"],df)

要了解有关 Lux 中其他功能的更多信息,可以请参阅 https://lux-api.readthedocs.io/


最后



今天的分享就到这里。如果觉得不错,点赞,转发安排起来吧。接下来我们会分享更多的 「深度学习案例以及python相关的技术」,欢迎大家关注。最后,最近新建了一个 python 学习交流群,会经常分享 「python相关学习资料,也可以问问题,非常棒的一个群」

「进群方式:加我微信,备注 “python”」



往期回顾


Fashion-MNIST 服装图片分类-Pytorch实现

python 探索性数据分析(EDA)案例分享

深度学习案例分享 | 房价预测 - PyTorch 实现

万字长文 |  面试高频算法题之动态规划系列

面试高频算法题之回溯算法(全文六千字)  

    



如果对本文有疑问可以加作者微信直接交流。进技术交流群的可以加微信拉你进群。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存