Python开源BI工具Superset的简单搭建与初级使用
Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard(看板),为数据分析提供了轻量级的数据查询与可视化方案。
06
目录:
1.搭建流程
1.1.构建虚拟环境
1.2.激活虚拟环境
1.3.安装superset
1.4.初始化superset
1.5.superset启动脚本
2.使用流程
2.1.数据源设置
2.2.上传csv文件
2.3.图表
2.4.看板
“官方网站:http://superset.apache.org/
”
Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard(看板),为数据分析提供了轻量级的数据查询与可视化方案。
主要功能及特点
(为啥是英文的,因为我不知道怎么翻译的好,反正能看懂就行)
主要功能
官方看板示例
1.搭建流程
我的本机环境如下:
# 系统版本:Windows10家庭版
# Python:python 3.7.7
# Superset:0.36.0
1.1.构建虚拟环境
当然,不构建虚拟环境也是可以搭建的,这里构建虚拟环境可以相对保证咱们只需要用到Superset的依赖库,纯净。这里我们简单介绍2中构建虚拟环境的方式,其中一种是通过Anconada navigator直接创建,另外一种是在命令行通过命令创建,大家可以根据自己的实际情况进行选择尝试。
方式一 Anconada navigator
如果你是安装的Anconada,可以直接打开 Anconada navigator,通过以下示例图方式创建虚拟环境supersetTest (名字可以自定义)
如果你安装的是Anconada,通过以下命令即可创建一个名为“supersetTest”的虚拟环境。
conda create -n supersetTest python=3.7.7
# 安装第三方库
pip install virtualenv
# 创建一个名为supersetTest且不拷贝系统的python第三方库的虚拟环境
virtualenv --no-site-packages supersetTest
# 激活该虚拟环境
supersetTest\Scripts\activate.bat
# 退出该虚拟环境
supersetTest\Scripts\deactivate.bat
1.2.激活虚拟环境
通过上述方式一,我们构建了虚拟环境 supersetTest,由于安装superset关联的第三方库较多,我们激活该虚拟环境后再进行superset的安装。
# 激活虚拟环境,后续在该环境下安装相关库
activate supersetTest
1.3.安装superset
在之前就行安装的时候,遇到很多问题,当然最后都解决了,所以这里直接以最终解决后总结的安装步骤进行介绍(注意:需要安装在上一步构建的虚拟环境中)。
第一步:升级setuptools和pip;
# Put all the chances on your side by getting the very latest pip and setuptools libraries.:
pip install --upgrade setuptools pip
第二步本地安装以下两个库;
“python_geohash-0.8.5-cp37-cp37m-win_amd64.whl
”
sasl-0.2.1-cp37-cp37m-win_amd64.whl
到https://www.lfd.uci.edu/~gohlke/pythonlibs
进行以上两个轮子的下载(大家根据自己的环境进行版本选择),然后本地安装,安装过程中一定要注意 被安装文件路径写全。
pip install C:\Users\Gdc\Downloads\sasl-0.2.1-cp37-cp37m-win_amd64.whl
pip install C:\Users\Gdc\Downloads\python_geohash-0.8.5-cp37-cp37m-win_amd64.whl
第三步:安装superset。
完成第一步的安装后,再进行本步骤,一般是很可以很顺利完成安装的,否则可能会出现很多报错(基本都是依赖关系库版本匹配问题等)
pip install apache-superset==0.36.0
1.4.初始化superset
直接拷贝官网初始化流程如下:
# Initialize the database
superset db upgrade
# Create an admin user (you will be prompted to set a username, first and last name before setting a password)
$ export FLASK_APP=superset
superset fab create-admin
# Load some data to play with
superset load_examples
# Create default roles and permissions
superset init
# To start a development web server on port 8088, use -p to bind to another port
superset run -p 8088 --with-threads --reload --debugger
不过,这些命令需要在superset安装路径下使用,比如我的是这样:
“C:\Users\Gdc\anaconda3\envs\supersetTest\Lib\site-packages\superset\bin
”
按照流程进行执行即可,每一步之前记得加上 python,部分步骤如:
python superset db upgrade【数据库初始化】
python superset fab create-admin【创建账号】
python superset run -p 8088 --with-threads --reload --debugger【启动superset】
1.5.superset启动脚本
为了快捷启动superset,我们可以编写简单的脚本bat文件
call cd C:\Users\Gdc\anaconda3\envs\supersetTest\Lib\site-packages\superset\bin
call activate supersetTest
call python superset run -p 8088 --with-threads --reload --debugger
pause
2.使用流程
当我们启动superset之后,在按照提示在浏览器输入“http://127.0.0.1:8088/”即可进行访问,在右侧可以选择页面语言(我这里选择的是中文)。
2.1.数据源设置
数据源设置里我们可以设置数据库,superset支持很多数据库,具体大家在官网即可查阅。这里我使用的是mysql,因此可以在数据源中新增mysql数据源,参考如下:
mysql://root:password@localhost/databasename?charset=utf8
2.2.上传csv文件
除了直接从数据库获取数据外,如果源数据是csv文件,也可以通过上传csv文件(其实是写入了你关联的数据库里)
2.3.图表
提供很多可视化图表,大家可以根据自己的需求进行数据字段的拖拽,然后创建需要的图表形式。
2.4.看板
多个图表可以组成看板,看板页面也可以自己拖拽图表创建你喜欢的看板形式。
往期推荐
默默关注才哥
然后惊艳所有人
可以叫我才哥