软件应用丨收藏!盘点最实用的数据科学Python库
The following article is from 读芯术 Author 读芯术
来源:DataQuest
本文转载自公众号读芯术,作者:读芯术。
▼
获取数据
清理数据
探索数据
构建数据
呈现数据
Beautiful Soup
Requests
Pandas
pip install beautifulsoup4
左右滑动查看更多
from bs4 import BeautifulSoupSoup = BeautifulSoup(page_name.text, ‘html.parser’)
左右滑动查看更多
Python的Requests库采用更加简单易用的方式发送HTTP请求。Requests库中有很多种方法,其中最常用的是request.get()。在URL转发成功或失败的情况下,request.get()都能够返回URL转发状态。推荐读者阅读Requests库官方文档了解更多信息:
pip install requests
左右滑动查看更多
import requestspaga_name = requests.get('url_name')
左右滑动查看更多
Pandas是一种方便易用的高性能数据结构,同时也是Python编程语言分析工具。Pandas提供了一种能够清晰、简洁地存储数据的数据框架。Pandas库官方文档如下:
pip install pandas
左右滑动查看更多
import pandas as pd
左右滑动查看更多
Pandas
NumPy
NumPy即Numeric Python,是一个支持科学计算的Python库。众所周知,Python本身并不支持矩阵数据结构,而Python中的NumPy库则支持创建和运行矩阵计算。NumPy库官方文档如下:
https://numpy.org/devdocs/?source=post_page-----a58e90f1b4ba----------------------
python -m pip install --user numpy scipy matplotlib ipython jupyter pandas sympy nose
左右滑动查看更多
import numpy as np
左右滑动查看更多
Pandas
Seaborn
Matplotlib.pyplot
pip install seaborn
左右滑动查看更多
推荐读者阅读Seaborn官方文档:
https://seaborn.pydata.org/examples/index.html?source=post_page-----a58e90f1b4ba----------------------#example-gallery
import seaborn as sns
左右滑动查看更多
python -m pip install -U matplotlib
左右滑动查看更多
推荐阅读Matplotlib官方文档:
https://matplotlib.org/users/index.html?source=post_page-----a58e90f1b4ba----------------------
import matplotlib.pyplot as plt
左右滑动查看更多
来源:scikit learn
SciKit learn是Python中一个便于使用的构建机器学习模型的库。它是基于NumPy、SciPy和Matplotlib开发的。SciKit learn库官方文档如下:
https://scikit-learn.org/stable/?source=post_page-----a58e90f1b4ba----------------------
import sklearn
左右滑动查看更多
pip install -U scikit-learn
左右滑动查看更多
这是数据科学的最后一步,也是很多人不想做的一步——毕竟没有人想要公开发表他们的数据发现。呈现数据也是有法可循的,并且这个方法极为重要,因为无论如何,成果最终还是要向人们展示的。而且由于人们并不关心所使用的的算法,他们只关心结果,所以展示还要做到简洁明了。为了展现数据成果,推荐读者安装Jupyter notebook:
https://jupyter.org/install.html?source=post_page-----a58e90f1b4ba----------------------
pip install RISE
左右滑动查看更多
阅读文章:
了解更多如何使用notebook做出精彩展示的教程。务必遵循教程的步骤。读者还可以观看Youtube的视频进行学习:
来源:LiveLessons
·END·
点击搜索你感兴趣的内容吧
软件应用丨数据缺失、混乱、重复怎么办?最全数据清洗指南
统计计量丨初级→高级计量经济学教材分析总结
软件应用丨一文看懂用Python读取Excel数据
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
出处:读芯术
推荐:青酱
欢迎扫描👇二维码添加关注