软件应用丨Pandas玩转数据进阶：（二）

向前走别回头数据Seminar 2021-06-02

收录于话题

104个

版权声明：本文为CSDN博主「向前走别回头」的原创文章合辑，遵循 CC 4.0 BY-SA 版权协议，特此附上原文出处链接及本声明。
原文链接：
https://blog.csdn.net/weixin_39778570/article/details/81114177
https://blog.csdn.net/weixin_39778570/article/details/81114746
https://blog.csdn.net/weixin_39778570/article/details/81115523
https://blog.csdn.net/weixin_39778570/article/details/81116510

点此回顾 软件应用丨Pandas玩转数据进阶：（一）

通过apply对数据进行处理

import pandas as pdimport numpy as npfrom pandas import Series, DataFrame

# 打开一个csv文件对其中一列分成几列，把data列进行分组f = open('apply_demo.csv')df = pd.read_csv(f)df.head()Out[8]: time data0 1473411962 Symbol: APPL Seqno: 0 Price: 16231 1473411962 Symbol: APPL Seqno: 0 Price: 16232 1473411963 Symbol: APPL Seqno: 0 Price: 16233 1473411963 Symbol: APPL Seqno: 0 Price: 16234 1473411963 Symbol: APPL Seqno: 1 Price: 1649

# 简单的apply应用s1 = Series(['a']*7978)

df['A'] = s1

df.head()Out[12]: time data A0 1473411962 Symbol: APPL Seqno: 0 Price: 1623 a1 1473411962 Symbol: APPL Seqno: 0 Price: 1623 a2 1473411963 Symbol: APPL Seqno: 0 Price: 1623 a3 1473411963 Symbol: APPL Seqno: 0 Price: 1623 a4 1473411963 Symbol: APPL Seqno: 1 Price: 1649 a

# apply传如一个函数,对某一列进行处理df['A'] = df['A'].apply(str.upper)df.head()Out[14]: time data A0 1473411962 Symbol: APPL Seqno: 0 Price: 1623 A1 1473411962 Symbol: APPL Seqno: 0 Price: 1623 A2 1473411963 Symbol: APPL Seqno: 0 Price: 1623 A3 1473411963 Symbol: APPL Seqno: 0 Price: 1623 A4 1473411963 Symbol: APPL Seqno: 1 Price: 1649 A

# 通过分析，我们需要的是如下数据df['data'][0]Out[15]: ' Symbol: APPL Seqno: 0 Price: 1623'

df['data'][0].strip().split(' ')Out[16]: ['Symbol:', 'APPL', 'Seqno:', '0', 'Price:', '1623']

l1 = df['data'][0].strip().split(' ')

l1[1], l1[3], l1[5]Out[18]: ('APPL', '0', '1623')

# 定义一个处理函数def foo(line): items = line.strip().split(' ') return Series([items[1], items[3], items[5]]) # 使用apply处理data列df_temp = df['data'].apply(foo)df_temp.head()Out[21]: 0 1 20 APPL 0 16231 APPL 0 16232 APPL 0 16233 APPL 0 16234 APPL 1 1649

# 修改列名df_temp = df_temp.rename(columns = {0:'Symbol', 1:'Seqno', 2:'Price'})df_temp.head()Out[28]: Symbol Seqno Price0 APPL 0 16231 APPL 0 16232 APPL 0 16233 APPL 0 16234 APPL 1 1649

# 添加到原df中df_new = df.combine_first(df_temp)

df_new.head()Out[30]: A Price Seqno Symbol data time0 A 1623.0 0.0 APPL Symbol: APPL Seqno: 0 Price: 1623 14734119621 A 1623.0 0.0 APPL Symbol: APPL Seqno: 0 Price: 1623 14734119622 A 1623.0 0.0 APPL Symbol: APPL Seqno: 0 Price: 1623 14734119633 A 1623.0 0.0 APPL Symbol: APPL Seqno: 0 Price: 1623 14734119634 A 1649.0 1.0 APPL Symbol: APPL Seqno: 1 Price: 1649 1473411963

# 删除掉无关列并生成csvdel df_new['data'], df_new[ 'A']

df_new.head()Out[33]: Price Seqno Symbol time0 1623.0 0.0 APPL 14734119621 1623.0 0.0 APPL 14734119622 1623.0 0.0 APPL 14734119633 1623.0 0.0 APPL 14734119634 1649.0 1.0 APPL 1473411963

df_new.to_csv('demo_duplicate.csv')

左右滑动查看更多

Series和DataFrame去重

import numpy as npimport pandas as pdfrom pandas import Series, DataFrame

df = pd.read_csv('demo_duplicate.csv')df.head()Out[40]: Unnamed: 0 Price Seqno Symbol time0 0 1623.0 0.0 APPL 14734119621 1 1623.0 0.0 APPL 14734119622 2 1623.0 0.0 APPL 14734119633 3 1623.0 0.0 APPL 14734119634 4 1649.0 1.0 APPL 1473411963# df.sizeOut[41]: 19945

len(df)Out[42]: 3989

len(df['Seqno'].unique())Out[46]: 1000

# 某一行Series的duplicatedf['Seqno'].duplicated().head()Out[47]: 0 False1 True2 True3 True4 FalseName: Seqno, dtype: bool

type(df['Seqno'].duplicated())Out[48]: pandas.core.series.Series

# DataFrame去重，drop_dupliatesdf.drop_duplicates(['Seqno']).head()Out[49]: Unnamed: 0 Price Seqno Symbol time0 0 1623.0 0.0 APPL 14734119624 4 1649.0 1.0 APPL 14734119638 8 1642.0 2.0 APPL 147341196412 12 1636.0 3.0 APPL 147341196516 16 1669.0 4.0 APPL 1473411966

# keep参数指定保留哪一个df.drop_duplicates(['Seqno'], keep='last').head()Out[53]: Unnamed: 0 Price Seqno Symbol time3 3 1623.0 0.0 APPL 14734119637 7 1649.0 1.0 APPL 147341196411 11 1642.0 2.0 APPL 147341196515 15 1636.0 3.0 APPL 147341196619 19 1669.0 4.0 APPL 1473411967

左右滑动查看更多

时间序列简单操作

import pandas as pdimport numpy as npfrom pandas import Series, DataFrame

from datetime import datetime# 生成一个时间t1 = datetime(2009, 10, 20)t1Out[7]: datetime.datetime(2009, 10, 20, 0, 0)

# 手写一个时间列表date_list = [datetime(2016,9,1), datetime(2016,9,10), datetime(2017,9,1),datetime(2017,9,20),datetime(2017,10,1)]

date_listOut[12]: [datetime.datetime(2016, 9, 1, 0, 0), datetime.datetime(2016, 9, 10, 0, 0), datetime.datetime(2017, 9, 1, 0, 0), datetime.datetime(2017, 9, 20, 0, 0), datetime.datetime(2017, 10, 1, 0, 0)] # Series是index改为date_lists1 = Series(np.random.rand(5), index=date_list)

s1Out[14]: 2016-09-01 0.0916392016-09-10 0.8232072017-09-01 0.0827052017-09-20 0.1628242017-10-01 0.379725dtype: float64

s1.valuesOut[15]: array([ 0.09163872, 0.82320691, 0.08270518, 0.16282401, 0.37972535])# index 是一个DatetimeIndexs1.indexOut[16]: DatetimeIndex(['2016-09-01', '2016-09-10', '2017-09-01', '2017-09-20', '2017-10-01'], dtype='datetime64[ns]', freq=None)# 对Series访问s1[datetime(2016,9,10)]Out[18]: 0.82320691034095983

s1['2016-9-10']Out[19]: 0.82320691034095983

s1['2016/9/10']Out[20]: 0.82320691034095983

s1['20160910']Out[21]: 0.82320691034095983# 不可以直接'201609',报错s1['2016-09']Out[22]: 2016-09-01 0.0916392016-09-10 0.823207dtype: float64

s1['2016']Out[23]: 2016-09-01 0.0916392016-09-10 0.823207dtype: float64

# pandas生成Datetime，一个开始参数，一个结束参数，periods表示数量，freq表示间隔# 生成100个，freq默认为'D'天数date_list_new = pd.date_range('2016-01-01', periods=100)date_list_newOut[29]: DatetimeIndex(['2016-01-01', '2016-01-02', '2016-01-03', '2016-01-04', '2016-01-05', '2016-01-06', '2016-01-07', '2016-01-08', '2016-01-09', '2016-01-10', '2016-01-11', '2016-01-12', '2016-01-13', '2016-01-14', '2016-01-15', '2016-01-16', '2016-01-17', '2016-01-18', '2016-01-19', '2016-01-20', '2016-01-21', '2016-01-22', '2016-01-23', '2016-01-24', '2016-01-25', '2016-01-26', '2016-01-27', '2016-01-28', '2016-01-29', '2016-01-30', '2016-01-31', '2016-02-01', '2016-02-02', '2016-02-03', '2016-02-04', '2016-02-05', '2016-02-06', '2016-02-07', '2016-02-08', '2016-02-09', '2016-02-10', '2016-02-11', '2016-02-12', '2016-02-13', '2016-02-14', '2016-02-15', '2016-02-16', '2016-02-17', '2016-02-18', '2016-02-19', '2016-02-20', '2016-02-21', '2016-02-22', '2016-02-23', '2016-02-24', '2016-02-25', '2016-02-26', '2016-02-27', '2016-02-28', '2016-02-29', '2016-03-01', '2016-03-02', '2016-03-03', '2016-03-04', '2016-03-05', '2016-03-06', '2016-03-07', '2016-03-08', '2016-03-09', '2016-03-10', '2016-03-11', '2016-03-12', '2016-03-13', '2016-03-14', '2016-03-15', '2016-03-16', '2016-03-17', '2016-03-18', '2016-03-19', '2016-03-20', '2016-03-21', '2016-03-22', '2016-03-23', '2016-03-24', '2016-03-25', '2016-03-26', '2016-03-27', '2016-03-28', '2016-03-29', '2016-03-30', '2016-03-31', '2016-04-01', '2016-04-02', '2016-04-03', '2016-04-04', '2016-04-05', '2016-04-06', '2016-04-07', '2016-04-08', '2016-04-09'], dtype='datetime64[ns]', freq='D')# 修改freq，每周一date_list_new = pd.date_range('2016-01-01', periods=100, freq='W-MON')date_list_newOut[31]: DatetimeIndex(['2016-01-04', '2016-01-11', '2016-01-18', '2016-01-25', '2016-02-01', '2016-02-08', '2016-02-15', '2016-02-22', '2016-02-29', '2016-03-07', '2016-03-14', '2016-03-21', '2016-03-28', '2016-04-04', '2016-04-11', '2016-04-18', '2016-04-25', '2016-05-02', '2016-05-09', '2016-05-16', '2016-05-23', '2016-05-30', '2016-06-06', '2016-06-13', '2016-06-20', '2016-06-27', '2016-07-04', '2016-07-11', '2016-07-18', '2016-07-25', '2016-08-01', '2016-08-08', '2016-08-15', '2016-08-22', '2016-08-29', '2016-09-05', '2016-09-12', '2016-09-19', '2016-09-26', '2016-10-03', '2016-10-10', '2016-10-17', '2016-10-24', '2016-10-31', '2016-11-07', '2016-11-14', '2016-11-21', '2016-11-28', '2016-12-05', '2016-12-12', '2016-12-19', '2016-12-26', '2017-01-02', '2017-01-09', '2017-01-16', '2017-01-23', '2017-01-30', '2017-02-06', '2017-02-13', '2017-02-20', '2017-02-27', '2017-03-06', '2017-03-13', '2017-03-20', '2017-03-27', '2017-04-03', '2017-04-10', '2017-04-17', '2017-04-24', '2017-05-01', '2017-05-08', '2017-05-15', '2017-05-22', '2017-05-29', '2017-06-05', '2017-06-12', '2017-06-19', '2017-06-26', '2017-07-03', '2017-07-10', '2017-07-17', '2017-07-24', '2017-07-31', '2017-08-07', '2017-08-14', '2017-08-21', '2017-08-28', '2017-09-04', '2017-09-11', '2017-09-18', '2017-09-25', '2017-10-02', '2017-10-09', '2017-10-16', '2017-10-23', '2017-10-30', '2017-11-06', '2017-11-13', '2017-11-20', '2017-11-27'], dtype='datetime64[ns]', freq='W-MON')# 间隔5小时date_list_new = pd.date_range('2016-01-01','2016-02-01', freq='5H')date_list_newOut[36]: DatetimeIndex(['2016-01-01 00:00:00', '2016-01-01 05:00:00', '2016-01-01 10:00:00', '2016-01-01 15:00:00', '2016-01-01 20:00:00', '2016-01-02 01:00:00', '2016-01-02 06:00:00', '2016-01-02 11:00:00', '2016-01-02 16:00:00', '2016-01-02 21:00:00', ... '2016-01-29 23:00:00', '2016-01-30 04:00:00', '2016-01-30 09:00:00', '2016-01-30 14:00:00', '2016-01-30 19:00:00', '2016-01-31 00:00:00', '2016-01-31 05:00:00', '2016-01-31 10:00:00', '2016-01-31 15:00:00', '2016-01-31 20:00:00'], dtype='datetime64[ns]', length=149, freq='5H') # Seriess2=Series(np.random.rand(100), index=date_list_new)s2.head()Out[40]: 2016-01-01 00:00:00 0.2985802016-01-01 05:00:00 0.1457822016-01-01 10:00:00 0.3568712016-01-01 15:00:00 0.6076902016-01-01 20:00:00 0.223771Freq: 5H, dtype: float64

左右滑动查看更多

时间序列的采样和画图

import numpy as npimport pandas as pdfrom pandas import Series, DataFrame

# 生成一个时间序列t_range = pd.date_range('2016-01-01', '2016-12-31')t_rangeOut[5]: DatetimeIndex(['2016-01-01', '2016-01-02', '2016-01-03', '2016-01-04', '2016-01-05', '2016-01-06', '2016-01-07', '2016-01-08', '2016-01-09', '2016-01-10', ... '2016-12-22', '2016-12-23', '2016-12-24', '2016-12-25', '2016-12-26', '2016-12-27', '2016-12-28', '2016-12-29', '2016-12-30', '2016-12-31'], dtype='datetime64[ns]', length=366, freq='D')# 创建Seriess1 = Series(np.random.randn(len(t_range)), index=t_range)s1Out[9]: 2016-01-01 -1.4084842016-01-02 -0.5307842016-01-03 0.6590892016-01-04 1.4681512016-01-05 0.6783992016-01-06 -2.4467002016-01-07 -0.4034042016-01-08 0.6231372016-01-09 1.0680362016-01-10 1.4063402016-01-11 -0.9259502016-01-12 0.8865422016-01-13 0.5276202016-01-14 0.1779872016-01-15 -0.8439072016-01-16 1.2713022016-01-17 1.6463412016-01-18 -0.4203052016-01-19 -1.5522052016-01-20 -0.8848222016-01-21 0.6602732016-01-22 0.9457902016-01-23 1.6982832016-01-24 0.6681802016-01-25 1.4705222016-01-26 0.6878482016-01-27 0.0333512016-01-28 -0.8446442016-01-29 0.4725182016-01-30 -0.920086

2016-12-02 0.3133752016-12-03 0.4586182016-12-04 0.1976962016-12-05 1.2385502016-12-06 2.2495322016-12-07 1.0957122016-12-08 0.6936742016-12-09 -0.3770202016-12-10 0.5326772016-12-11 1.7147452016-12-12 0.1247742016-12-13 -0.3720792016-12-14 -0.9325412016-12-15 -0.3202672016-12-16 -0.7194032016-12-17 -2.0123142016-12-18 -0.5109382016-12-19 -0.3540062016-12-20 -0.3516262016-12-21 -0.6534672016-12-22 0.1699202016-12-23 0.5881632016-12-24 -0.6925582016-12-25 -0.0787812016-12-26 -0.1572612016-12-27 -1.4808092016-12-28 1.5869042016-12-29 -0.7918162016-12-30 0.9517992016-12-31 1.283303Freq: D, Length: 366, dtype: float64

# 一月份数据s1['2016-01']Out[10]: 2016-01-01 -1.4084842016-01-02 -0.5307842016-01-03 0.6590892016-01-04 1.4681512016-01-05 0.6783992016-01-06 -2.4467002016-01-07 -0.4034042016-01-08 0.6231372016-01-09 1.0680362016-01-10 1.4063402016-01-11 -0.9259502016-01-12 0.8865422016-01-13 0.5276202016-01-14 0.1779872016-01-15 -0.8439072016-01-16 1.2713022016-01-17 1.6463412016-01-18 -0.4203052016-01-19 -1.5522052016-01-20 -0.8848222016-01-21 0.6602732016-01-22 0.9457902016-01-23 1.6982832016-01-24 0.6681802016-01-25 1.4705222016-01-26 0.6878482016-01-27 0.0333512016-01-28 -0.8446442016-01-29 0.4725182016-01-30 -0.9200862016-01-31 -1.070854Freq: D, dtype: float64

# 一月份取平均值s1['2016-01'].mean()Out[11]: 0.15476017406190043

# 对月份取平均值s1_month = s1.resample('M').mean()s1_monthOut[13]: 2016-01-31 0.1547602016-02-29 -0.1715722016-03-31 -0.1273752016-04-30 -0.2980812016-05-31 0.3324332016-06-30 -0.3175802016-07-31 -0.2397762016-08-31 -0.0201082016-09-30 -0.2765032016-10-31 -0.1219382016-11-30 -0.0255102016-12-31 0.088271Freq: M, dtype: float64

# 前填充ffill，比如一号里的没有的数据是从1月1号采取过来的s1.resample('H').ffill()Out[14]: 2016-01-01 00:00:00 -1.4084842016-01-01 01:00:00 -1.4084842016-01-01 02:00:00 -1.4084842016-01-01 03:00:00 -1.4084842016-01-01 04:00:00 -1.4084842016-01-01 05:00:00 -1.4084842016-01-01 06:00:00 -1.4084842016-01-01 07:00:00 -1.4084842016-01-01 08:00:00 -1.4084842016-01-01 09:00:00 -1.4084842016-01-01 10:00:00 -1.4084842016-01-01 11:00:00 -1.4084842016-01-01 12:00:00 -1.4084842016-01-01 13:00:00 -1.4084842016-01-01 14:00:00 -1.4084842016-01-01 15:00:00 -1.4084842016-01-01 16:00:00 -1.4084842016-01-01 17:00:00 -1.4084842016-01-01 18:00:00 -1.4084842016-01-01 19:00:00 -1.4084842016-01-01 20:00:00 -1.4084842016-01-01 21:00:00 -1.4084842016-01-01 22:00:00 -1.4084842016-01-01 23:00:00 -1.4084842016-01-02 00:00:00 -0.5307842016-01-02 01:00:00 -0.5307842016-01-02 02:00:00 -0.5307842016-01-02 03:00:00 -0.5307842016-01-02 04:00:00 -0.5307842016-01-02 05:00:00 -0.530784

2016-12-29 19:00:00 -0.7918162016-12-29 20:00:00 -0.7918162016-12-29 21:00:00 -0.7918162016-12-29 22:00:00 -0.7918162016-12-29 23:00:00 -0.7918162016-12-30 00:00:00 0.9517992016-12-30 01:00:00 0.9517992016-12-30 02:00:00 0.9517992016-12-30 03:00:00 0.9517992016-12-30 04:00:00 0.9517992016-12-30 05:00:00 0.9517992016-12-30 06:00:00 0.9517992016-12-30 07:00:00 0.9517992016-12-30 08:00:00 0.9517992016-12-30 09:00:00 0.9517992016-12-30 10:00:00 0.9517992016-12-30 11:00:00 0.9517992016-12-30 12:00:00 0.9517992016-12-30 13:00:00 0.9517992016-12-30 14:00:00 0.9517992016-12-30 15:00:00 0.9517992016-12-30 16:00:00 0.9517992016-12-30 17:00:00 0.9517992016-12-30 18:00:00 0.9517992016-12-30 19:00:00 0.9517992016-12-30 20:00:00 0.9517992016-12-30 21:00:00 0.9517992016-12-30 22:00:00 0.9517992016-12-30 23:00:00 0.9517992016-12-31 00:00:00 1.283303Freq: H, Length: 8761, dtype: float64

# 后填充bfill，比如一号里的没有的数据是从1月2号采取过来的s1.resample('H').bfill()Out[15]: 2016-01-01 00:00:00 -1.4084842016-01-01 01:00:00 -0.5307842016-01-01 02:00:00 -0.5307842016-01-01 03:00:00 -0.5307842016-01-01 04:00:00 -0.5307842016-01-01 05:00:00 -0.5307842016-01-01 06:00:00 -0.5307842016-01-01 07:00:00 -0.5307842016-01-01 08:00:00 -0.5307842016-01-01 09:00:00 -0.5307842016-01-01 10:00:00 -0.5307842016-01-01 11:00:00 -0.5307842016-01-01 12:00:00 -0.5307842016-01-01 13:00:00 -0.5307842016-01-01 14:00:00 -0.5307842016-01-01 15:00:00 -0.5307842016-01-01 16:00:00 -0.5307842016-01-01 17:00:00 -0.5307842016-01-01 18:00:00 -0.5307842016-01-01 19:00:00 -0.5307842016-01-01 20:00:00 -0.5307842016-01-01 21:00:00 -0.5307842016-01-01 22:00:00 -0.5307842016-01-01 23:00:00 -0.5307842016-01-02 00:00:00 -0.5307842016-01-02 01:00:00 0.6590892016-01-02 02:00:00 0.6590892016-01-02 03:00:00 0.6590892016-01-02 04:00:00 0.6590892016-01-02 05:00:00 0.659089

2016-12-29 19:00:00 0.9517992016-12-29 20:00:00 0.9517992016-12-29 21:00:00 0.9517992016-12-29 22:00:00 0.9517992016-12-29 23:00:00 0.9517992016-12-30 00:00:00 0.9517992016-12-30 01:00:00 1.2833032016-12-30 02:00:00 1.2833032016-12-30 03:00:00 1.2833032016-12-30 04:00:00 1.2833032016-12-30 05:00:00 1.2833032016-12-30 06:00:00 1.2833032016-12-30 07:00:00 1.2833032016-12-30 08:00:00 1.2833032016-12-30 09:00:00 1.2833032016-12-30 10:00:00 1.2833032016-12-30 11:00:00 1.2833032016-12-30 12:00:00 1.2833032016-12-30 13:00:00 1.2833032016-12-30 14:00:00 1.2833032016-12-30 15:00:00 1.2833032016-12-30 16:00:00 1.2833032016-12-30 17:00:00 1.2833032016-12-30 18:00:00 1.2833032016-12-30 19:00:00 1.2833032016-12-30 20:00:00 1.2833032016-12-30 21:00:00 1.2833032016-12-30 22:00:00 1.2833032016-12-30 23:00:00 1.2833032016-12-31 00:00:00 1.283303Freq: H, Length: 8761, dtype: float64

# 画图# 新建一个时间序列t_range = pd.date_range('2016-01-01', '2016-12-31', freq='H')t_rangeOut[17]: DatetimeIndex(['2016-01-01 00:00:00', '2016-01-01 01:00:00', '2016-01-01 02:00:00', '2016-01-01 03:00:00', '2016-01-01 04:00:00', '2016-01-01 05:00:00', '2016-01-01 06:00:00', '2016-01-01 07:00:00', '2016-01-01 08:00:00', '2016-01-01 09:00:00', ... '2016-12-30 15:00:00', '2016-12-30 16:00:00', '2016-12-30 17:00:00', '2016-12-30 18:00:00', '2016-12-30 19:00:00', '2016-12-30 20:00:00', '2016-12-30 21:00:00', '2016-12-30 22:00:00', '2016-12-30 23:00:00', '2016-12-31 00:00:00'], dtype='datetime64[ns]', length=8761, freq='H')# 建立一个DataFramestock_df = DataFrame(index=t_range)# 加入两行，模拟股票stock_df['BABA'] = np.random.randint(80, 100, size=len(t_range))stock_df['TENCENT'] = np.random.randint(30, 50, size=len(t_range))

# 显示图片,下面stock_df.plot()Out[22]: <matplotlib.axes._subplots.AxesSubplot at 0x2259b52fa90>

# 数据过于密集，重新清洗，按周清洗weekly_df = DataFrame()# resample参数w表示周分类，再取平均值weekly_df['BABA'] = stock_df['BABA'].resample('W').mean()weekly_df['TENCENT'] = stock_df['TENCENT'].resample('W').mean()

weekly_df.head()Out[31]: BABA TENCENT2016-01-03 89.250000 39.4305562016-01-10 89.065476 38.5952382016-01-17 89.363095 39.4107142016-01-24 89.482143 38.8571432016-01-31 89.869048 40.309524

# 显示weekly_df.plot()Out[32]: <matplotlib.axes._subplots.AxesSubplot at 0x2259bf84e48>

左右滑动查看更多

·END·

点击阅读原文，进入新型农业经营主体大数据库

点击搜索你感兴趣的内容吧

软件应用丨Pandas入门系列（三)：简单数据处理

软件应用丨Pandas入门系列（二）：Pandas io操作

软件应用丨Pandas入门系列（一）：深入理解Series和DataFrame

数据Seminar

这里是大数据、分析技术与学术研究的三叉路口

出处：CSDN作者：向前走别回头推荐：青酱排版编辑：青酱

欢迎扫描👇二维码添加关注

点击阅读原文，获得更多精彩内容！

一把短刀，怎么就让他连捅18人？！

上海超市血案：背后缘由让人揪心

为啥一线城市只有广州取消限购？是因为穷吗

当前三大问题：国家的方向感、精英的安全感、百姓的希望感

这次我怀疑邱成桐已经“学阀化”了

软件应用丨Pandas玩转数据进阶：（二）

点此回顾 软件应用丨Pandas玩转数据进阶：（一）

您可能也对以下帖子感兴趣

一把短刀，怎么就让他连捅18人？！

上海超市血案：背后缘由让人揪心

为啥一线城市只有广州取消限购？是因为穷吗

当前三大问题：国家的方向感、精英的安全感、百姓的希望感

这次我怀疑邱成桐已经“学阀化”了

生成图片，分享到微信朋友圈

软件应用丨Pandas玩转数据进阶：（二）

点此回顾软件应用丨Pandas玩转数据进阶：（一）

您可能也对以下帖子感兴趣