查看原文
其他

Python中处理日期时间库的使用方法

2018-01-05

作者 大邓

最近在搞一个项目,遇到时间处理相关的需求。真的是实战需求导致学习需求,于是百度谷歌了一番,常用的时间处理方法和函数整理出本文。用百分之20时间,学会解决时间问题百分之80的问题。

常用的库有time、datetime。其中datetime库是对time库的封装,所以使用起来更加便捷。date是指日期时间(年月日)处理,time往往更加细小的单位(小时分秒等)的时间处理。

一、datetime库

1.1 datetime.date类

表示日期的类,常用的属性有year、month、day。参数都为整数。

import datetime

#任何一天
someday = datetime.date(year=2018,month=1,day=1)
someday
datetime.date(2018, 1, 1)

日期的标准化格式符号

%a  星期的简写。如 星期三为Web %A  星期的全写。如 星期三为Wednesday %b  月份的简写。如4月份为Apr %B  月份的全写。如4月份为April %c:  日期时间的字符串表示。(如: 04/07/10 10:43:39) %d:  日在这个月中的天数(是这个月的第几天) %f:  微秒(范围[0,999999]) %H:  小时(24小时制,[0, 23]) %I:  小时(12小时制,[0, 11]) %j:  日在年中的天数 [001,366](是当年的第几天) %m:  月份([01,12]) %M:  分钟([00,59]) %p:  AM或者PM %S:  秒(范围为[00,61],为什么不是[00, 59] %U:  周在当年的周数当年的第几周),星期天作为周的第一天 %w:  今天在这周的天数,范围为[0, 6],6表示星期天 %W:  周在当年的周数(是当年的第几周),星期一作为周的第一天 %x:  日期字符串(如:04/07/10) %X:  时间字符串(如:10:43:39) %y:  2个数字表示的年份 %Y:  4个数字表示的年份 %z:  与utc时间的间隔 (如果是本地时间,返回空字符串) %Z:  时区名称(如果是本地时间,返回空字符串)

以规定的格式返回。

print(someday.strftime('%Y-%m-%d'))
print(someday.strftime('%Y/%m/%d'))
2018-01-01 2018/01/01

生成如‘2018-01-01’

someday.isoformat()'2018-01-01'

今天

datetime.date.today()datetime.date(2018, 1, 4)

根据给定的时间戮,返回一个date对象

import time datetime.date.fromtimestamp(time.time())datetime.date(2018, 1, 4)

1.2 datetime.time类

表示时间的类,参数包括hour、minute、second、microsecond。 time类的方法同datetime类。

看看isoformat、strftime方法会返回什么

sometime = datetime.time(hour=12,minute=50,second=12,microsecond=10)
sometime
datetime.time(12, 50, 12, 10)

时间的格式化处理

print(sometime.isoformat())

print(sometime.strftime('%H:%M:%S'))

print(sometime.strftime('%H::%M::%S'))
12:50:12.000010 12:50:12 12::50::12

1.3 datetime.datetime类

日期实践类,常用的参数包含year、month、day、hour、minute、second、microsecond。但是至少要包含year、month、day三个参数。

datetime.datetime(year=2018,month=1,day=1,hour=12,minute=50,second=12,microsecond=10)datetime.datetime(2018, 1, 1, 12, 50, 12, 10)

只含有年月日

datetime.datetime(2018,1,1)datetime.datetime(2018, 1, 1, 0, 0)

看看isoformat、strftime方法会返回什么

somedatetime = datetime.datetime(2018,1,1)

#isoformat、strftime
print(somedatetime.isoformat())
print(somedatetime.strftime('%Y-%m-%d %H:%M:%S'))
2018-01-01T00:00:00 2018-01-01 00:00:00

1.4 datetime.timedelta类

表示时间间隔类,给一个时间点加上此类,即可得到一个新的时间。

参数包含days、hours、minutes、seconds、microseconds。

#1天零1小时零1分零1秒又10毫秒的时间间隔

datetime.timedelta(days=1,hours=1,minutes=1,seconds=1,microseconds=10)
datetime.timedelta(1, 3661, 10)

35天间隔

datetime.timedelta(days=35)datetime.timedelta(35)

现在+/-时间间隔操作

print(datetime.datetime.now())

print(datetime.datetime.now()+datetime.timedelta(days=35))

print(datetime.datetime.now()-datetime.timedelta(days=35))

print(datetime.datetime.now()-datetime.timedelta(hours=10))

print(datetime.datetime.now()-datetime.timedelta(hours=10,days=1))
2018-01-04 23:59:37.437627 2018-02-08 23:59:37.438283 2017-11-30 23:59:37.438775 2018-01-04 13:59:37.438987 2018-01-03 13:59:37.439190

二、time库

常用的方法有time、localtime

import time timestamp = time.time()
print('时间戳: ',timestamp)

locaoltime = time.localtime(timestamp)
print('当地时间: ',locaoltime)

#转化为有格式的时间,如只显示年月日
print(time.strftime('%Y-%m-%d %H:%M:%S',locaoltime))
时间戳:  1515081476.966094 当地时间:  time.struct_time(tm_year=2018, tm_mon=1, tm_mday=4, tm_hour=23, tm_min=57, tm_sec=56, tm_wday=3, tm_yday=4, tm_isdst=0) 2018-01-04 23:57:56

三、pandas库时间处理函数

获取当前时间,并返回出年月日规范格式。形如 2017-01-04

常用的方法有:

pd.date_range() 生成一个时间段 pd.bdate_range() 生成一个时间段,跟date_range()不同,可见下面代码 df.asfreq() 生成以一定时间间隔的序列

3.1 根据始末时间生成时间段

pd.date_range(start, end, freq) 生成一个时间段

freq参数由英文(M D H Min 。。。)、英文数字结合。D表示一天,M表示一月如20D表示20天,5M表示5个月。

#生成20171011-20171030
pd.date_range('20171011', '20171030',freq='5D')
DatetimeIndex(['2017-10-11', '2017-10-16', '2017-10-21', '2017-10-26'], dtype='datetime64[ns]', freq='5D')

3.2 根据起始向后生成时间段

pd.date_range(日期字符串, periods=5, freq='T') 生成一个时间段

periods :时间段长度,整数类型 

freq: 时间单位。月日时分秒。M D H ...

import pandas as pd

#20171231 12:50时间点开始,生成以月为间隔,长度为5的时间段

tm_rng = pd.date_range('20171231 12:50',periods=5,freq='M')

print(type(tm_rng))

print(tm_rng)
<class 'pandas.core.indexes.datetimes.DatetimeIndex'>

DatetimeIndex(['2017-12-31 12:50:00', '2018-01-31 12:50:00','2018-02-28 12:50:00', '2018-03-31 12:50:00', '2018-04-30 12:50:00'],dtype='datetime64[ns]', freq='M')

我们发现date_range()生成的是index,那么我们就可以索引为日期类型的dateframe

#生成一个Series,时间段为索引

tm_series = pd.Series(range(len(tm_rng)),index=tm_rng)

tm_series
2017-12-31 12:50:00    0 2018-01-31 12:50:00    1 2018-02-28 12:50:00    2 2018-03-31 12:50:00    3 2018-04-30 12:50:00    4 Freq: M, dtype: int64

3.3 根据给定时间点向前(向后)生成时间段

pd.bdate_range(end,periods,freq) 根据end时间点开始,以freq为单位,向前生成周期为period的时间序列

pd.bdate_range(start,periods,freq) 根据start时间点开始,以freq为单位,向后生成周期为period的时间序列

#向前5天

print(pd.bdate_range(end='20180101',periods=5,freq='D'))
DatetimeIndex(['2017-12-28', '2017-12-29', '2017-12-30', '2017-12-31','2018-01-01'],dtype='datetime64[ns]', freq='D')
#向后5天

print(pd.bdate_range(start='20180101',periods=5,freq='D'))
DatetimeIndex(['2018-01-01', '2018-01-02', '2018-01-03', '2018-01-04','2018-01-05'],dtype='datetime64[ns]', freq='D')

改变时间间隔

对dateframe或者series对象操作,更改对象中时间的时间间隔。 dateframe.asfreq(freq='时间间隔',method='填充方式',fill_value='对Nan值进行填充')


freq格式:M D H Min 。。。与数字结合。如20D表示20天,5M表示5个月。 method:有pad、backfill两种填充方式 fill_value:缺失值更改为fill_value的值。
#改变时间间隔,以20天为间隔

tm_series.asfreq('20D',method='pad')
2017-12-31 12:50:00    0 2018-01-20 12:50:00    0 2018-02-09 12:50:00    1 2018-03-01 12:50:00    2 2018-03-21 12:50:00    2 2018-04-10 12:50:00    3 2018-04-30 12:50:00    4 Freq: 20D, dtype: int64#改变时间间隔,以20天为间隔

tm_series.asfreq('20D',method='backfill')
2017-12-31 12:50:00    0 2018-01-20 12:50:00    1 2018-02-09 12:50:00    2 2018-03-01 12:50:00    3 2018-03-21 12:50:00    3 2018-04-10 12:50:00    4 2018-04-30 12:50:00    4 Freq: 20D, dtype: int64#改变时间间隔,以100小时为间隔

tm_series.asfreq('100H')
2017-12-31 12:50:00    0.0 2018-01-04 16:50:00    NaN 2018-01-08 20:50:00    NaN 2018-01-13 00:50:00    NaN ..... 2018-04-10 12:50:00    NaN 2018-04-14 16:50:00    NaN 2018-04-18 20:50:00    NaN 2018-04-23 00:50:00    NaN 2018-04-27 04:50:00    NaN Freq: 100H, dtype: float64#改变时间间隔,以100小时为间隔
tm_series.asfreq('100H',fill_value='缺失值')
2017-12-31 12:50:00      0 2018-01-04 16:50:00    缺失值 2018-01-08 20:50:00    缺失值 2018-01-13 00:50:00    缺失值 ..... 2018-04-14 16:50:00    缺失值 2018-04-18 20:50:00    缺失值 2018-04-23 00:50:00    缺失值 2018-04-27 04:50:00    缺失值 Freq: 100H, dtype: object

3.4 可以统一日期格式

data = pd.Series(['May 20, 2017','2017-07-12','20170930','2017/10/11','2017 12 11'])

pd.to_datetime(data)
0   2017-05-20 1   2017-07-12 2   2017-09-30 3   2017-10-11 4   2017-12-11 dtype: datetime64[ns]

3.5 提取指定日期的数据

如下tm_rng是以5小时时间间隔,生成了20个数据。我们只要2018-01-02的数据。对Series或Dataframe都可以使用日期字符串操作,选取指定时间范围的数据。

import pandas as pd
import numpy as np tm_rng = pd.date_range('2017-12-31 12:00:00',periods=20,freq='5H')

tm_series = pd.Series(np.random.randn(len(tm_rng)), index=tm_rng)

print(type(tm_series))

print(tm_series)
<class 'pandas.core.series.Series'>
2017-12-31 12:00:00    0.618465 2017-12-31 17:00:00   -0.963631 2017-12-31 22:00:00   -0.782348 ..... 2018-01-04 06:00:00   -0.681123 2018-01-04 11:00:00   -0.710626 Freq: 5H, dtype: float64
#我们只要tm_series中是2018-01-02的数据
tm_series['2018-01-02']
2018-01-02 04:00:00    0.293941 2018-01-02 09:00:00   -1.437363 2018-01-02 14:00:00   -0.527275 2018-01-02 19:00:00    1.140872 Freq: 5H, dtype: float64#我们要2018年的数据,结果全保留
tm_series['2018']
2018-01-01 03:00:00   -0.363019 2018-01-01 08:00:00    0.426922 2018-01-01 13:00:00   -1.118425 2018-01-01 18:00:00    0.956300 ..... 2018-01-03 20:00:00   -1.967839 2018-01-04 01:00:00   -0.654029 2018-01-04 06:00:00   -0.681123 2018-01-04 11:00:00   -0.710626 Freq: 5H, dtype: float64dft = pd.DataFrame(np.random.randn(len(tm_rng)), index=tm_rng)

print(type(dft))
print(dft)
<class 'pandas.core.frame.DataFrame'>                             2017-12-31 12:00:00  0.213331 2017-12-31 17:00:00  1.920131 2017-12-31 22:00:00 -1.608645 2018-01-01 03:00:00 -0.226439 2018-01-01 08:00:00 -0.558741 ..... 2018-01-03 20:00:00  0.866822 2018-01-04 01:00:00 -0.361902 2018-01-04 06:00:00  0.902717 2018-01-04 11:00:00 -0.431569#对dataframe中的时间操作,只要2018-01-04日的数据

print(type(dft['2018-01-04']))

print(dft['2018-01-04'])
<class 'pandas.core.frame.DataFrame'>                             2018-01-04 01:00:00 -0.361902 2018-01-04 06:00:00  0.902717 2018-01-04 11:00:00 -0.431569


数据采集

【视频教程】用python批量抓取简书用户信息

【视频讲解】Scrapy递归抓取简书用户信息

【视频讲解】在scrapy框架中如何使用selenium?

【实战视频】使用scrapy写爬虫-爬知乎live

美团商家信息采集神器

使用gevent实现高效异步请求

selenium驱动器配置详解

爬虫神器PyQuery的使用方法

pyquery爬取豆瓣读书

pyquery一些自定义的用法

【视频】猫途鹰网站评论数据抓取

简易SQLite3数据库学习

【视频教程】对视频进行基本操作

【视频】抓包小练习-B站评论数据抓取

【视频】爬取饿了么平台上的门店信息

如何抓取视频资源-以头条视频为例

当爬虫遭遇验证码,怎么办

【视频】手把手教你抓美女~

【视频】有了selenium,小白也可以自豪的说:“去TMD的抓包、cookie”

北邮人论坛爬虫实操:session代替cookies

【视频】快来get新技能--抓包+cookie,爬微博不再是梦

文本处理分析

gensim:用Word2Vec进行文本分析

RAKE:快速自动抽取关键词算法

对于中文,nltk能做哪些事情

如何对csv文件中的文本数据进行分析处理

复杂网络分析数据准备篇

文本分析之网络关系

用词云图解读“于欢案”

基于共现发现人物关系的python实现

用pyecharts制作词云图

留在网上的每个字,都在泄露你的身份

图片数据处理

OpenCV:快速入门图片人脸识别

好玩的OpenCV:图片操作的基本知识(1)

好玩的OpenCV:图像操作的基本知识(2)

OpenCV:计算图片有多色

如何对数据进行各种排序?

其他

迅雷不给力,我DIY了个下载器

【视频】初学者必看:python环境配置

开扒皮自己微信的秘密

初识装饰器函数

计算运行时间-装饰器实现

花十分钟,给爱机安装个MongoDB

chardet库:轻松识别文件的编码格式

使用Python登录QQ邮箱发送QQ邮件

8行代码实现微信聊天机器人

使用Python+OpenCV进行面部合成

优雅简洁的列表推导

为什么你要为2019,而不是2018做计划?


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存