查看原文
其他

reduce()函数和filter()函数闪亮登场

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:李婷婷,河南大学经济学院

本文编辑:任   哲

技术总编:张馨月

爬虫俱乐部云端课程

  爬虫俱乐部于2020年暑期在线上举办的Stata与Python编程技术训练营和Stata数据分析法律与制度专题训练营已经圆满结束啦~应广大学员需求,我们的课程现已在腾讯课堂全面上线,且继续提供答疑服务。现在关注公众号并在朋友圈转发推文《来腾讯课堂学Stata和Python啦》或《8月Stata数据分析法律与制度专场来啦!》,即可获得600元课程优惠券,集赞50个再领200元课程优惠券!(截图发至本公众号后台领取)原价2400元的课程,现在只要1600元!  

导读

  Python中有很多非常好用的函数,这些函数不仅简单实用,而且可以简化代码,提高我们的工作效率。在推文《优雅的map()》中,我们向大家介绍了map()函数的使用方法。今天给大家带来了另外两个相当实用的Python函数——reduce()函数和filter()函数。大家想对这两个函数有进一步了解的话,就请继续看下去吧!

一.reduce()

  reduce()函数是用函数对参数序列中的元素进行累积。
  reduce()函数的语法是:

reduce(function, sequence[, initializer])

  其中function是指函数,函数必须接受两个参数;sequence是参数序列;initializer是指初始参数。reduce()函数是用function先对sequence中的第1、2个元素进行操作,得到的结果与第3个元素再作为两个参数用function进行运算,以此类推,最终得到一个结果。
  在Python3中,如果想要使用reduce()函数,需要通过引入functools模块来调用。

from functools import reduce

  接下来就通过几个简单的小例子介绍一下reduce()函数的用法~

1.用reduce()函数进行求和

  在没有学习reduce()函数之前,如果想对数字进行求和,我们可能最先想到的方法就是循环。先来看一下怎样用循环对数字1-5进行求和,程序如下:

num=[1,2,3,4,5]a=0for n in num: a=a+nprint(a)

  运行结果如下:

  在我们了解了reduce()函数的用法之后,再使用reduce()函数实现求和的过程。程序如下:

def add(x,y): return x + yreduce(add, [1,2,3,4,5])

  运行结果如下:

  在上边的程序中,首先定义了一个add函数,之后使用reduce()函数进行操作,即先对前两个元素1和2进行求和,得到3,再用3和3进行求和,得到6,再用6和4进行求和,得到10······以此类推,最终得到15。

2.利用lambda函数和reduce()函数实现从1到100的累加

  lambda函数是一个匿名函数。在Python中,创建lambda函数的语法是:

lambda argument_list: expression

即lambda函数包括三个部分,分别为lambda参数列表表达式,表达式中出现的参数需要在argument_list中有定义。 

reduce(lambda x, y:sum([x+y]), range(1,101))

  运行结果如下:

在上边的例子中,x和y是传递给lambda函数的参数表达式部分将传递进去的参数按照函数表达式进行运算。上述程序就实现了1到100的累加,得到结果为5050。

3.使用reduce()函数对字符进行累积
strs=["P","y","t","h","o","n"]strs1 =reduce(lambda x, y:x+y,strs)strs1

  运行结果如下:

  上述程序使用reduce()函数和lambda函数实现了对strs里的元素进行累积,得到结果为“Python”。

二.filter()函数

  filter()函数是Python中常见的一个内置函数。filter()函数用于过滤掉序列中不符合条件的元素,返回由符合条件的元素组成的新序列。
  filter()函数的语法是:

filter(function or None, iterable)

  其中function是过滤函数,iterable为一个过滤序列或可迭代对象。filter()会将过滤函数依次作用于过滤序列的每一个元素,返回一个由符合过滤函数条件的元素所组成的可迭代对象,如果function传入None,则返回所有本身可以判断为True的元素。
  接下来通过简单的小例子来介绍一下filter()函数的用法。

1.过滤奇偶数

  如果不了解filter()函数的用法,应该怎样筛选奇偶数呢?我们一起来看一下。

num=range(1,11) is_even = [] def value(list): for i in list: if i%2 == 0: #偶数要满足的条件,余数等于0 is_even.append(i) #将满足条件的数字,附加到空列表中 return is_even even=value(num) print(even)

  运行结果如下图所示,筛选出了1-10中的偶数。

  但是在我们了解了filter()函数的用法之后,可以使用filter()函数更简便的筛选出奇偶数。

def is_even(n): #定义一个判断偶数的过滤函数 return n % 2 == 0even = list(filter(is_even, range(1,11)))even

  运行结果如下:

  在上边的程序中,首先定义了一个判断是否为偶数的过滤函数is_even(n);接下来,将range(1,11)中的数字依次传入到过滤函数中,将is_even(n)函数返回值为True的元素保留下来,然后通过list()函数列示出来。

  过滤奇数和过滤偶数的程序本质是一样的,代码与结果如下:

def is_odd(n): #定义一个判断奇数的过滤函数 return n % 2 != 0odd = list(filter(is_odd, range(1,11)))odd

  运行结果如下:

2.过滤出首字母为p的单词

import redef start_p(string): #定义过滤函数 return re.findall('^p',string)string = ['stata','python']fil = list(filter(start_p, string))fil

  运行结果如下:

  和上述过滤奇偶数的例子不一样的是,这里是事先通过正则表达式定义了一个过滤序列,通过filter()函数就可以筛选出首字母为p的单词。

  通过上边的介绍,大家是不是对这两个函数有了更加直观的理解了呢?快来动手试试吧~





对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!
往期推文推荐
“环环”入扣之foreach命令

统计年鉴数据整理小技巧

Seminar | 作为飞行员,我比别的CEO多了什么?

利用TensorFlow构建前馈神经网络

推文合集(1)| Stata学习者必看的n篇推文!

Seminar | 诚信的价值

利用tushare获取股票数据及实现可视化

从Excel到Stata的“摆渡车”——import excel命令

光阴十载,见证了《经济研究》中的“高被引”

利用tushare获取股票数据

         在Python中实现Stata的stack功能

这些年,经管类C刊都在研究什么?

Seminar | 眼见为实吗?高管面部可信度、审计师任期与审计费用

Seminar | 恐怖袭击与CEO薪酬

代码补全,主题更换,Jupyter Notebook原来可以这样用?

【爬虫实战】“双十一”微博热搜实时跟进

Stata中的数值型变量分类神器--recode

fs命令——我们的小帮手

【邀请函】听说你还在为处理表格头大?

用stack取代excel的数据重整操作吧

  日期数据处理

关于我们


微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存