查看原文
其他

Python自动化读取邮件基础代码讲解

陈熹、刘早起 早起Python 2022-07-20

大家好,在之前的文章中我们已经了解如何对自己的邮箱做一些代码操作前的基础配置,也学会了通过 yagmail 发送邮件。这篇文章将分别介绍两个很实用的收取及读取邮件的库imboxpoplib,主要将讲解:

  1. imbox 收取邮件
  2. poplib 收取邮件
  3. keyring 存储密码

之前的文章中我们也提到了,基础配置需要打开 POP3/SMTP/IMAP,针对不同邮箱有不同的操作,并以网易 163 邮箱和 QQ 邮箱 举例说明,如果你不熟悉,可以查看Python发送邮件基础代码讲解

确定配置好了之后就可以继续阅读今天的文章!

一、poplib库

poplib 模块提供了 poplib.POP3poplib.POP3_SSL 两个类,分别用于连接普通的 POP 服务器和基于 SSL 的 POP 服务器。连接到服务器后,按照 POP3 协议与服务器交互。

注意:虽然 POP3 得到了广泛支持,但已过时。POP3 服务器的实现质量差异很大,而且太多的服务器都很差。后面会介绍基于 IMAP 服务器的 imbox

下面以 QQ 邮箱为例示范如何完整 poplib 库的使用

1、创建连接

使用poplib.POP3_SSL创建连接

import poplib
import email.parser, email.policy
conn = poplib.POP3_SSL('pop.qq.com'995

2、登录服务器

注意输入的是邮箱授权码而不是真实 QQ 密码

conn.user('xxxx@qq.com')   
conn.pass_('xxxx'# 注意输入的是邮箱授权码而不是真实 QQ 密码

3、获取邮件列表

response, maillist, r = conn.list()
print('响应:', response)
print('邮件列表:', maillist) 

4、遍历邮件

multipart 代表邮件内容的容器,无需处理

msg = email.parser.BytesParser(policy=email.policy.default).parsebytes(data)
for part in msg.walk():
    # multipart 代表邮件内容的容器,无需处理
    if part.get_content_type().split("/"1)[0] == 'multipart':
        continue
    elif part.get_content_type().split("/"1)[0] == 'text':
        print(part.get_content())
    else:    
        filename = part.get_filename()   
        print(filename)
        with open(filename, 'wb'as f:
            f.write(part.get_payload(decode=True))

多级判断的目的主要是跳过容器、输出正文、下载附件的本地

5、退出服务器

conn.quit()  

常用的代码中有部分稍微繁琐,但整体还是比较好理解的

二 、imbox库

在正式介绍 imbox 库之前,再分享一个技巧。从上面 poplib 的代码中也可以看到,当输入密码(授权码)的时候是在代码中明文显示,这就带来了风险:

假如你不小心把这个代码没有处理就发给别人,或者上传的 github,那么所有拿到这段代码的人都可以对你的邮箱大肆操作,这是很可怕的事情

这里读取邮件用的模块 imbox 也和 poplib 一样需要密码这个参数,但不希望在代码中明文呈现密码,怎么办?

解决办法是利用 keyring 库,通过系统密钥环将密码(授权码),预先在本地存储好,后面在代码中调用 keyring 库的方法,通过账号把密码取出来作为变量就可以。

这样即使别人拿到了全部代码,但他的本地中没有预先配置好密码,就不会有泄露信息的风险了。具体使用方法为,首先打开命令行输入:

import keyring
keyring.set_password("qqmail""username""password")

这样 password 在本地存储好了,后面只需要 keyring.get_password 获取作为变量即可:

import keyring
password = keyring.get_password('qqmail''username')

imbox 读取邮件的代码如下:

import keyring 
from imbox import Imbox
password = keyring.get_password('qqmail''username')

with Imbox('imap.qq.com''xxx@qq.com', password, ssl=Trueas imbox: 
    # 获取全部邮件
    all_inbox_messages = imbox.messages() 
    for uid, message in all_inbox_messages: 
        print(message.subject)  # 邮件主题
        print(message.body['plain']) # 邮件文本格式正文

Imbox('imap.qq.com', 'xxx@qq.com', password, ssl=True) 这行代码中需要填写服务器、用户名邮箱、密码、SSL加密循环体中 uid 参数是每封邮件的编号,邮件编号十分重要,可以用于邮件的标记和删除。除了邮件主题及文本格式正文外,我们主要常用获取以下内容:

除了获取全部邮件用 all_inbox_messages = imbox.messages() 外,我们常常会有选择性获取已读、未读和红旗标记邮件:

unread_inbox_messages = imbox.messages(unread=True# 未读邮件
read_inbox_messages = imbox.messages(unread=False# 已读邮件
flagged_inbox_messages = imbox.messages(flagged=True# 红旗标记邮件

也可以通过邮件的收件时间获取邮件:

inbox_message_before = imbox.messages(date__lt=datetime.date(2021118)) 
inbox_message_after = imbox.messages(date__gt=datetime.date(2021118)) 
inbox_message_on_date = imbox.messages(date__on=datetime.date(2021118))

那么如何筛选指定发件人发送的邮件呢?答案就在于对 message.sent_from 的理解了。message.sent_from 是一个字典元组,在遍历的过程中只需要简单通过 message.sent_from[0]['email'] 就能够将发件人邮箱提取出来,接着做判断就能够达到目的:

with Imbox('imap.qq.com''xxx@qq.com', password, ssl=Trueas imbox: 
all_inbox_messages = imbox.messages() 
for uid, message in all_inbox_messages: 
    print(message.subject) 
    print(message.sent_from) 
    print(message.body['plain']) 
    # 把邮箱提取出来 
    email = message.sent_from[0]['email'
    if email == 某个特定的邮箱: 
        pass

上文还提到了邮件编号 uid 的重要性。基于编号的两个重要方法:

  1. 标记已读 imbox.mark_seen(uid)
  2. 删除邮件 imbox.delete(uid)

使用以删除邮件为例:

for uid, message in all_inbox_messages: 
    if 满足某种条件的邮件: 
        imbox.delete(uid)

以上就是基于 POP3 的 poplib 和基于 IMAP 的 imbox 针对收取邮件的常用操作!之后我们将更新更多基于邮件的自动化办公系列文章!

-END-




扫码添加早小起

1. 回复「进群」进入Python技术交流群

2. 回复「Python」获得Python技术图书

3. 回复「习题」领取Python数据处理200题




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存