查看原文
其他

像对象一样对待数据

Crossin先生 Crossin的编程教室 2024-03-28

入门教程、案例源码、学习资料、读者群

请访问: python666.cn


大家好,欢迎来到 Crossin的编程教室 !

咱们编程教室有不少同学,学完了基础课程,掌握了一定的编程能力,开始做项目了。然后很可能遇到一个问题:管理数据。课程里有讲过用文件保存数据,还有 picklecsv 等模块辅助。但对于稍微复杂一点的数据,往往不够方便。成熟的解决方案就是使用数据库

估计每个刚刚使用数据库的人都会被坑得遍体鳞伤。对于一个刚刚学会 Python 不久的开发新手来说,使用数据库的 SQL 语句几乎相当于再学一种新的语言。虽然 sqlitepymysql 等模块提供了与数据的连接,但仍然需要自己去拼接 SQL 语句。Python 语法和 SQL 语法、各种引号、百分号、转义字符混杂在一起的酸爽,用过的人都忘不了。

所以实际开发中,如无特殊需求,一般不会直接写 SQL,而是用更为方便的 ORM(对象关系映射,Object Relational Mapping)。顾名思义,就是将关系型数据库与 Python 中的对象关联起来,提供了一种操作数据的简便方式,相当于对数据库加了一层更友好的接口。

目前 Python 中比较流行的 ORM 解决方案有三种:

  1. Django ORM。使用方便,但很难脱离 Django 单独使用。

  2. SQLAlchemy。功能强大,成熟可扩展,但学习门槛较高。

  3. peewee。轻量,可扩展,易学习,但功能有限。

对于偏初级的小型项目,通常用不到很复杂的功能,这时候 peewee 或许是最好的选择。今天我们就来重点介绍下 peewee 这个 Python ORM 库。

> 安装

pip install peewee

> 连接数据库

以 SQLite 为例:

import peewee
db = peewee.SqliteDatabase('people.db')
db.connect()

people.db 是 SQLite 的数据库文件,如果不存在会自己新建。

如果是 MySQL,要稍微复杂点,需再提供地址、用户名、密码等信息,并且必须先手动建好库:

db = peewee.MySQLDatabase('people', host='127.0.0.1', user='root', passwd='', charset='utf8', port=3306)

特别要记住的一点是,代码进行完所有数据库操作后,要主动关闭数据库:

db.close()

> 创建数据类型

既然是与对象关联,自然需要以面向对象的方式定义数据结构。我们假定一个表示人的类型 Person,包含姓名 name 和生日 birthday 两个字段:

class Person(peewee.Model):
   class Meta:
       database = db
   name = peewee.CharField()
   birthday = peewee.DateField()

Person.create_table()

如果是用过 Django 的同学,对这个 Model 应该非常熟悉了。要注意的就是,需要在 Meta 里定义 database 为前面创建的数据库。然后使用相应的 Field 类型定义字段即可。

> 新增数据对象

from datetime import date
# 方法1
uncle_bob = Person(name='Bob', birthday=date(1960, 1, 15))
uncle_bob.save()
# 方法2
Person.create(name='Crossin', birthday=date(1985, 5, 5))

直接创建数据对象,需要调用 save 方法保存到数据库中。而使用 create 方法创建则不用。

> 查找数据对象

bob = Person.get(Person.name == 'Bob')
print(bob.name, bob.birthday)
# 获取所有数据
for person in Person.select():
   print(person.name)

注意这里的查找条件写法,这与 Django 是不同的。查找还可以用 where 语句,这里不做演示,可以参考官方文档。

> 修改数据对象

对于上一步找到的 bob 变量:

bob.name = 'Robert'
bob.save()

直接向属性赋值,修改完记得要 save

> 删除数据对象

bob.delete_instance()

顺便说句,一般不建议在数据库里删除数据,因为数据删了就不好找回来了,而且可能还会引发关联数据的报错。通常是增加一个 is_deleted 字段标记已删除的内容。(所以,不要以为在网上把发布过的内容删掉就真的不存在了)

> 创建关联数据

在程序中,经常会有一些具有关联关系的数据。比如我们再创建一个宠物类 Pet,每个宠物有名字 name 和主人 owner。owner 对应的就是我们前面创建的 Person 类:

class Pet(peewee.Model):
   class Meta:
       database = db
   owner = peewee.ForeignKeyField(Person, backref='pets')
   name = peewee.CharField()

这样一来,我们就可以很方便的通过宠物找到它的主人:

bob_kitty = Pet.create(owner=bob, name='Kitty')
bob_fido = Pet.create(owner=bob, name='Fido')
print(bob_kitty.owner.name)

也可以找到一个人养的所有宠物:

for pet in bob.pets:
   print(pet.name)

以上就是 peewee 的基本操作,如果你了解面向对象,应该不难理解。这些例子取自其官方文档的快速上手 Quickstart。虽然没有像 Requests 那样贴心地提供中文版,但也同样足够人性化。

地址:http://docs.peewee-orm.com/en/latest/peewee/quickstart.html

> 自动生成代码

peewee 提供了一个功能,可以从已有的数据库反向生成数据模型代码。以 SQLite 为例:

python -m pwiz -e sqlite people.db > db.py

在你的数据库文件所在路径下执行这条命令,就可以在 db.py 中自动生成代码。

自动生成的代码

在我们先前的案例中,有一些就使用了 peewee。比如 Python 高频词汇表(关键字:单词)和押韵检索工具(关键字:押韵)。在本公众号(Crossin的编程教室)里回复相应关键字可查看文章及代码。

最后提一下,除了使用 ORM 外,对于数据存储还有一种解决方案,就是使用非关系型数据库,比如 mongodb。尽管坑也不少,但对于简单的数据存储来说,它有个巨大的优势就是同 Python 内置的 dict、list 等类型兼容良好,可以直接存取,让你甚至感觉不到有数据库的存在,也根本无需关心 SQL 语句。爬虫实战课程中的部分案例,就选择了 mongodb 作为数据存储方案。



Crossin的第2本书码上行动:利用Python与ChatGPT高效搞定Excel数据分析已经上市了

点此查看上一本《码上行动:零基础学会Python编程》介绍

本书从 Python 和 Excel 结合使用的角度讲解处理分析数据的思路、方法与实战应用。不论是希望从事数据分析岗位的学习者,还是其他职业的办公人员,都可以通过本书的学习掌握 Python 分析数据的技能。书中创新性地将 ChatGPT 引入到教学当中,用 ChatGPT 答疑并提供实训代码,并介绍了使用 ChatGPT 辅助学习的一些实用技巧,给学习者带来全新的学习方式。


公众号的读者朋友们购买后可在后台联系我,加入读者交流群,Crossin会为你开启陪读模式,解答你在阅读本书时的一切疑问。


感谢转发点赞的各位~

_往期文章推荐_

字符串里如何换行?




如需了解付费精品课程教学答疑服务
请在Crossin的编程教室内回复: 666

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存