查看原文
其他

一日一技:实现函数调用结果的 LRU 缓存

kingname 未闻Code 2022-07-06

摄影:产品经理

在工程项目中,可能有一些函数调用耗时很长,但是又需要反复多次调用,并且每次调用时,相同的参数得到的结果都是相同的。在这种情况下,我们可能会使用变量或者列表来存放,例如:

  1. resp_1 = get_resp(param=1)

  2. resp_2 = get_resp(param=2)

  3. resp_3 = get_resp(param=3)

但是,如果返回的结果占用内存比较大,我们每次调用都把结果存在内存里面,就会消耗大量内存。

于是,我们可以使用 LRU 算法:最近最常使用的参数生成的结果,我们存下来,下次遇到相同的参数时直接返回结果。而不常出现的参数,等到需要的时候再计算。计算完成后,也先存下来。但是如果缓存空间不够了,不常使用的会先删除。

LRU 的算法自己手动实现起来比较麻烦,但好在 Python 的 functions模块已经提供了现成的 lru_cache装饰器供我们使用。

首先我们写一个不带 lru 算法的程序:

  1. import time

  2. import datetime



  3. def say(name):

  4. print(f'你好:{name}')

  5. now = datetime.datetime.now()

  6. return now


  7. now = say('kingname')

  8. print(f'现在时间为:{now}')

  9. time.sleep(10)

  10. now = say('产品经理')

  11. print(f'现在时间为:{now}')

  12. time.sleep(10)

  13. now = say('kingname')

  14. print(f'现在时间为:{now}')

运行效果如下图所示:

从运行结果可以看到,调用函数三次,第一次和第三次传入的参数都是 kingname,第二次传入的参数为 产品经理你好:kingname打印了两次, 你会:产品经理打印了一次。第二次打印的时间比第一次多了10秒,第三次打印的时间比第二次多了10秒。

现在我们把 LRU 缓存加上。

  1. import time

  2. import datetime

  3. from functools import lru_cache


  4. @lru_cache(maxsize=32)

  5. def say(name):

  6. print(f'你好:{name}')

  7. now = datetime.datetime.now()

  8. return now


  9. now = say('kingname')

  10. print(f'现在时间为:{now}')

  11. time.sleep(10)

  12. now = say('产品经理')

  13. print(f'现在时间为:{now}')

  14. time.sleep(10)

  15. now = say('kingname')

  16. print(f'现在时间为:{now}')

从打印出来的结果可以看出,第三次调用 say函数的时候,传入的也是 kingname,但是函数根本没有运行,所以没有打印第二个 你好:kingname。并且第三个时间与第一个时间完全相同。说明第三次调用函数的时候,直接读取的缓存。

lru_cache(maxsize=128,typed=False)接收两个参数,第一个参数 maxsize表示最多缓存多少个结果,这个数字建议设置为2的幂。超出这个结果就会启用 LRU 算法删除不常用的数据。第二个参数 typed表示是否检查参数类型,默认为 False,如果设置为 True,那么参数 33.0会被当做不同的数据处理。

由于 lru_cache底层是基于字典来实现的缓存,所以参数都必须是 hashable 的,否则会导致报错。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存