Python性能提升大杀器：深入解析functools.lru_cache装饰器

站长

2023年11月22日 11:56 · 阅读数 96

更多学习内容：ipengtao.com

Python的标准库中有许多强大的工具和装饰器，用于提高程序性能和减少计算时间。functools.lru_cache装饰器就是其中之一。它可以用来缓存函数的输出，以避免重复计算，从而显著提高程序的执行速度。

本文将详细介绍functools.lru_cache装饰器的原理、用法以及适当的场景，以帮助你更好地利用这一功能。

1. 引言

为什么需要缓存？

在编写程序时，经常会遇到需要计算某个函数的输出，然后在稍后的代码中多次使用该输出的情况。如果每次需要计算时都重新运行函数，将浪费大量的计算时间。这时，缓存就能派上用场。缓存可以将函数的输出存储在内存中，以便以后可以直接获取，而无需重新计算。这可以显著提高程序的性能，特别是在处理计算密集型任务时。

2. `functools.lru_cache` 简介

什么是LRU缓存？

LRU（最近最少使用）缓存是一种常见的缓存策略，它保留最近使用的项，而丢弃最不常使用的项。functools.lru_cache装饰器是Python标准库中的一种缓存工具，它使用LRU策略来存储函数的输出结果。这意味着最近使用的函数调用结果将被保留在缓存中，而较长时间未被使用的结果将被清除，以释放内存。

3. `lru_cache`的基本用法

装饰一个函数

使用functools.lru_cache非常简单。只需在要缓存的函数上添加装饰器即可。

例如：

from functools import lru_cache

@lru_cache()
def expensive_function(arg):
    # 计算复杂的结果
    return result

这将自动为expensive_function函数添加缓存功能，以避免重复计算相同输入值的结果。

缓存大小限制

设置缓存的大小限制，以控制缓存的大小。

例如，要将缓存大小限制为1000个条目：

@lru_cache(maxsize=1000)
def expensive_function(arg):
    # 计算复杂的结果
    return result

当缓存达到最大大小时，最不常使用的结果将被清除以腾出空间。

清除缓存

如果需要手动清除缓存，可以使用clear方法：

expensive_function.cache_clear()

4. 高级用法和选项

`typed` 参数

默认情况下，lru_cache会将不同类型的参数视为相同的参数。如果希望根据参数的类型进行缓存，可以使用typed=True：

@lru_cache(typed=True)
def function_with_typed_cache(arg):
    # 根据参数类型进行缓存
    return result

自定义`key`函数

默认情况下，lru_cache使用参数的值作为缓存键。但可以为参数定义自定义缓存键的函数：

def custom_key_function(arg):
    return arg.key

@lru_cache(key=custom_key_function)
def function_with_custom_key(arg):
    # 使用自定义键进行缓存
    return result

缓存的元数据

lru_cache对象还具有一些有用的元数据，如hits（缓存命中次数）和misses（缓存未命中次数）：

result = expensive_function(arg)
print(expensive_function.cache_info())
# 输出缓存信息，包括命中次数和未命中次数

5. 性能和注意事项

缓存的命中率

在使用lru_cache时，要注意缓存的命中率。

如果缓存的命中率很低，大部分时间都在计算未命中的结果，那么缓存可能不会显著提高性能。

使用`lru_cache`的最佳实践

仅对需要频繁计算的函数使用缓存。
调整缓存的大小以适应内存限制。
谨慎使用typed参数和自定义key函数，确保它们符合需求。

6. 示例：使用`lru_cache`优化斐波那契数列计算

一个实际示例，演示如何使用lru_cache来优化斐波那契数列的计算：

from functools import lru_cache

@lru_cache(maxsize=None)  # 不限制缓存大小
def fibonacci(n):
    if n <= 1:
        return n
    else:
        return fibonacci(n - 1) + fibonacci(n - 2)

result = fibonacci(50)  # 非常快速

使用缓存，计算斐波那契数列的值变得非常迅速，即使是大数值。

7. 适用场景

何时使用`lru_cache`

当有昂贵的函数计算，并且希望避免重复计算时。
当需要快速访问最近使用的函数结果。

何时不使用`lru_cache`

当函数的结果占用大量内存，导致内存不足时。
当函数的参数具有大量可能的取值，缓存命中率很低。

8. 总结

functools.lru_cache装饰器是Python中一个强大的工具，可用于缓存函数的输出结果，以提高程序性能。通过使用LRU缓存策略，它能够有效管理缓存大小，确保最常使用的结果得以保留。

在实际应用中，lru_cache可以用于加速各种类型的计算，尤其是递归函数或需要频繁计算的函数。然而，要谨慎使用缓存大小、typed参数和自定义key函数，以确保它们与需求相符。

Python学习路线

更多学习内容：ipengtao.com

Python性能提升大杀器：深入解析functools.lru_cache装饰器

转载自:https://juejin.cn/post/7303804980342472741

Python性能提升大杀器：深入解析functools.lru_cache装饰器

1. 引言

为什么需要缓存？

2. functools.lru_cache 简介

什么是LRU缓存？

3. lru_cache的基本用法

装饰一个函数

缓存大小限制

清除缓存

4. 高级用法和选项

typed 参数

自定义key函数

缓存的元数据

5. 性能和注意事项

缓存的命中率

使用lru_cache的最佳实践

6. 示例：使用lru_cache优化斐波那契数列计算

7. 适用场景

何时使用lru_cache

何时不使用lru_cache

8. 总结

Python学习路线

2. `functools.lru_cache` 简介

3. `lru_cache`的基本用法

`typed` 参数

自定义`key`函数

使用`lru_cache`的最佳实践

6. 示例：使用`lru_cache`优化斐波那契数列计算

何时使用`lru_cache`

何时不使用`lru_cache`