Python 优化技巧-让你的代码运行速度提高10 倍

流形sbz 2023-11-17 发布于甘肃

展开全文

Python 是一种解释语言，这意味着它的运行速度可能不如C或C++等编译语言。但是，您可以利用某些技术和策略来优化 Python 代码并提高其性能。代码优化涉及使代码运行得更快、使用更少的资源并且执行更流畅，从而提高其性能和效率。

使用推导式和生成器

在 2.7 和 3.0 版本中，Python 除其他功能外还发布了以下功能：列表理解、字典理解和密切相关的集合理解。这些功能使得以更干净、简洁和更有效的方式生成列表、字典和集合变得更容易。使用传统的“循环和追加”方法创建一个函数并生成一个列表：

>>> def do_1 (): ... list_object = [] ... for i in range ( 100 ): ... list_object.append(i)

导入Python内置的timeit模块来查看这个函数运行了多长时间：

>>>导入timeit >>> t = timeit.Timer(setup= 'from __main__ import do_1' , stmt= 'do_1()' ) >>> print (t.timeit()) 9.681053700041957

上面的输出显示该函数运行大约需要9.68 秒。

现在，使用推导式生成此列表并查看需要多长时间：

>>> def  do (): ...     [i for i in  range ( 100 )] >>> t = timeit.Timer(setup= 'from __main__ import do' , stmt= 'do()' ) >>> t.timeit() 7.292758799972944

从上面的代码中可以看出，该函数的运行时间约为7.29秒，而前一个函数的运行时间为9.68秒（无法理解），相差2.39秒。除了理解更简洁、更容易阅读之外，它也更快。这使得它成为生成列表和循环的首选方法。

避免字符串连接

+=开发人员通常使用使用运算符来连接字符串来连接字符串。但是，在循环内，由于字符串的不可变性质，它可能会很慢。

相反，请使用str.join()有效串联的方法。

使用运算+=符连接字符串并查看其执行时间：

>>> def  do (): ...     obj = [ 'hello' , 'my' , 'name' , 'is' , 'Delight' , '!' ] ...     s = '' ...     for elem in obj: ...         s += elem >>> import timeit >>> t = timeit.Timer(setup= 'from __main__ import do' , stmt= 'do ()' ) >>> t.timeit() 0.9870554000372067

该函数（使用+=运算符实现字符串连接）大约需要0.98秒才能完成。

使用join()替代方法进行有效串联：

>>> def  do (): ...     s = [ 'hello' , 'my' , 'name' , 'is' , 'Delight' , '!' ] ...     '' .join(s) >>> import timeit >>> t = timeit.Timer(setup= 'from __main__ import do' , stmt= 'do()' ) >>> t.timeit() 0.38973289995919913

使用join()将函数的执行时间从0.98 秒减少到0.38 秒，这使其成为连接字符串的更快且更好的方法。

循环

在 Python 中，for 循环是一种控制结构，允许迭代一系列项目，例如列表中的元素、字符串中的字符或其他可迭代对象中的元素。for 循环对序列中的每一项重复执行代码块，从第一项迭代到最后一项。

然而，在大多数情况下，for 循环可以被更有效的函数（称为map(). 该map()函数是一个内置的高阶函数，允许将给定函数应用于可迭代对象（例如列表、元组或字符串）中的每个项目，并生成一个新的可迭代对象，其中包含将该函数应用于每个项目的结果物品。使用的主要优点map()是它提供了一种简洁有效的数据转换方法，而不需要显式循环。

比较实现for 循环和的函数的执行时间map()：

def  do ():     obj = [ 'hello' , 'my' , 'name' , 'is' , 'Delight' , '!' ]     new = []     for i in obj:         new.append(i.upper())

获取该函数的执行时间：

>>>导入timeit >>> t = timeit.Timer(setup= 'from __main__ import do' , stmt= 'do()' ) >>> t.timeit() 1.042804399970919

使用内置函数实现相同的函数map()并获取执行时间：

>>> def  square ( x ): ...     return x.upper() >>> def  do (): ...     obj = [ 'hello' , 'my' , 'name' , 'is' , 'Delight ”、“！” ] ...     map (square, obj) >>> import timeit >>> t = timeit.Timer(setup= 'from __main__ import do' , stmt= 'do()' ) >>> t.timeit() 0.37273399997502565

在上面的代码中，使用map()而不是for 循环使函数的运行速度提高了大约3 倍。

Python的内置函数使我们的代码运行得更快，主要是因为它们是用C语言编写和编译的。

选择正确的数据结构

选择正确的数据结构会对 Python 代码的速度和效率产生重大影响。不同的数据结构针对特定类型的操作进行了优化，选择合适的数据结构可以加快查找、插入、删除速度，并提高整体性能。

例如，使用集合进行成员资格测试比使用列表快得多：

>>> def  do (): ...     fruits_list = [ '苹果' , '香蕉' , '橙子' , '葡萄' , '梨' ] ...     '香蕉' 在fruits_list ...     '猕猴桃' 在fruits_list >>> import timeit >>> t = timeit.Timer(setup= 'from __main__ import do' , stmt= 'do()' ) >>> t.timeit() 0.48580530006438494 >>> def  do (): .. 。    Fruits_list = { '苹果', '香蕉' , '橙' , '葡萄' , '梨' } ...     '香蕉' 在fruits_list ...     '猕猴桃' 在fruits_list >>> import timeit >>> t = timeit.Timer(setup= '来自 __main__ import do' , stmt= 'do()' ) >>> t.timeit() 0.34570479998365045