Skip to content

生成器

引入

Python中,使用生成器可以很方便的支持迭代器协议。生成器通过生成器函数产生,生成器函数可以通过常规的def语句来定义,但是不用return返回,而是用yield一次返回一个结果,在每个结果之间挂起和继续它们的状态,来自动实现迭代协议。

也就是说,yield是一个语法糖,内部实现支持了迭代器协议,同时yield内部是一个状态机,维护着挂起和继续的状态。

python
def my_range(n):
    i = 0
    while i < n:
        yield i
        i += 1
        
my_range = my_range(3)
print(my_range)
print(next(my_range))
# print([i for i in my_range])

在这个例子中,定义了一个生成器函数,函数返回一个生成器对象,然后就可以通过for语句进行迭代访问了。

其实,生成器函数返回生成器的迭代器。 "生成器的迭代器"这个术语通常被称作"生成器"。要注意的是生成器就是一类特殊的迭代器。作为一个迭代器,生成器必须要定义一些方法,其中一个就是__next__()。如同迭代器一样,我们可以使用__next__()函数来获取下一个值。

生成器工作流程

下面就仔细看看生成器是怎么工作的。从上面的例子也可以看到,生成器函数跟普通的函数是有很大差别的。结合上面的例子我们加入一些打印信息,进一步看看生成器的执行流程:

python
def my_range(n):
    print('开始迭代...')
    i = 0
    while i < n:
        print('迭代中...')
        yield i
        i += 1
        print('迭代结束...')


my_range = my_range(3)
# print(my_range)
print(next(my_range))
print(next(my_range))
print(next(my_range))

通过结果可以看到:

  1. 当调用生成器函数的时候,函数只是返回了一个生成器对象,并没有执行。

  2. next()方法第一次被调用的时候,生成器函数才开始执行,执行到yield语句处停止: next()方法的返回值就是yield语句处的参数yielded value

  3. 当继续调用next()方法的时候,函数将接着上一次停止的yield语句处继续执行,并到下一个yield处停止;如果后面没有yield就抛出StopIteration异常

生成器表达式

在开始介绍生成器表达式之前,先看看我们比较熟悉的列表解析[List comprehensions],列表解析一般都是下面的形式。

python
[expr for iter_var in iterable if cond_expr]

迭代iterable里所有内容,每一次迭代后,把iterable里满足cond_expr条件的内容放到iter_var中,再在表达式expr中获取iter_var的内容,最后用表达式的计算值生成一个列表。

例如,生成一个list包含50以内的所有奇数:

python
[i for i in range(50) if i % 2]

生成器表达式是在python2.4中引入的,当序列过长, 而每次只需要获取一个元素时,应当考虑使用生成器表达式而不是列表解析。生成器表达式的语法和列表解析一样,只不过生成器表达式是被()括起来的,而不是[],如下:

python
(expr for iter_var in iterable if cond_expr)

生成器表达式并不是创建一个列表, 而是返回一个生成器,这个生成器在每次计算出一个条目后,把这个条目"产生"(yield)出来。 生成器表达式使用了"惰性计算"(lazy evaluation),只有在检索时才被赋值(evaluated),所以在列表比较长的情况下使用生成器会在内存上更有效。

python
gen = (i for i in range(10000) if i % 2)

print("__iter__" in dir(gen))
print("__next__" in dir(gen))
# 使用sum求和之后会导致再次迭代所获取的值为空
print(sum(gen))
print([i for i in gen])
生成器中的send()close()方法

生成器中还有两个很重要的方法:send()close()

  • send(value):

    从前面了解到,next()方法可以恢复生成器状态并继续执行,其实send()是除next()外另一个恢复生成器的方法。

    Python 2.5中,yield语句变成了yield表达式,也就是说yield可以有一个值,而这个值就是send()方法的参数,所以send(None)next()是等效的。同样,next()send()的返回值都是yield语句处的参数(yielded value)

    关于send()方法需要注意的是:调用send传入非None值前,生成器必须处于挂起状态,否则将抛出异常。也就是说,第一次调用时,要使用next()语句或send(None),因为没有yield语句来接收这个值。

  • close():

    这个方法用于关闭生成器,对关闭的生成器后再次调用nextsend将抛出StopIteration异常。

python
def my_range(n):
    i = 0
    while i < n:
        val = yield i
        print('val is: ', val)
        i += 1


my_range = my_range(5)

print(my_range.__next__())
print(my_range.__next__())
print(my_range.send('hello'))
my_range.close()
print(my_range.send('world'))

总结:

  • 生成器是一种特殊的迭代器,内部支持了生成器协议,不需要明确定义__iter__()__next__()方法。
  • 生成器通过生成器函数产生,生成器函数可以通过常规的def语句来定义,但是不用return返回,而是用yield一次返回一个结果。

Sube's Study Notes.