列表生成式,就是一个能够生成列表的推导式,用[]括起来,里面是一个包含for循环的推导式,形式一般如下:
[x * x for x in range(1, 11) if x % 2 == 0]意思是从1-10遍历,选取偶数数字然后平方组成新的列表。
生成器,generator,两种写法,第一种把上面的列表生成式的中括号[]改成小括号(),如下:
g = (x * x for x in range(10))需要注意这样得到的不是一个列表也不是元组,也不是1-10每个数平方后的数据,而是一个生成器对象,它又么用呢?
使用列表生成式是一下子把所有元素都计算出来,比如说我们最终要100万个元素,列表生成式一下子计算就得到了100万个元素,但是就目前而言我只用到前10个后面的元素以后才可能用,那一下子计算出100万个又慢有占空间。
所以生成器就可以按需计算,即我们只需要告诉它计算推导的规则就行,想要得到下一个元素,我们就调用next()方法按照规则计算获取下一个元素,当然也可以用for循环获取前n个元素,所以它有一种惰性计算的性质。
比如上面代码中的生成器,可以使用next()方法不断获取下一个元素:
g = (x * x for x in range(10)) next(g) # 0 next(g) # 1 next(g) # 4也可以使用for循环:
g = (x * x for x in range(10)) for n in g: print(n) # 0 # 1 # 4 # 9 ... # 81第二种方式就是通过函数告诉它计算规则,但是函数毕竟是函数,怎么变成生成器呢,只要每次计算出数据用yield关键字返回就行了,比如计算斐波那契数量:
def fib(max): n, a, b = 0, 0, 1 while n < max: yield b # 计算出b并返回,下次执行从上次终止的地方开始而不是重新开始 a, b = b, a + b n = n + 1 return 'done'也是可以通过next()或者for循环去遍历,比如使用next()方法:
g = fib(6) # 创建一个生成6个斐波那契数的生成器 next(g) # 1 next(g) # 1 next(g) # 2 next(g) # 3 next(g) # 5 next(g) # 8 next(g) # Traceback (most recent call last): # File "<stdin>", line 1, in <module> # StopIteration发现每次执行next()方法,它是从上次停止的地方继续执行,而不会像函数一样从头开始,最后结束如果继续调用next()方法会返回StopIteration异常。
使用for循环同理:
for n in fib(6): print(n) # 1 # 1 # 2 # 3 # 5 # 8可以直接作用于for循环的数据类型有以下几种:
一类是集合数据类型,如list、tuple、dict、set、str等;
一类是generator,包括生成器和带yield的generator function。
凡是可作用于for循环的对象都是可迭代的,叫Iterable类型;
凡是可作用于next()函数的对象都是迭代器,叫Iterator类型,它们表示一个惰性计算的序列;
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
Python的Iterator对象也就是迭代器,表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。
Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。