Python基础教程:迭代和解析
Python中的迭代是指按照元素的顺序逐个调用的过程,迭代概念包括:迭代协议、可迭代对象和迭代器三个概念。
迭代协议是指有__next__()
函数的对象会前进到下一个结果,而到达系列的末尾时,则会引发StopIteration异常。为了支持迭代协议,Python内置了两个函数:iter()和next()函数。iter()从可迭代对象中获得一个迭代器,迭代器含有next()函数。next()函数的作用就是调用对象的__next__()
函数,从而递进进到下一项。
在Python中,任何支持迭代协议的对象都是可迭代的。如果对象是序列类型,或者在迭代工具中一次产生一个结果,那么就是可迭代的,这就以为着,序列(字符串、元组和列表)是可迭代对象。
迭代器是Python中实现迭代协议的对象,具体指的是iter()返回的,支持next()函数的对象。
Python中的迭代工具会自动调用iter()和next()函数以实现迭代,迭代工具主要有:for循环、列表解析、in成员关系测试以及map内置函数等。
一,手动迭代
列表不是自身的迭代器,对于这样的可迭代对象,可以调用iter()函数来启动迭代,调用next()函数递进到下一项:
>>> a=list(range(0,5))
>>> a is iter(a)
False
>>> a=iter(a)
>>> next(a)
0
像for循环等迭代工具,会自动调用iter()和next()函数,以实现序列的自动迭代:
>>> for i in range(0,5): print(i,end=' ')
0 1 2 3 4
二,生成器
生产器是一个延迟产生结果的工具,在需要的时候才产生结果,而不是立即产生结果。
1,生成器函数
Python提供了yield语句以实现生成器函数,以实现在需要的时候才产生结果,而不是立即产生结果。Python的生产器函数是指:编写为常规的def语句,但是使用yield语句,一次返回一个结果,在每个结果之间挂起和继续的状态。
生产器函数自动实现迭代协议,每次调用只返回一个值,下次调用时,会从其退出的地方继续执行。
生产器函数和常规函数的不同之处在于:生产器yield一个值,而不是return一个值。yield语句挂起该函数,并向调用者发送一个值,但是,保留足够的状态以使得函数能够从它离开的地方继续执行。当继续时,函数在上一个yield返回后继续执行。这使得生产器函数每次调用只返回一个值,穷尽调用会产生一系列的值。
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:531509025
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
>>> def seq_int(n):
for i in range(n):
yield i**2
>>> for i in seq_int(5):
print(i,end =' ')
0 1 4 9 16
生产器函数返回的对象就是迭代器,可以使用next()前进到下一项:
>>> func=seq_int(5)
>>> iter(func) is func
True
>>> next(func)
0
2,生产器表达式
另外一个实现生产器的对象是生产器表达式,从语法上讲,生成器表达式是在小括号中的表达式。从执行过程来讲,生产器表达式不在内存中构建结果,而是返回一个生成器对象,这个对象支持迭代协议。
>>> a=(x**2 for x in range(0,5))
>>> a is iter(a)
True
三,解析
解析分为列表解析,集合解析和字典解析。
- 列表解析的格式是:[ f(x) for x in seq ],对应的生成器表达式是:list( f(x) for x in seq )
- 集合解析的格式是:{ f(x) for x in seq },对应的生成器表达式是:set(f(x) for x in seq )
- 字典解析的格式是:{key:value for (key, value) in zip(keys,values)},对应的生成器表达式是:dict((x,f(x)) for x in items )
从语法上讲,列表解析是在中括号中的表达式;从执行过程来讲,列表解析对序列中的每一个元素执行一个操作;从执行的结果来讲,列表解析产生的一个新的列表对象。
由于列表解析产生的结果是一个列表对象,包含所有的序列项,不属于延迟产生结果的工具。
>>> a=[x**2 for x in range(0,5)]
>>> isinstance(a,list)
True
四,内置的迭代器函数
这一节,总结Python 3.0中内置的迭代器函数,除了range()函数之外,其余的函数都会产生迭代器对象,延迟产生结果。
1,range 迭代对象
range返回一个可迭代对象,该迭代对象根据需要产生范围中的数字,而不是在内存中构建一个列表。如果需要一个范围列表的话,必须使用list( range(…))来强制返回一个列表。
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:531509025
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
>>> r = range(0,5)
>>> iter(r) is r
False
>>> list(r)
[0, 1, 2, 3, 4]
>>> r=iter(r)
>>> next(r)
0
2,zip实现并行遍历
zip()函数用于合并序列,按照序列中元素的位置,把序列的元素组合成元组,元组项的数量就是zip合并的序列的个数。当序列的长度不同时,zip会以最短序列的长度为准来截断所得到的元组。
例如,zip把序列a和b合并为一个序列c,c的元素的元组(0,5),(1,6),(2,7),(3,8),(4,9)。
>>> a = range(0,5)
>>> b = range(5,10)
>>> c = zip(a,b)
>>> iter(c) is c
True
>>> next(c)
(0, 5)
>>> list(c)
[(1, 6), (2, 7), (3, 8), (4, 9)]
3,map对序列应用函数
map()函数对一个序列的各个元素应用函数,返回函数调用的结果序列。
>>> m=map(ord,'abcd')
>>> iter(m) is m
True
>>> list(m)
[97, 98, 99, 100]
4,产生偏移和元素
enumerate是Python内置的函数,作用于每一个序列项,获取每一个序列项偏移,并把偏移和序列项组合成元组(index, item)返回。原始序列的每个元素及其索引都能得到。
enumerate()函数返回一个迭代器对象,使用next()方法会返回下一个元素:
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:531509025
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
>>> t=enumerate('abcd')
>>> iter(t) is t
True
>>> list(t)
[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd')]
在for循环结构中,每次迭代,for循环都会自动调用next()函数以返回下一个元组(index,item):
>>> [c * i for (i,c) in enumerate('abcd')]
['', 'b', 'cc', 'ddd']
5,filter迭代器
filter()函数对一个序列的各个元素应用函数,返回结果为True的元素。
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:531509025
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
>>> f=filter(bool, ['a','','b',None])
>>> iter(f) is f
True
>>> list(f)
['a', 'b']
6,reduce() 函数
注意:reduce()函数并不是一个迭代器,它是functools模块中的一个工具函数。
reduce()用于对序列的元素依次应用函数,并把函数调用的结果作为参数传递给函数,最终返回函数调用的结果。
>>> from functools import reduce
>>> reduce((lambda x,y:x+y),range(0,5))
10
reduce()函数执行流程等价于下面的代码块:
x=list(range(0,5)]
res=x[0]
for i in x[1:] :
res+=i