종종 나는 쌍으로 목록을 처리해야 할 필요성을 발견했습니다. 나는 그것을 수행하는 비단뱀적이고 효율적인 방법이 무엇인지 궁금해했으며 Google에서 이것을 발견했습니다.
pairs = zip(t[::2], t[1::2])
나는 그것이 충분히 비단뱀 적이라고 생각했지만, 최근 관용어 대 효율성에 관한 토론을 한 후 몇 가지 테스트를하기로 결정했습니다.
import time
from itertools import islice, izip
def pairs_1(t):
return zip(t[::2], t[1::2])
def pairs_2(t):
return izip(t[::2], t[1::2])
def pairs_3(t):
return izip(islice(t,None,None,2), islice(t,1,None,2))
A = range(10000)
B = xrange(len(A))
def pairs_4(t):
# ignore value of t!
t = B
return izip(islice(t,None,None,2), islice(t,1,None,2))
for f in pairs_1, pairs_2, pairs_3, pairs_4:
# time the pairing
s = time.time()
for i in range(1000):
p = f(A)
t1 = time.time() - s
# time using the pairs
s = time.time()
for i in range(1000):
p = f(A)
for a, b in p:
pass
t2 = time.time() - s
print t1, t2, t2-t1
내 컴퓨터의 결과는 다음과 같습니다.
1.48668909073 2.63187503815 1.14518594742
0.105381965637 1.35109519958 1.24571323395
0.00257992744446 1.46182489395 1.45924496651
0.00251388549805 1.70076990128 1.69825601578
올바르게 해석하고 있다면 파이썬에서 목록, 목록 인덱싱 및 목록 분할을 구현하는 것이 매우 효율적이라는 것을 의미합니다. 편안함과 예상치 못한 결과입니다.
쌍으로 목록을 순회하는 또 다른 “더 나은”방법이 있습니까?
목록에 홀수 개의 요소가있는 경우 마지막 요소는 쌍에 포함되지 않습니다.
모든 요소가 포함되도록하는 올바른 방법은 무엇입니까?
테스트에 대한 답변에서 다음 두 가지 제안을 추가했습니다.
def pairwise(t):
it = iter(t)
return izip(it, it)
def chunkwise(t, size=2):
it = iter(t)
return izip(*[it]*size)
결과는 다음과 같습니다.
0.00159502029419 1.25745987892 1.25586485863
0.00222492218018 1.23795199394 1.23572707176
지금까지의 결과
가장 비단뱀적이고 매우 효율적입니다.
pairs = izip(t[::2], t[1::2])
가장 효율적이고 매우 비단뱀 적입니다.
pairs = izip(*[iter(t)]*2)
첫 번째 답변은 두 개의 반복자를 사용하고 두 번째 답변은 하나의 반복자를 사용한다는 것을 알아 차리는 데 잠시 시간이 걸렸습니다.
요소 수가 홀수 인 시퀀스를 처리하기 위해 None
이전 마지막 요소와 쌍을 이루는 하나의 요소 ( )를 추가하여 원래 시퀀스를 확장하는 것이 itertools.izip_longest()
좋습니다.
드디어
파이썬 3.x를, 즉 참고 zip()
로 동작 itertools.izip()
하고, itertools.izip()
사라 졌어요.
답변
내가 가장 좋아하는 방법 :
from itertools import izip
def pairwise(t):
it = iter(t)
return izip(it,it)
# for "pairs" of any length
def chunkwise(t, size=2):
it = iter(t)
return izip(*[it]*size)
모든 요소를 페어링하려면 분명히 fillvalue가 필요할 수 있습니다.
from itertools import izip_longest
def blockwise(t, size=2, fillvalue=None):
it = iter(t)
return izip_longest(*[it]*size, fillvalue=fillvalue)
답변
pairs = zip(t[::2], t[1::2])
가장 읽기 쉽기 때문에 초기 솔루션 이 가장 좋다고 말하고 싶습니다 (파이썬 3에서는 zip
자동으로 목록 대신 반복자를 반환합니다).
모든 요소가 포함되도록하려면 목록을 None
.
그런 다음 목록에 홀수 개의 요소가 있으면 마지막 쌍은입니다 (item, None)
.
>>> t = [1,2,3,4,5]
>>> t.append(None)
>>> zip(t[::2], t[1::2])
[(1, 2), (3, 4), (5, None)]
>>> t = [1,2,3,4,5,6]
>>> t.append(None)
>>> zip(t[::2], t[1::2])
[(1, 2), (3, 4), (5, 6)]
답변
작은 면책 조항으로 시작합니다. 아래 코드를 사용하지 마세요. 그것은 Pythonic이 아닙니다. 저는 단지 재미로 썼습니다. @ THC4k pairwise
함수 와 비슷 하지만 사용 iter
하고 닫 습니다 lambda
. itertools
모듈을 사용 하지 않으며 fillvalue
. 누군가 흥미로울 수 있기 때문에 여기에 넣었습니다.
pairwise = lambda t: iter((lambda f: lambda: (f(), f()))(iter(t).next), None)
답변
대부분의 파이썬이 진행 되는 한, 파이썬 소스 문서에 제공된 레시피 (일부는 @JochenRitzel이 제공 한 답변과 매우 유사 함)가 아마도 최선의 방법이라고 말하고 싶습니다.)
def grouper(iterable, n, fillvalue=None):
"Collect data into fixed-length chunks or blocks"
# grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx
args = [iter(iterable)] * n
return izip_longest(fillvalue=fillvalue, *args)
답변
쌍으로 목록을 순회하는 또 다른 “더 나은”방법이 있습니까?
확실히 말할 수는 없지만 의심 스럽습니다. 다른 순회에는 해석되어야하는 더 많은 Python 코드가 포함될 것입니다. zip ()과 같은 내장 함수는 훨씬 빠른 C로 작성됩니다.
모든 요소가 포함되도록하는 올바른 방법은 무엇입니까?
목록의 길이를 확인하고 홀수 ( len(list) & 1 == 1
)이면 목록을 복사하고 항목을 추가합니다.
답변
>>> my_list = [1,2,3,4,5,6,7,8,9,10]
>>> my_pairs = list()
>>> while(my_list):
... a = my_list.pop(0); b = my_list.pop(0)
... my_pairs.append((a,b))
...
>>> print(my_pairs)
[(1, 2), (3, 4), (5, 6), (7, 8), (9, 10)]
답변
단지 그것을하십시오 :
>>> l = [1, 2, 3, 4, 5, 6]
>>> [(x,y) for x,y in zip(l[:-1], l[1:])]
[(1, 2), (2, 3), (3, 4), (4, 5), (5, 6)]