때때로 행 또는 열 벡터를 행렬에 “복제”하는 것이 유용합니다. 복제함으로써 나는 다음과 같은 행 벡터를 변환하는 것을 의미합니다.
[1,2,3]
행렬로
[[1,2,3]
[1,2,3]
[1,2,3]
]
또는 다음과 같은 열 벡터
[1
2
3
]
으로
[[1,1,1]
[2,2,2]
[3,3,3]
]
matlab 또는 옥타브에서 이것은 매우 쉽게 수행됩니다.
x = [1,2,3]
a = ones(3,1) * x
a =
1 2 3
1 2 3
1 2 3
b = (x') * ones(1,3)
b =
1 1 1
2 2 2
3 3 3
나는 이것을 numpy로 반복하고 싶지만 실패했습니다.
In [14]: x = array([1,2,3])
In [14]: ones((3,1)) * x
Out[14]:
array([[ 1., 2., 3.],
[ 1., 2., 3.],
[ 1., 2., 3.]])
# so far so good
In [16]: x.transpose() * ones((1,3))
Out[16]: array([[ 1., 2., 3.]])
# DAMN
# I end up with
In [17]: (ones((3,1)) * x).transpose()
Out[17]:
array([[ 1., 1., 1.],
[ 2., 2., 2.],
[ 3., 3., 3.]])
첫 번째 방법 ( In [16]
)이 작동 하지 않은 이유는 무엇 입니까? 파이썬 에서이 작업을보다 우아한 방법으로 달성 할 수있는 방법이 있습니까?
답변
우아하고 파이썬적인 방법은 다음과 같습니다.
>>> array([[1,2,3],]*3)
array([[1, 2, 3],
[1, 2, 3],
[1, 2, 3]])
>>> array([[1,2,3],]*3).transpose()
array([[1, 1, 1],
[2, 2, 2],
[3, 3, 3]])
문제 [16]
는 조옮김이 배열에 영향을 미치지 않는다는 것 같습니다. 아마도 대신 행렬을 원할 것입니다.
>>> x = array([1,2,3])
>>> x
array([1, 2, 3])
>>> x.transpose()
array([1, 2, 3])
>>> matrix([1,2,3])
matrix([[1, 2, 3]])
>>> matrix([1,2,3]).transpose()
matrix([[1],
[2],
[3]])
답변
사용 numpy.tile
:
>>> tile(array([1,2,3]), (3, 1))
array([[1, 2, 3],
[1, 2, 3],
[1, 2, 3]])
또는 반복되는 열의 경우 :
>>> tile(array([[1,2,3]]).transpose(), (1, 3))
array([[1, 1, 1],
[2, 2, 2],
[3, 3, 3]])
답변
먼저 numpy의 브로드 캐스트 작업에서는 일반적으로 행과 열을 복제 할 필요가 없습니다. 참조 이 와 이 에 대한 설명.
그러나 이렇게하려면 반복 과 새로운 축 이 가장 좋은 방법 일 것입니다.
In [12]: x = array([1,2,3])
In [13]: repeat(x[:,newaxis], 3, 1)
Out[13]:
array([[1, 1, 1],
[2, 2, 2],
[3, 3, 3]])
In [14]: repeat(x[newaxis,:], 3, 0)
Out[14]:
array([[1, 2, 3],
[1, 2, 3],
[1, 2, 3]])
이 예제는 행 벡터에 대한 것이지만 이것을 열 벡터에 적용하는 것은 분명합니다. 반복은이 철자를 잘 쓰는 것처럼 보이지만 예제와 같이 곱셈을 통해 할 수도 있습니다.
In [15]: x = array([[1, 2, 3]]) # note the double brackets
In [16]: (ones((3,1))*x).transpose()
Out[16]:
array([[ 1., 1., 1.],
[ 2., 2., 2.],
[ 3., 3., 3.]])
답변
허락하다:
>>> n = 1000
>>> x = np.arange(n)
>>> reps = 10000
제로 비용 할당
보기는 추가 메모리를하지 않습니다. 따라서 이러한 선언은 즉각적입니다.
# New axis
x[np.newaxis, ...]
# Broadcast to specific shape
np.broadcast_to(x, (reps, n))
강제 할당
내용을 메모리에 강제로 저장하려면 다음을 수행하십시오.
>>> %timeit np.array(np.broadcast_to(x, (reps, n)))
10.2 ms ± 62.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
>>> %timeit np.repeat(x[np.newaxis, :], reps, axis=0)
9.88 ms ± 52.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
>>> %timeit np.tile(x, (reps, 1))
9.97 ms ± 77.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
세 가지 방법 모두 대략 같은 속도입니다.
계산
>>> a = np.arange(reps * n).reshape(reps, n)
>>> x_tiled = np.tile(x, (reps, 1))
>>> %timeit np.broadcast_to(x, (reps, n)) * a
17.1 ms ± 284 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
>>> %timeit x[np.newaxis, :] * a
17.5 ms ± 300 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
>>> %timeit x_tiled * a
17.6 ms ± 240 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
세 가지 방법 모두 대략 같은 속도입니다.
결론
계산 전에 복제하려면 “제로 비용 할당”방법 중 하나를 사용하십시오. “강제 할당”으로 인한 성능 저하가 발생하지 않습니다.
답변
나는 numpy에서 방송을 사용하는 것이 가장 좋고 빠르다고 생각합니다.
나는 다음과 같이 비교했다
import numpy as np
b = np.random.randn(1000)
In [105]: %timeit c = np.tile(b[:, newaxis], (1,100))
1000 loops, best of 3: 354 µs per loop
In [106]: %timeit c = np.repeat(b[:, newaxis], 100, axis=1)
1000 loops, best of 3: 347 µs per loop
In [107]: %timeit c = np.array([b,]*100).transpose()
100 loops, best of 3: 5.56 ms per loop
방송을 사용하여 약 15 배 더 빠름
답변
깨끗한 솔루션 중 하나는 NumPy의 외부 제품 함수를 벡터로 사용하는 것입니다.
np.outer(np.ones(n), x)
n
반복되는 행을 제공 합니다. 반복되는 열을 얻으려면 인수 순서를 전환하십시오. 같은 수의 행과 열을 얻으려면
np.outer(np.ones_like(x), x)
답변
당신이 사용할 수있는
np.tile(x,3).reshape((4,3))
타일은 벡터의 담당자를 생성합니다
모양을 변경하면 원하는 모양이됩니다.