[python] numpy 배열에서 특정 요소를 제거하는 방법

numpy 배열에서 특정 요소를 어떻게 제거 할 수 있습니까? 내가 가지고 있다고

import numpy as np

a = np.array([1,2,3,4,5,6,7,8,9])

그때 제거 할 3,4,7에서 a. 내가 아는 것은 값의 색인입니다 ( index=[2,3,6]).

답변

numpy.delete () 사용 – 삭제 된 축을 따라 하위 배열이 있는 새 배열을 반환합니다.

numpy.delete(a, index)

특정 질문에 대해 :

import numpy as np

a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
index = [2, 3, 6]

new_a = np.delete(a, index)

print(new_a) #Prints `[1, 2, 5, 6, 8, 9]`

배열 스칼라 는 파이썬의 문자열과 유사하게 변경할 수 없으므로 numpy.delete()새 배열 을 반환 하므로 변경 할 때마다 새 객체가 생성됩니다. 즉, 문서 를 인용하려면 :delete()

” obj로 지정된 요소가 제거 된 arr 사본 이 삭제 되었습니다. 삭제는 제자리에서 발생하지 않습니다 .”

내가 게시 한 코드에 출력이 있으면 코드를 실행 한 결과입니다.

답변

이를 돕기 위해 수많은 내장 함수가 있습니다.

import numpy as np
>>> a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> b = np.array([3,4,7])
>>> c = np.setdiff1d(a,b)
>>> c
array([1, 2, 5, 6, 8, 9])

답변

Numpy 배열은 변경할 수 없으므로 기술적으로 항목을 삭제할 수 없습니다. 그러나 원하지 않는 값없이 다음과 같이 새 배열을 구성 할 수 있습니다 .

b = np.delete(a, [2,3,6])

답변

값으로 삭제하려면 :

modified_array = np.delete(original_array, np.where(original_array == value_to_delete))

답변

멍청한 사람이 아닌 나는 총을 맞았습니다.

>>> import numpy as np
>>> import itertools
>>> 
>>> a = np.array([1,2,3,4,5,6,7,8,9])
>>> index=[2,3,6]
>>> a = np.array(list(itertools.compress(a, [i not in index for i in range(len(a))])))
>>> a
array([1, 2, 5, 6, 8, 9])

내 테스트에 따르면 성능이 뛰어납니다 numpy.delete(). 초기 배열의 작은 크기로 인해 왜 그런지 모르겠습니다.

python -m timeit -s "import numpy as np" -s "import itertools" -s "a = np.array([1,2,3,4,5,6,7,8,9])" -s "index=[2,3,6]" "a = np.array(list(itertools.compress(a, [i not in index for i in range(len(a))])))"
100000 loops, best of 3: 12.9 usec per loop

python -m timeit -s "import numpy as np" -s "a = np.array([1,2,3,4,5,6,7,8,9])" -s "index=[2,3,6]" "np.delete(a, index)"
10000 loops, best of 3: 108 usec per loop

그것은 (예상했던 것과 반대 방향으로) 상당히 중요한 차이입니다.이 이유가 무엇인지 아는 사람 있습니까?

더 이상하게도, numpy.delete()목록을 전달 하면 목록을 반복하여 단일 인덱스를 제공하는 것보다 성능이 떨어집니다.

python -m timeit -s "import numpy as np" -s "a = np.array([1,2,3,4,5,6,7,8,9])" -s "index=[2,3,6]" "for i in index:" "    np.delete(a, i)"
10000 loops, best of 3: 33.8 usec per loop

편집 : 배열의 크기와 관련이있는 것 같습니다. 큰 배열의 경우 numpy.delete()훨씬 빠릅니다.

python -m timeit -s "import numpy as np" -s "import itertools" -s "a = np.array(list(range(10000)))" -s "index=[i for i in range(10000) if i % 2 == 0]" "a = np.array(list(itertools.compress(a, [i not in index for i in range(len(a))])))"
10 loops, best of 3: 200 msec per loop

python -m timeit -s "import numpy as np" -s "a = np.array(list(range(10000)))" -s "index=[i for i in range(10000) if i % 2 == 0]" "np.delete(a, index)"
1000 loops, best of 3: 1.68 msec per loop

분명히, 당신은 항상 명확성을 위해 가고 바퀴를 재발 명하지 않아야하기 때문에 이것은 모두 관련이 없습니다. 그러나 나는 조금 흥미 롭다는 것을 알았습니다.

답변

색인을 모르면 사용할 수 없습니다 logical_and

x = 10*np.random.randn(1,100)
low = 5
high = 27
x[0,np.logical_and(x[0,:]>low,x[0,:]<high)]

답변

np.delete제거하려는 요소의 인덱스를 알고 있다면 사용하는 것이 가장 빠른 방법입니다. 그러나 완전성을 위해의 도움으로 생성 된 부울 마스크를 사용하여 배열 요소를 “제거”하는 다른 방법을 추가하겠습니다 np.isin. 이 방법을 사용하면 요소를 직접 또는 색인으로 지정하여 요소를 제거 할 수 있습니다.

import numpy as np
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])

지수로 제거 :

indices_to_remove = [2, 3, 6]
a = a[~np.isin(np.arange(a.size), indices_to_remove)]

요소별로 제거합니다 (원본 a은 이전 줄에서 다시 작성되었으므로 다시 작성해야 함).

elements_to_remove = a[indices_to_remove]  # [3, 4, 7]
a = a[~np.isin(a, elements_to_remove)]