[python] numpy 배열에서 특정 열 추출

이것은 쉬운 질문이지만 MxN 행렬이 있다고 말합니다. 내가하고 싶은 것은 특정 열을 추출하여 다른 numpy 배열에 저장하는 것이지만 잘못된 구문 오류가 발생합니다. 코드는 다음과 같습니다.

extractedData = data[[:,1],[:,9]]. 

위의 줄로 충분할 것 같지만 그렇지 않습니다. 나는 둘러 보았지만이 특정 시나리오와 관련하여 현명한 구문을 찾을 수 없었습니다.



답변

나는 당신이 열을 원한다고 가정 1하고 9? 그게

data[:, [1, 9]]

또는 이름으로 :

data[:, ['Column Name1','Column Name2']]

당신은에서 이름을 얻을 수 있습니다 data.dtype.names


답변

해당 코드 스 니펫으로 열 1과 9를 얻으려는 경우 다음과 같아야합니다.

extractedData = data[:,[1,9]]


답변

일부 열만 추출하려는 경우 :

idx_IN_columns = [1, 9]
extractedData = data[:,idx_IN_columns]

특정 열을 제외하려는 경우 :

idx_OUT_columns = [1, 9]
idx_IN_columns = [i for i in xrange(np.shape(data)[1]) if i not in idx_OUT_columns]
extractedData = data[:,idx_IN_columns]


답변

내가 지적하고 싶은 한 가지는 추출하려는 열의 수가 1 인 경우 결과 행렬 예상대로 Mx1 행렬 이 아니라 대신 추출한 열의 요소를 포함하는 배열입니다.

이를 Matrix로 변환하려면 결과 배열에 reshape (M, 1) 메소드를 사용해야합니다.


답변

다만:

>>> m = np.matrix(np.random.random((5, 5)))
>>> m
matrix([[0.91074101, 0.65999332, 0.69774588, 0.007355  , 0.33025395],
        [0.11078742, 0.67463754, 0.43158254, 0.95367876, 0.85926405],
        [0.98665185, 0.86431513, 0.12153138, 0.73006437, 0.13404811],
        [0.24602225, 0.66139215, 0.08400288, 0.56769924, 0.47974697],
        [0.25345299, 0.76385882, 0.11002419, 0.2509888 , 0.06312359]])
>>> m[:,[1, 2]]
matrix([[0.65999332, 0.69774588],
        [0.67463754, 0.43158254],
        [0.86431513, 0.12153138],
        [0.66139215, 0.08400288],
        [0.76385882, 0.11002419]])

열이 순서대로 정렬 될 필요는 없습니다.

>>> m[:,[2, 1, 3]]
matrix([[0.69774588, 0.65999332, 0.007355  ],
        [0.43158254, 0.67463754, 0.95367876],
        [0.12153138, 0.86431513, 0.73006437],
        [0.08400288, 0.66139215, 0.56769924],
        [0.11002419, 0.76385882, 0.2509888 ]])


답변

다음과 같은 목록을 사용하여 ND 배열에서 열을 선택할 때주의해야 할 사항이 하나 더 있습니다.

data[:,:,[1,9]]

예를 들어 하나의 행만 선택하여 차원을 제거하는 경우 결과 배열은 (어떤 이유로 든) 치환 됩니다. 그래서:

print data.shape            # gives [10,20,30]
selection = data[1,:,[1,9]]
print selection.shape       # gives [2,20] instead of [20,2]!!


답변

당신이 사용할 수있는 :

extracted_data = data.ix[:,['Column1','Column2']]