이것은 쉬운 질문이지만 MxN 행렬이 있다고 말합니다. 내가하고 싶은 것은 특정 열을 추출하여 다른 numpy 배열에 저장하는 것이지만 잘못된 구문 오류가 발생합니다. 코드는 다음과 같습니다.
extractedData = data[[:,1],[:,9]].
위의 줄로 충분할 것 같지만 그렇지 않습니다. 나는 둘러 보았지만이 특정 시나리오와 관련하여 현명한 구문을 찾을 수 없었습니다.
답변
나는 당신이 열을 원한다고 가정 1
하고 9
? 그게
data[:, [1, 9]]
또는 이름으로 :
data[:, ['Column Name1','Column Name2']]
당신은에서 이름을 얻을 수 있습니다 data.dtype.names
…
답변
해당 코드 스 니펫으로 열 1과 9를 얻으려는 경우 다음과 같아야합니다.
extractedData = data[:,[1,9]]
답변
일부 열만 추출하려는 경우 :
idx_IN_columns = [1, 9]
extractedData = data[:,idx_IN_columns]
특정 열을 제외하려는 경우 :
idx_OUT_columns = [1, 9]
idx_IN_columns = [i for i in xrange(np.shape(data)[1]) if i not in idx_OUT_columns]
extractedData = data[:,idx_IN_columns]
답변
내가 지적하고 싶은 한 가지는 추출하려는 열의 수가 1 인 경우 결과 행렬 은 예상대로 Mx1 행렬 이 아니라 대신 추출한 열의 요소를 포함하는 배열입니다.
이를 Matrix로 변환하려면 결과 배열에 reshape (M, 1) 메소드를 사용해야합니다.
답변
다만:
>>> m = np.matrix(np.random.random((5, 5)))
>>> m
matrix([[0.91074101, 0.65999332, 0.69774588, 0.007355 , 0.33025395],
[0.11078742, 0.67463754, 0.43158254, 0.95367876, 0.85926405],
[0.98665185, 0.86431513, 0.12153138, 0.73006437, 0.13404811],
[0.24602225, 0.66139215, 0.08400288, 0.56769924, 0.47974697],
[0.25345299, 0.76385882, 0.11002419, 0.2509888 , 0.06312359]])
>>> m[:,[1, 2]]
matrix([[0.65999332, 0.69774588],
[0.67463754, 0.43158254],
[0.86431513, 0.12153138],
[0.66139215, 0.08400288],
[0.76385882, 0.11002419]])
열이 순서대로 정렬 될 필요는 없습니다.
>>> m[:,[2, 1, 3]]
matrix([[0.69774588, 0.65999332, 0.007355 ],
[0.43158254, 0.67463754, 0.95367876],
[0.12153138, 0.86431513, 0.73006437],
[0.08400288, 0.66139215, 0.56769924],
[0.11002419, 0.76385882, 0.2509888 ]])
답변
다음과 같은 목록을 사용하여 ND 배열에서 열을 선택할 때주의해야 할 사항이 하나 더 있습니다.
data[:,:,[1,9]]
예를 들어 하나의 행만 선택하여 차원을 제거하는 경우 결과 배열은 (어떤 이유로 든) 치환 됩니다. 그래서:
print data.shape # gives [10,20,30]
selection = data[1,:,[1,9]]
print selection.shape # gives [2,20] instead of [20,2]!!
답변
당신이 사용할 수있는 :
extracted_data = data.ix[:,['Column1','Column2']]
