[r] 데이터 프레임에서 특정 열 추출
6 개의 열이있는 R 데이터 프레임이 있고 세 개의 열만있는 새 데이터 프레임을 만들고 싶습니다.
내 데이터 프레임을 가정이다 df
, 나는 추출 컬럼에 원하는 A
, B
그리고 E
, 이것은 단지 내가 알아낼 수있는 명령입니다 :
data.frame(df$A,df$B,df$E)
더 간단한 방법이 있습니까?
답변
data.frame 이 호출되는 경우 dplyr 패키지 사용 df1
:
library(dplyr)
df1 %>%
select(A, B, E)
%>%
파이프 없이 다음 과 같이 쓸 수도 있습니다 .
select(df1, A, B, E)
답변
열 이름으로 구성된 벡터를 사용하여 부분 집합을 지정할 수 있습니다. subset()
특히 함수, 패키지 또는 응용 프로그램에서 프로그래밍 할 때 열 이름을 객체 이름처럼 처리하는 방법보다이 방법을 선호 합니다.
# data for reproducible example
# (and to avoid confusion from trying to subset `stats::df`)
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[,c("A","B","E")]
답변
이것이 subset()
기능 의 역할입니다 .
> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9))
> subset(dat, select=c("A", "B"))
A B
1 1 3
2 2 4
답변
두 가지 명백한 선택이 있습니다 : Joshua Ulrich ‘s df[,c("A","B","E")]
또는
df[,c(1,2,5)]
에서와 같이
> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9))
> df
A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
A B E
1 1 3 8
2 2 4 8
답변
어떤 이유로 만
df[, (names(df) %in% c("A","B","E"))]
나를 위해 일했다. 위의 모든 구문에서 “정의되지 않은 열이 선택되었습니다”.
답변
여기서 df1은 원래 데이터 프레임입니다.
df2 <- subset(df1, select = c(1, 2, 5))
답변
sqldf
R 데이터 프레임에서 선택을 수행 하는 패키지를 다음과 같이 사용할 수도 있습니다 .
df1 <- sqldf("select A, B, E from df")
이것은 출력으로 데이터 df1
열을 제공합니다 : A, B, E.