[r] R dplyr : 여러 열 삭제

해당 데이터 프레임에 삭제하려는 데이터 프레임과 열 목록이 있습니다. 하자의 사용 iris예를 들어 데이터 집합을. 나는 드롭하고 싶습니다 Sepal.LengthSepal.Width만 나머지 열을 사용합니다. 패키지를 사용 select하거나 패키지 select_에서 어떻게 수행 dplyr합니까?

지금까지 시도한 내용은 다음과 같습니다.

drop.cols <- c('Sepal.Length', 'Sepal.Width')
iris %>% select(-drop.cols)

-drop.cols 오류 : 단항 연산자에 대한 잘못된 인수

iris %>% select_(.dots = -drop.cols)

-drop.cols 오류 : 단항 연산자에 대한 잘못된 인수

iris %>% select(!drop.cols)

! drop.cols 오류 : 잘못된 인수 유형

iris %>% select_(.dots = !drop.cols)

! drop.cols 오류 : 잘못된 인수 유형

이미 존재해야하는 꽤 유용한 작업처럼 보이기 때문에 분명한 것을 놓치고있는 것 같습니다. Github에서 누군가 비슷한 문제를 게시 했고 Hadley는 ‘네거티브 인덱싱’을 사용한다고 말했습니다. 그게 (내 생각에) 시도했지만 아무 소용이 없습니다. 어떤 제안?



답변

select_vars에 대한 도움말을 확인하십시오. 이것으로 작업하는 방법에 대한 몇 가지 추가 아이디어를 제공합니다.

귀하의 경우 :

iris %>% select(-one_of(drop.cols))


답변

또한 시도

## Notice the lack of quotes
iris %>% select (-c(Sepal.Length, Sepal.Width))


답변

그 외에도 모든 특정 열 이름을 정의하지 않는 select(-one_of(drop.cols))사용하여 열을 삭제하는 몇 가지 다른 옵션이 있습니다 select()(열 이름의 다양성에 대해 dplyr starwars 샘플 데이터 사용).

starwars %>% 
  select(-(name:mass)) %>%        # the range of columns from 'name' to 'mass'
  select(-contains('color')) %>%  # any column name that contains 'color'
  select(-starts_with('bi')) %>%  # any column name that starts with 'bi'
  select(-ends_with('er')) %>%    # any column name that ends with 'er'
  select(-matches('^f.+s$')) %>%  # any column name matching the regex pattern
  select_if(~!is.list(.)) %>%     # not by column name but by data type
  head(2)

# A tibble: 2 x 2
homeworld species
  <chr>     <chr>  
1 Tatooine  Human  
2 Tatooine  Droid 


답변

select()dplyr 및 MASS 패키지에서 모두 사용되므로 함수에 주의하십시오 . 따라서 MASS가로드되면 select ()가 제대로 작동하지 않을 수 있습니다. 로드 sessionInfo()된 패키지를 확인하려면 “다른 첨부 된 패키지 :”섹션에서 해당 패키지를 입력 하고 찾으십시오. 로드 된 경우을 입력 detach( "package:MASS", unload = TRUE )하면 select()함수가 다시 작동합니다.


답변

우리는 시도 할 수 있습니다

iris %>% 
      select_(.dots= setdiff(names(.),drop.cols))


답변

또 다른 방법은 원하지 않는 열을로 변경하는 것입니다 NULL. 이렇게하면 삽입 된 괄호를 피할 수 있습니다.

head(iris,2) %>% mutate_at(drop.cols, ~NULL)
#   Petal.Length Petal.Width Species
# 1          1.4         0.2  setosa
# 2          1.4         0.2  setosa


답변

열 이름에 특수 문자가있는 경우 select또는 select_예상대로 작동하지 않을 수 있습니다. 이 재산 dplyr의 사용 ".". 질문의 데이터 세트를 참조하기 위해 다음 행을 사용하여이 문제를 해결할 수 있습니다.

drop.cols <- c('Sepal.Length', 'Sepal.Width')
  iris %>% .[,setdiff(names(.),drop.cols)]