[r] 목록 요소가 있는지 테스트하는 방법은 무엇입니까?

문제

목록의 요소가 있는지 테스트하고 싶습니다. 여기에 예가 있습니다.

foo <- list(a=1)
exists('foo')
TRUE   #foo does exist
exists('foo$a')
FALSE  #suggests that foo$a does not exist
foo$a
[1] 1  #but it does exist

이 예에서는 그것이 foo$a존재 한다는 것을 알고 있지만 테스트는FALSE .

나는 들여다보고 ?existswith(foo, exists('a')반환 을 찾았 TRUE지만 exists('foo$a')반환 이유를 이해하지 못합니다.FALSE .

질문

  • exists('foo$a')돌아 오나요 FALSE?
  • with(...)선호하는 접근 방식을 사용 하고 있습니까?


답변

이것은 실제로 생각보다 약간 까다 롭습니다. 목록은 실제로 (약간의 노력으로) NULL 요소를 포함 할 수 있으므로 is.null(foo$a). 더 엄격한 테스트는 이름이 실제로 목록에 정의되어 있는지 확인하는 것입니다.

foo <- list(a=42, b=NULL)
foo

is.null(foo[["a"]]) # FALSE
is.null(foo[["b"]]) # TRUE, but the element "exists"...
is.null(foo[["c"]]) # TRUE

"a" %in% names(foo) # TRUE
"b" %in% names(foo) # TRUE
"c" %in% names(foo) # FALSE

… 후자는 부분 일치를 사용하므로 더 긴 이름과 일치 할 수도 있기 때문에 foo[["a"]]보다 안전합니다 foo$a.

x <- list(abc=4)
x$a  # 4, since it partially matches abc
x[["a"]] # NULL, no match

[업데이트] 그래서, 왜 exists('foo$a')작동하지 않는지 질문으로 돌아갑니다 . 이 exists함수는 개체의 일부가 존재하는지가 아닌 환경에 변수가 있는지 만 확인합니다. 문자열 "foo$a"은 문학적으로 해석됩니다. “foo $ a”라는 변수가 있습니까? … 그리고 대답은 FALSE

foo <- list(a=42, b=NULL) # variable "foo" with element "a"
"bar$a" <- 42   # A variable actually called "bar$a"...
ls() # will include "foo" and "bar$a" 
exists("foo$a") # FALSE 
exists("bar$a") # TRUE


답변

명명 된 요소를 확인하는 가장 좋은 방법 exist()은를 사용하는 것이지만 위의 답변은 함수를 제대로 사용하지 않습니다. 목록 에서 where변수를 확인 하려면 인수 를 사용해야 합니다.

foo <- list(a=42, b=NULL)

exists('a', where=foo) #TRUE
exists('b', where=foo) #TRUE
exists('c', where=foo) #FALSE


답변

다음은 다른 답변에서 제안 된 방법의 성능 비교입니다.

> foo <- sapply(letters, function(x){runif(5)}, simplify = FALSE)
> microbenchmark::microbenchmark('k' %in% names(foo),
                                 is.null(foo[['k']]),
                                 exists('k', where = foo))
Unit: nanoseconds
                     expr  min   lq    mean median   uq   max neval cld
      "k" %in% names(foo)  467  933 1064.31    934  934 10730   100  a
      is.null(foo[["k"]])    0    0  168.50      1  467  3266   100  a
 exists("k", where = foo) 6532 6998 7940.78   7232 7465 56917   100   b

목록을 여러 번 액세스하는 빠른 사전으로 사용할 계획이라면 is.null접근 방식이 유일한 실행 가능한 옵션 일 수 있습니다. 나는 그것이 O (1)이라고 가정하고 %in%접근법은 O (n)입니까?


답변

@ salient.salamander의 약간 수정 된 버전은 전체 경로를 확인하려는 경우 사용할 수 있습니다.

Element_Exists_Check = function( full_index_path ){
  tryCatch({
    len_element = length(full_index_path)
    exists_indicator = ifelse(len_element > 0, T, F)
      return(exists_indicator)
  }, error = function(e) {
    return(F)
  })
}


답변

아직 나오지 않은 한 가지 해결책은 NULL을 성공적으로 처리하는 length를 사용하는 것입니다. 내가 알 수있는 한 NULL을 제외한 모든 값의 길이는 0보다 큽니다.

x <- list(4, -1, NULL, NA, Inf, -Inf, NaN, T, x = 0, y = "", z = c(1,2,3))
lapply(x, function(el) print(length(el)))
[1] 1
[1] 1
[1] 0
[1] 1
[1] 1
[1] 1
[1] 1
[1] 1
[1] 1
[1] 1
[1] 3

따라서 우리는 명명 된 인덱스와 번호 인덱스 모두에서 작동하는 간단한 함수를 만들 수 있습니다.

element.exists <- function(var, element)
{
  tryCatch({
    if(length(var[[element]]) > -1)
      return(T)
  }, error = function(e) {
    return(F)
  })
}

요소가 존재하지 않으면 tryCatch 블록에서 포착 된 범위를 벗어난 조건이 발생합니다.


답변

rlang::has_name() 이것도 할 수 있습니다 :

foo = list(a = 1, bb = NULL)
rlang::has_name(foo, "a")  # TRUE
rlang::has_name(foo, "b")  # FALSE. No partial matching
rlang::has_name(foo, "bb")  # TRUE. Handles NULL correctly
rlang::has_name(foo, "c")  # FALSE

보시다시피 @Tommy가 기본 R을 사용하여 처리하는 방법을 보여주고 이름이 지정되지 않은 항목이있는 목록에 대해 작동하는 모든 경우를 본질적으로 처리합니다. exists("bb", where = foo)가독성을 위해 다른 답변에서 제안한대로 여전히 권장 하지만 has_name이름이없는 항목이있는 경우 대안입니다.


답변

목록 요소 purrr::has_element 을 확인하는 데 사용 합니다 .

> x <- list(c(1, 2), c(3, 4))
> purrr::has_element(x, c(3, 4))
[1] TRUE
> purrr::has_element(x, c(3, 5))
[1] FALSE