저는 R을 처음 접했고 벡터의 모든 요소 (배열?)에서 마지막 n 문자를 제거하는 방법에 대한 간단한 예를 온라인에서 찾을 수 없습니다.
저는 Java 배경에서 왔기 때문에 모든 요소를 반복하고 모든 요소 a$data
에서 마지막 3 개 문자를 제거하고 싶습니다 .
어떻게 하시겠습니까?
답변
다음은 내가 할 일의 예입니다. 나는 그것이 당신이 찾고있는 것이기를 바랍니다.
char_array = c("foo_bar","bar_foo","apple","beer")
a = data.frame("data"=char_array,"data2"=1:4)
a$data = substr(a$data,1,nchar(a$data)-3)
a는 이제 다음을 포함해야합니다.
data data2
1 foo_ 1
2 bar_ 2
3 ap 3
4 b 4
답변
방법은 gsub
다음 과 같습니다.
cs <- c("foo_bar","bar_foo","apple","beer")
gsub('.{3}$', '', cs)
# [1] "foo_" "bar_" "ap" "b"
답변
이것은 @nfmcclure의 대답과 거의 동일하지만 stringr
기본 R에있는 것보다 이름이 가장 일관되고 설명적인 함수 집합을 제공하기 때문에 package를 사용하는 것을 선호합니다 (사실 저는 항상 “수를 얻는 방법 이름을 기억할 수 없기 때문에 R의 문자nchar()
).
library(stringr)
str_sub(iris$Species, end=-4)
#or
str_sub(iris$Species, 1, str_length(iris$Species)-3)
그러면 Species
열의 각 값에서 마지막 3 개 문자가 제거 됩니다.
답변
stringi 패키지로도 동일한 결과를 얻을 수 있습니다 .
library('stringi')
char_array <- c("foo_bar","bar_foo","apple","beer")
a <- data.frame("data"=char_array, "data2"=1:4)
(a$data <- stri_sub(a$data, 1, -4)) # from the first to the last but 4th char
## [1] "foo_" "bar_" "ap" "b"
답변
@Matthew_Plourde와 유사합니다. gsub
그러나 0 문자로 트리밍되는 패턴을 사용합니다. 즉, 원래 문자열이 잘라낼 문자 수보다 짧으면 “”를 반환합니다 .
cs <- c("foo_bar","bar_foo","apple","beer","so","a")
gsub('.{0,3}$', '', cs)
# [1] "foo_" "bar_" "ap" "b" "" ""
차이점은 {0,3}
수량 자는 0 ~ 3 개의 일치 항목을 나타내지 만 {3}
정확히 3 개의 일치 항목이 필요하며 그렇지 않으면 일치 항목이 없습니다.gsub
수정되지 않은 원래 문자열을 반환하는 .
NB를 사용 {,3}
하는 것은 {0,3}
, 나는 단순히 후자의 표기법을 선호합니다.
정규식 한정자에 대한 자세한 내용은
https://www.regular-expressions.info/refrepeat.html을 참조하십시오.