[r] R의 문자열에서 마지막 n 문자 추출

R의 문자열에서 마지막 n자를 어떻게 얻을 수 있습니까? SQL의 RIGHT와 같은 기능이 있습니까?



답변

기본 R에는 아무것도 모르지만 substrand를 사용 하여이 작업을 수행하는 것은 간단합니다 nchar.

x <- "some text in a string"

substrRight <- function(x, n){
  substr(x, nchar(x)-n+1, nchar(x))
}

substrRight(x, 6)
[1] "string"

substrRight(x, 8)
[1] "a string"

@mdsumner가 지적한 것처럼 벡터화됩니다. 치다:

x <- c("some text in a string", "I really need to learn how to count")
substrRight(x, 6)
[1] "string" " count"


답변

stringr패키지 사용이 마음에 들지 않으면 str_sub음수를 사용하여 역으로 계산할 수 있으므로 편리합니다.

x <- "some text in a string"
str_sub(x,-6,-1)
[1] "string"

또는 Max가이 답변에 대한 의견에서 지적한 것처럼,

str_sub(x, start= -6)
[1] "string"


답변

패키지의 stri_sub기능을 사용하십시오 stringi. 끝에서 부분 문자열을 얻으려면 음수를 사용하십시오. 아래 예를보십시오.

stri_sub("abcde",1,3)
[1] "abc"
stri_sub("abcde",1,1)
[1] "a"
stri_sub("abcde",-3,-1)
[1] "cde"

github에서이 패키지를 설치할 수 있습니다 : https://github.com/Rexamine/stringi

CRAN에서 사용 가능합니다. 간단히 입력하십시오.

install.packages("stringi")

이 패키지를 설치합니다.


답변

str = 'This is an example'
n = 7
result = substr(str,(nchar(str)+1)-n,nchar(str))
print(result)

> [1] "example"
> 


답변

또 다른 합리적인 방법은 정규 표현식을 사용하는 것입니다 sub.

sub('.*(?=.$)', '', string, perl=T)

따라서 “한 문자 뒤에 모든 것을 제거하십시오”. 끝에서 더 많은 문자를 얻으려면 lookahead 어설 션에 많은 점을 추가하십시오.

sub('.*(?=.{2}$)', '', string, perl=T)

어디 .{2}수단 ..그렇게하는 의미, 또는 “두 글자”, “모든 것을 제거는 두 문자 다음에”.

sub('.*(?=.{3}$)', '', string, perl=T)

변수를 사용하여 잡을 문자 수를 설정할 수 있지만 paste변수 값을 정규식 문자열에 입력해야합니다.

n = 3
sub(paste('.+(?=.{', n, '})', sep=''), '', string, perl=T)


답변

업데이트 : mdsumner 에서 언급했듯이 substr이기 때문에 원래 코드는 이미 벡터화되었습니다. 더 조심해야 했어요.

그리고 벡터화 된 버전을 원한다면 ( Andrie 의 코드를 기반으로 )

substrRight <- function(x, n){
  sapply(x, function(xx)
         substr(xx, (nchar(xx)-n+1), nchar(xx))
         )
}

> substrRight(c("12345","ABCDE"),2)
12345 ABCDE
 "45"  "DE"

내가 변경 한 것을 참고 (nchar(x)-n)하는 (nchar(x)-n+1)얻을 n문자.


답변

substring()함수를 사용하는 간단한 기본 R 솔루션 (이 기능이 존재한다는 것을 누가 알았습니까?) :

RIGHT = function(x,n){
  substring(x,nchar(x)-n+1)
}

기본적으로 substr()아래에 있지만 기본 종료 값은 1,000,000입니다.

예 :

> RIGHT('Hello World!',2)
[1] "d!"
> RIGHT('Hello World!',8)
[1] "o World!"