특히이 변수에 특수 문자가있는 경우 변수에서 첫 번째 요소를 제거하려면 어떻게해야합니까? 예를 들어, 다음 열이 있습니다.
Date
01/01/2009
01/01/2010
01/01/2011
01/01/2012
다음과 같은 새 열이 필요합니다.
Date
2009
2010
2011
2012
답변
모든 날짜의 너비가 같으면 날짜를 벡터에 넣고 하위 문자열을 사용할 수 있습니다.
Date
a <- c("01/01/2009", "01/01/2010" , "01/01/2011")
substring(a,7,10) #This takes string and only keeps the characters beginning in position 7 to position 10
산출
[1] "2009" "2010" "2011"
답변
주석에서 논의했듯이 항목을 Date
형식 으로 변환 하고 연도를 추출하면 다음과 같이 수행 할 수 있습니다 .
format(as.Date(df1$Date, format="%d/%m/%Y"),"%Y")
답변
library(lubridate)
a=mdy(b)
year(a)
https://cran.r-project.org/web/packages/lubridate/vignettes/lubridate.html
http://vita.had.co.nz/papers/lubridate.pdf
답변
변수를 Date
다음으로 변환 할 때 :
date <- as.Date('10/30/2018','%m/%d/%Y')
그런 다음 원하는 요소를 잘라 내고 연도와 같은 새 변수를 만들 수 있습니다.
year <- as.numeric(format(date,'%Y'))
또는 월 :
month <- as.numeric(format(date,'%m'))
답변
date
package를 사용한다면 이것은 상당히 쉽게 할 수 있습니다.
library(date)
Date <- c("01/01/2009", "01/01/2010", "01/01/2011", "01/01/2012")
Date <- as.date(Date)
Date
# [1] 1Jan2009 1Jan2010 1Jan2011 1Jan2012
date.mdy(Date)$year
# [1] 2009 2010 2011 2012
## be aware that these are now integers and thus different methods may be invoked:
str(date.mdy(Date)$year)
# int [1:4] 2009 2010 2011 2012
summary(Date)
# First Last
# "1Jan2009" "1Jan2012"
summary(date.mdy(Date)$year)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 2009 2010 2010 2010 2011 2012
답변
이것은 특정 답변보다 더 많은 조언이지만 내 제안은 날짜를 문자열로 유지하는 대신 날짜를 날짜 변수로 즉시 변환하는 것입니다. 이렇게하면 매우 번거로운 해결 방법을 사용하지 않고 날짜 (및 시간) 기능을 사용할 수 있습니다.
지적했듯이 윤활유 패키지에는 좋은 추출 기능이 있습니다.
일부 프로젝트의 경우 시작부터 날짜를 연결하는 것이 도움이된다는 사실을 발견했습니다. 시작할 연도, 월, 일 (월) 및 일 (주) 변수를 만듭니다. 추출 코드가 요약 / 표 / 그래프 코드와 분리되어 있고 변경해야하는 경우 여러 지점에서 이러한 변경 사항을 롤아웃 할 필요가 없기 때문에 요약, 표 및 그래프를 단순화 할 수 있습니다.
답변
당분간은 data.table
패키지와 해당 IDate
클래스 및 관련 함수 (Check ?as.IDate()
) 에만 의존 할 수 있습니다 . 따라서 lubridate
.
require(data.table)
a <- c("01/01/2009", "01/01/2010" , "01/01/2011")
year(as.IDate(a, '%d/%m/%Y')) # all data.table functions