[r] 날짜에서 연도 추출

특히이 변수에 특수 문자가있는 경우 변수에서 첫 번째 요소를 제거하려면 어떻게해야합니까? 예를 들어, 다음 열이 있습니다.

Date
01/01/2009
01/01/2010
01/01/2011
01/01/2012

다음과 같은 새 열이 필요합니다.

Date
2009
2010
2011
2012



답변

모든 날짜의 너비가 같으면 날짜를 벡터에 넣고 하위 문자열을 사용할 수 있습니다.

Date
a <- c("01/01/2009", "01/01/2010" , "01/01/2011")
substring(a,7,10) #This takes string and only keeps the characters beginning in position 7 to position 10

산출

[1] "2009" "2010" "2011"


답변

주석에서 논의했듯이 항목을 Date형식 으로 변환 하고 연도를 추출하면 다음과 같이 수행 할 수 있습니다 .

format(as.Date(df1$Date, format="%d/%m/%Y"),"%Y")


답변


답변

변수를 Date다음으로 변환 할 때 :

date <-  as.Date('10/30/2018','%m/%d/%Y')

그런 다음 원하는 요소를 잘라 내고 연도와 같은 새 변수를 만들 수 있습니다.

year <- as.numeric(format(date,'%Y'))

또는 월 :

month <- as.numeric(format(date,'%m'))


답변

datepackage를 사용한다면 이것은 상당히 쉽게 할 수 있습니다.

library(date)
Date <- c("01/01/2009", "01/01/2010", "01/01/2011", "01/01/2012")
Date <- as.date(Date)
Date
# [1] 1Jan2009 1Jan2010 1Jan2011 1Jan2012
date.mdy(Date)$year
# [1] 2009 2010 2011 2012

## be aware that these are now integers and thus different methods may be invoked:
str(date.mdy(Date)$year)
# int [1:4] 2009 2010 2011 2012
summary(Date)
#     First      Last   
# "1Jan2009" "1Jan2012" 
summary(date.mdy(Date)$year)
#    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#    2009    2010    2010    2010    2011    2012 


답변

이것은 특정 답변보다 더 많은 조언이지만 내 제안은 날짜를 문자열로 유지하는 대신 날짜를 날짜 변수로 즉시 변환하는 것입니다. 이렇게하면 매우 번거로운 해결 방법을 사용하지 않고 날짜 (및 시간) 기능을 사용할 수 있습니다.

지적했듯이 윤활유 패키지에는 좋은 추출 기능이 있습니다.

일부 프로젝트의 경우 시작부터 날짜를 연결하는 것이 도움이된다는 사실을 발견했습니다. 시작할 연도, 월, 일 (월) 및 일 (주) 변수를 만듭니다. 추출 코드가 요약 / 표 / 그래프 코드와 분리되어 있고 변경해야하는 경우 여러 지점에서 이러한 변경 사항을 롤아웃 할 필요가 없기 때문에 요약, 표 및 그래프를 단순화 할 수 있습니다.


답변

당분간은 data.table패키지와 해당 IDate클래스 및 관련 함수 (Check ?as.IDate()) 에만 의존 할 수 있습니다 . 따라서 lubridate.

require(data.table)

a <- c("01/01/2009", "01/01/2010" , "01/01/2011")
year(as.IDate(a, '%d/%m/%Y')) # all data.table functions