‘B’의 날짜에서 ‘A’의 날짜를 빼고 차이가있는 새 열을 추가하고 싶습니다.
df
A B
one 2014-01-01 2014-02-28
two 2014-02-03 2014-03-01
다음을 시도했지만 for 루프에 포함하려고하면 오류가 발생합니다.
import datetime
date1=df['A'][0]
date2=df['B'][0]
mdate1 = datetime.datetime.strptime(date1, "%Y-%m-%d").date()
rdate1 = datetime.datetime.strptime(date2, "%Y-%m-%d").date()
delta = (mdate1 - rdate1).days
print delta
어떻게해야합니까?
답변
이것이 datetime 열이라고 가정하면 (적용되지 않는 경우 to_datetime
) 빼면됩니다.
df['A'] = pd.to_datetime(df['A'])
df['B'] = pd.to_datetime(df['B'])
In [11]: df.dtypes # if already datetime64 you don't need to use to_datetime
Out[11]:
A datetime64[ns]
B datetime64[ns]
dtype: object
In [12]: df['A'] - df['B']
Out[12]:
one -58 days
two -26 days
dtype: timedelta64[ns]
In [13]: df['C'] = df['A'] - df['B']
In [14]: df
Out[14]:
A B C
one 2014-01-01 2014-02-28 -58 days
two 2014-02-03 2014-03-01 -26 days
참고 : 새 Pandas (예 : 0.13.1)를 사용하고 있는지 확인하세요. 이전 버전에서는 작동하지 않을 수 있습니다.
답변
‘days’텍스트 요소를 제거하려면 시리즈에 대한 dt () 접근자를 사용할 수도 있습니다. https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.dt.html
그래서,
df[['A','B']] = df[['A','B']].apply(pd.to_datetime) #if conversion required
df['C'] = (df['B'] - df['A']).dt.days
다음을 반환합니다.
A B C
one 2014-01-01 2014-02-28 58
two 2014-02-03 2014-03-01 26
답변
목록 이해는이를 수행하는 가장 Pythonic (그리고 가장 빠른) 방법에 대한 최선의 선택입니다.
[int(i.days) for i in (df.B - df.A)]
- timedelta (예 : ‘-58 일’)를 반환합니다.
- i.days는이 값을 긴 정수 값 (예 : -58L)으로 반환합니다.
- int (i.days)는 당신이 찾는 -58을 줄 것입니다.
열이 datetime 형식이 아닌 경우. 더 짧은 구문은 다음과 같습니다.df.A = pd.to_datetime(df.A)
답변
이건 어때:
times['days_since'] = max(list(df.index.values))
times['days_since'] = times['days_since'] - times['months']
times