[python] 여러 개의 인수로 함수를 적용하여 새 팬더 열 만들기
pandas
두 개의 기존 열에 함수를 적용하여 데이터 프레임에 새 열을 만들고 싶습니다 . 이 답변에 따라 하나의 열만 인수로 필요할 때 새 열을 만들 수있었습니다.
import pandas as pd
df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]})
def fx(x):
return x * x
print(df)
df['newcolumn'] = df.A.apply(fx)
print(df)
그러나 함수에 여러 인수가 필요한 경우 동일한 작업을 수행하는 방법을 알 수 없습니다. 예를 들어, 열 A와 열 B를 아래 함수에 전달하여 새 열을 작성하는 방법은 무엇입니까?
def fxy(x, y):
return x * y
답변
또는 numpy 기본 함수를 사용할 수 있습니다.
>>> import numpy as np
>>> df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]})
>>> df['new_column'] = np.multiply(df['A'], df['B'])
>>> df
A B new_column
0 10 20 200
1 20 30 600
2 30 10 300
또는 일반적인 경우 임의의 함수를 벡터화하십시오.
>>> def fx(x, y):
... return x*y
...
>>> df['new_column'] = np.vectorize(fx)(df['A'], df['B'])
>>> df
A B new_column
0 10 20 200
1 20 30 600
2 30 10 300
답변
함수를 다시 작성할 수 있다면 @greenAfrican 예제를 사용할 수 있습니다. 그러나 함수를 다시 작성하지 않으려면 다음과 같이 apply 내부에서 익명 함수로 래핑 할 수 있습니다.
>>> def fxy(x, y):
... return x * y
>>> df['newcolumn'] = df.apply(lambda x: fxy(x['A'], x['B']), axis=1)
>>> df
A B newcolumn
0 10 20 200
1 20 30 600
2 30 10 300
답변
이것은 문제를 해결합니다 :
df['newcolumn'] = df.A * df.B
당신은 또한 할 수 있습니다 :
def fab(row):
return row['A'] * row['B']
df['newcolumn'] = df.apply(fab, axis=1)
답변
한 번에 여러 열 을 만들어야하는 경우 :
-
데이터 프레임을 만듭니다.
import pandas as pd df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]})
-
함수를 작성하십시오.
def fab(row): return row['A'] * row['B'], row['A'] + row['B']
-
새 열을 지정하십시오.
df['newcolumn'], df['newcolumn2'] = zip(*df.apply(fab, axis=1))
답변
dict 스타일의 깔끔한 구문이 하나 더 있습니다.
df["new_column"] = df.apply(lambda x: x["A"] * x["B"], axis = 1)
또는,
df["new_column"] = df["A"] * df["B"]