데이터 사이언스/Python 데이터분석

pandas.Dataframe – 3편 column 추가 방법

Storage Gonie 2018. 5. 19. 01:54
반응형

 

from pandas import Series, DataFrame
#데이터프레임 생성 
df = DataFrame({"x1":[1,2,3], "x2":[11,22,33], "x3":[111,222,333]}, index=["i1","i2","i3"]) 
print(df) 
""" 
  x1 x2 x3
i1 1 11 111 
i2 2 22 222 
i3 3 33 333 
"""

1. 단일값을 가지는 column 추가

df["x4"] = 6
print(df)
"""
 x1 x2 x3 x4
i1 1 a 111 6
i2 2 b 222 6
i3 3 c 333 6
"""

2. 다른 column을 이용한 column 추가 방법

#Boolean 값을 가지는 column 추가
df["x5"] = df["x1"] > 300
print(df)
"""
 x1 x2 x3 x4 x5
i1 1 a 111 6 False
i2 2 b 222 6 False
i3 3 c 333 6 False
"""
#두 column을 이용하여 새로운 column 추가
df["x6"] = df["x1"] + df["x3"]
print(df)
"""
 x1 x2 x3 x4 x5 x6
i1 1 a 111 6 False 112
i2 2 b 222 6 False 224
i3 3 c 333 6 False 336
"""

2. Series로 column 추가(column값을 변경할때도 사용가능)

add_srs = Series([1001, 2001, 3001, 4001], index=["i1", "i2", "i3", "i4"])
#i4는 존재하지 않으므로 적용이 안됨.
df["x7"] = add_srs
print(df)
"""
    x1  x2   x3  x4     x5   x6    x7
i1   1  11  111   6  False  112  1001
i2   2  22  222   6  False  224  2001
i3   3  33  333   6  False  336  3001
"""
# 부분적으로 값을 가지는 시리즈도 추가 가능하다.
add_srs = Series([2222, 3333], index=["i2", "i3"])
df["x8"] = add_srs
print(df)
"""
    x1  x2   x3  x4     x5   x6    x7      x8
i1   1  11  111   6  False  112  1001     NaN
i2   2  22  222   6  False  224  2001  2222.0
i3   3  33  333   6  False  336  3001  3333.0
"""

3. list로 column추가

add_lst = [4141,1212,3131]
df["x9"] = add_lst
print(df)
"""
    x1  x2   x3  x4     x5   x6    x7      x8    x9
i1   1  11  111   6  False  112  1001     NaN  4141
i2   2  22  222   6  False  224  2001  2222.0  1212
i3   3  33  333   6  False  336  3001  3333.0  3131
"""
 

 

반응형