pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False) |
data | Series나 DataFrame을 작성할 데이터. Series를 생성할 때에는 python의 list, DataFrame을 생성할 때에는 python의 dictionary를 이용할 수 있다. |
index | Pandas 객체를 생성할 때 사용할 인덱스 명. 인덱스명을 지정하지 않으면 0~ 정수 값으로 지정된다. |
columns | DataFrame의 컬럼 명 지정. |
dtype | 데이터 타입의 설정 |
name | DataFrame이나 Series의 이름을 설정 |
from pandas import Series, DataFrame
import pandas as pd
import numpy as np
print(pd.__version__)
# Series 생성
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)
list_data = [11, 12, 13, 14, 15]
list_name = ['a', 'b', 'c', 'd', 'e']
obj = Series(data=list_data, index=list_name)
print(obj)
# 파이썬 딕셔너리를 이용해서 Series 생성하기
dic_data = {'a':21, 'b': 22, 'c' : 23, 'd' : 24, 'e': 25}
dic_obj = Series(data=dic_data, dtype=np.float, name="mySeries")
print(dic_obj)
import pandas as pd
import numpy as np
score_mat = {'홍길동': 97,
'임꺽정': 88,
'전우치': 91,
'손오공': 76,
'저팔계': 88,
'사오정': 87}
mat = pd.Series(score_mat)
mat
mat['손오공']
mat['임꺽정' : '저팔계']
mat.values
mat.value_counts()
mat.index
'손오공' in mat
mat.isin([97, 88]) # value data 중 데이터가 있는지 확인
from pandas import Series, DataFrame
import pandas as pd
import numpy as np
print(pd.__version__)
# Series 생성
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)
list_data = [11, 12, 13, 14, 15]
list_name = ['a', 'b', 'c', 'd', 'e']
obj = Series(data=list_data, index=list_name)
print(obj)
# 파이썬 딕셔너리를 이용해서 Series 생성하기
dic_data = {'a':21, 'b': 22, 'c' : 23, 'd' : 24, 'e': 25}
dic_obj = Series(data=dic_data, dtype=np.float, name="mySeries")
print(dic_obj)
# 데이터 참조하기
print(dic_obj["e"])
# 특정 인덱스의 값수정
dic_obj["e"] = 55.7
print(dic_obj)
# value와 index를 각각 파이썬 리스트로 추출
print(dic_obj.values)
print(dic_obj.index)
print(dic_obj[dic_obj > 22])
print(dic_obj * 1.5) # 브로드 캐스팅 가능
print(dic_obj)
# fillna를 이용하여 NaN 데이터 처리하기
dic_obj2.fillna(0)
dic_obj2['f'] = dic_obj2['g'] = dic_obj2['h'] = 0
04. DataFrame 생성 (0) | 2023.11.10 |
---|---|
02. Index 생성 (0) | 2023.11.09 |
01. 판다스 개요 (0) | 2023.11.09 |
댓글 영역