03. Series 생성

Python 데이터 분석/판다스

by 알파고제로 2023. 11. 9. 08:52

■ Series 생성

Pandas의 Series은 Series()이라는 클래스를 이용해 생성 가능하다
Series는 numpy의 reference이다.

pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

data	Series나 DataFrame을 작성할 데이터. Series를 생성할 때에는 python의 list, DataFrame을 생성할 때에는 python의 dictionary를 이용할 수 있다.
index	Pandas 객체를 생성할 때 사용할 인덱스 명. 인덱스명을 지정하지 않으면 0~ 정수 값으로 지정된다.
columns	DataFrame의 컬럼 명 지정.
dtype	데이터 타입의 설정
name	DataFrame이나 Series의 이름을 설정

Series의 생성

from pandas import Series, DataFrame
import pandas as pd
import numpy as np

print(pd.__version__)

# Series 생성
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)

list_data = [11, 12, 13, 14, 15]
list_name = ['a', 'b', 'c', 'd', 'e']
obj = Series(data=list_data, index=list_name)
print(obj)

# 파이썬 딕셔너리를 이용해서 Series 생성하기
dic_data = {'a':21, 'b': 22, 'c' : 23, 'd' : 24, 'e': 25}
dic_obj = Series(data=dic_data, dtype=np.float, name="mySeries")

print(dic_obj)

import pandas as pd
import numpy as np

score_mat = {'홍길동': 97, 
         '임꺽정': 88, 
         '전우치': 91, 
         '손오공': 76, 
         '저팔계': 88, 
         '사오정': 87}
mat = pd.Series(score_mat)
mat

mat['손오공']
mat['임꺽정' : '저팔계']
mat.values
mat.value_counts()
mat.index
'손오공' in mat
mat.isin([97, 88])	 # value data 중 데이터가 있는지 확인

from pandas import Series, DataFrame
import pandas as pd
import numpy as np

print(pd.__version__)

# Series 생성
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)

list_data = [11, 12, 13, 14, 15]
list_name = ['a', 'b', 'c', 'd', 'e']
obj = Series(data=list_data, index=list_name)
print(obj)

# 파이썬 딕셔너리를 이용해서 Series 생성하기
dic_data = {'a':21, 'b': 22, 'c' : 23, 'd' : 24, 'e': 25}
dic_obj = Series(data=dic_data, dtype=np.float, name="mySeries")

print(dic_obj)

데이터 참조

# 데이터 참조하기
print(dic_obj["e"])

# 특정 인덱스의 값수정
dic_obj["e"] = 55.7
print(dic_obj)

# value와 index를 각각 파이썬 리스트로 추출 
print(dic_obj.values)
print(dic_obj.index)
print(dic_obj[dic_obj > 22])
print(dic_obj * 1.5)   # 브로드 캐스팅 가능
print(dic_obj)

# fillna를 이용하여 NaN 데이터 처리하기
dic_obj2.fillna(0)
dic_obj2['f'] = dic_obj2['g'] = dic_obj2['h'] = 0