상세 컨텐츠

본문 제목

03. Series 생성

데이터 분석/판다스

by 알파고제로 2023. 11. 9. 08:52

본문

■ Series 생성

  • Pandas의 Series은 Series()이라는 클래스를 이용해 생성 가능하다
  • Series는 numpy의 reference이다.
pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

 

data SeriesDataFrame을 작성할 데이터.
Series를 생성할 때에는 python list, DataFrame을 생성할 때에는 pythondictionary를 이용할 수 있다.
index Pandas 객체를 생성할 때 사용할 인덱스 명. 인덱스명을 지정하지 않으면 0~ 정수 값으로 지정된다.
columns DataFrame의 컬럼 명 지정.
dtype 데이터 타입의 설정
name DataFrame이나 Series의 이름을 설정

 

  • Series의 생성
from pandas import Series, DataFrame
import pandas as pd
import numpy as np

print(pd.__version__)

# Series 생성
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)

list_data = [11, 12, 13, 14, 15]
list_name = ['a', 'b', 'c', 'd', 'e']
obj = Series(data=list_data, index=list_name)
print(obj)

# 파이썬 딕셔너리를 이용해서 Series 생성하기
dic_data = {'a':21, 'b': 22, 'c' : 23, 'd' : 24, 'e': 25}
dic_obj = Series(data=dic_data, dtype=np.float, name="mySeries")

print(dic_obj)

 

import pandas as pd
import numpy as np

score_mat = {'홍길동': 97, 
         '임꺽정': 88, 
         '전우치': 91, 
         '손오공': 76, 
         '저팔계': 88, 
         '사오정': 87}
mat = pd.Series(score_mat)
mat

mat['손오공']
mat['임꺽정' : '저팔계']
mat.values
mat.value_counts()
mat.index
'손오공' in mat
mat.isin([97, 88])	 # value data 중 데이터가 있는지 확인

 

from pandas import Series, DataFrame
import pandas as pd
import numpy as np

print(pd.__version__)

# Series 생성
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)

list_data = [11, 12, 13, 14, 15]
list_name = ['a', 'b', 'c', 'd', 'e']
obj = Series(data=list_data, index=list_name)
print(obj)

# 파이썬 딕셔너리를 이용해서 Series 생성하기
dic_data = {'a':21, 'b': 22, 'c' : 23, 'd' : 24, 'e': 25}
dic_obj = Series(data=dic_data, dtype=np.float, name="mySeries")

print(dic_obj)

 

  • 데이터 참조
# 데이터 참조하기
print(dic_obj["e"])

# 특정 인덱스의 값수정
dic_obj["e"] = 55.7
print(dic_obj)

# value와 index를 각각 파이썬 리스트로 추출 
print(dic_obj.values)
print(dic_obj.index)
print(dic_obj[dic_obj > 22])
print(dic_obj * 1.5)   # 브로드 캐스팅 가능
print(dic_obj)

# fillna를 이용하여 NaN 데이터 처리하기
dic_obj2.fillna(0)
dic_obj2['f'] = dic_obj2['g'] = dic_obj2['h'] = 0

'데이터 분석 > 판다스' 카테고리의 다른 글

04. DataFrame 생성  (0) 2023.11.10
02. Index 생성  (0) 2023.11.09
01. 판다스 개요  (0) 2023.11.09

관련글 더보기

댓글 영역