■ Pandas의 개요
- 구조화된 데이터의 처리를 지원하는 Python 라이브러리 (파이썬 계의 엑셀!!!!)
- 데이터 분석과 편집에 강력
- 고성능 Array 계산 라이브러리인 NumPy와 통합하여, 강력한 “스프레드시트” 처리 기능을 제공.
- 인덱싱, 연산용 함수, 전 처리 함수 등을 제공
- 각 Column 별로 서로 다른 데이터 타입으로 구성 가능
- 최대 100G까지 메모리에 로딩 가능하므로 많은 양의 데이터를 처리하는데 적합
- URL : https://pandas.pydata.org/
■ Pandas의 구성 요소
- Series
- DataFrame 중에서 하나의 column에 해당하는 데이터
- 1차원 (index, values 2가지 요소)
- DataFrame
- Data Table 전체를 의미하는 용어
- 2차원 (index, columns, values ) 3가지 요소로 구성
- Index
- Series, DataFrame을 구성하는 이름. 다양한 타입으로 구성할 수 있다.
댓글 영역