상세 컨텐츠

본문 제목

01. 판다스 개요

데이터 분석/판다스

by 알파고제로 2023. 11. 9. 08:35

본문

■ Pandas의 개요

  • 구조화된 데이터의 처리를 지원하는 Python 라이브러리 (파이썬 계의 엑셀!!!!)
  • 데이터 분석과 편집에 강력
  • 고성능 Array 계산 라이브러리인 NumPy와 통합하여, 강력한 “스프레드시트” 처리 기능을 제공. 
  • 인덱싱, 연산용 함수, 전 처리 함수 등을 제공
  • 각 Column 별로 서로 다른 데이터 타입으로 구성 가능
  • 최대 100G까지 메모리에 로딩 가능하므로 많은 양의 데이터를 처리하는데 적합
  • URL : https://pandas.pydata.org/ 

 Pandas의 구성 요소

  1. Series
    • DataFrame 중에서 하나의 column에 해당하는 데이터
    • 1차원 (index, values 2가지 요소)

  2. DataFrame
    • Data Table 전체를 의미하는 용어
    • 2차원 (index, columns, values ) 3가지 요소로 구성

  3. Index
    • Series, DataFrame을 구성하는 이름. 다양한 타입으로 구성할 수 있다.

출처: https://pandas.pydata.org/docs/getting_started/intro_tutorials/01_table_oriented.html

 

Pandas의 구성

 

'데이터 분석 > 판다스' 카테고리의 다른 글

04. DataFrame 생성  (0) 2023.11.10
03. Series 생성  (0) 2023.11.09
02. Index 생성  (0) 2023.11.09

관련글 더보기

댓글 영역