상세 컨텐츠

본문 제목

02. Index 생성

데이터 분석/판다스

by 알파고제로 2023. 11. 9. 08:47

본문

■ Index 생성

  • Index는 Series, DataFrame을 구성하는 요소
  • Series 생성방법과 유사하며 다양한 타입으로 작성할 수 있다.
  • Index는 따로 사용되기 보다는 Series와, DataFrame과 함께 사용하는 경우가 많다.
  • 다양한 연산 가능
pd.Index(data=None, dtype=None, copy=False, name=None, ...)

 

data 1차원 arrayIndex를 작성할 데이터.
dtype dtype을 작성하지 않으면 입력한 데이터와 맞는 타입으로 변환
copy 입력된 ndarray의 복사본을 생성
name Index의 이름을 설정

 

■ Index 객체의 종류

클래스의 종류 설명
RangeIndex 일련의 정수 범위의 Index
CategoricalIndex 범주형 Index
MultiIndex 단일 축에 여러 단계 Index를 표현하는 계층적 Index객체 (Tuple과 유사)
IntervalIndex 일정 간격을 갖는 Index
DatetimeIndex NumPydatetime64 타입으로 된 Index. 시계열 데이터의 Index로 많이 사용
Int64Index 정수형 레이블의 Index
Float64Index 실수형 레이블의 Index

 

■ Index 연산의 종류

메소드 설명
append() index 객체를 추가한 새로운 index 반환
difference() index차집합 반환
intersection() index의 교집합 반환
union() index의 합집합 반환
isin() index가 존재하는지 여부를 불리언 배열로 반환
delete() index가 삭제된 새로운 index 반환
drop() 값이 삭제된 새로운 index 반환
insert() index에 추가된 새로운 index 반환
is_unique() 중복되는 index가 없으면 True
unique() index에서 중복되는 요소를 제거하고 유일한 값만 반환

 

# Index 연산
import numpy  as np
import pandas as pd

# Index 객체 생성
idx1 = pd.Index([1, 2, 4, 6, 8])
idx2 = pd.Index([2, 4, 5, 6, 7]) 

print(idx1.append(idx2))    	# idx1에 idx2를 추가
print(idx1.difference(idx2))

print(idx1.intersection(idx2))
print(idx1.union(idx2))
print(idx1.delete(0))
print(idx1.drop(1))     		# 값 1이 삭제

print(idx1 - idx2)      		# 각 요소별 minus 연산

 

'데이터 분석 > 판다스' 카테고리의 다른 글

04. DataFrame 생성  (0) 2023.11.10
03. Series 생성  (0) 2023.11.09
01. 판다스 개요  (0) 2023.11.09

관련글 더보기

댓글 영역