02. Index 생성

알파고제로 2023. 11. 9. 08:47

■ Index 생성

Index는 Series, DataFrame을 구성하는 요소
Series 생성방법과 유사하며 다양한 타입으로 작성할 수 있다.
Index는 따로 사용되기 보다는 Series와, DataFrame과 함께 사용하는 경우가 많다.
다양한 연산 가능

pd.Index(data=None, dtype=None, copy=False, name=None, ...)

data	1차원 array로 Index를 작성할 데이터.
dtype	dtype을 작성하지 않으면 입력한 데이터와 맞는 타입으로 변환
copy	입력된 ndarray의 복사본을 생성
name	Index의 이름을 설정

■ Index 객체의 종류

클래스의 종류	설명
RangeIndex	일련의 정수 범위의 Index
CategoricalIndex	범주형 Index
MultiIndex	단일 축에 여러 단계 Index를 표현하는 계층적 Index객체 (Tuple과 유사)
IntervalIndex	일정 간격을 갖는 Index
DatetimeIndex	NumPy의 datetime64 타입으로 된 Index. 시계열 데이터의 Index로 많이 사용
Int64Index	정수형 레이블의 Index
Float64Index	실수형 레이블의 Index

■ Index 연산의 종류

메소드	설명
append()	index 객체를 추가한 새로운 index 반환
difference()	index의 차집합 반환
intersection()	index의 교집합 반환
union()	index의 합집합 반환
isin()	index가 존재하는지 여부를 불리언 배열로 반환
delete()	index가 삭제된 새로운 index 반환
drop()	값이 삭제된 새로운 index 반환
insert()	index에 추가된 새로운 index 반환
is_unique()	중복되는 index가 없으면 True
unique()	index에서 중복되는 요소를 제거하고 유일한 값만 반환

# Index 연산
import numpy  as np
import pandas as pd

# Index 객체 생성
idx1 = pd.Index([1, 2, 4, 6, 8])
idx2 = pd.Index([2, 4, 5, 6, 7]) 

print(idx1.append(idx2))    	# idx1에 idx2를 추가
print(idx1.difference(idx2))

print(idx1.intersection(idx2))
print(idx1.union(idx2))
print(idx1.delete(0))
print(idx1.drop(1))     		# 값 1이 삭제

print(idx1 - idx2)      		# 각 요소별 minus 연산