■ Index 생성
- Index는 Series, DataFrame을 구성하는 요소
- Series 생성방법과 유사하며 다양한 타입으로 작성할 수 있다.
- Index는 따로 사용되기 보다는 Series와, DataFrame과 함께 사용하는 경우가 많다.
- 다양한 연산 가능
| pd.Index(data=None, dtype=None, copy=False, name=None, ...) |
| data |
1차원 array로 Index를 작성할 데이터. |
| dtype |
dtype을 작성하지 않으면 입력한 데이터와 맞는 타입으로 변환 |
| copy |
입력된 ndarray의 복사본을 생성 |
| name |
Index의 이름을 설정 |
■ Index 객체의 종류
| 클래스의 종류 |
설명 |
| RangeIndex |
일련의 정수 범위의 Index |
| CategoricalIndex |
범주형 Index |
| MultiIndex |
단일 축에 여러 단계 Index를 표현하는 계층적 Index객체 (Tuple과 유사) |
| IntervalIndex |
일정 간격을 갖는 Index |
| DatetimeIndex |
NumPy의 datetime64 타입으로 된 Index. 시계열 데이터의 Index로 많이 사용 |
| Int64Index |
정수형 레이블의 Index |
| Float64Index |
실수형 레이블의 Index |
■ Index 연산의 종류
| 메소드 |
설명 |
| append() |
index 객체를 추가한 새로운 index 반환 |
| difference() |
index의 차집합 반환 |
| intersection() |
index의 교집합 반환 |
| union() |
index의 합집합 반환 |
| isin() |
index가 존재하는지 여부를 불리언 배열로 반환 |
| delete() |
index가 삭제된 새로운 index 반환 |
| drop() |
값이 삭제된 새로운 index 반환 |
| insert() |
index에 추가된 새로운 index 반환 |
| is_unique() |
중복되는 index가 없으면 True |
| unique() |
index에서 중복되는 요소를 제거하고 유일한 값만 반환 |
# Index 연산
import numpy as np
import pandas as pd
# Index 객체 생성
idx1 = pd.Index([1, 2, 4, 6, 8])
idx2 = pd.Index([2, 4, 5, 6, 7])
print(idx1.append(idx2)) # idx1에 idx2를 추가
print(idx1.difference(idx2))
print(idx1.intersection(idx2))
print(idx1.union(idx2))
print(idx1.delete(0))
print(idx1.drop(1)) # 값 1이 삭제
print(idx1 - idx2) # 각 요소별 minus 연산
댓글 영역