데이터 분석/판다스
02. Index 생성
알파고제로
2023. 11. 9. 08:47
■ Index 생성
- Index는 Series, DataFrame을 구성하는 요소
- Series 생성방법과 유사하며 다양한 타입으로 작성할 수 있다.
- Index는 따로 사용되기 보다는 Series와, DataFrame과 함께 사용하는 경우가 많다.
- 다양한 연산 가능
pd.Index(data=None, dtype=None, copy=False, name=None, ...) |
data | 1차원 array로 Index를 작성할 데이터. |
dtype | dtype을 작성하지 않으면 입력한 데이터와 맞는 타입으로 변환 |
copy | 입력된 ndarray의 복사본을 생성 |
name | Index의 이름을 설정 |
■ Index 객체의 종류
클래스의 종류 | 설명 |
RangeIndex | 일련의 정수 범위의 Index |
CategoricalIndex | 범주형 Index |
MultiIndex | 단일 축에 여러 단계 Index를 표현하는 계층적 Index객체 (Tuple과 유사) |
IntervalIndex | 일정 간격을 갖는 Index |
DatetimeIndex | NumPy의 datetime64 타입으로 된 Index. 시계열 데이터의 Index로 많이 사용 |
Int64Index | 정수형 레이블의 Index |
Float64Index | 실수형 레이블의 Index |
■ Index 연산의 종류
메소드 | 설명 |
append() | index 객체를 추가한 새로운 index 반환 |
difference() | index의 차집합 반환 |
intersection() | index의 교집합 반환 |
union() | index의 합집합 반환 |
isin() | index가 존재하는지 여부를 불리언 배열로 반환 |
delete() | index가 삭제된 새로운 index 반환 |
drop() | 값이 삭제된 새로운 index 반환 |
insert() | index에 추가된 새로운 index 반환 |
is_unique() | 중복되는 index가 없으면 True |
unique() | index에서 중복되는 요소를 제거하고 유일한 값만 반환 |
# Index 연산
import numpy as np
import pandas as pd
# Index 객체 생성
idx1 = pd.Index([1, 2, 4, 6, 8])
idx2 = pd.Index([2, 4, 5, 6, 7])
print(idx1.append(idx2)) # idx1에 idx2를 추가
print(idx1.difference(idx2))
print(idx1.intersection(idx2))
print(idx1.union(idx2))
print(idx1.delete(0))
print(idx1.drop(1)) # 값 1이 삭제
print(idx1 - idx2) # 각 요소별 minus 연산