데이터 분석/시각화
01. 시각화 개념
알파고제로
2023. 11. 2. 08:35
■ 시각화란?
- 수집된 원본 데이터나 분석된 결과를 점, 선, 면으로 이루어진 다양한 종류의 그래프로 표현하는 것
■ 시각화를 하는 이유
- 분석된 정보를 그래프 등을 통해 확인하면 데이터에 대해 더욱 잘 이해할 수 있게 된다.
■ 시각화 라이브러리의 종류
- matplotlib, seaborn, plotnine, folium, poly.ly, pyecharts 등이 있다.
- 자바스크립트 기반 라이브러리인 d3.js 등으로도 시각화 가능.
- scikit-learn 등의 패키지에서도 제공되는 시각화 기능이 존재
- matplotlib, seaborn이 많이 사용된다.
■ matplotlib의 특징
- 정형화된 차트 이외에도 저수준 api를 사용한 다양한 시각화 기능을 제공.
- 2차원 평면 그래프를 간단하게 그릴 수 있다.
- 사이트 : http://www.matplotlib.org
■ matplotlib로 그릴 수 있는 그래프 종류
- 선그래프 (Line chart)
- 막대그래프 (Bar chart)
- 산점도 (scatter plot)
- 누적 막대 그래프 (stack bar chart)
- Back-to-Back 그래프
- Pie 차트
- 히스토그램 (Histogram)
- 이미지파일 그리기