데이터 분석을 시작했다면, 이제 중요한 건 데이터를 눈으로 확인하는 시각화입니다. 이번 글에서는 파이썬의 대표적인 시각화 라이브러리인 Matplotlib과 Seaborn의 기본 사용법을 소개합니다.
1. 시각화가 왜 중요한가?
수치로 보는 것보다 시각적으로 표현하면 데이터의 흐름, 패턴, 이상치 등을 한눈에 파악할 수 있습니다.
또한, 분석 결과를 다른 사람에게 설명할 때도 시각화는 매우 강력한 도구입니다.
2. Matplotlib 기초 사용법
Matplotlib은 파이썬에서 가장 기본적인 시각화 도구입니다.
2-1. 기본 선 그래프
python
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [10, 8, 6, 4, 2] plt.plot(x, y) plt.title("기본 선 그래프") plt.xlabel("x값") plt.ylabel("y값") plt.show()
2-2. 바 차트 (Bar Chart)
python
fruits = ['사과', '바나나', '체리'] counts = [10, 5, 7] plt.bar(fruits, counts) plt.title("과일 수량") plt.show()
2-3. 히스토그램
python
import numpy as np data = np.random.randn(1000) plt.hist(data, bins=30) plt.title("히스토그램") plt.show()
3. Seaborn으로 더 아름답게 그리기
Seaborn은 Matplotlib을 기반으로 좀 더 세련된 시각화를 쉽게 만들어줍니다.
python
import seaborn as sns import pandas as pd # 예시 데이터셋: 타이타닉 titanic = sns.load_dataset('titanic')
3-1. 막대 그래프 (countplot)
python
sns.countplot(data=titanic, x='class') plt.title("승객 클래스별 인원 수") plt.show()
3-2. 상자 그림 (boxplot)
python
sns.boxplot(data=titanic, x='class', y='age') plt.title("클래스별 나이 분포") plt.show()
3-3. 히트맵 (heatmap)
python
corr = titanic.corr(numeric_only=True) sns.heatmap(corr, annot=True, cmap='coolwarm') plt.title("수치형 변수 간 상관관계") plt.show()
4. 시각화 팁
- 한글 폰트 설정이 필요하다면 matplotlib.rcParams['font.family']을 이용하세요.
- Seaborn은 색상 테마 설정도 가능합니다: sns.set_style('whitegrid')
5. 마무리
Matplotlib과 Seaborn을 활용하면 데이터 분석의 결과를 더 쉽게 이해하고 전달할 수 있습니다.