Python 데이터 분석의 첫걸음
데이터 분석을 시작하려는 분이라면, 가장 먼저 마주치는 라이브러리가 바로 **판다스(Pandas)**입니다.
엑셀처럼 행과 열로 구성된 데이터를 코드로 자유롭게 다룰 수 있는 파이썬의 대표적인 도구죠.
오늘은 Pandas의 대표적인 기초 함수들과 함께, 간단한 인구통계 데이터를 분석해보겠습니다.
아래는 Pandas에서 자주 쓰이는 기본 함수들입니다.
보통 5행만 출력되어 데이터의 구조나 컬럼명을 빠르게 확인할 수 있습니다.
평균, 표준편차, 최소/최댓값, 분위수 등 요약 통계 제공
수치형 컬럼 분석에 매우 유용합니다.
지역별로 인구수를 합산해볼 수 있습니다.
여러 기준으로 나눠서 분석할 때 자주 사용됩니다.
엑셀의 피벗 테이블과 동일한 기능
기준에 따라 값을 요약해 보여주는 데 탁월합니다.
아래는 population.csv라는 가상의 데이터를 사용한 예시입니다.
다음 글에서는 결측치 처리와 데이터 정제를 다뤄보겠습니다.
궁금한 내용이나 예제 요청은 댓글로 남겨주세요!
| Matplotlib과 Seaborn으로 데이터 시각화 시작하기 (0) | 2025.07.17 |
|---|---|
| 넘파이 이론 – 데이터 분석의 기초 (3) | 2025.07.09 |
| 데이터란 무엇인가? (1) | 2025.07.08 |
| 📓 쥬피터 노트북(Jupyter Notebook)이란? (1) | 2025.07.05 |
| 파이썬 개발을 위한 첫걸음: 아나콘다 & VSCode 설치 방법 정리 (0) | 2025.07.05 |