Post

머신러닝 #8 - 회귀모델의 성능지표

머신러닝 #8 - 회귀모델의 성능지표

📚 회귀모델의 성능지표

회귀(regression)는 연속적인 수치 예측 문제이기 때문에, 분류 문제에서 쓰는 정확도(accuracy) 같은 지표는 쓸 수 없고, 예측값과 실제값의 차이를 측정하는 방식이 필요하다. 이 차이를 어떻게 재느냐에 따라 다양한 성능지표가 생긴다.


🔧 1. 왜 알아야 하는가?

회귀 성능지표는 모델이 얼마나 잘 예측하는지, 과적합(overfitting) 또는 과소적합(underfitting) 여부를 판단할 수 있게 해준다. 어떤 지표를 쓰느냐에 따라 해석도 다르고, 모델 선택도 달라진다.


🧭 2. 전체 구조

회귀 성능지표는 크게 다음 네 가지 유형으로 나뉜다:

  1. 오차의 크기 중심 지표
  2. 오차의 제곱 중심 지표
  3. 상대 오차 중심 지표
  4. 설명력 중심 지표

📐 3. 핵심 성능지표 설명

① MAE (Mean Absolute Error) – 평균 절댓값 오차

  • 정의: 오차(예측값 - 실제값)의 절댓값 평균
  • 직관성: 사람에게 가장 직관적인 지표
  • 공식:

    \[\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|\]
  • 특징: 이상치(outlier)에 덜 민감함

② MSE (Mean Squared Error) – 평균 제곱 오차

  • 정의: 오차를 제곱한 뒤 평균
  • 공식:

    \[\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2\]
  • 특징: 큰 오차를 더 크게 패널티
  • 활용: 미분이 잘 돼서 학습에 자주 사용 (ex. Gradient Descent)

③ RMSE (Root Mean Squared Error) – 제곱 평균 오차의 제곱근

  • 정의: MSE의 단위를 맞추기 위해 루트를 씌운 것
  • 공식:

    \[\text{RMSE} = \sqrt{ \text{MSE} }\]
  • 해석: 실제값과 예측값의 평균적인 거리

④ MAPE (Mean Absolute Percentage Error) – 평균 절댓값 백분율 오차

  • 정의: 예측오차를 실제값 대비 비율로 측정
  • 공식:

    \[\text{MAPE} = \frac{100}{n} \sum_{i=1}^{n} \left| \frac{y_i - \hat{y}_i}{y_i} \right|\]
  • 주의점: 실제값이 0에 가까울수록 오차가 폭증 (→ 0 division 문제)

⑤ R² (결정계수, Coefficient of Determination)

  • 정의: 전체 변동성 중 예측이 설명한 비율
  • 공식:

    \[R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2}\]
  • 해석:

    • 1: 완벽 예측
    • 0: 평균값 예측과 동일
    • <0: 평균보다도 못함
  • 장점: 모델의 설명력을 직관적으로 파악

🎯 4. 예시로 이해해보기

실제값: [100, 200, 300] 예측값: [110, 190, 310]

  • MAE = (10 + 10 + 10) / 3 = 10
  • MSE = (100 + 100 + 100) / 3 = 100
  • RMSE = √100 = 10
  • MAPE = [(10/100 + 10/200 + 10/300)/3] × 100 ≈ 6.1%
  • R² = 1 - (MSE / 분산) → 분산에 따라 변동, 보통 높을수록 좋음

⚠️ 5. 주의할 점

  • MSE와 RMSE는 이상치에 민감 → outlier가 많으면 MAE나 MAPE 추천
  • MAPE는 0에 민감 → target이 0 근처인 문제엔 쓰지 말 것
  • R²는 비교 지표일 뿐, 절대 기준은 아님

🧩 6. 요약 정리

지표직관성이상치 민감도용도
MAE높음낮음직관적 해석
MSE낮음높음학습 최적화
RMSE중간높음MSE 보완
MAPE비율 해석0에 민감실무 보고용
상대적 설명력-모델 비교용

This post is licensed under CC BY 4.0 by the author.

Trending Tags