Post

머신러닝 #3 - 분류와 회귀

머신러닝 #3 - 분류와 회귀

📚 분류와 회귀 (Classifier & Regressor)

머신러닝에서 가장 기본이자 널리 쓰이는 두 가지 모델이 있다:
분류(classification)회귀(regression).

이 문서에서는 두 개념을 예시 중심으로 쉽게 이해하고, 핵심 원리를 정리한다.


Classifier란 무엇인가?

데이터를 받아 미리 정해진 카테고리(Class) 중 하나로 분류하는 모델.


🔍 예시로 이해하기

다음 문장을 보고 직접 분류해보자:

  • “이 영화는 정말 최고였어.” → 긍정
  • “시간 낭비였다.” → 부정
  • “연기는 괜찮았는데, 스토리는 별로였어.” → 부정

이처럼 문장의 의미나 단어들을 보고 감정(긍정/부정)을 분류하는 것이 바로 classifier의 역할.


🧠 핵심 개념

  • Classifier: 입력 데이터를 분류하는 모델
  • 입력 (features): 텍스트, 이미지, 숫자 등
  • 출력 (label): “긍정/부정”, “개/고양이”, “스팸/정상” 등
  • 학습 (training): 데이터를 보고 규칙을 학습함

⚙️ 주요 유형

  • 이진 분류 (Binary Classification)
    예: 스팸 메일인가 아닌가?

  • 다중 분류 (Multiclass Classification)
    예: 뉴스 기사 → 정치 / 스포츠 / 경제

  • 모델 예시:

    • Naive Bayes
    • SVM (Support Vector Machine)
    • Logistic Regression
    • Neural Networks

Regressor란 무엇인가?

데이터를 받아 숫자 값을 예측하는 모델


🔍 예시로 이해하기

입력: “햇빛이 잘 들고, 과일이 많은 여름날”
출력: “기온은 약 29도일 거야.”


🧠 핵심 개념

  • Regressor: 입력 데이터를 숫자로 예측하는 모델
  • 입력 (features): 면적, 위치, 나이 등
  • 출력 (label): 가격, 온도, 점수 등 연속적인 수치
  • 학습 (training): 데이터를 보고 숫자 예측 방법을 학습함

⚙️ 주요 유형

  • 선형 회귀 (Linear Regression)
    간단하고 빠른 회귀 모델

  • 다항 회귀 (Polynomial Regression)
    비선형적인 곡선 형태도 다룰 수 있음

  • 랜덤 포레스트 회귀 (Random Forest Regressor)
    여러 개의 결정 트리를 합친 앙상블 회귀

  • 신경망 회귀 (Neural Network Regression)
    복잡한 관계도 학습 가능


✅ 분류와 회귀 비교 요약

항목ClassifierRegressor
목적카테고리 분류숫자 예측
출력정해진 클래스 (ex. 고양이/개)연속적인 수치 (ex. 가격, 온도)
예시스팸 메일 여부내일 기온 예측
대표 모델SVM, Naive Bayes 등Linear Regression, Random Forest 등

💡 핵심 요약

Classifier는 데이터를 보고
“이건 어떤 범주(class)에 속하지?”를 예측하는 모델이다.

Regressor는 데이터를 보고
“이건 숫자로 따지면 얼마일까?”를 예측하는 모델이다.

This post is licensed under CC BY 4.0 by the author.

Trending Tags