머신러닝 #3 - 분류와 회귀
머신러닝 #3 - 분류와 회귀
📚 분류와 회귀 (Classifier & Regressor)
머신러닝에서 가장 기본이자 널리 쓰이는 두 가지 모델이 있다:
분류(classification)와 회귀(regression).
이 문서에서는 두 개념을 예시 중심으로 쉽게 이해하고, 핵심 원리를 정리한다.
Classifier란 무엇인가?
데이터를 받아 미리 정해진 카테고리(Class) 중 하나로 분류하는 모델.
🔍 예시로 이해하기
다음 문장을 보고 직접 분류해보자:
- “이 영화는 정말 최고였어.” → 긍정
- “시간 낭비였다.” → 부정
- “연기는 괜찮았는데, 스토리는 별로였어.” → 부정
이처럼 문장의 의미나 단어들을 보고 감정(긍정/부정)을 분류하는 것이 바로 classifier의 역할.
🧠 핵심 개념
- Classifier: 입력 데이터를 분류하는 모델
- 입력 (features): 텍스트, 이미지, 숫자 등
- 출력 (label): “긍정/부정”, “개/고양이”, “스팸/정상” 등
- 학습 (training): 데이터를 보고 규칙을 학습함
⚙️ 주요 유형
이진 분류 (Binary Classification)
예: 스팸 메일인가 아닌가?다중 분류 (Multiclass Classification)
예: 뉴스 기사 → 정치 / 스포츠 / 경제모델 예시:
- Naive Bayes
- SVM (Support Vector Machine)
- Logistic Regression
- Neural Networks
Regressor란 무엇인가?
데이터를 받아 숫자 값을 예측하는 모델
🔍 예시로 이해하기
입력: “햇빛이 잘 들고, 과일이 많은 여름날”
출력: “기온은 약 29도일 거야.”
🧠 핵심 개념
- Regressor: 입력 데이터를 숫자로 예측하는 모델
- 입력 (features): 면적, 위치, 나이 등
- 출력 (label): 가격, 온도, 점수 등 연속적인 수치
- 학습 (training): 데이터를 보고 숫자 예측 방법을 학습함
⚙️ 주요 유형
선형 회귀 (Linear Regression)
간단하고 빠른 회귀 모델다항 회귀 (Polynomial Regression)
비선형적인 곡선 형태도 다룰 수 있음랜덤 포레스트 회귀 (Random Forest Regressor)
여러 개의 결정 트리를 합친 앙상블 회귀신경망 회귀 (Neural Network Regression)
복잡한 관계도 학습 가능
✅ 분류와 회귀 비교 요약
| 항목 | Classifier | Regressor |
|---|---|---|
| 목적 | 카테고리 분류 | 숫자 예측 |
| 출력 | 정해진 클래스 (ex. 고양이/개) | 연속적인 수치 (ex. 가격, 온도) |
| 예시 | 스팸 메일 여부 | 내일 기온 예측 |
| 대표 모델 | SVM, Naive Bayes 등 | Linear Regression, Random Forest 등 |
💡 핵심 요약
Classifier는 데이터를 보고
“이건 어떤 범주(class)에 속하지?”를 예측하는 모델이다.
Regressor는 데이터를 보고
“이건 숫자로 따지면 얼마일까?”를 예측하는 모델이다.
This post is licensed under CC BY 4.0 by the author.