๋จธ์ ๋ฌ๋ #2 - LOOCV, LOPCV
๋จธ์ ๋ฌ๋ #2 - LOOCV, LOPCV
๐ ๋ ๊ต์ฐจ๊ฒ์ฆ ๋ฐฉ์ LOOCV & LOPCV
๐งฌ LOOCV (Leave-One-Out Cross Validation)
๋ง ๊ทธ๋๋ก ํ๋ ๋นผ๊ณ ๋ค ํ์ตํ๋ ๋ฐฉ์์ด์ผ.
- ๋ฐ์ดํฐ์ ์ด N๊ฐ๋ผ๋ฉด, N๊ฐ์ fold๋ฅผ ๋ง๋๋ ๊ฒ๊ณผ ๊ฐ์.
- ๋งค๋ฒ ํ๋์ ์ํ๋ง ๊ฒ์ฆ์ฉ์ผ๋ก ๋นผ๊ณ , ๋๋จธ์ง N-1๊ฐ๋ก ํ์ต.
- ์ด ๊ณผ์ ์ N๋ฒ ๋ฐ๋ณตํ๊ณ , N๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ํ๊ท ๋.
์:
1
2
3
4
5
6
์ ์ฒด ๋ฐ์ดํฐ: [A, B, C, D]
1๋ฒ: ํ์ต [B, C, D], ๊ฒ์ฆ A
2๋ฒ: ํ์ต [A, C, D], ๊ฒ์ฆ B
3๋ฒ: ํ์ต [A, B, D], ๊ฒ์ฆ C
4๋ฒ: ํ์ต [A, B, C], ๊ฒ์ฆ D
์ฅ์
- ๋ฐ์ดํฐ๋ฅผ ๊ฑฐ์ ๋ชจ๋ ํ์ต์ ์ฌ์ฉ โ ํธํฅ(bias)โ
- ๊ฒ์ฆ ์ํ์ด ๋งค๋ฒ ํ๋๋ฟ โ ๋ถ์ฐ(variance)โ
๋จ์
- ๊ณ์ฐ๋ ํญ๋ฐ: ๋ฐ์ดํฐ ๋ง์ผ๋ฉด ํ์ต ํ์๋ ๋ง์
- ์์ธก ๊ฒฐ๊ณผ๊ฐ ๋ถ์์ ํ ์ ์์ (ํนํ ๋ ธ์ด์ฆ ๋ง์ ๋ฐ์ดํฐ์์)
๐ LOPCV (Leave-P-Out Cross Validation)
LOOCV์ ์ผ๋ฐํ ๋ฒ์ ์ด์ผ. ์ด๋ฒ์ โํ๋โ๊ฐ ์๋๋ผ P๊ฐ๋ฅผ ๋นผ๊ณ ๋๋จธ์ง๋ก ํ์ตํ๋ ๊ฑฐ์ง.
- ๋ฐ์ดํฐ์ ์์ ๊ฐ๋ฅํ ๋ชจ๋ P๊ฐ ์กฐํฉ์ ๊ฒ์ฆ ์ธํธ๋ก ์ฌ์ฉ.
- ๋จ์ NโP๊ฐ๋ก ํ์ต, P๊ฐ๋ก ๊ฒ์ฆ.
- ์ด๊ฑธ ๊ฐ๋ฅํ ๋ชจ๋ ์กฐํฉ์ ๋ํด ๋ฐ๋ณต.
์๋ฅผ ๋ค์ด:
- ๋ฐ์ดํฐ๊ฐ 5๊ฐ, P=2๋ผ๋ฉด ๊ฒ์ฆ ์กฐํฉ์ (A,B), (A,C), (A,D), โฆ (D,E) ๋ฑ ์ด 10๊ฐ์ง โ ์กฐํฉ ์๋
C(N, P)
์ฅ์
- ๋ค์ํ ๊ฒ์ฆ ํจํด์ผ๋ก ๋ชจ๋ธ์ ๊ฐ๊ฑด์ฑ ํ ์คํธ ๊ฐ๋ฅ
๋จ์
- P๊ฐ ์กฐ๊ธ๋ง ์ปค์ ธ๋ ์กฐํฉ ์๊ฐ ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐ โ ์ค์ ๋ก๋ ๊ฑฐ์ ์ ์
โ๏ธ ์์ฝ ๋น๊ต
| ๋ฐฉ๋ฒ | ๊ฒ์ฆ ์ํ ์ | ๋ฐ๋ณต ํ์ | ๊ณ์ฐ ๋น์ฉ | ์ฅ์ | ๋จ์ |
|---|---|---|---|---|---|
| K-Fold | N/K | K | ๋ณดํต | ํจ์จ์ , ์ ์ฐํ ๊ตฌ์ฑ ๊ฐ๋ฅ | K ์ค์ ์ ๋ฐ๋ผ ํธํฅ/๋ถ์ฐ ํธ๋ ์ด๋์คํ |
| LOOCV | 1 | N | ๋์ | ํธํฅ ์ ๊ณ , ๋ชจ๋ ๋ฐ์ดํฐ ํ์ฉ | ๊ณ์ฐ๋ ํผ, ๋ถ์ฐ ํผ |
| LOPCV | P | C(N, P) | ๋งค์ฐ ๋์ | ๋ค์ํ ํ๊ฐ ๊ฐ๋ฅ | ํ์ค์ ์ผ๋ก ๋๋ฆฌ๊ณ ๋ฌด๊ฑฐ์ |
LOOCV๋ ๋ฐ์ดํฐ๊ฐ ์ ์ ๋๋ง ์ฐ๋ ๊ฒ ํ์ค์ ์ด๊ณ , LOPCV๋ ๋ณดํต ์ด๋ก ์ฐ๊ตฌ์ฉ์ผ๋ก๋ง ๋จ์ ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง์.
This post is licensed under CC BY 4.0 by the author.