1. ๋ฒ ์ด์ง์ ๊ฒฐ์ ์ด๋ก
๋จธ์ ๋ฌ๋์์ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ํ ๋, ์ด๋ค ๊ธฐ์ค์ผ๋ก "์ต์ ์ ๋ถ๋ฅ๊ธฐ"๋ผ๊ณ ๋ถ๋ฅผ ์ ์์๊น?
์์ธก์ ์์ค์ ์ต์ํํ๋ ๋ถ๋ฅ๊ธฐ๊ฐ ์ต์ ์ด๋ผ๊ณ ํ ์ ์๋ค. ์ด๋ ์ฌ์ฉ๋๋ ์ด๋ก ์ด ๋ฒ ์ด์ง์ ๊ฒฐ์ ์ด๋ก ์ด๋ค.
๋ฒ ์ด์ง์ ๊ฒฐ์ ์ด๋ก : ์ด๋ก ์ ์ผ๋ก ์์ค์ ์ต์ํํ๋ ๋ถ๋ฅ ๊ธฐ์ค์ ์ ์ํ๋ค.
๋ค์ค ํด๋์ค ๋ถ๋ฅ
- ๋ถ๋ฅ ๋ผ๋ฒจ ์งํฉ : Y={c1โ,c2โ,...,cNโ}
- ์ด๋ค ์ํ x๊ฐ ์ฃผ์ด์ก์ ๋, ์ฐ๋ฆฌ๋ x๋ฅผ ์ด๋ ํด๋์ค
๊ฐ ์ํ x์ ๋ํด h๊ฐ ์์ค R(h(x)|x)๋ฅผ ์ต์ํํ ์ ์๋ค๋ฉด ์ ์ฒด ๋ฆฌ์คํฌ๋ ์ต์ํํ ์ ์๋ค.
๋ฒ ์ด์ฆ ๊ฒฐ์ ๊ท์น : ๊ฐ ์ํ์ ๋ํ์ฌ R(c|x)๋ฅผ ์ต์ํํ๋ ํด๋์ค ๋ ์ด๋ธ์ ์ ํํ๋ค.
์ค์ฐจ์จ ์ต์ํ๋ฅผ ๋ชฉํ๋ก ํ ๋
- ๋จ์ํ ๋ถ๋ฅ๊ธฐ์ ์ค์ฐจ์จ์ ์ต์ํํ๋ ๊ฒ์ด ๋ชฉํ๋ผ๋ฉด?
- ์์ค ํจ์๋ ๋ค์๊ณผ ๊ฐ์ด ๋จ์ํ๋๋ค.
- ์ด ๊ฒฝ์ฐ์ ์กฐ๊ฑด๋ถ ์์ค์ ๋ค์๊ณผ ๊ฐ๋ค.
์ฌํํ๋ฅ (P(c|x))์ด ๊ฐ์ฅ ๋์ ํด๋์ค๋ฅผ ์ ํํ๋ฉด ๋๋ค.
๋ฒ ์ด์ฆ ๊ฒฐ์ ๊ท์น์ ์ฌ์ฉํ์ฌ ์์ค์ ์ต์ํํ๋ ค๋ฉด ์ฌํ ํ๋ฅ P(c|x)๋ฅผ ์์์ผ ํ๋ค. ํ์ง๋ง ํ์ค ๋ฌธ์ ์์ ์ด๋ฅผ ์ง์ ์ป๋ ๊ฒ์ ๋งค์ฐ ์ด๋ ค์ด ์ผ์ด๋ค. ํ๋ฅ ์ ํ๋ ์์ํฌ ํ์์ ๋จธ์ ๋ฌ๋์ ์ ํํ ์ํ ๋ฐ์ดํฐ์ ๋ํ ๊ธฐ๋ฐํ์ฌ ์ต๋ํ ์ ํํ๊ฒ ์ฌํ ํ๋ฅ P(c|x)๋ฅผ ์์ธกํ๋ ๊ฒ์ด๋ค.
๋ฒ ์ด์ฆ ์ ๋ฆฌ : ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ๊ณ์ฐํ๋ ๊ณต์
[example]
๊ฒฝ๊ธฐ๋์ ์ด๋ค ๊ตฐ์์๋ ์ฃผ๋ฏผ ์ค 15%๊ฐ ๊ฐ๊ธฐ์ ๊ฑธ๋ฆฐ๋ค. ๊ฐ๊ธฐ ํ์์ 50%๋ ๊ธฐ์นจ ์ฆ์์ ๋ณด์ธ๋ค.
๊ทธ๋ฌ๋ ์ ์ฒด ์ฃผ๋ฏผ์ 20%๋ ๊ฐ๊ธฐ์ ๋ฌด๊ดํ๊ฒ ๊ฐ๋ ๊ธฐ์นจ์ ํ๋ค.
์ด์ ํ ์ฌ๋์ด ๊ธฐ์นจ์ ํ์ ๋, ์ด ์ฌ๋์ด ๊ฐ๊ธฐ์ผ ํ๋ฅ ์?
P(๊ฐ๊ธฐ) = 0.15
P(๊ธฐ์นจ|๊ฐ๊ธฐ) = 0.5
P(๊ธฐ์นจ) = 0.2
P(๊ฐ๊ธฐ|๊ธฐ์นจ) = P(๊ฐ๊ธฐ) * P(๊ธฐ์นจ|๊ฐ๊ธฐ) / P(๊ธฐ์นจ) = 0.15 * 0.5 / 0.2 = 0.375
- P(c) : ์ฌ์ ํ๋ฅ , ์ฌ์ ์ ์๊ณ ์๋ ํ๋ฅ ์ด๋ฉฐ, ์ด ๋ c๋ ๋ฐ์ดํฐ๋ฅผ ํตํด ์ถ์ ํ๊ณ ์ ํ๋ ๊ฐ. ๋ถ๋ฅ ๋ฌธ์ ์์๋ ์ ์ฒด์ ์ธ ํด๋์ค์ ๋ถํฌ๋ฅผ ๋งํ๋ค.
- P(x|c) : ์ฐ๋, c์ ๋ํ ๊ฐ์ ์ ํ ์ํ์์ ๋ฐ์ดํฐ์ ๋ถํฌ (๋ก์ง์คํฑ ํ๊ท ์์)
- P(x) : ์ฃผ๋ณ ํ๋ฅ , ๋ฐ์ดํฐ x ์์ฒด์ ๋ถํฌ
- P(c|x) : ์ฌํ ํ๋ฅ , ๋ฐ์ดํฐ x๊ฐ ์ฃผ์ด์ก์ ๋ ๊ฐ ํด๋์ค์ ์ํ ํ๋ฅ
P(x)๋ ์์, P(c)๋ ๋์์ ๋ฒ์น์ ์ํด ํ๋ จ ์ธํธ ์์์ ๊ฐ ํด๋์ค ์ํ์ ์ถํ๋น๋๋ฅผ ํตํด ๊ณ์ฐํ ์ ์๋ค.
2. ์ต๋ ์ฐ๋ ์ถ์ (MLE)
์ฐ๋๋, ์ด๋ค ํ๋ผ๋ฏธํฐ θ ํ์์ ๊ด์ธก๋ ๋ฐ์ดํฐ D๊ฐ ๋ํ๋ ํ๋ฅ ์ ์๋ฏธํ๋ค.
MLE๋ ์ฐ๋๋ฅผ ์ต๋ํํ๋ ํ๋ผ๋ฏธํฐ θ ๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ด๋ค.
P(x|c)๊ฐ ์ ํด์ง ํ์์ด ์๊ณ , ์ด ๋, ํ๋ผ๋ฏธํฐ θc์ ์ํด์๋ง ๊ฒฐ์ ๋๋ค๊ณ ๊ฐ์ ํ์.
Dc๋ก ํ๋ จ ์ธํธ D์์ cํด๋์ค ์ํ๋ก ๊ตฌ์ฑ๋ ์งํฉ์ ๋ํ๋ด๊ณ , ์ด๋ฐ ์ํ๋ค์ด ๋ ๋ฆฝํญ๋ฑ๋ถํฌ๋ผ๊ณ ๊ฐ์ ํ๋ค๋ฉด ๋ฐ์ดํฐ ์ธํธ Dc์ ๋ํ ํ๋ผ๋ฏธํฐ θc์ ์ฐ๋๋ ๋ค์๊ณผ ๊ฐ๋ค.
์ดํญ ๋ถํฌ (๋ก์ง์คํฑ ํ๊ท)
P(x|c) = θ^5(1-θ)^2
LL = 5lnθ + 2ln(1-θ)
๋ฏธ๋ถํ๋ฉด 5/θ - 2/(1-θ) = 0
5/θ = 2/(1-θ)
๊ณ์ฐํ๋ฉด θ = 5/7 ์ด๋ค.
์ฐ์ํ ๋ณ์ (์ ๊ท๋ถํฌ ๊ฐ์ )
MLE์ ํ๊ณ
- ์ด๋ฌํ ํ๋ผ๋ฏธํฐํ ๋ฐฉ๋ฒ์ ํด๋์ค ์กฐ๊ฑด ํ๋ฅ ์ถ์ ์ ์๋์ ์ผ๋ก ๊ฐ๋จํ๊ฒ ๋ง๋ค๊ธฐ๋ ํ๋, ์ถ์ ๊ฒฐ๊ณผ์ ์ ํ์ฑ์ ๊ฐ์ ํ๋ ํ๋ฅ ๋ถํฌ ํ์์ด ์ ์ฌ์ ์ธ ์ค์ ๋ฐ์ดํฐ ๋ถํฌ์ ์ผ๋ง๋ ์ผ์นํ๋์ง์ ๊ณผํ๊ฒ ์์กดํ๊ฒ ๋๋ค.
- ํ๋ฅ ๋ถํฌ ํ์์ ๋ํด ๋ง์๋๋ก ์์ธกํ๊ณ ๊ฐ์ ํ๋ฉด ์๋ชป๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ๊ฐ๋ฅ์ฑ์ด ํฌ๋ค.
3. ๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ
ํ๋ผ๋ฏธํฐํ ์์ด ๋ถ๋ฅํ ์ ์๋ ๋ฐฉ๋ฒ์ ์์๊น?
๋ฌธ์ ๋ ์ฐ๋ P(x|c)๋ฅผ ๊ณ์ฐํ ๋ ์ด๊ฒ์ด ๋ชจ๋ ์์ฑ๋ค์ ๋ํ ๊ฒฐํฉ ํ๋ฅ ์ด๊ธฐ ๋๋ฌธ์ ์ ํํ ํ๋ จ ์ํ๋ก๋ง์ผ๋ก ์ถ์ ํ๊ธฐ ํ๋ค๋ค๋ ๊ฒ์ด๋ค.
์ด๋ฌํ ์ฅ์ ๋ฌผ์ ํผํ๊ณ ์ ๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ๋ ์์ฑ ์กฐ๊ฑด๋ ๋ฆฝ ๊ฐ์ค์ ์ด์ฉํ๋ค.
์์ฑ ์กฐ๊ฑด๋ ๋ฆฝ ๊ฐ์ค : ๋ชจ๋ ์์ฑ์ด ํด๋์ค ์กฐ๊ฑด ํ์์ ์๋ก ๋ ๋ฆฝ์ด๋ผ๋ ๊ฐ์
๋ชจ๋ ํด๋์ค์ ๋ํด P(x)๋ ๋์ผํ๋ค.
์ ์ฒด ๋ฐ์ดํฐ D์ ๋ํด c ํด๋์ค ์ํ๋ก ๊ตฌ์ฑ๋ ์งํฉ์ Dc๋ผ๊ณ ํ์.
ํ๋ จ์ธํธ ๋ด์์ ์ด๋ค ์์ฑ๊ฐ์ด ์ด๋ค ํด๋์ค์ ๋์์ ๋์จ ์ ์ด ์๋ค๋ฉด?
ํน์ ํด๋์ค(ripe=true)์ ๋ํด ์ด๋ค ์์ฑ๊ฐ(sound=crisp)์ด ๋ฑ์ฅํ ์ ์ด ์์ ๋๋ฅผ ๋ณด๋ฉด ํ๋ จ ๋ฐ์ดํฐ์์ ripe=true์ธ ๊ฒฝ์ฐ๊ฐ 8๋ฒ ์์์ง๋ง ๊ทธ ์ค ๋จ ํ ๋ฒ๋ sound=crisp์ธ ๊ฒฝ์ฐ๊ฐ ์์๊ธฐ ๋๋ฌธ์ ํ๋ฅ ์ด 0์ด ๋ ์ํฉ์ด๋ค.
๋์ด๋ธ ๋ฒ ์ด์ฆ๋ ์์ฑ๋ณ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ๊ณฑํด์ ์ ์ฒด ์ฌํ ํ๋ฅ ์ ๊ตฌํ๋๋ฐ ์ด ์ค ํ๋๋ผ๋ P(xi|c) = 0 ์ด๋ฉด ์ ์ฒด ๊ฐ์ด 0์ด ๋๋ค. ์ฆ, ๋จ ํ๋์ ์์ฑ ๊ฐ์ด ๋ฑ์ฅํ ์ ์ด ์๋ค๋ ์ด์ ๋ง์ผ๋ก ํด๋น ํด๋์ค์ ๊ฐ๋ฅ์ฑ์ด ์์ ํ ๋ฐฐ์ ๋ผ๋ฒ๋ฆฐ๋ค.
๋ผํ๋ผ์์ ๋ณด์
- ํ๋ จ ์ธํธ D์ ํด๋์ค ๊ฐ์๋ฅผ N, i๋ฒ์งธ ์์ฑ์ด ์ทจํ ์ ์๋ ๊ฐ์ ๊ฐ์๋ฅผ Ni๋ก ๋ํ๋ธ๋ค๋ฉด ๋ค์๊ณผ ๊ฐ์ด ์์ ํ๋ค.