Loading [MathJax]/jax/output/CommonHTML/jax.js
Statistics/Concepts(+codes)

MLE for the normal distribution

metamong 2022. 6. 27.

๐Ÿ”Š ์ €๋ฒˆ ์‹œ๊ฐ„์— MLE์— ๋Œ€ํ•ด์„œ ๋ฐฐ์› ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์˜ˆ์ œ๋กœ MLE ๊ธฐ๋ฒ•์„ logistic regression์— ์ ์šฉํ•ด ์ตœ์ ์˜ sigmoid ํ•จ์ˆ˜๋ฅผ ์–ด๋–ป๊ฒŒ ๊ตฌํ•˜๋Š” ์ง€ ์ˆ˜ํ•™์ ์œผ๋กœ ์ˆ˜์‹์„ ํ†ตํ•ด ์•Œ์•„๋ณด์•˜๋‹ค.

 

๐Ÿ”Š ์ด๋ฒˆ ์‹œ๊ฐ„์—๋Š” logistic์ด ์•„๋‹Œ normal distribution์— MLE ๊ธฐ๋ฒ•์„ ์ ์šฉํ•ด ์ฃผ์–ด์ง„ data๋ฅผ ๊ฐ€์žฅ ์ž˜ ์„ค๋ช…ํ•˜๋Š” normal distribution์˜ ๋‘ ๋ชจ์ˆ˜์ธ ฮผ์™€ ฯƒ๋ฅผ ์ฐพ์•„ ์ตœ์ ์˜ normal distribution์„ ์•Œ์•„๋ณด๋Š” ์‹œ๊ฐ„์„ ๊ฐ€์ ธ๋ณด๋ ค ํ•œ๋‹ค.

 

 

Maximum Likelihood Estimation(MLE)

๐ŸŒŸ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€ ํฌ์ŠคํŒ…์—์„œ MLE๊ธฐ๋ฒ•์„ ํ†ตํ•ด model์„ ๊ฒฐ์ •ํ•œ๋‹ค๊ณ  ํ•˜์˜€๋‹ค. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€์˜ ์‹์„ ๋” deepํ•˜๊ฒŒ ์ˆ˜ํ•™์ ์œผ๋กœ ๋“ค์–ด๊ฐ€, ์–ด๋–ค ๋ชจ๋ธ์„ ๊ณ ๋ฅผ ์ง€ ์ˆ˜์‹์œผ๋กœ ์—ฐ์‚ฐํ•˜๋Š” ๊ณผ์ •์—์„œ MLE๊ฐ€ ํ•ต์‹ฌ์œผ๋กœ...

sh-avid-learner.tistory.com

* normal distribution ๊ฐœ์š”>

pr(x|ฮผ,ฯƒ) = 1ฯƒโˆš2ฯ€ eโˆ’12(xโˆ’ฮผฯƒ)2

 

MLE for the normal distribution - * normal distribution ๊ฐœ์š”>

 

โ†’ ์œ„ ๊ทธ๋ฆผ์—์„œ ๋ณด๋“ฏ์ด distribution์˜ ์ด๋™ ๋ฐฉํ–ฅ์€ ฮผ๊ฐ€ ๊ฒฐ์ •ํ•ด์ค€๋‹ค. ๋ถ„ํฌ ์ „์ฒด์˜ ํ‰๊ท ์ธ ์ค‘์‹ฌ์„ ๋œปํ•œ๋‹ค. ฮผ ๊ฐ’์ด ํฌ๋ฉด ์˜ค๋ฅธ์ชฝ์œผ๋กœ ์ด๋™, ์ž‘์œผ๋ฉด ์™ผ์ชฝ์œผ๋กœ ์ด๋™ํ•œ๋‹ค.

โ†’ distribution์˜ ๋„ˆ๋น„, ์ฆ‰ ์–‘ ์˜†์œผ๋กœ ํผ์ง„ ์ •๋„๋Š” ฯƒ๊ฐ€ ๊ฒฐ์ •ํ•ด์ค€๋‹ค. ฯƒ ๊ฐ’์ด ํด์ˆ˜๋ก ์–‘ ์˜†์œผ๋กœ ํผ์ง€๊ณ , ์ž‘์„์ˆ˜๋ก ์œ„๋กœ ๋พฐ์กฑํ•ด์ง„๋‹ค.

 

๐ŸŒฟ ์šฐ๋ฆฌ๋Š” ํ•ด๋‹น distribution ํ•จ์ˆ˜๋ฅผ likelihood๋กœ ๋‘์–ด ํ•ด๋‹น likelihood๊ฐ€ ์ตœ๋Œ€๊ฐ€ ๋  ๋•Œ์˜ distribution์„ ์ฐพ์œผ๋ ค ํ•œ๋‹ค (๋‘ ๋ชจ์ˆ˜ ์ฐพ๊ธฐ)

 

๐ŸŒฟ L(ฮผ,ฯƒ|x) = 1ฯƒโˆš2ฯ€ eโˆ’12(xโˆ’ฮผฯƒ)2

 

๐ŸŒฟ speculation) ์ฃผ์–ด์ง„ x data๋“ค์ด ์žˆ์„ ๋•Œ, ํ•ด๋‹น x data๋“ค์„ ๊ฐ€์žฅ ์ž˜ ์„ค๋ช…ํ•˜๋Š” normal distribution์€ ์ฃผ์–ด์ง„ x data์˜ ํ‰๊ท ์ด ํ•ด๋‹น distribution์˜ ๋ชจ์ˆ˜ ฮผ์ด๊ณ , ์ฃผ์–ด์ง„ x data์˜ ํ‘œ์ค€ํŽธ์ฐจ๊ฐ€ distribution์˜ ฯƒ๋ผ๊ณ  ์ถ”์ธกํ•  ์ˆ˜ ์žˆ๋‹ค.

 

๐ŸŒฟ MLE ๊ธฐ๋ฒ•์œผ๋กœ ์ฆ๋ช…ํ•ด๋ณด์ž.

* using MLE>

โ€ป ์ฃผ์˜ - ๋ชจ์ˆ˜๊ฐ€ 2๊ฐœ ์ด์ƒ์ธ ๊ฒฝ์šฐ ๊ฐ ๋ชจ์ˆ˜๋ณ„๋กœ ํŽธ๋ฏธ๋ถ„ํ•  ๋•Œ, ๋‹ค๋ฅธ ๋ชจ์ˆ˜๋Š” constant ์ทจ๊ธ‰ํ•œ ์ฑ„๋กœ ํŽธ๋ฏธ๋ถ„

 

โ‘  ์ „์ฒด likelihood๋Š” ๊ฐ x point๋ณ„ likelihood๋ฅผ ๋ชจ๋‘ ๊ณฑํ•œ ๊ฐ’์ด๋‹ค

โ†’ L(ฮผ,ฯƒ|x1,x2,...,xn) = L(ฮผ,ฯƒ|x1) x L(ฮผ,ฯƒ|xn) = 1ฯƒโˆš2ฯ€ x eโˆ’12(x1โˆ’ฮผฯƒ)2 x ... x 1ฯƒโˆš2ฯ€ x eโˆ’12(xnโˆ’ฮผฯƒ)2

 

โ‘ก ๋ฏธ๋ถ„์—ฐ์‚ฐ ํŽธ์˜๋ฅผ ์œ„ํ•ด ์–‘๋ณ€์— ln ๋กœ๊ทธ๋ฅผ ์ทจํ•˜๋ฉด

โ†’ ln[L(ฮผ,ฯƒ|x1,x2,...,xn)] = ln(1ฯƒโˆš2ฯ€ x eโˆ’12(x1โˆ’ฮผฯƒ)2 x ... x 1ฯƒโˆš2ฯ€ x eโˆ’12(xnโˆ’ฮผฯƒ)2)

 

โ‘ข ์šฐ๋ณ€ ln์„ ์ญ‰ ํ’€๊ณ  ๊ณ„์‚ฐํ•˜๋ฉด

โ†’ = ln(1ฯƒโˆš2ฯ€ x eโˆ’12(x1โˆ’ฮผฯƒ)2) + ... + ln(1ฯƒโˆš2ฯ€ x eโˆ’12(xnโˆ’ฮผฯƒ)2)

= ln[(2ฯ€ฯƒ2)โˆ’1/2] - (x1โˆ’ฮผ)22ฯƒ2ln(e) + ... + ln[(2ฯ€ฯƒ2)โˆ’1/2] - (xnโˆ’ฮผ)22ฯƒ2ln(e)

= -12ln(2ฯ€ฯƒ2) - (x1โˆ’ฮผ)22ฯƒ2 + ... + -12ln(2ฯ€ฯƒ2) - (xnโˆ’ฮผ)22ฯƒ2

= -12ln(2ฯ€) -12ln(ฯƒ2) - (x1โˆ’ฮผ)22ฯƒ2 + ... + -12ln(2ฯ€) -12ln(ฯƒ2) - (xnโˆ’ฮผ)22ฯƒ2

= -12ln(2ฯ€) -ln(ฯƒ) - (x1โˆ’ฮผ)22ฯƒ2 + ... + -12ln(2ฯ€) -ln(ฯƒ) - (xnโˆ’ฮผ)22ฯƒ2

 

โ‘ฃ ๊ณตํ†ต๋œ ํ•ญ๋“ค์„ ๋ฌถ์–ด ํ‘œํ˜„ํ•˜๋ฉด ln ์—ฐ์‚ฐ์„ ๊ฐ„๋‹จํ•˜๊ฒŒ ์™„์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค.

โ†’ = -n2ln(2ฯ€) -nln(ฯƒ) - (x1โˆ’ฮผ)22ฯƒ2 - ... - (xnโˆ’ฮผ)22ฯƒ2

 

โ‘ค (1) ์ด์ œ ฮผ์— ๊ด€ํ•œ ํŽธ๋ฏธ๋ถ„์„ ํ•ด๋ณด๋ฉด

โ†’ โˆ‚โˆ‚ฮผ ln[L(ฮผ,ฯƒ|x1,x2,...,xn)] = 0 - 0 + x1โˆ’ฮผฯƒ2 + ... + xnโˆ’ฮผฯƒ2

= 1ฯƒ2 [(x1+...+xn)โˆ’nฮผ]

 

โ‘ฅ (2) ฯƒ์— ๊ด€ํ•œ ํŽธ๋ฏธ๋ถ„์„ ํ•ด๋ณด๋ฉด

โ†’ โˆ‚โˆ‚ฯƒ ln[L(ฮผ,ฯƒ|x1,x2,...,xn)] = 0 -nฯƒ + (x1โˆ’ฮผ)2ฯƒ3 + ... + (xnโˆ’ฮผ)2ฯƒ3 = -nฯƒ + 1ฯƒ3[(x1โˆ’ฮผ)2+...+(xnโˆ’ฮผ)2]

 

โ‘ฆ ๋‘ ๋ชจ์ˆ˜์—์˜ ํŽธ๋ฏธ๋ถ„ ๊ฐ’์ด 0์ผ ๋•Œ๋ฅผ ํ™•์ธ (์ตœ๋Œ€์น˜์ด๋ฏ€๋กœ)

โ†’ 1> 0 = 1ฯƒ2 [(x1+...+xn)โˆ’nฮผ]

โ†” 0 = (x1+...xn)โˆ’nฮผ

โ†” ฮผ = (x1+...xn)n

 

โ†’ 2> 0 = -nฯƒ + 1ฯƒ3[(x1โˆ’ฮผ)2+...+(xnโˆ’ฮผ)2]

โ†” 0 = โˆ’n + 1ฯƒ2[(x1โˆ’ฮผ)2+...+(xnโˆ’ฮผ)2]

โ†” ฯƒ = โˆš(x1โˆ’ฮผ)2+...+(xnโˆ’ฮผ)2n

 

โ‘ง ๊ฒฐ๊ณผ, ์ตœ์ ์˜ ฮผ๋Š” ์ฃผ์–ด์ง„ data์˜ ํ‰๊ท , ์ตœ์ ์˜ ฯƒ๋Š” ์ฃผ์–ด์ง„ data์˜ ํ‘œ์ค€ํŽธ์ฐจ์ž„์„ MLE ๊ธฐ๋ฒ•์„ ํ†ตํ•ด ์ฆ๋ช…ํ•˜์˜€๋‹ค! 

(์œ„์˜ speculation์ด ๋งž์•˜์Œ ํ™•์ธ ๊ฐ€๋Šฅ)


* ์ถœ์ฒ˜) ๊ฐ“ STATQUEST https://www.youtube.com/watch?v=Dn6b9fCIUpM 

* ์‚ฌ์ง„, ์ธ๋„ฌ์ถœ์ฒ˜) https://www.boost.org/doc/libs/1_49_0/libs/math/doc/sf_and_dist/graphs/normal_pdf.png

๋Œ“๊ธ€