๐ฉ๐ฌ Parametric(๋ชจ์์ ) & Non-Parametric(๋น๋ชจ์์ ) test ์ข ๋ฅ ๊ตฌ๋ณ์ ๋งค์ฐ ์ค์ํ๋ค!
๐ฉ๐ฌ ๊ฐ๋ตํ ๋งํ์๋ฉด ๋ชจ์์ ๋ฐฉ๋ฒ์ data์ ๋ถํฌ๋ฅผ ๊ฐ์ (์ฃผ๋ก ์ ๊ท์ฑ - normal distribution)ํ ์ฑ hypothetical test๋ฅผ ์งํํ๋ ๋ฐฉ์(๋ชจ์ง๋จ์ ๋ํ ์ ๋ณด๋ฅผ ์๊ณ ์๋ ์ฑ๋ก ์งํ)์ด๊ณ & ๋น๋ชจ์์ ๋ฐฉ๋ฒ์ ๊ทธ๋ฐ ๋ถํฌ๊ฐ ์์ ์กด์ฌํ์ง ์๋๋ค ์๊ฐํ๊ณ ์งํํ๋ ๋ฐฉ๋ฒ(๋ชจ์ง๋จ์ ๋ํ ์ ๋ณด๊ฐ ์์)์ด๋ค.
๐ฉ๐ฌ ์ผ๋จ ๋ถํฌ๋ฅผ ๊ฐ์ ํ๊ณ ์์ํ๋, ๋๋ถ๋ถ์ test๋ก ๋ชจ์์ ๋ฐฉ๋ฒ์ ์งํํ๋ Parametric Method์ ์ฅ์ ๋ค๋ถํฐ ์์๋ณด์
Parametric Methods - ์ฅ์
1> ๐โ๏ธ skewed๋๊ฑฐ๋ ํน์ ๋ฐฉํฅ์ผ๋ก ์น์ฐ์น์ง ์์ ๋ถํฌ์ฌ๋ ์ ๋ขฐํ ๋งํ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ ธ๋ค ์ค๋ค
* outlier๊ฐ ์กด์ฌํ๊ฑฐ๋, non-normally distributed๋ data์ฌ๋ test ๋ณ ์๊ตฌ sample size๋ง ๋๊ฒจ์ค๋ค๋ฉด, '๋ชจ์์ ๋ฐฉ๋ฒ'์ ์ํด ์ ๋ขฐํ ์ ์๋ ํ ์คํธ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ ธ๋ค ์ค
* ์์ ๋ฐฐ์ ๋ ์ด 3๊ฐ์ง์ test (One-Sample T-Test & Two-Samples T-Test & ANOVA)์ ์ต์ ์๊ตฌ์กฐ๊ฑด sample size๋ ์๋์ ๊ฐ์
2> ๐โ๏ธ ๊ทธ๋ฃน ๊ฐ์ ๋ถ์ฐ์ด ๋ฌ๋ผ๋ ์ ๋ขฐ์ฑ ์๋ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ ธ๋ค ์ค๋ค
→ ๊ทธ๋ฃน ๊ฐ ๋ถ์ฐ์ ํฌ๊ฒ ์ํฅ์ ์๋ฐ์!
3> ๐โ๏ธ ํต๊ณ์ power (Statistical Power)๋ฅผ ๊ฐ๊ณ ์๋ค
→ ์ฆ ์ค์ ์ด๋ค ํจ๊ณผ effect๋ฅผ ๊ฐ์ง๊ณ ์๋ ์ง ํ์งํ๋ ํต๊ณ์ ๋ฌธ์ ์์ ๋ชจ์์ method๊ฐ ๋ ์ฝ๊ฒ ํ์งํ ์ ์๋ power๋ฅผ ๊ฐ์ง
Non-Parametric Methods - ์ฅ์
1> ๐จ๐ฉ๐ง๐ฆ mean์ด ์๋ median์ ์ธก์ ํ๋ค
→ skewed๋ distribution์ ๋ณด๋ฉด mean๊ณผ median์ ๋งค์ฐ ๋ค๋ฅธ ์ง์ ์ ์กํ๋ฏ๋ก parametric์ ์ ํํ ๊ฒ์ธ์ง, non-parametric์ ์ ํํ ๊ฒ์ธ์ง์ ๋ฐ๋ผ ๋งค์ฐ ๋ค๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ์ฐ์ถํ๋ค. ํนํ ์ฌํ๊ฒ skewed๋ ๋ถํฌ์ ๊ฒฝ์ฐ, ์ฐ๋ฆฌ๊ฐ ๊ด์ฌ์์ด ํ๋ data์ ์ง์ค๋ ๋ถ๋ถ์ ์ฃผ๋ก median์ผ๋ก ์ธก์ ์ด ๋๊ธฐ ๋๋ฌธ์ ๊ฒฝ์ฐ์ ๋ฐ๋ผ non-parametric method๋ฅผ ๋ ์ ํธํ ์๋ ์๋ค.
2> ๐จ๐ฉ๐ง๐ฆ sample size๊ฐ ์๊ณ , non-normalํ data์ ๊ฒฝ์ฐ ์ ์ฉ
3> ๐จ๐ฉ๐ง๐ฆ ordinal data, ranked data, outliers์ ์ ํฉ
→ parametric์ ๋จ์ ์ ์๋ฌด๋๋ outlier์ ์ํฅ์ ๊ทธ๋๋ก ๋ฐ๊ธฐ ๋๋ฌธ์ ์ํ์ง ์๋ ๊ฒฐ๊ณผ๊ฐ ๋์ฌ ์ ์๋ค๋ ์ ์ด๋ค. ํ์ง๋ง ๋น๋ชจ์์ ๋ฐฉ๋ฒ์ outlier์ ํฌ๊ฒ ์ํฅ์ ๋ฐ์ง ์๋๋ค.
hypothesis test ์ข ๋ฅ>
* ๋นจ๊ฐ ์ฌ๊ฐํ ๋ฐฐ์ (ํ์ฌ ํฌ์คํ ๋ ์ง ๊ธฐ์ค) (๊ณง ๋ค๋ฅธ test๋ ๋ฐฐ์ธ ์์ !)
๐คก One-Sample Parametric T-Test>
๐คก Two-Samples Independent Parametric T-Tests>
๐คก More Than Two Samples One-Way Parametric ANOVA>
** ์ ๋ฆฌ๋ฅผ ํด๋ณด์๋ฉด! **
Properties | Parametric | Non-Parametric |
๊ฐ์ | O | X |
central tendency value | ํ๊ท | ์ค๊ฐ๊ฐ(median) |
correlation | pearson | spearman |
probablistic distribution | normal(์ ๊ท) | arbitrary |
population ์ง์ | ํ์ | ํ์ X |
์ฌ์ฉ๋๋ ๊ณณ | interval data | nominal data |
์์ | z-test, t-test ๋ฑ๋ฑ | Kruskal-Wallis, Mann-Whitney ๋ฑ๋ฑ |
์ฅ์ | data ์์ฒด์ dependent - accuracy ๋์ | ๋ถํฌ์ ์ํฅ x - robust, ๋ ๋ค์ํ ์ํฉ์ ์ฐ์ |
์ ์ฉ | variable | variable & attributes |
๐ค ํ์ฌ ํฌ์คํ ์๊ฐ ๊ธฐ์ค ์ด 3๊ฐ์ test์ ๋ํด์๋ง ๋ฐฐ์ ๋๋ฐ, ์์ผ๋ก ํจ์ฌ ๋ ๋ง์ test ํฌ์คํ ํจ์ผ๋ก์จ parametric vs. non-parametric์ ์ฐจ์ด๋ฅผ ์ง์ ๋์ผ๋ก ํ์ธํด๋ณด์!
* ์ถ์ฒ1) https://byjus.com/maths/difference-between-parametric-and-nonparametric/
* ์ถ์ฒ2) https://keydifferences.com/difference-between-parametric-and-nonparametric-test.html
* ์ถ์ฒ4) https://statisticsbyjim.com/hypothesis-testing/nonparametric-parametric-tests/
'Statistics > Concepts(+codes)' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Two-Samples ๐2 test (0) | 2022.05.03 |
---|---|
๐2 distribution + One-Sample ๐2 test (0) | 2022.05.02 |
Types of Errors in Hypothesis Testing (0) | 2022.04.27 |
ANOVA & (One-Way ANOVA + w/code) (1) | 2022.04.25 |
distributionโซ Student's t-distribution (in-depth) (0) | 2022.04.25 |
๋๊ธ