Math & Linear Algebra/Concepts

Probability fundamentals

metamong 2023. 2. 27.

 

🧜‍♀️ ν™•λ₯ μ€ λ°˜λ“œμ‹œ μ•Œμ•„μ•Ό ν•˜λŠ” 기초 κ°œλ…! 기초 κ°œλ…μ„ ν™•μ‹€νžˆ μ•Œμž!

* μš©μ–΄ 정리

🧜‍♀️ ν™•λ₯ 

'the measure of the likelihood that an event will occur'


🧜‍♀️ μ‹œν–‰(experiment, trial)

→ ν™•λ₯ μ—μ„œμ˜ 'μ‹œν–‰'은 일반적으둜 λ¬΄μž‘μœ„ μ‹œν–‰μ„ μ˜λ―Έν•˜μ—¬, μ΄λŠ” λ™μΌν•œ μ‘°κ±΄μ—μ„œ 반볡 μˆ˜ν–‰ κ°€λŠ₯, κ·Έ κ²°κ³Όλ₯Ό 사전에 μ•Œ 수 μ—†λŠ” 행동

(ex) 동전과 μ£Όμ‚¬μœ„λ₯Ό λ˜μ§€λŠ” 것)

→ μ‹œν–‰μ€ ν‘œλ³Έκ³΅κ°„μ΄λΌλŠ” 집합(set)으둜 ν‘œν˜„


🧜‍♀️ ν‘œλ³Έκ³΅κ°„(Sample space)

μ–΄λ– ν•œ μ‹œν–‰μ—μ„œ 일어날 수 μžˆλŠ” λͺ¨λ“  λ°œμƒ κ°€λŠ₯ν•œ 결과의 집합

ex) μ£Όμ‚¬μœ„λ₯Ό ν•œ 번 λ˜μ§€λŠ” μ‹œν–‰μ˜ ν‘œλ³Έ 곡간 = {1, 2, 3, 4, 5, 6}

→ 각 μ›μ†Œ(element)λŠ” μ‹œν–‰μ˜ νŠΉμ •ν•œ κ²°κ³Όλ₯Ό μ˜λ―Έν•˜λ©°, 이λ₯Ό ν‘œλ³Έμ (sample point)라고 ν•œλ‹€.


🧜‍♀️ 사건(event)

μ‹œν–‰μ˜ 결과둜 λ‚˜μ˜¬ 수 μžˆλŠ” νŠΉμ •ν•œ κ°’ λ˜λŠ” κ°’λ“€μ˜ 집합

ex) ν•œ 개의 μ£Όμ‚¬μœ„λ₯Ό λ˜μ§€λŠ” μ‹œν–‰μ— λŒ€ν•΄μ„œ 1의 눈이 λ‚˜μ˜€λŠ” 사건, 2의 눈이 λ‚˜μ˜€λŠ” 사건, ... 6의 눈이 λ‚˜μ˜€λŠ” 사건 λ“±λ“± 쑴재 / 사건은 μ§‘ν•©μœΌλ‘œ ν‘œν˜„ κ°€λŠ₯({1}, {2}, ... {6} λ“±λ“±) 

→ 사건 λͺ¨λ‘ ν•΄λ‹Ή μ‹œν–‰μ— λŒ€ν•œ ν‘œλ³Έκ³΅κ°„μ˜ 뢀뢄집합

 

E ⊆ S

(E: 사건, S: ν‘œλ³Έ 곡간)

→ 사건 Eκ°€ λ°œμƒν–ˆλ‹€λŠ” 의미 = 'μ–΄λ– ν•œ μ‹œν–‰μ˜ 결괏값이 사건 E 집합에 μ†ν•œλ‹€. 즉, μ›μ†Œμ΄λ‹€'

ex) E = {2,4,6} μ£Όμ‚¬μœ„λ₯Ό λ˜μ Έμ„œ 2의 눈이 λ‚˜μ˜¨λ‹€λ©΄, 2λŠ” 집합 E의 μ›μ†Œμ΄κΈ° λ•Œλ¬Έμ— '사건 Eκ°€ λ°œμƒν–ˆλ‹€'라고 ν‘œν˜„


🧜‍♀️ μ‚¬κ±΄μ˜ 합집합 & ꡐ집합

→ 집합 A와 Bκ°€ 사건인 경우, ν•΄λ‹Ή μ‚¬κ±΄λ“€μ˜ 합집합인 A∪B와 ꡐ집합인 A∩B도 사건

(즉, 합집합과 ꡐ집합 λͺ¨λ‘ ν‘œλ³Έ κ³΅κ°„μ˜ 뢀뢄집합)

→ ex) μ£Όμ‚¬μœ„λ₯Ό ν•œ 번 λ˜μ§€λŠ” μ‹œν–‰μ— λŒ€ν•œ 사건 A, B

- 사건 A: 짝수의 눈이 λ‚˜μ˜€λŠ” 사건 (A = {2,4,6})

- 사건 B: 5μ΄μƒμ˜ 눈이 λ‚˜μ˜€λŠ” 사건 (B = {5,6})

- 합집합은 {2,4,5,6}이 되고, ꡐ집합은 {6} (두 개 λͺ¨λ‘ ν‘œλ³Έκ³΅κ°„μ˜ 뢀뢄집합)


🧜‍β™€οΈμ‚¬κ±΄μ˜ ν™•λ₯ (probability of an event)

ν•΄λ‹Ή 사건이 일어날 수 μžˆλŠ” κ°€λŠ₯성을 수치적으둜 ν‘œν˜„ν•œ 것

→ 사건 Aκ°€ λ°œμƒν•  ν™•λ₯ μ€ P(A)라고 ν‘œν˜„

→ μ •μ˜) (νŠΉμ • 사건이 λ°œμƒν• ) ν™•λ₯  = ν•΄λ‹Ή 사건이 λ°œμƒν•  경우의 수 / νŠΉμ • μ‹œν–‰μ— λŒ€ν•œ λͺ¨λ“  κ°€λŠ₯ν•œ 결과에 λŒ€ν•œ 경우의 수

= '사건 A μ§‘ν•©μ˜ μ›μ†Œμ˜ 수 / ν‘œλ³Έ 집합 S의 μ›μ†Œμ˜ 수'

$$P(A) = \frac{|A|}{|S|}$$

→ ex) ν•˜λ‚˜μ˜ μ£Όμ‚¬μœ„λ₯Ό λ˜μ Έμ„œ μ§μˆ˜κ°€ λ‚˜μ˜¬ ν™•λ₯ 

- μ‹œν–‰ = ν•˜λ‚˜μ˜ μ£Όμ‚¬μœ„λ₯Ό λ˜μ§€λŠ” 것 {1,2,3,4,5,6}

- 사건 = μ§μˆ˜κ°€ λ‚˜μ˜€λŠ” 사건 {2,4,6}

- 즉 μœ„ 'μ‚¬κ±΄μ˜ ν™•λ₯ ' μ •μ˜μ— μ˜ν•΄ 3/6 = 1/2이 λœλ‹€.


🧜‍♀️확λ₯ μ˜ κΈ°λ³Έ Axioms

β‘  Axiom1: μ–΄λ– ν•œ 사건 A에 λŒ€ν•΄μ„œ P(A) ≥ 0

β‘‘ Axiom2: ν‘œλ³Έκ³΅κ°„ S의 ν™•λ₯ (P(S)) = 1

β‘’ Axiom3: $A_1, A_2, ... $κ°€ μ„œλ‘œ μƒν˜Έλ°°νƒ€μ  사건(disjoint events)인 경우, $P(A_1 \cup A_2 \cup A_3 \cup ...) = P(A_1) + P(A_2) + P(A_3) + ...$

→ 즉, 두 사건이 μ„œλ‘œ μƒν˜Έλ°°νƒ€μ μ΄λ‹€λΌλŠ” λœ»μ€ 두 μ‚¬κ±΄μ˜ ꡐ집합이 μ—†λ‹€λŠ” 것을 λœ»ν•œλ‹€.

→ $A \cap B = \varnothing$

→ 두 사건이 μƒν˜Έλ°°νƒ€μ μ΄ μ•„λ‹ˆλΌλ©΄, $P(A \cup B) = P(A) + P(B) - P(A \cap B)$

 

cf)

$$P(A \cup B) = P(A\;or\;B)$$

$$P(A \cap B) = P(A\;and\;B) = P(A,B)$$


🧜‍♀️쑰건뢀 ν™•λ₯ (Conditional probability)

= 두 개의 사건 A,Bκ°€ μžˆλŠ” κ²½μš°μ— λŒ€ν•΄μ„œ, 사건 Bκ°€ λ°œμƒν–ˆλ‹€λŠ” 쑰건 ν•˜μ—μ„œ 사건 Aκ°€ λ°œμƒν•  ν™•λ₯ 

→ $P(A|B) = \frac{P(A\cap B)}{P(B)}, where\;P(B) > 0$

ex) ν•œ 개의 μ£Όμ‚¬μœ„λ₯Ό λ˜μ§€λŠ” μ‹œν–‰μ— λŒ€ν•΄μ„œ, ν™€μˆ˜μ˜ 눈이 λ‚˜μ˜€λŠ” 사건을 A, 3 μ΄ν•˜μ˜ 눈이 λ‚˜μ˜€λŠ” 사건을 B

(S = {1,2,3,4,5,6} / A = {1,3,5} / B = {1,2,3})

- λ”°λΌμ„œ 3μ΄ν•˜μ˜ 눈이 λ°œμƒν–ˆλ‹€λŠ” 쑰건 ν•˜μ—μ„œ ν™€μˆ˜μ˜ 눈이 λ‚˜μ˜€λŠ” 사건이 λ°œμƒν•  ν™•λ₯ μ„ μœ„ 쑰건뢀 ν™•λ₯  곡식에 μ˜ν•΄ ν’€μžλ©΄,

$P(A|B) = \frac{P(A\cap B)}{P(B)} = \frac{\frac{|A\cap B|}{S}}{\frac{|B|}{|S|}}$

$= \frac{|A\cap B|}{|B|} = \frac{2}{3}$

 

β€» 연쇄법칙

$$P(𝐴_1∩𝐴_2∩…∩𝐴_𝑛 )=𝑃(𝐴_1 )𝑃(𝐴_2│𝐴_1 )𝑃(𝐴_3│𝐴_2,𝐴_1 )…𝑃(𝐴_𝑛 |𝐴_(𝑛−1),𝐴_(𝑛−2),…,𝐴_1 )$$

 

ex) 곡μž₯μ—μ„œ μ–΄λ–€ μ œν’ˆ 100개λ₯Ό μƒμ‚°ν–ˆλŠ”λ°, κ·Έ 쀑에 결함이 μžˆλŠ” μ œν’ˆμ΄ 5개라고 κ°€μ •ν•©λ‹ˆλ‹€. 100개의 μ œν’ˆ μ€‘μ—μ„œ 3개λ₯Ό μ„ νƒν–ˆμ„ λ•Œ, μ…‹ λͺ¨λ‘ 결함이 μ—†λŠ” μ œν’ˆμΌ ν™•λ₯ ?

→ 첫번째 μ œν’ˆμ΄ 결함이 μ—†λŠ” μ œν’ˆμΈ 사건을 $A_1$, λ‘λ²ˆμ§Έ μ œν’ˆμ΄ 결함이 μ—†λŠ” μ œν’ˆμΈ 사건을 $A_2$, μ„Έλ²ˆμ§Έ μ œν’ˆμ΄ 결함이 μ—†λŠ” μ œν’ˆμΈ 사건을 $A_3$라고 ν•˜λŠ” 경우 κ΅¬ν•˜κ³ μž ν•˜λŠ” 값은 $P(𝐴_1∩𝐴_2∩𝐴_3 )$

→ 연쇄법칙을 μ‚¬μš©ν•˜λ©΄ μ•„λž˜μ™€ 같이 ν‘œν˜„ κ°€λŠ₯

$P(𝐴_1∩𝐴_2∩𝐴_3 )=𝑃(𝐴_1 )𝑃(𝐴_2│𝐴_1 )𝑃(𝐴_3│𝐴_2,𝐴_1 )$


🧜‍♀️쑰건뢀 ν™•λ₯ (Conditional probability) Axioms

→ μœ„μ—μ„œ 닀룬 ν™•λ₯ μ˜ κΈ°λ³Έ 3 axioms 적용

β‘  Axiom1: μ‚¬κ±΄ A에 λŒ€ν•΄μ„œ P(A|B) ≥0

β‘‘ Axiom2: μ‚¬κ±΄ B μ‘°κ±΄ν•˜μ—μ„œμ˜ B의 ν™•λ₯ , μ¦‰, P(B|B) = 1

β‘’ Axiom3: $𝐴_1, 𝐴_2, 𝐴_3$, …κ°€ μ„œλ‘œ μƒν˜Έλ°°νƒ€μ  사건(disjoint events)인 경우, $P(𝐴_1∪𝐴_2∪𝐴_3∪…|B)=P(𝐴_1 |𝐡)+𝑃(𝐴_2 |𝐡)+P(𝐴_3 |𝐡)+…$

 

Q1. 사건 A와 Bκ°€ μ„œλ‘œ μƒν˜Έλ°°νƒ€μ μΌ λ•Œ, P(A|B)λŠ” 0

Q2. B ⊂ A인 경우, P(A|B)λŠ” 1

Q3. 두 개의 μ£Όμ‚¬μœ„λ₯Ό λ™μ‹œμ— λ˜μ§€λŠ” κ²½μš°μ—, 첫 번째 μ£Όμ‚¬μœ„μ˜ λˆˆμ„ N1이라고 ν•˜κ³ , 두 번째 μ£Όμ‚¬μœ„μ˜ λˆˆμ„ N2라고 ν•˜μž. N1+N2 = 5라고 ν•˜λŠ” 경우, N1=2 λ˜λŠ” N2=2일 ν™•λ₯ 

→ μœ„ 쑰건뢀 ν™•λ₯ μ˜ μ •μ˜μ— μ˜ν•΄ (2/36)/(4/36) = 1/2


🧜‍♀️독립 사건(independent events)

두 사건이 μ„œλ‘œ 독립 = ν•œ 사건이 λ°œμƒν•  ν™•λ₯ μ΄ λ‹€λ₯Έ μ‚¬κ±΄μ˜ λ°œμƒ 여뢀에 영ν–₯을 받지 μ•ŠμŒ

ex) 두 개의 동전을 λ™μ‹œμ— λ˜μ§€λŠ” μ‹œν–‰μ— λŒ€ν•΄μ„œ 첫 번째 λ™μ „μ˜ μ•žλ©΄μ΄ λ‚˜μ˜€λŠ” 사건을 A, 두 번째 λ™μ „μ˜ μ•žλ©΄μ΄ λ‚˜μ˜€λŠ” 사건을 B라고 ν•˜λ©΄ 사건 A와 사건 BλŠ” 독립

→ 즉, 사건 A와 사건 BλŠ” μ„œλ‘œ 영ν–₯을 주지 μ•ŠμœΌλ―€λ‘œ P(B|A) = P(B) & P(A∩B) = P(A) * P(B)

ex) μ£Όμ‚¬μœ„λ₯Ό 두 번 던질 λ•Œ, 1이 λ¨Όμ € λ‚˜μ˜€κ³  2κ°€ κ·Έ λ‹€μŒ λ‚˜μ˜€λŠ” ν™•λ₯ μ€?

: 1이 λ‚˜μ˜€λŠ” 사건을 A라 ν•˜κ³ , 2κ°€ λ‚˜μ˜€λŠ” 사건을 B라고 ν•˜λ©΄ 두 사건은 μ„œλ‘œ 영ν–₯을 주지 μ•ŠμœΌλ―€λ‘œ 독립이닀. λ”°λΌμ„œ P(A∩B) = 1/6*1/6 = 1/36


🧜‍β™€οΈμƒν˜Έλ°°νƒ€μ  vs. μƒν˜Έλ…λ¦½μ 

→ μƒν˜Έλ°°νƒ€μ ) P(A and B)=$𝑃(𝐴, 𝐡)=𝑃(𝐴∩𝐡)=0$

→ μƒν˜Έλ…λ¦½μ ) P(A and B)=$𝑃(𝐴, 𝐡)=𝑃(𝐴∩𝐡)=𝑃(𝐴)𝑃(𝐡)$

 

Q. P(A) ≠ 0, P(B) ≠ 0인 경우, 두 사건이 μƒν˜Έλ°°νƒ€μ μΌ λ•Œ, 두 사건은 μ„œλ‘œ 독립이 될 수 μžˆλŠ”κ°€?

A. μƒν˜Έλ°°νƒ€μ μ΄λ―€λ‘œ P(A∩B) = 0. 두 사건이 λ…λ¦½μ΄λ―€λ‘œ P(A∩B) = P(A) * P(B) ≠ 0. λ”°λΌμ„œ μ„œλ‘œ 독립이 될 수 μ—†λ‹€.


🧜‍♀️전체 ν™•λ₯ μ˜ 법칙(Law of total probability)

→ λ§Œμ•½ $B_1, B_2, B_3, ... $κ°€ ν‘œλ³Έκ³΅κ°„ S의 일뢀뢄을 μ°¨μ§€ν•œλ‹€λ©΄, κ·Έ μ–΄λ–€ 사건 A에 λŒ€ν•΄

$$P(A)=\sum_{j=1}^{n} P(A\cap B_j)= \sum_{j=1}^{n} P(A|B_j)P(B_j)$$

 

ex) μœ„ 그림의 경우 $𝑃(𝐴)= π‘ƒ(𝐴∩𝐡_1 )+𝑃(𝐴∩𝐡_2 )+𝑃(𝐴∩𝐡_3 )$


🧜‍β™€οΈλ² μ΄μ¦ˆ 곡식 (Bayes' Rule; Bayes' theorem)

κ²°κ³Ό Aκ°€ μ£Όμ–΄μ‘Œμ„ λ•Œ 각 원인듀($B_1, B_2, ...$)이 λ°œμƒν•  ν™•λ₯ μ„ κ΅¬ν•˜λŠ” 것

β‘  κ²°κ³Ό Aλ₯Ό μœ„ν•œ μ—¬λŸ¬ 원인듀 $B_1, B_2, ...$은 μ„œλ‘œ μƒν˜Έλ°°λ°˜ / 합집합은 전체 ν‘œλ³Έκ³΅κ°„

β‘‘ κ²°κ³Ό A와 원인(Bx)을 μ•ˆλ‹€λ©΄ 결과의 ν™•λ₯ (P(A))을 μœ„ 전체 ν™•λ₯  법칙에 μ˜ν•΄ ν‘œν˜„ν•  수 μžˆλ‹€.

 

γ€Š1》 λΆ„ν• λœ 원인 사건듀 $B_1, B_2, ... $ 각각의 ν™•λ₯ 

γ€Š2》 각 원인 사건듀 $B_1, B_2, ... $을 μ „μ œλ‘œ ν–ˆμ„ λ•Œ 결과사건(A)κ°€ λ°œμƒν•  쑰건뢀 ν™•λ₯ 

→ μœ„ 두 가지λ₯Ό μ•Œκ³  μžˆλ‹€λŠ” 쑰건 ν•˜μ— μ•„λž˜μ™€ 같은 μ‹μœΌλ‘œ κ΅¬ν•˜κ³  싢은 'κ²°κ³Ό λ°œμƒ 쑰건 ν•˜ 원인 ν™•λ₯ '을 μ•Œ 수 μžˆλ‹€.

 

→ μžμ„Έν•œ 건 μ•„λž˜ ν¬μŠ€νŒ… μ°Έμ‘°

 

Bayesian Theorem

😺 이미 λ² μ΄μ§€μ•ˆ 이둠과 κ΄€λ ¨ν•œ λ¬Έμ œμ— λŒ€ν•΄μ„œ μ˜›λ‚  ν¬μŠ€νŒ…μ— 닀룬 λ°” μžˆμ—ˆλ‹€! Bayesian Theorem '(example - 2 exercises) Q1) At a certain stage of a criminal investigation, β‘ the inspector in charge is 60% convinced of the guil

sh-avid-learner.tistory.com


* 좜처) λŒ€ν•™μ› μ‚¬μ „κ΅μœ‘ <데이터뢄석을 μœ„ν•œ κΈ°λ³Έμˆ˜ν•™>

 

'Math & Linear Algebra > Concepts' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

SVD(Singular Value Decomposition)  (0) 2023.02.20
eigendecomposition  (0) 2023.02.19
vector similarity  (0) 2023.02.09
Linear Equation & Linear System / Rank & det(A)  (0) 2023.02.01
Matrix (fundamentals)  (0) 2022.07.31

λŒ“κΈ€