다시 이음

데이터 통계 - 4 (베이즈 정리) 본문

AI 일별 공부 정리

데이터 통계 - 4 (베이즈 정리)

Taeho(Damon) 2021. 7. 20. 21:05

이유 불충분의 원리

- 아무 정보가 없는 상태에서 확률을 동등하게 생각하는 것

 

총확률의 법칙

- 선택지의 확률을 총합하면 해당 이벤트에 대한 총확률은 1이다.

총확률의 법칙

 

베이즈 정리

사전확률을 데이터를 얻어 업데이트해서 사후확률을 구하는 것 

 

A조건과 B조건의 확률이 독립적인가 아닌가에 대해선 카이제곱검정을 통해 확인을 할 수 있다.

 

검정을 통해 독립적인 조건이라고 한다면 B가 일어났을 때, A가 일어날 확률은 𝑃(𝐴) 𝑃(𝐴)𝑃(𝐵) 이다.

 

두 조건 사이에 연관성이 있다면

 과 같이 표현한다.

 

베이즈 정리에 핵심 공식은

𝑝(𝐴|𝐵) -> 사후 확률. (B라는 정보가 업데이트 된 이후의 사(이벤트)후 확률)

𝑝(𝐴) -> 사전 확률. B라는 정보가 업데이트 되기 전의 사전확률 (prior)

𝑝(𝐵|𝐴) -> likelihood

 

예시)

베이즈 정리를 그림으로 표현한 것

 

**False Positive Rate(FPR)와 True Positive Rate(TPR)

“Positive”의 의미는 판단자가 “그렇다”라고 판별했다는 의미

True와 False는 각각 ‘판단을 올바르게 했다’는 것과 ‘판단을 틀리게 했다’는 것을 표현

반대의 의미를 가진다고 해서 둘의 표현이 무조건 TPR = 1-FPR 이런 식은 아니다.

 

 

파이썬을 통한 베이즈정리 활용 - 신뢰구간 설정

mean_CI, _, _ = stats.bayes_mvs(표본, alpha(신뢰구간) = .95) # mean , variance, std