[데이터사이언스] Diary-(9)

*베이지안 정리:

사전확률 / 사후확률을 초기값으로 각각 0.5를 설정한후

사건이 발생함에 따라 사후확률을 계속 업데이트 하는 방식.

1.총 확률의 법칙은 무멋인가?

A라는 특정 확률 변수에 대해 모든 일어날 경우를 더하면 1이 된다.

Ex) 주사위가 1,2,3,4,5,6이 나올 확률을 모두 더하면 1

1/6 + 1/6 + 1/6 + 1/6 +1/6 + 1/6 = 6/6 = 1

A,B의 서로 연관 되어있는 변수도 고려해보자.

사건B가 일어난 상황에서 사건A가 일어날 확률은 P(A|B) 로 표기된다.

예를들어, 피자를 시키는 손님이 음료까지 같이 시킬까? 에 대한 확률 표기는

P(A) = 피자를 시킨다
P(B1) = 음료를 시킨다
P(B2) = 음료를 시키지 않는다.

P(A) = P(A|B1)P(B1) + P(A|B2)P(B2)

  1. 베이지안 이론이 무엇인가?:

B라는 새로운 데이터가 들어왔을때 기존 사건A의 확률을 업데이트 하는것!

여기선 사전확률과 사후확률의 개념이 있는데 사전확률은 기존에 사건이 일어날 확률이고 사후확률은 그 기존 사건이 어떤사건에 영향을 받아 값이 새롭게 바뀐 확률을 사후확률이라 한다.

특히 사전확률의 경우 관찰하고자 하는 대상의 정보가 없을경우 0.5로 설정한다.
(그렇다면 사후확률도 0.5로 설정)

질문 : 내가 피자집을 운영하는데 내 고객이 피자를 시킬때 음료도 같이 시킬 확률이 어떻게 될까? ( 단, 음료를 시킬확률은 0.6 이고 시키지 않을 확률은 0.4라 가정한다. )

P(A1) = 피자를 시킨다
P(A2) = 피자를 안시킨다
P(B1) = 음료를 시킨다
P(B2) = 음료를 안시킨다

피자를 시켰을때 음료를 시킬 확률 =

P(A1)*P(B1) / P(A|B1)*P(B1) + P(A|B2)*P(B2)

0.5 * 0.6 / (0.5*0.6) + (0.5*0.01)

= 0.857 = 85.7%

좋은 웹페이지 즐겨찾기