티스토리 뷰

반응형

#. 확률실험(=확률 시행) : E

다음을 만족할 때, 

  - 어떠한 실험에 대한 결과를 알지 못 할 경우

  - 결과는 모르지만, 결과로 나타날 수 있는 가능한 사건(경우)를 아는 경우

  - 동일한 실험을 계속 반복할 수 있는 경우


ex) 동전를 2번 던져서 어떤 면이 나오는지 실험 



#. 표본공간 : Ω

예상 가능한 모든 결과(모든 경우의 수)

표본공간을 그래프로 그린 것이 확률 분포


ex) 동전를 2번 던져서(학률 실험) 나올 수 있는 모든 경우의 수 

       Ω = {앞, 뒤}

       Ω = {뒤, 앞}

       Ω = {앞, 앞}

       Ω = {뒤, 뒤}

 


#. 사건 : A, B, ...

발생 가능한 특정 사건


ex) 동전를 2번 던져서(학률 실험) + 첫 번째 동전이 앞면이 나올 경우(사건)

      앞면이 1번 나오는 사건 : P(x=1) : {앞,뒤}

      앞면이 2번 나오는 사건 : P(x=2) : {앞,앞}


 

#. 사건의 연산

- 합사건 : 사건 A 혹은 사건 B가 발생할 확률 (OR 조건)

                ex) 주사위를 1번 던졌을 때, 앞면이 나올 사건 : {앞} or {뒤}


- 곱사건 : 사건 A와 사건 B가 동시에 발생할 확률 (AND 조건)

                ex) 주사위를 2번 던졌을 때, 앞면이 1번 나올 사건 : {앞,뒤} or {뒤,앞}


- 여사건 : 사건 A or B가 발생하지 않을 사건 (여집합)


- 독립사건 : 사건 A가 사건 B에 영향을 미치지 않는 사건


- 배반사건 : 사건 A와 사건 B가 동시에 발생하지 않는 사건 



#. 확률

 - 수학적 확률 : 동일한 결과의 확률

                      ex) 동전의 앞 면이 나올 확률 : 1/2

                                    뒷 면이 나올 확률 : 1/2

  

 - 통계적 확률 : N번 발생된 실험에서 사건 A가 a번 발생할 확률

                      ex) 동전을 N번 던졌을 때, 첫 번째로 앞 면이 나올(a) 확률 : P(A) = a/N



#. 확률변수의 확률

 확률변수는 일정한 확률을 가지고 있는 수치적 변수를 의미,

확률변수는 순수한 변수 뿐 아니라, 확률을 가지고있는 표본평균도 포함할 수 있음


 - 확률실험           : 동전를 2번 던져서 어떤 면이 나오는지 실험 

 - 표본공간           : 동전를 2번 던져서 나올 수 있는 모든 경우의 수 

 - 표본공간의 확률 : 동전을 2번 던졌을 때 나오는 확률 ( 1/2 x 1/2 = 1/4 )

 - 사건                : 동전를 2번 던져서 앞면이 나올 경우

 - 확률변수          : 동전을 2번 던졌을 때, 앞면이 나올 수 있는 개수(=성공 횟수, 표본공간에서 정의)

 - 발생 확률         : 총 경우의 수 x 성공확률 x 실패확률 ( NCa x pr x (1-p)n-r )

                               1) P(X=0) : 2C0 x (1/2)0 x (1/2)2

                               2) P(X=1) : 2C2 x (1/2)1 x (1/2)1

                               3) P(X=2) : 2C1 x (1/2)2 x (1/2)0

 표본공간

 표본공간의 확률

확률변수 ( X = x )

 발생확률 ( P(X=x) )

1. {뒤, 뒤}

 1/4

 0 

1/4

 2. {앞, 뒤} 

 1/4

 1 

 1/2 

3. {뒤, 앞}

 1/4

4. {앞, 앞}

 1/4

2

1/4

위 결과를 이항분포로 표현해보면

# 확률질량함수(dbinom)의 이항분포

> p1 <- dbinom(0:2, size = 2, prob = 0.5)  # 확률변수,성공횟수(0~2), 반복 회수(2회), 확률(0.5)

> barplot(p1, ylim = c(0,0.6), xlab = '확률변수(X)', ylab = '확률(P(X=x))')

> axis(1, at = 1:3, lab = 0:2)  




#. 확률분포

 확률변수(X)가 가질 수 있는 값과 그에 따른 발생확률(P(X=x)) 분포

확률분포는 확률변수가 이산형인지, 연속형인지에 따라 그래프가 달라집니다.


 - 확률질량함수f(x) : 확률변수(X)가 이산형 (중간이 없이 두 개의 값을 갖는 형태 (ex. 앞 or 뒤, 0 or 1))

                           막대 그래프(이항분포)로 표현


 - 확률밀도함수f(x) : 확률변수(X)가 연속형 (연속적인 분포 (ex. 사용시간))

                           선 그래프(정규분포)로 표현


참고. 누적 분포 함수 : 확률질향함수 또는 확률밀도함수가 구해진 후, 특정 이상, 이하 확률 값을 찾을 수 있도록 해주는 함수

               ex)  ~에서 ~사이에 있는 분포는 ~다


#########################################################################################


1. 이항분포 (확률질량함수 사용)

X ~ B(n,p)


 - n번 반복하는 실험에서 확률 변수(X)에 따른 사건의 성공 확률(p)을 표현한 분포 => 정의가 명확한 분포 

 - 이항분포의 모수(n: 시행 횟수, p: 성공 확률)에 따라 분포 모양이 결정 => n이 커질수록 정규분포에 근접 

 - 성공 확률(p)이 동일한 베르누이 시행(2가지 확률, 앞or뒤)을 독립적으로 n번 반복해서 실험하는 경우

      ex) 동전 1개(베르누이 시행)를 n번 던져서 앞면이 나올 성공 확률(p), 뒷면은(1-p)


ex) 주사위를 3번 굴려서 2의 배수 나올 확률     

    - 주사위를 굴려 2의 배수가 나오면 성공

    - 주사의는 독립적으로 3번 반복(n) 

    - 성공 확률(p)은 모두 1/3 (2가 나올 확률 : 1/3, 4가 나올 확률 : 1/3, 6이 나올 확률 : 1/3)

    - 확률 변수(X) = {0,1,2,3} (주사위를 3번 굴렸을 때, 2의 배수가 나올 수 있는 개수) 

    - 성공 횟수의 확률질량함수 = X ~ B(3, 1/3)


# 확률질량함수(dbinom)의 이항분포

> p1 <- dbinom(0:3, size = 3, prob = 1/3)  # 확률변수(0~3), 반복 회수(3회), 확률(1/3)

> names(p1) <- 0:3

> barplot(p1, ylim = c(0,0.5), xlab = '확률변수(X) = 성공횟수', ylab = '확률(P(X=x))')



2. 정규분포 (확률밀도함수 사용)

 - 정규분포는 이항분포처럼 정확한 정의가 없이, 확률변수(X)에 따른 사건의 확률이 종모양을 갖는 확률변수(X)의 분포

 - 종모양 = 그래프의 좌,우 대칭 = 평균 주변에 밀집

      ex) 어느 공장에서는 생산품 검사 시 매번 5개의 불량품이 발견 => 평균 5개 기준으로 밀집하여 그래프가 대칭

 - 확률분포가 어떠한 분포를 갖던 반복횟수를 늘리면 대체적으로 종모양의 형태를 가짐

      ex) X~B(n,p) 에서 n 의 크기를 증가시킬수록 정규분포(N)에 근사


# 확률밀도함수(dnorm)의 정규분포

> x1 <- seq(-3, 3, 0.01)

y1 <- dnorm(x1, 0, 1)  # 평균 : 0, 표준편차 : 1 


plot(x1, y1, type = 'l', col = 'red', ylim = c(0,0.4), 

           xlab = '확률변수(X)', ylab = '확률(P(X=x))', axes = F)

abline(h=0)

abline(v=0, lty = 2) 

axis(1, c(-3:3))

axis(2, seq(0,0.4,0.1))



3. 표준정규분포 (표준화된 정규분포)

Z ~ N(0,1)    * N(모평균, 표본분산)

Z = (X - μ) / σ  ( X: 확률변수, μ:평균(뮤), σ:표준편차(시그마) )


 - 정규분포의 확률변수(X)가 표준화된 분포

 - 모든 정규분포는 표준정규분포로 변환 가능

 - 평균이 0을 기준으로 그래프가 대칭

 - 평균 = 0, 표준편차(분산) = 1








반응형
댓글
최근에 올라온 글
최근에 달린 댓글
링크
Total
Today
Yesterday