티스토리 뷰
#. 확률실험(=확률 시행) : E
다음을 만족할 때,
- 어떠한 실험에 대한 결과를 알지 못 할 경우
- 결과는 모르지만, 결과로 나타날 수 있는 가능한 사건(경우)를 아는 경우
- 동일한 실험을 계속 반복할 수 있는 경우
ex) 동전를 2번 던져서 어떤 면이 나오는지 실험
#. 표본공간 : Ω
예상 가능한 모든 결과(모든 경우의 수)
표본공간을 그래프로 그린 것이 확률 분포
ex) 동전를 2번 던져서(학률 실험) 나올 수 있는 모든 경우의 수
Ω = {앞, 뒤}
Ω = {뒤, 앞}
Ω = {앞, 앞}
Ω = {뒤, 뒤}
#. 사건 : A, B, ...
발생 가능한 특정 사건
ex) 동전를 2번 던져서(학률 실험) + 첫 번째 동전이 앞면이 나올 경우(사건)
앞면이 1번 나오는 사건 : P(x=1) : {앞,뒤}
앞면이 2번 나오는 사건 : P(x=2) : {앞,앞}
#. 사건의 연산
- 합사건 : 사건 A 혹은 사건 B가 발생할 확률 (OR 조건)
ex) 주사위를 1번 던졌을 때, 앞면이 나올 사건 : {앞} or {뒤}
- 곱사건 : 사건 A와 사건 B가 동시에 발생할 확률 (AND 조건)
ex) 주사위를 2번 던졌을 때, 앞면이 1번 나올 사건 : {앞,뒤} or {뒤,앞}
- 여사건 : 사건 A or B가 발생하지 않을 사건 (여집합)
- 독립사건 : 사건 A가 사건 B에 영향을 미치지 않는 사건
- 배반사건 : 사건 A와 사건 B가 동시에 발생하지 않는 사건
#. 확률
- 수학적 확률 : 동일한 결과의 확률
ex) 동전의 앞 면이 나올 확률 : 1/2
뒷 면이 나올 확률 : 1/2
- 통계적 확률 : N번 발생된 실험에서 사건 A가 a번 발생할 확률
ex) 동전을 N번 던졌을 때, 첫 번째로 앞 면이 나올(a) 확률 : P(A) = a/N
#. 확률변수의 확률
확률변수는 일정한 확률을 가지고 있는 수치적 변수를 의미,
확률변수는 순수한 변수 뿐 아니라, 확률을 가지고있는 표본평균도 포함할 수 있음
- 확률실험 : 동전를 2번 던져서 어떤 면이 나오는지 실험
- 표본공간 : 동전를 2번 던져서 나올 수 있는 모든 경우의 수
- 표본공간의 확률 : 동전을 2번 던졌을 때 나오는 확률 ( 1/2 x 1/2 = 1/4 )
- 사건 : 동전를 2번 던져서 앞면이 나올 경우
- 확률변수 : 동전을 2번 던졌을 때, 앞면이 나올 수 있는 개수(=성공 횟수, 표본공간에서 정의)
- 발생 확률 : 총 경우의 수 x 성공확률 x 실패확률 ( NCa x pr x (1-p)n-r )
1) P(X=0) : 2C0 x (1/2)0 x (1/2)2
2) P(X=1) : 2C2 x (1/2)1 x (1/2)1
3) P(X=2) : 2C1 x (1/2)2 x (1/2)0
표본공간 |
표본공간의 확률 |
확률변수 ( X = x ) |
발생확률 ( P(X=x) ) |
1. {뒤, 뒤} |
1/4 |
0 |
1/4 |
2. {앞, 뒤} |
1/4 |
1 |
1/2 |
3. {뒤, 앞} |
1/4 |
||
4. {앞, 앞} |
1/4 |
2 |
1/4 |
위 결과를 이항분포로 표현해보면
# 확률질량함수(dbinom)의 이항분포
> p1 <- dbinom(0:2, size = 2, prob = 0.5) # 확률변수,성공횟수(0~2), 반복 회수(2회), 확률(0.5)
> barplot(p1, ylim = c(0,0.6), xlab = '확률변수(X)', ylab = '확률(P(X=x))')
> axis(1, at = 1:3, lab = 0:2)
#. 확률분포
확률변수(X)가 가질 수 있는 값과 그에 따른 발생확률(P(X=x)) 분포
확률분포는 확률변수가 이산형인지, 연속형인지에 따라 그래프가 달라집니다.
- 확률질량함수f(x) : 확률변수(X)가 이산형 (중간이 없이 두 개의 값을 갖는 형태 (ex. 앞 or 뒤, 0 or 1))
막대 그래프(이항분포)로 표현
- 확률밀도함수f(x) : 확률변수(X)가 연속형 (연속적인 분포 (ex. 사용시간))
선 그래프(정규분포)로 표현
참고. 누적 분포 함수 : 확률질향함수 또는 확률밀도함수가 구해진 후, 특정 이상, 이하 확률 값을 찾을 수 있도록 해주는 함수
ex) ~에서 ~사이에 있는 분포는 ~다
#########################################################################################
1. 이항분포 (확률질량함수 사용)
X ~ B(n,p)
- n번 반복하는 실험에서 확률 변수(X)에 따른 사건의 성공 확률(p)을 표현한 분포 => 정의가 명확한 분포
- 이항분포의 모수(n: 시행 횟수, p: 성공 확률)에 따라 분포 모양이 결정 => n이 커질수록 정규분포에 근접
- 성공 확률(p)이 동일한 베르누이 시행(2가지 확률, 앞or뒤)을 독립적으로 n번 반복해서 실험하는 경우
ex) 동전 1개(베르누이 시행)를 n번 던져서 앞면이 나올 성공 확률(p), 뒷면은(1-p)
ex) 주사위를 3번 굴려서 2의 배수 나올 확률
- 주사위를 굴려 2의 배수가 나오면 성공
- 주사의는 독립적으로 3번 반복(n)
- 성공 확률(p)은 모두 1/3 (2가 나올 확률 : 1/3, 4가 나올 확률 : 1/3, 6이 나올 확률 : 1/3)
- 확률 변수(X) = {0,1,2,3} (주사위를 3번 굴렸을 때, 2의 배수가 나올 수 있는 개수)
- 성공 횟수의 확률질량함수 = X ~ B(3, 1/3)
# 확률질량함수(dbinom)의 이항분포
> p1 <- dbinom(0:3, size = 3, prob = 1/3) # 확률변수(0~3), 반복 회수(3회), 확률(1/3)
> names(p1) <- 0:3
> barplot(p1, ylim = c(0,0.5), xlab = '확률변수(X) = 성공횟수', ylab = '확률(P(X=x))')
2. 정규분포 (확률밀도함수 사용)
- 정규분포는 이항분포처럼 정확한 정의가 없이, 확률변수(X)에 따른 사건의 확률이 종모양을 갖는 확률변수(X)의 분포
- 종모양 = 그래프의 좌,우 대칭 = 평균 주변에 밀집
ex) 어느 공장에서는 생산품 검사 시 매번 5개의 불량품이 발견 => 평균 5개 기준으로 밀집하여 그래프가 대칭
- 확률분포가 어떠한 분포를 갖던 반복횟수를 늘리면 대체적으로 종모양의 형태를 가짐
ex) X~B(n,p) 에서 n 의 크기를 증가시킬수록 정규분포(N)에 근사
# 확률밀도함수(dnorm)의 정규분포
> x1 <- seq(-3, 3, 0.01)
> y1 <- dnorm(x1, 0, 1) # 평균 : 0, 표준편차 : 1
> plot(x1, y1, type = 'l', col = 'red', ylim = c(0,0.4),
xlab = '확률변수(X)', ylab = '확률(P(X=x))', axes = F)
> abline(h=0)
> abline(v=0, lty = 2)
> axis(1, c(-3:3))
> axis(2, seq(0,0.4,0.1))
Z ~ N(0,1) * N(모평균, 표본분산)
Z = (X - μ) / σ ( X: 확률변수, μ:평균(뮤), σ:표준편차(시그마) )
- 정규분포의 확률변수(X)가 표준화된 분포
- 모든 정규분포는 표준정규분포로 변환 가능
- 평균이 0을 기준으로 그래프가 대칭
- 평균 = 0, 표준편차(분산) = 1
'Data > Statistics' 카테고리의 다른 글
[Statistics/R] 모집단 추론, 추정 (0) | 2019.01.31 |
---|---|
[Statistics] 표준 정규 분포 (0) | 2019.01.31 |
[Statistics/R] 중심극한정리(표본과 모집단) (0) | 2019.01.30 |
[Statistics] 모집단과 표본 (0) | 2019.01.25 |
[Statistics/R] 확률분포(이항분포, 정규분포) 그리기, 확률분포 함수(d,p,q) (0) | 2019.01.24 |