2019년 10월 1일 화요일

Chp9. 정규분포의 사용 -2

본론
"Over the top"
"두개의 다른 확률분포를 1개의 확률분포로 만들기"


다른 두개의 확률 분포를 어떻게 합칠수 있을까?
두개의 합의 평균과 분산은?
이산에서의 수식을 적용하자
E(x+y)=E(x)+E(y)
E(x-y)=E(x)-E(y)
Var(x+y) , Var(x-y)=Var(x)+Var(y)
분산의 차도 더하는것

정규분포 상황에서 두개의 합을 구하기 (독립상황)
x와 y의 기대값,분산을 알면 x+y도 가능하다
μ)σ
X~N(μ(x의),σ^2) ,Y~N(μ(y의),σ^2) 성립시
x+y~N(μ,σ^2)에서
μ=μ(x의)+μ(y의)
σ^2=σ^2(x의)+σ^2(y의)

x-y 일때
μ=μ(x의)-μ(y의)

선형변환- 기저의 값을 변화 시키기(Linear Transformations)
"x의 분포에서 x의 a가 4, b가 0으로의 변화 , 사람이라 할때 몸무계가 4배가 증가,감소 하는것"

선형변환 분포
X~N(μ,σ^2)에서 a(x)+b의 변환
x가 정규분포일때 a(x)+b도 정규분포
기대값
***E(aX+b)=aE(x)+b 로 표현된다***
분산
Var(aX+b)=a^2*Var(x)
   (σ^2으로 표시)
=a^2*σ^2
***aX+b ~N(aμ+b,b^2*σ^2)***

독립관측의 기대치, 분산
E(X1 + X2...+ Xn)= nE(x)
Var(X1 + X2...+ Xn)= nVar(x)

X~N(N(x),σ^2(x))이고 Y~N(N(y),σ^2(y)) 에 x,y가 독립이면
X+Y ~N(μ(x)+μ(y),σ^2(x)+σ^2(y))
X-Y ~N(μ(x)-μ(y),σ^2(x)+σ^2(y)) --->평균은 빼고 표준편차는 더한다

독립상황에서는 데이터가 이항분포 --> 포아송분포를 따라간다
**이항분포에서 (np,npq)가 (μ=np,σ^2=npq) 5보다 클때**

ex) 2개의 보기가 있는 12개의 문제중 5개 이하를 맞출 확률
이항분포로 풀기
p(x=0) 12C0 * 0.5^12 (틀릴확율)
p(x=1) 12C1 * 0.5^1 (맞출 확률) * 0.5^11 (틀릴확율)
p(x=2) 12C2 * 0.5^2 (맞출 확률) * 0.5^10 (틀릴확율)
p(x=3) 12C3 * 0.5^3 (맞출 확률) * 0.5^9 (틀릴확율)
p(x=4) 12C4 * 0.5^4 (맞출 확률) * 0.5^8 (틀릴확율)
p(x=5) 12C5 * 0.5^5 (맞출 확률) * 0.5^7 (틀릴확율)
**모든 확률을 다 더함**
=0.387

포아송분포로 풀기
n=12 p=0.5 q=0.5 x=6
N(12*0.5,12*0.5*0.5) = N(6,3)
Z=6-6/√3 = 0
P(x<6)=0.5
=0.5

포아송분포와 이항분포의 차이가 크다!!!
**연속성 보정이 필요함

연속성 보정(continuity correction)
**이항분포를 정규분포로 가져올때 차이
이항분포는 "이산" 정규분포는 "연속"



정규분포에서는  P(x<8.5)로 지정해야 정규분포와 같아진다
z=8.5-8/√x 을 구해서 table 에서 값을 찾는다
ex) 만약 6 까지 라고 하면 p(x<5.5)
z=5.5-6/√3=-0.29  table 에서 값=0.38

연속성 보정 정리
찾는대상 ≤ 확율


p(x ≤ 8) 0.5를 더한 8.5까지

찾는대상 ≥ 확율


p(x ≥ 8) 0.5를 뺀 7.5 까지

확율(x) ≤ 대상 ≥ 확율(y)
x에서 -0.5 , y에서 +0.5

포아송 분포와 정규분포
평균값을 인수로 가지는 상황=포아송분포 사용
사용 가능 시기
λ>15 일때
λ가 작다
이산 그래프가 좌측으로 치우침
λ가 크다
이산 그래프가 정규분포의 형상을 가짐

댓글 없음:

댓글 쓰기