본론
"표본을 가지고 모집단을 예측할수 있다면 훌륭하지 않을까?"
"표본의 평균이 모집단의 평균과 동일하다고 가정하자"
표본의 평균이 모집단의 평균과 일치한다?
"정확히" 일치한다고 볼수는 없으나 그게 가장 "최선" 의 방법이다
표본의 평균값은 모집단의 평균을 위한 점추정(point estimater)이라고 불린다
모집단 파라미터의 값을 추정하기 위해 사용할수 있는 함수나 계산, 실제 모집단 param의 점추정 값은
모집단 값에 ^를 씌운다
ex) 모집단 평균위에 ^ 사용 μ(모집단 평균) ^μ (점추정값)--위에 쓰는 기호면 문자 앞에 표기
표본의 평균 표시: _x 모집단의 평균 μ 점추정값 ^μ
표본의 평균으로 모집단의 평균을 추정하기 때문에 _x = ^μ
모집단의 분산은? 추정이 가능한가?
분산:평균에서 얼마나 떨어져 있는가
표본에는 모집단보다 적은 데이터가 있다
모집단에 비해 모여있을 가능성이 높다
"새로운 방법론이 필요하다"
^σ^2=Σ(x - _x)^2 / n-1 표본의 값에서 평균을 빼고 제곱후 총합을 구한다
모집단 분산 공식
σ^2=Σ(x-μ)^2/n
모집단 분산 추정 공식
^σ=Σ(x-_x)^2/n-1 추정치 이기때문에 -1한다
ex)
61.9 63.3 65.1 67.1 68.7
62.6 64.8 66.4 67.2 69.9
657 65.7
14.44 5.76 0.36 1.96 9
9.61 0.81 0.49 2.25 17.64
62.32 6.924444444
******중요******
그리스기호 =모집단
로마문자 =표본
모집단 안에서 성공비율 찾기
^p=Ps
Ps=성공회수/표본크기
ex) 40명의 표본에서 성공 인수수 32일때 = Ps=32/40
P=확율=비율
표본의 비율 자체를 위한 확율 구하기
1.고려하는 표본과 같은 크기를 갖는 모든것 탐색
표본의 크기 탐색
2.표본의 형상분포를 보고 기대치, 분산 보기
Ps의 기대치 = Ps=x/n에서 E(Ps)구하기
E(Ps)=E(x/n)=E(x)/n = np/n = p
E(x)=np
표본이 가지는 성공비와 모집단이 가지는 성공비는 같다
Ps의 분산 Var(Ps)는?
Ps=x/n 에서 Var(Ps) = Var(x/n) = Var(x)/n^2 = npq/n^2 = pq/n
분산의 제곱근 √은 p의 표준편차 = √npq/n (비율의 표준오차)
E(Ps)=P Var(Ps)=npq/n
Ps의 분포 찾기
Ps의 분포는 표몬의 크기에 달렷음
n이 클때(30이상)의 분포는 정규분포와 비슷함
기대값
p
Var(Ps)
pq/n
Ps는 정규분포를 따른다
Ps ~N(p,pq/n)
표본은 이산인데 분포가 "연속"일수 있나?
-->연속성 보정을 해야한다
확율의 연속성보정 = +-(1/2)/n = +- 1/2 / n/1 = +-1/2n
ex)
모집단의 25%가 찬성이다 100명그룹에서 40%가 찬성할 확율은?
1)Ps의 분포는?
P=0.25, Ps ~N(p,pq/n) = (0.25,0.1875/100)=0.25,0.001875)
2)P(Ps ≥0.4) 는?(연속성 보정을 사용)
Ps~N(0.25,0.001875)
P(ps≥0.4)=(0.4-1/2.100)=0.395
Z=0.345-0.25/√0.001875 = 3.35
P(Z>z)=1-p(Z≥3.35)
=1-0.9996
=0.0004
모집단(전체)의 평균,분산을 알때 표본비 비하기
_X=x1~Xn/n = E(_x)=E(x1-Xn/n)
=E(1/n*1 + 1/n*2 ...1/nXn)
=1/n( E(x1) + E(x2) ... E(xn) )
=E(_x)=1/n(μ1+μ2...μn)
=1/n(n,μ)
=μ
표본의 분산 Var(_X)=σ^2/N
중심 극한 정리
표본의 크기가 크면 정규분포를 따른다
_X ~N(μ,σ^2/n)
이항분포
n이 30보다 크고 x~b(n,p)의 모집단이 있다면
μ=no , q^2=npq
푸아송 분포
μ=σ=λ
확율찾기
정규분포와 같다
중심 극한 정리에서의 연속성 보정
중심 극한정리에서는 필요없음
댓글 없음:
댓글 쓰기