2019년 10월 2일 수요일

Chp11. 모집단과 표본의 추정

본론
"표본을 가지고 모집단을 예측할수 있다면 훌륭하지 않을까?"
"표본의 평균이 모집단의 평균과 동일하다고 가정하자"


표본의 평균이 모집단의 평균과 일치한다?
"정확히" 일치한다고 볼수는 없으나 그게 가장 "최선" 의 방법이다

표본의 평균값은 모집단의 평균을 위한 점추정(point estimater)이라고 불린다
모집단  파라미터의 값을 추정하기 위해 사용할수 있는 함수나 계산, 실제 모집단 param의 점추정 값은
모집단 값에 ^를 씌운다
ex) 모집단 평균위에 ^ 사용 μ(모집단 평균) ^μ (점추정값)--위에 쓰는 기호면 문자 앞에 표기

표본의 평균 표시: _x 모집단의 평균 μ  점추정값 ^μ

표본의 평균으로 모집단의 평균을 추정하기 때문에 _x = ^μ

모집단의 분산은? 추정이 가능한가?
분산:평균에서 얼마나 떨어져 있는가
표본에는 모집단보다 적은 데이터가 있다
모집단에 비해 모여있을 가능성이 높다
"새로운 방법론이 필요하다"

^σ^2=Σ(x - _x)^2 / n-1  표본의 값에서 평균을 빼고 제곱후 총합을 구한다

모집단 분산 공식
σ^2=Σ(x-μ)^2/n

모집단 분산 추정 공식
^σ=Σ(x-_x)^2/n-1   추정치 이기때문에 -1한다
ex)
61.9 63.3 65.1 67.1 68.7
62.6 64.8 66.4 67.2 69.9
657 65.7
14.44 5.76 0.36 1.96 9
9.61 0.81 0.49 2.25 17.64
62.32 6.924444444

******중요******
그리스기호 =모집단
로마문자 =표본

모집단 안에서 성공비율 찾기
^p=Ps
Ps=성공회수/표본크기
ex) 40명의 표본에서 성공 인수수 32일때 = Ps=32/40
P=확율=비율

표본의 비율 자체를 위한 확율 구하기
1.고려하는 표본과 같은 크기를 갖는 모든것 탐색
표본의 크기 탐색
2.표본의 형상분포를 보고 기대치, 분산 보기

Ps의 기대치 = Ps=x/n에서 E(Ps)구하기
E(Ps)=E(x/n)=E(x)/n = np/n = p
E(x)=np
표본이 가지는 성공비와 모집단이 가지는 성공비는 같다

Ps의 분산 Var(Ps)는?
Ps=x/n 에서 Var(Ps) = Var(x/n) = Var(x)/n^2 = npq/n^2 = pq/n

분산의 제곱근 √은 p의 표준편차 = √npq/n (비율의 표준오차)

E(Ps)=P Var(Ps)=npq/n

Ps의 분포 찾기
Ps의 분포는 표몬의 크기에 달렷음
n이 클때(30이상)의 분포는 정규분포와 비슷함

기대값
p
Var(Ps)
pq/n

Ps는 정규분포를 따른다
Ps ~N(p,pq/n)

표본은 이산인데 분포가 "연속"일수 있나?
-->연속성 보정을 해야한다
확율의 연속성보정 = +-(1/2)/n = +- 1/2 / n/1 = +-1/2n
ex)
모집단의 25%가 찬성이다 100명그룹에서 40%가 찬성할 확율은?
1)Ps의 분포는?
P=0.25, Ps ~N(p,pq/n) = (0.25,0.1875/100)=0.25,0.001875)

2)P(Ps ≥0.4) 는?(연속성 보정을 사용)
Ps~N(0.25,0.001875)
P(ps≥0.4)=(0.4-1/2.100)=0.395
Z=0.345-0.25/√0.001875 = 3.35

P(Z>z)=1-p(Z≥3.35)
=1-0.9996
=0.0004

모집단(전체)의 평균,분산을 알때 표본비 비하기
_X=x1~Xn/n = E(_x)=E(x1-Xn/n)
=E(1/n*1 + 1/n*2 ...1/nXn)
=1/n( E(x1) + E(x2) ... E(xn) )
=E(_x)=1/n(μ1+μ2...μn)
=1/n(n,μ)


표본의 분산 Var(_X)=σ^2/N

중심 극한 정리
표본의 크기가 크면 정규분포를 따른다
_X ~N(μ,σ^2/n)

이항분포
n이 30보다 크고 x~b(n,p)의 모집단이 있다면
μ=no , q^2=npq

푸아송 분포
μ=σ=λ

확율찾기
정규분포와 같다

중심 극한 정리에서의 연속성 보정
중심 극한정리에서는 필요없음

댓글 없음:

댓글 쓰기