2019년 10월 1일 화요일

Chp8. 정규분포의 사용

본론
"정상적으로 되기"
"연속 확율분포와(continuous probability distribition) 정규분포(normal distribution)"

이산데이터
정확한 값을 취한다, 수치적이고,정확하다
모든 데이터가 이산데이터가 아니다, 범위안의 데이터등
연속(continous)데이터 , 세어지는(counted)게 아니라 "측정" measured 데이터

ex)약속시간에 늦는사람을 기다리는 시간은 "이산" 데이터인가 "연속" 데이터인가
"시간은 연속이다"
8-1.png


데이터 종류
이산확율=특정 "값"을 가지는 확율
연속확율=특정 "범위"를 가지는 확율

확율 밀도함수(Probability density function)
일정한 값들의 범위를 포함하는 연속 변수와 확율을 찾는다

8-2.png
값의 범위에 대한 일정한 도수
연속에서의 확율은 "면적" 즉 그림처럼 0에서 20까지의 범위는 1이다(총합이니까)
f(x)=1 --> "높이"가 중요하다 1=20*x -->x=1/20 --> x=0.05
면적으로 확율을 계산
p(x>5) = 20-5)*0.05 = 0.75

연속확율에서 특정한 값의 지정하는게 불가능한 이유
-->값과 값 사이에 무한한 값이 있기 때문이다

연속확율에서 특정값을 지정해서 확율을 구한다면?
-->그런 확율은 0이다 무한한 소수점을 가지는 연속에서 1개의 수는 극히 작은값이기 때문이다

곡선에 대한 확율분포(밀도)
-->정규분포의 등장

실생활에서 기대되는 이상적 모델
데이터를 다룰때 "정상적" 으로 기대하는것
μ=곡선의 가운데 σ=분포도
연속확율변수가(x) 평균값μ와 표준편차 σ를 가지며 정규분포를 따를때
X ~N(μ,σ^2)이라고 표기함


σ값이 큰 상태 , σ값이 작은 상태

**그래프에서 아무리 멀리떨어져도 0이 되지 않는다**

그래프 상에서 정규 확률
**범위로 찾는다**
ex) 변수 x가 a,b사이에 있을확율= 면적 계산
어떻게 구하는가-->확률테이블의 도움, 면적의 범위를 찾아서 확률을 계산

정규확률 계산 단계
1)분포,범위 계산 <--평균,표준편차 계산
2)표준화
3)확률탐색
μ,σ
Step-1:분포도의 결정
μ=71 , σ^2=20.25 -->  x~N(71,20.25)
에서 X>64 가 될수있는 확율은?


64이상에서의 면적 구하기

Step-2 : N(0,1)로의 표준화
변수 x가 평균은 0 표준편차는 1을 가지게 표준화 한다
**모든 정규분포에 대한 확율을 제공하는게 불가능하기때문에**

1.평균(71)을 0으로 이동(좌측으로)

2.넓이를 찌그려틀림(줄임)--(분산σ^2을 줄인다)
분포를 표준편차로 나눈다 - 분산의 √를 씌운다
√20.45 = 4.5

3.표준점수 구하기
z=x-μ/σ -->z= 64-71/4.5 = 1.56

4.table 에서 확률찾기
z를 소수 2번째까지 찾아서 만나는 지점에 해당하는 값을 읽는다
ex)1.56찾기

댓글 없음:

댓글 쓰기