2020년 4월 16일 목요일

Chp07. 대표값과 산포도, 상관관계

01.대표값과 평균
대푯값
=자료의 중심경향을 하나의 수로 나타낸 값으로 평균, 중앙, 최빈값등이 있다
평균
=변량의 총합을 변량의 개수로 나눈값 , 변량의 총합/변량의수



02.중앙값,최빈값
중앙값
=자료를 작은것부터 나열시 가운데에 위치한값
=개수가 홀수일 때 가운데 위치한값
=개수가 짝수일 때 가운데 위치한 두 자료의 평균



최빈값
=자료의 값중에 가장 많이 나타나는값
=자료의 값중에서 도수가 큰ㄱ밧이 여러 개 있으면 값이 모두 최빈값이다
=각자료의 도수값이 모두 같으면 최빈값은 없다



03.산포도와 편차
산포도
=자료들이 대표값을 중심으로 흩어져 있는 정도를 하나의 수로 나타낸 값
=산포도가 크면 멀리 흩어져있다
=산포도가 작으면 대표값 주위에 있다



편차
=어떤 자료가 있을 때 각 변량에서 평균을 뺀값
=편차= 변량-평균
**편차의 총합은 항상 0이다
평균보다 큰 변량의 차는 항상 양수, 평균보다 작으면 음수가 나온다



04.분산과 표준편차
분산
=각 편차의 제곱의 합을 변량 전체의 개수로 나눈 것, 편차의 제곱의 평균
=편차^2의 총합/변량의 개수



표준편차
=분산의 음이 아닌 제곱근
=√분산
**분산과 표준편차가 작을수록 평균을 중심으로 몰려있다고 볼 수 있다**



05.도수 분포표에서의 분산, 표준편차
평균 – 편차 – 편차^2 – 분산 – 표준편차
평균 =(계급값*도수)총합 / 도수의 총합
편차 = 계급값-평균
분산 = ((편차)^2 * 도수) 총합 / 도수의 총합
표준편차 = √분산



06.적당한 대표값의 선택
=대푯값으로는 평균이 적당함
=매우 작거나 큰 값에서 대표값은 중앙값이 좋다



산포도의 해석
분산과 표준 편차가 

     작다
          =자료가 평균에 가깝게 있다, 고르게 분포되어 있다

    크다
         =자료가 평균에서 멀리있다 넓게 퍼져있다



07.산점도
정의 = 두 변량 x,y에 대한 관계를 알아보기 위해 이를 순서쌍 x,y로 좌료 평면에 나타낸 것


양의 상관관계
=x값이 커질 때 y값도 커진다

음의 상관관계
=x값이 커질 때 y값이 작아진다


관계가 없다
=x,y축에 수평하게 분포하거나 광범위하게 퍼져있다


댓글 없음:

댓글 쓰기