목적
"숫자의 모양 - Shape of number"
데이터를 그림으로 나타내는 방법으로 분포,변동성,중심집중 경량등을 측정 가능하다
본론
ex)임금인상 히스토그램을 만든다
Chp-09.zip의 hfda_ch09_employees_kr.csv
(직원의 성별,임금협상 여부,등이 기록되있음, - 데이가 많아서 "분해" 해야 한다)
1.Excel)
엑셀에서 "데이터"탭 -> "데이터분석" 에서 "입력범위"에 ->인상율의 처음부터 끝까지 표시 (B2:B3001) ->차트출력에 체크 ->확인
*히스토그램의 X축을 보기쉬운 정수로 표현하면 좋음*
2.R
https://www.r-project.org/ R 다운로드 , 설치
>source("http://dw.hanbit.co.kr/exam/2011/hfda.R")
> hist(employees$인상률,breaks=50)
R에서 제공하는 히스토그램 명령어
> sd(employees$인상률)
[1] 2.432138
>>표준편차를 구하는 방법
> summary(employees$인상률)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-1.800 4.600 5.500 6.028 6.700 25.900
>>column 데이터 요약
**히스토그램은 분석방법중 한가지이며 해석 전에 하는 방법이 아님**
**히스토그램이 종형 곡선의 형태일때 정규분포를(가우스 분포)를 의미 한다
댓글 없음:
댓글 쓰기