2019년 8월 7일 수요일

Chp9. 히스토그램

목적
"숫자의 모양 - Shape of number"
데이터를 그림으로 나타내는 방법으로 분포,변동성,중심집중 경량등을 측정 가능하다

본론
ex)임금인상 히스토그램을 만든다
Chp-09.zip의 hfda_ch09_employees_kr.csv
(직원의 성별,임금협상 여부,등이 기록되있음, - 데이가 많아서 "분해" 해야 한다)

1.Excel)
엑셀에서 "데이터"탭 -> "데이터분석" 에서 "입력범위"에 ->인상율의 처음부터 끝까지 표시 (B2:B3001) ->차트출력에 체크 ->확인





*히스토그램의 X축을 보기쉬운 정수로 표현하면 좋음*

2.R
https://www.r-project.org/ R 다운로드 , 설치


>source("http://dw.hanbit.co.kr/exam/2011/hfda.R")
> hist(employees$인상률,breaks=50)


R에서 제공하는 히스토그램 명령어

> sd(employees$인상률)
[1] 2.432138
>>표준편차를 구하는 방법

> summary(employees$인상률)
Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
-1.800   4.600   5.500   6.028   6.700  25.900
>>column 데이터 요약

**히스토그램은 분석방법중 한가지이며 해석 전에 하는 방법이 아님**
**히스토그램이 종형 곡선의 형태일때 정규분포를(가우스 분포)를 의미 한다

댓글 없음:

댓글 쓰기