2019년 8월 7일 수요일

Chp4. 데이터 시각화

목적
"그림은 사람을똑똑하게 만든다"
데이터 시각화는 데이터를 이해하기 쉬워 "보이게" 만든다는것 (실제로 이해하기 쉬울수도, 이상한 데이터의 시각화 일수도 있기때문)
그래서 "시각화된 정보뒤에 무었이 있는가" 를 주의깊게 봐야한다

본론
시각화를 할때 "데이터가 많으면 문제가 된다?" (불필요한 데이터가 있을수있고 시각화 등에 방해되며 처리에 쉽지않을수 있어서)는 생각을 가질수 있지만 답은
"NO"이다 데이터가 많은건 문제가 되지않는다, 목적을 염두하고 목적에 맞는 DATA 만 집중하면 문제될게 없기때문에
-->"데이터는 많을수록 좋다"

데이터의 시각화--> 적절한 비교가 이루어진것
ex)Chp-04.zip의 hfda_ch04_home_page1_kr.csv 을 참조하면 사이트 체류시간과 수입의 상관관계를 볼수있음)

좋은 데이터 시각화의 특징
--> 데이터를 나타냄, 적정한 비교 , 여러변수의 명시 등이 이루어진것

데이터의 "탐색적 분석" 에서 "산포도"는 특히 "인과관계" 조사에서 쓸모가 있다
-->가로(x)는 독립변수 - 영향을 미치는 변수,원인이라고 생각하는 변수)
-->세로(y)는 종속변수 - 결과가 된다고 생각하는 변수




그림에서보면 2차원 그래프 이기때문에 변수 역시 제한된 개수만 사용 가능함
-->다양한 변수를 사용한 시각화를 "다변량 시각화" 라고 한다

***데이터 시각화의 핵심***
"인과관계" - 시각화 시킨 방법이 데이터와 잘 어울려서 다른 인과 관계 모델에도 대응이 되야한다
-->"데이터 일관성(Integrity)"가 있는 데이터 시각화가 중요하다

에드워드 터프티 (edward tufte)
-->데이터 시각화의 최고권위자, 참고할만한 자료가 많음 "인지예술" 이라고도 불리는 권위자이다

댓글 없음:

댓글 쓰기