2019년 8월 17일 토요일

Chp0. 준비하기

본론
0-1 무었을 왜 분석할까?
데이터 분석으로 나오는 화려한 그래프보다 우선 *고객의 Needs를 먼저 파악한다*
-->고객의 범주는 최종 분석된 data를 보게되는 사람으로 넓게 보는게 필요
=====================
책에서
고객의 Needs파악 -> 데이터 분석 -> 시각화 -> 제출
데이터가 말하게 만드는게 중요하다
하지만 내 생각은
산출된 데이터의 원인파악 (Mental model체크) -> Needs분석 -> data 분석 -> 시각화 -> 분석 -> 시각화 -> 보고
데이터는 절대 말하지 않는다 , 데이터는 멘탈 모델의 산출물이기 때문에
=====================

사용하기 좋은 data 들
서울시 공개 data , 통계청 , 국가통계포털

데이터 분석 단계
수집->저장->분석
-->저장시 hadoop을 사용해서 비정형 data를 저장함, 분석시 mapreduce 라는 java기반으로 분석한다

R설치
r-project에서 설치

패키지관리
cran 지정 , install.packages("패키지명")으로 설치 , remove.packages("패키지명")으로 삭제

R working Directory 지정
1.setwd(dir)
-->잘 인식되지 않음 3.6.1 설치에서 확인
2.파일 직접 설정
C:\Program Files\R\R-3.6.1\etc
-->R설치 경로의 etc에 들어가서 Rprofile.site 파일의 맨 위에
setwd("D:\\002 Work")
# Things you might want to change

# options(papersize="a4")

다음과 같은 setwd 를 지정한다, 이때 \는 특수문자(escape character)이기때문에 한번 더 적어준다

댓글 없음:

댓글 쓰기