=분석 목적에 따른 가설을 설정해서 필요한 데이터를 수집하고 모델을 생성하고 평가한다
교과목 특징
=단순 암기를 통한 시험이 아닌 Project 설계와 수행을 중심으로 하는 수업
데이터 분석의 특징이란?
=데이터의 특징과 같으며 생존 기술이 된다
**정화민.Dr research
한국인의 data 수집 DNA
=고대 측우기부터 시작된 데이터의 열정
==측우기
===조선초기 문종부터 조선 멸망인 20세기 초까지의 강수 기록이 남아있음
===”어떤 크기의 직경을 가진 그릇을 사용해야 하는가?”
===직경과 길이에 따라 얼마나 비가 왔는지 달라지기 때문이다
==팔만대장경
===5억자가 넘는 한자로 이루어 졌으나 오탈자가 한 개도 없는 특징
기업경영에서의 데이터 분석(Value chain 중심으로)
위를 기반으로 ERP, CRM 필요 요소 나열
ERP-전사적 자원관리 | 2, 6, 8, 재무회계 |
CRM-고객 자원 관리 | 8, 9 |
미국의 JOB 추세
=미국 최고 직업에 DATA 과학자가 최상위에 랭크
=행동 예측 분석 분야가 최근 뜨고 있음
데이터 분야 확장 영역
=의료 영역까지 데이터가 잠식 하는 추세
=경험과 Algorithm을 통달해야 진입이 가능한 특징 존재
실생활에서 통계학의 사용
=크림전쟁의 장미도표
=전쟁에서 사상자보다 병원내 2,3차 감염에 의해 사망하는 비율이 높다는 것을 입증한 도표
통계학이란?
=통계학의 어원 – statistics = state(동사) + state(명사-국가) = 국가를 표시하다
=다양한 사회 현상에서 자료를 바탕으로 신뢰할 만한 정보를 제공하는 학문
모집단과 표본
모집단 | =알고자 하는 대상 전체 =조사 대상의 범위 =전수조사:모집단 전체를 조사하는 방법 |
표본 | =모집단으로부터 조사하기 위해 선택된 조사대상 =모집단 전체를 조사하는 것이 불가능 할 때 =수류탄과 같이 조사하면 사라지는 형태에서 사용하는 경우가 많음 |
공학 분야별 데이터 특징
공학-Engineering | 데이터의 양 =10TB이상 데이터의 특징 =데이터의 크기를 줄이는 것이 쟁점 |
사회공학 – Social Engineering | 데이터의 수 & 특징 =200건 이상에서 데이터의 특징 유추까지 |
통계학에서 데이터의 예시
변수유형 | 자료유형 | 인구주택 총조사 자료 | Ex |
질적 변수 | 명목형 | 성별, 배우자와의 관계 | 거주지, 혈액형 |
순서형 |
학력 |
학점, 설문문항 | |
양적 변수 |
이산형 |
출생아 수 | 형재 수 , 수강과목 수 |
연속형 |
연령 |
키, 몸무게 |
자료 구분이 중요한 이유
=유형에 따라 사용되는 분석 algorithm이 다르다
==ex)혈액형과 MBTI 성격유형 이라는 논제에서 어떤 분석을 사용 해야 할지 구별 해야함
댓글 없음:
댓글 쓰기