2020년 9월 23일 수요일

Day_00. Introduction

 

강의의 소개

=통계 방법론을 이용해서 데이터 과학자의 소양을 기른다

=기본언어는 R, Python 을 사용한다

 

중간고사

=개인과제 어렵다, 하지만 시간을 들이면 좋은 결과가 있을 것이다

 

기말고사

=팀과제, 멘토링을 통해 결과가 좋으면 학회지에 계제도 노려본다 좋은 기회가 될듯

 

배점

출결

10

과제

30

중간

30

기말

30

기말 과제는 팀과제로 팀장의 권한이 크다,  5명이 1팀으로 5팀이 나온다

 

 

데이터의 종류

=정형  - 수치형 데이터

=비정형 영상, txt

 

데이터 분석의 순서

분석(통ㄱ) -à

정보 생성à

예측,분류 지도학습

올바른 의사결정

경쟁우위 쟁취

생존

 

군집 비지도학습

 

시각화

위의 단계를 통해 데이터 분석을 실시하고 미래 예측과 생존을 한다

 

조선시대의 측우 데이터 수집

=쌀 수확량 데이터와 같이 수집 à데이터의 파급효과를 다양하게 생각해야 한다

 

빅데이터의 등장으로 산업이 바뀌며 낙후되고 떨어지는 사람이 있다

==시대적 흐름을 거스를 수는 없는법이다

 

인공지능

머신러닝

**인공신경망

 

딥러닝(은닉층-Hidden Network 2개 이상)

인공신경망의 XOR문제의 해결

**이 모든 것은 통계학이 기반이다

 

기업경영에서 data가 중요한 이유

=업무 프로세스에서 data가 회전한다

==data가 회전하면서 만드는 value chain이 끊어지면 매출이 떨어진다

 

통계적 지식 + 분석능력 = 데이터 사이언티스트

à50 best jobs in America 자료 참조, glassdoor

 

전문분야별 분석기술 & 방법 table참조해서 file 에 넣는 것

==기획 + 수집 + 분석(통계,시각화) 를 할줄 아는 사람 데이터 사이언티스트이다

댓글 없음:

댓글 쓰기