강의의 소개
=통계 방법론을 이용해서 데이터 과학자의 소양을 기른다
=기본언어는 R, Python 을 사용한다
중간고사
=개인과제 – 어렵다, 하지만 시간을 들이면 좋은 결과가 있을 것이다
기말고사
=팀과제, 멘토링을 통해 결과가 좋으면 학회지에 계제도 노려본다 – 좋은 기회가 될듯
배점
출결 |
10 |
과제 |
30 |
중간 |
30 |
기말 |
30 |
기말 과제는 팀과제로 팀장의 권한이 크다, 5명이 1팀으로 5팀이 나온다 |
데이터의 종류
=정형 - 수치형 데이터
=비정형 – 영상, txt
데이터 분석의 순서
분석(통ㄱ) -à |
정보 생성à |
예측,분류 –지도학습 |
올바른 의사결정 |
경쟁우위 쟁취 |
생존 |
|
군집 – 비지도학습 |
|
|||
시각화 |
위의 단계를 통해 데이터 분석을 실시하고 미래 예측과 생존을 한다
조선시대의 측우 데이터 수집
=쌀 수확량 데이터와 같이 수집 à데이터의 파급효과를 다양하게 생각해야 한다
빅데이터의 등장으로 산업이 바뀌며 낙후되고 떨어지는 사람이 있다
==시대적 흐름을 거스를 수는 없는법이다
인공지능 |
머신러닝 |
**인공신경망 |
|
딥러닝(은닉층-Hidden Network 가 2개 이상) |
인공신경망의 XOR문제의 해결 |
**이 모든 것은 통계학이 기반이다
기업경영에서 data가 중요한 이유
=업무 프로세스에서 data가 회전한다
==data가 회전하면서 만드는 value chain이 끊어지면 매출이 떨어진다
통계적 지식 + 분석능력 = 데이터 사이언티스트
à50 best jobs in America 자료 참조, glassdoor
전문분야별 분석기술 & 방법 table참조해서 file 에 넣는 것
==기획 + 수집 + 분석(통계,시각화) 를 할줄 아는 사람 –데이터 사이언티스트이다
댓글 없음:
댓글 쓰기