2020년 3월 22일 일요일

Day_00. Intro

1.introduction

소셜data의 소개 – introduction to social data

Ex)facebook을 예로 들면
--facebook의 데이터를 사용하는 방법은?
--facebook은 우리의 정보를 어디에 사용할까?
---amazon,yelp,twitter는 데이터를 어떻게 사용할까?


코스의 목적(objective)

1.웹의 사회적 측면의 이해
--사회이론 + 소셜 미디어 _ 마이닝
--소셜 미디어 data의 수집과 정제 방법
--소셜 미디어에서의 홍보 방법
--소셜 미디어의 중요 속성의 특징과 소결미디어 시뮬레이션
--소셜미디어 커뮤니티의 탐색과 분석
--소셜 미디어에서의 친구 추천과 인간 행동분석

2.대표적 알고리즘과 도구의 학습


필수 선수과목

1.자료구조 & 알고리즘
--감색정렬 알고리즘
--시공간 복잡도의 이해
--그래프 알고리즘(Traversal,MST,최소경로)

2.프로그래밍 SKILL
--java,Matlab
----java를 기반으로한 크롤링
----matlab을 이용한 행렬의 고유값 계산

3.확률/통계/미적분학의 기본 지식
--기대,분산,표준편차
--고유값계산,결정요인,특정 방정식
--기본적인 미분,적분,미분방정식의 지식


소셜미디어의 정의
인터넷을 기반으로 사람들의 경험과 정보를 효과적으로 나누는 것


소셜미디어의 4가지 landspace
--publishing,sharing,networking,discussing


소셜 네트워크=페이스북,링크드인
사진,동영상 공유 = 플맄커,유튜브,팟케스트
블로그 = 사용자가 만드는 저널, 구글블로그 트위터(마이크로 블로그라고 할수있다)
뉴스= 커뮤니티에서 해당 그룹의 소식을 전하거나 홍보 raddit
북마크=사용자의 북마크를 저장해서 공유하거나 카테고리화 시키는 기능,delicious.com stumbleupon.com
의견,리뷰,레이팅(순위)=고객이 경험한 것을 별점등의 시스템을 통해 순위를 측정하는 것
집단지성 시스템(social provide answer = 네이버 지식in처럼 사용자가 묻고 답해주는 시스템

소셜미디어의 주요 특성
1.참여 = 소셜미디어는 사용자의 참여에 따라 정보가 공유된다
2.개방성=대부분의 소셜 미디어는 참여에 개방되어있다, 계시글 삭제시에만 password가 필요하는등 큰 경계가 없다
3.대화=기존 미디어는 broadcast 라는 키워드로 단방향 소통을 했다면 소셜미디어는 양방향 소통을 한다
4.커뮤니티화=자신이 졸하하는 분야에 대한 커뮤니티의 생성이 쉽고 흔하다
5.연결성= 해당 커뮤니티에서 정보와 홍보를 위해 링크를 이용해서 커뮤니티의 질이 더 좋아지고 사람이 유입되서 규모가 커진다


소셜미디어 마이닝이란?
--소셜미디어에서 의미있는 패턴을 추출하고 분석하는 행위

소셜미디어 마이닝에서의 도전과제

1.빅데이터의 역설(paradox)
----소셜미디어 데이터는 크지만 균일하게 분포되어 있지 않음
----각각 개인적 측면에서는 데이터가 적다

2.충분한 sample의 취득
----취득한 sample이 전체 모집단을 대표할수 있는가

3.noise 제거의 오류
----데이터를 많이 삭제하면 데이터 사이의 공간이 많아진다
----노이즈의 정의는 하는 작업에 따라 달라진다, 어떻게 노이즈를 정의할수 있는가

4.평가의 딜레마(dilemma)
----기저에 깔린 평가 기준이 없다면 어떻게 분석을 평가할수 있을까?

댓글 없음:

댓글 쓰기