Kusee's Blog: Day_08. Network Models

2020년 5월 20일 수요일

Day_08. Network Models

Network models

네트워크 모델을 사용하는 이유는?
=관계를 만드는데 사용되는 기본 이론은?
=겉보기에 독립적인 개인이 어떻게 네트워크를 형성하는지?
===소셜 미디어는 복잡하고 분석하기 어렵다

분석을 위해 할 일은 무었인가?
==실세계 데이터를 가져오기는 쉽지않다( 법적 , 비용적 한계로 인해)
===실세계와 비슷환 환경을 만들수 있으면 좋겟다
====무엇이 가장 중요한 kill factor 로 작용할까?

실세계 network의 3가지 특징은 무었일까?
==1.power – low distribution
==2.high clustering coefficient
==3.small average path length
====이 장의 3가지의 point

1.Degree distribution
=부(wealth) 의 분배(Distribution) –대부분의 사삼들은 평균적 소득을 내고있다
-최소한의 ,극소수의 사람들이 많은 부를 가지고 있다
-비율적으로 평균적 소득을 가지는 사람이 훨씬 많다

=city population 도시인구

-몇 개의 대도시가 있고 대부분의 도시는 평균적 인구수치다

=팔레토의 법칙pareto principle

-20:80의 법칙

=degree distribution -웹페이지,사용자활동,제품가격,친구관계에도 적용됨

Power low의 수식

P=degree 비율
a=제공되는 상수,비율
d=노드에 해당하는 degree
-b=지수
====기본적으로 감소하는 형상의 그래프, d=degree가 증가할수록 감소한다

Power-low의 예시
==call network – 하루에 전화를 받는 비율

==book purchasing – 책의 구매 비율

==scientific paper – 과학 논문의 비율

==social network – 사용 node의 in-degree비율

그래프의 형상

=power-law degree distribution 그래프

=각 항목에 log를 취해서 분포를 확인
----감소하는 형상의 그래프를 보임

실생활에서도 적용되는 예

Blog, my blog log , twitter, my space 모두 내려가는 형상을 보인다

Long tail 이론

그래프 설명
==아마존의 매출을 그래프로 그린 것, 파란부분= 상위에 표시되는 제품, 인기품목의 매출이 높다 하지만 하위 순위의 제품도 많은 비율(50%이상)의 매출이 나오기 때문에 하위 제품 역시 포기할수 없다

Clustering coefficient
==실세계에서 살펴보는 구도, “친구의 친구는 내 친구다”

Average path length
==세계는 얼마나 작은가? 몇다리를 거치면 친구가 되는가
----296명의 사람에게 특정 a에 편지를 써보는 실험에서 a는 64개의 편지를 받았다, 이때 6다리만 거치면 보통 편지가 배달되었다
-----paul erdos의 논문 참조 비율, 논문을 같이쓴 공저자간의 관계를 1이라 할 때 4~5번의 다리를 건너면 대부분의 학자와 연결이 된다

Real world paradox
=친구관계의 역설–friendship paradox

–평균적으로 너의 친구들은 자기보다 친구가 많다

=core periphery structure
===중심 네트워크의 특징 – dense – 밀집되어 있다
===제외한 주변 네트워크 구조는 sparse – 퍼져있다
===해파리,문어구조 (jelly fish, octopus) 형태의 network