2021년 5월 12일 수요일

Python - Factor Analysis

요인분석을 통해 factor 의 개수를 알아냈다면 factor에 따른 data의 상황을 살펴볼 차례


1.package install
!pip install factanal
package 설명은 링크
2.package import
import pandas as pd
import random
from factanal.wrapper import factanal

3.dataframe 생성
pdf = pd.DataFrame({"v1": [random.randint(0, 100) for _ in range (30)],
"v2": [random.randint(0, 100) for _ in range (30)],
"v3": [random.randint(0, 100) for _ in range (30)],
"v4": [random.randint(0, 100) for _ in range (30)],
"v5": [random.randint(0, 100) for _ in range (30)],
"v6": [random.randint(0, 100) for _ in range (30)],
"v7": [random.randint(0, 100) for _ in range (30)],
"v8": [random.randint(0, 100) for _ in range (30)]})

***가로축(column)에 항목의 이름이, 세로축(row)에 속성값이 들어간 상태에서 진행한다***

4.Factor analysis 수행
fa_res = factanal(pdf, factors=2, scores='regression', rotation='promax', verbose=True, return_dict=True)


factor 1,2에 대한 각 항목들의 유사도를 볼수 있다


factor의 개수가 2개이며 해당하는 p-value 를 보여준다

댓글 없음:

댓글 쓰기