2021년 10월 27일 수요일

Day_06. 평균비교 & Logistic Regression

모집단이 2개인 경우
=독립인 집단에서 차이 검정
=평균 차이 검정


집단이 3개 이상일 때
=독립적 집단이 3개 이상일 때 평균 비교 방법
==2개씩 짝을 지어 비교한다
=마케팅 부분에서 주로 사용한다 -> 고객에게 만족을 주는가 -> 의사결정이 가능한가


일원배치 분산 분석
=동질성 파악이 중요
=분산=편차 제곱의 합의 평균
=표준편차 = 분산의 제곱근


가설
=귀무가설(영가설) – 모든 집단의 처리의 평균이 같다 , 각 처리의 효과가 없다
=대안가설(연구가설) – 평균의 차이가 있는 것으로 적어도 한 개 처리의 평균이 다르다


독립표본 T검증 – 2개 집단의 평균의 차이(
일원배치 분산 분석 = 3개 이상의 특성
===국내 대학생의 취업 태도/취업 준비 비용에 대한 연구


인공지능과 통계의 관계
==통계를 모르고 인공지능을 할 수 없음


Logistic Regression
=Binomial Logistic Regression 결과값이 0,1 로 나옴, 종속변수가 이항
=결과값이 2개이상에서는 다항 Logistic Regression 을 이용한다
==장점
===모수 추정이 가능/범주 확률값의 추정 / 해석성이 좋다
==단점
===데이터 set의 차원이 크면 성능이 떨어진다


수업중 참조한 논문
=근로 경험이 취업에 미치는 영향 분석
=GOMS 공공데이터를 사용했음


공공데이터의 특징
=범위가 BROAD 해서 데이터의 INSIGHT를 추출하는 방법이 쉽지 않음

댓글 없음:

댓글 쓰기