2019년 8월 8일 목요일

Chp10. 회귀

목적
"예측 - Prediction"
회귀란 제대로만 사용하면 특정값을 예측하는 강력한 도구가 될수 있다
이때 대조시험과 같이 사용하면 성능이 더 향상된다

본론
"알고리즘"
-->예측을 하기위환 Process

예측을 위해 해야, 알아야할것들
예측해야할것
사람들의 행동
시장의 움직임
중요한사건
실험결과
데이터에 포함되지 않은것
항상 해야하는 질문
예측하는데 필요한 충분한 data가 있는가
예측의 정확도는 어느정도 있는가
"정 성/량 적 여부"
고객의 예측 역시 사용하고있는가
내예측의 한계는 어디까지인가

-->"산포도"를 뽑기위한 정보

산포도 원칙
-->변수간의 인과관계를 알기위해사용
-->2개의 변수를 비교
-->산포도의 한점은 하나의 관측점 (1개의 raw = 한점)
**산포도는 자주 사용할수록 좋다**

산포도의 점을 평균을 내서 선으로 이으면 = "회귀선"

"회귀"
프란시스 갈튼(francis galton 1822 ~ 1922)이 부모의 키에서 아들의 키를 예측하는 방안을 연구했는데
키가큰 부모 --> 키가 작은 아들 , 키가 작은 부모 -->키가 큰 아들 의 경향을 보여서 이를 "평범으로의 회귀"
라고 불럿다

Q:회귀선은 직선이여야 하나?
A:적절한 값이라면 직선일필요는 없다 , 비선형회귀는 직선이 아님

하지만 회귀선은 직선이 좋음
강한 상관관계가 있음을 의미하고 강도를 "상관계수"로 표시한다 (r 로표기하고 -1 ~ 1까지의 값이며 0이면 관계가 없음을 의미

***회귀선을 이용하는방법***
회귀선은 직선 = 직선은 1차방정식으로 y=a+bx 로 (y=원하는 결과 a=y축절편 b=기울기 x=넣을 x값)
여기서 기울기 = y변량 / x축의 변량

댓글 없음:

댓글 쓰기