2019년 8월 8일 목요일

Chp11. 에러

목적
"세상은 복잡하다 - World is complex"
예측이 틀려도 실망할 일이 아니다 하지만 "오차범위"를 알면 예상역시 가능하다

본론
"외삽"
chp10의 회귀선을 이용해 그래프에서 평균치를 잡았을때 데이터 범위 밖을 예상하는작업
--->외삽을 이용할때 범위를 벗어나는 일은 예상할수 없다는 가정을 추가해야 한다

붉은색이 회귀선

"잔차 - residual"
-->회귀선을 기준으로 위와 아래로 퍼진 수치

"RMS - Root Mean Square"
회귀선으로부터의 분포로 R에서는 mylm 명령으로 사용


검정 막대가 RMS 수치
그래프의 RMS 가 극명히 갈린다면 데이터를 나워서 회귀선을 여러개 만들어서 사용하면 효과가 좋다

Q:정확성을 올리기 위해 모든 점에 대한 회귀선을 짠다면?
A:확율은 올라가나 (각점에대한 회귀선을 생성하니 오차확율은 0%가 된다) 예측 능력은 떨어진다 따라서 어느수준 (RMS가 극명히 갈리는지점)을 찾아서 회귀선을 새로 생성하는게 중요하다


댓글 없음:

댓글 쓰기