#단순선회 회귀 모델 적절성 head(women,2) nrow(women) cor(women$weight, women$height) plot(weight ~ height, data=women) fit <- lm(weight ~ height, data=women) fit abline(fit, col='red') summary(fit) cor.test(women$weight, women$height) # cor 0.9954948 0.9954948 ** 2 # 0.9910099 # R-squared: 0.991 # 99% 설명력이 있다. - 99% 적중률 y = -87.51667 + 3.45000 * 78 y women #회귀 모델 적절성을 조건 #1) 정규성:잔차항이 정규분포를 따라야 한 #2) 독립성:독립변수의 값이 서로 관련되어 있지 않아야 한다. #3) 선형성: 독립변수의 변화에 따라 종속변수도 일정크기로 변화. 직선적 #4) 등분산성 : 독립변수의 모든 값에 대한 오차들의 분산이 일정 #5) 특정잔차의 영향력 # 다중공선성 - 3개 이상의 독립변수 간에 강한 상관관계로 인한 문제가 발생해서는 안된다. plot(fit) par(mfrow=c(2,2)) plot(fit) plot(fit, which = c(4, 6)) # 선형성을 띠지 않는 경우 다항회귀를 수행 fit2 <- lm(weight ~ height + I(height ^ 2), data=women) fit2 summary(fit2) plot(fit2)