상세 컨텐츠

본문 제목

R - 회귀분석 조건 예제

02_Big Data

by 에스프리터 2018. 4. 30. 00:38

본문



이번에 배울 것은 회귀분석을 사용할 때 적절한지 확인하기 위한 예제입니다.


코드

#단순선회 회귀 모델 적절성
head(women,2)
nrow(women)

cor(women$weight, women$height)
plot(weight ~ height, data=women)
fit <- lm(weight ~ height, data=women)
fit
abline(fit, col='red')

summary(fit)
cor.test(women$weight, women$height)  # cor 0.9954948
0.9954948 ** 2  #  0.9910099
# R-squared:  0.991   # 99% 설명력이 있다. - 99% 적중률
y = -87.51667 + 3.45000 * 78
y
women
#회귀 모델 적절성을 조건
#1) 정규성:잔차항이 정규분포를 따라야 한
#2) 독립성:독립변수의 값이 서로 관련되어 있지 않아야 한다.
#3) 선형성: 독립변수의 변화에 따라 종속변수도 일정크기로 변화. 직선적
#4) 등분산성 : 독립변수의 모든 값에 대한 오차들의 분산이 일정
#5) 특정잔차의 영향력
# 다중공선성 - 3개 이상의 독립변수 간에 강한 상관관계로 인한 문제가 발생해서는 안된다.
plot(fit)
par(mfrow=c(2,2))
plot(fit)
plot(fit, which = c(4, 6))

# 선형성을 띠지 않는 경우 다항회귀를 수행
fit2 <- lm(weight ~ height + I(height ^ 2), data=women)
fit2
summary(fit2)
plot(fit2)



샘플 데이터




본 포스팅은 KIC 캠퍼스에서 박영권 강사의 지도하에 공부하며 작성한 리포트입니다.
혹시 잘못된 내용이 있거나 문제 소지시 댓글 남겨주시면 조치하겠습니다.






'02_Big Data' 카테고리의 다른 글

R - 로지스틱 회귀분석 #1  (0) 2018.05.08
R - 다중 회귀분석 예제  (0) 2018.04.30
R - 단순회귀 분석 예제  (0) 2018.04.30
R - 회귀분석 조건 예제  (0) 2018.04.30
R - 회귀분석 예제  (0) 2018.04.30
R - 요인분석 예제  (0) 2018.04.30
R - 상관계수 분석 예제  (0) 2018.04.30

태그

관련글 더보기

댓글 영역