상세 컨텐츠

본문 제목

R - 상관계수 분석 예제

02_Big Data

by 에스프리터 2018. 4. 30. 00:33

본문





이번에 배울 것은 R 환경에서 상관계수 분석 예제입니다.
두 변수간 관련 수준을 확인하는 예제입니다.


코드

# 상관계수 : 두 확률변수 간 관련있는 정도(밀도)를 수자로 표현
# 두 변수 간 관련이 있다 해서 원인과 결과에 의한 관계라고 볼 수는 없다
#  -1 <= r <= 1
# DM 발송 횟수(x) : 1,2,3,4,5     : 평균 3
# 제품 판매 수(y) : 3,5,8,11,13   : 평균 8

x <- c(1,2,3,4,5)
y <- c(3,5,8,11,13)

mean(x)
mean(y)
cor(x, y)  #상관계수 계산 함수

data <- read.csv("testdata/drinking_water.csv")
head(data)

sd(data$친밀도)
sd(data$적절성)
sd(data$만족도)

hist(data$친밀도)
hist(data$적절성)
hist(data$만족도)

cov(1:5, 2:6)
cov(1:5, c(2,2,2,2,2))
cov(1:5, 5:1)

cov(data$친밀도, data$적절성)
cov(data)

# 상관계수 : Correlation
help(cor)
cor(data$친밀도, data$적절성) # r이 +0.3과 +0.7 사이이면, 뚜렷한 양적 선형관계
cor(data$친밀도, data$만족도)

cor(data$적절성+data$친밀도, data$만족도,method="pearson")  #spearman,kendall
#r이 +0.7과 +1.0 사이이면, 강한 양적 선형관계
#스피어만 상관계수(Spearman correlation coefficient) 는 데이터가 서열척도인 경우 즉 자료의 값 대신 순위를 이용하는 경우의 상관계수

cor(data,method="pearson")

symnum(cor(data,method="pearson"))
# 상관계수 관련 차트 : corrgram - 방향성 있는 색으로 표현
install.packages("corrgram")
library("corrgram")
corrgram(data)
corrgram(data, upper.panel = panel.conf)
corrgram(data, lower.panel = panel.conf)

install.packages("PerformanceAnalytics")
library(PerformanceAnalytics)
chart.Correlation(data, histogram =, pch="+")



샘플 데이터




본 포스팅은 KIC 캠퍼스에서 박영권 강사의 지도하에 공부하며 작성한 리포트입니다.
혹시 잘못된 내용이 있거나 문제 소지시 댓글 남겨주시면 조치하겠습니다.




'02_Big Data' 카테고리의 다른 글

R - 회귀분석 조건 예제  (0) 2018.04.30
R - 회귀분석 예제  (0) 2018.04.30
R - 요인분석 예제  (0) 2018.04.30
R - 상관계수 분석 예제  (0) 2018.04.30
R - 아노바 분석 예제  (0) 2018.04.23
R - 세집단간 평균 분석 예제  (0) 2018.04.23
R - 두 집단간 평균 분석 예제  (0) 2018.04.23

태그

관련글 더보기

댓글 영역