본문 바로가기

Statistics/통계학 입문

연관성 척도

목차

- 연관성 척도
- 연관성 척도의 예시
- 공분산(모집단/표본)
- 상관계수(모집단/표본)
- 상관계수 값의 판단 기준(선형일 때 / 비선형일 때)

#1 연관성 척도

 

연관성 척도란?

상관관계를 scatter plot으로 나타내는 것을 연관성 척도라고 한다

 

상관관계가 양의 관계일 때는 공분산이나 상관계수를 사용할 수 있지만 연관이 없다고 판단될 때는 사용할 수 없다

 

 

 

연관성 척도의 예시

이제 공분산에 대해서 알아보자.

 

공분산을 자세하기 살펴보기 전에 식과 특징만 간단하게 파악해보자

#2 공분산

 

1. 모집단 공분산

모집단 공분산 > 0 : 양의 선형관계
모집단 공분산 < 0 : 음의 선형관계
모집단 공분산 = 0 : 선형 관계를 갖지 않는다.

 

2. 표본 공분산

모집단 공분산 > 0 : 양의 선형관계
모집단 공분산 < 0 : 음의 선형관계
모집단 공분산 = 0 : 선형 관계를 갖지 않는다.

 

그래서 공분산이 뭔데?

즉 x자료와 y자료들의 떨어져있는 정도를 서로 곱한 후 더한다

이 때 모집단에서는 N으로 나누고

표본에서는 N-1로 나눈다

 

 

Q: 그러면 이 공분산으로 뭘 할 수 있는건데....

 

A: 상관계수를 구할 수 있지! 공분산을 표준편차로 나눈 값을 뜻해!

즉 상관계수는 공분산을 표준화 했다고 말할 수 있어

 

#3 상관계수

 

이 때, 상관계수를 구하는 식은

상관계수 = 공분산 / 분산x * 분산y

분산 x랑 분산 y를 어떻게 구하는지 까먹어도 괜찮아! (복습해라)

 

특별히 기억못하는 너를 위해 준비했어 ! 

분산 x를 구하는 식(Sx)분산 y를 구하는 식(Sy)은 다음과 같아(외워)

 

마찬가지로 모집단, 표본의 상관계수가 나누어져 있어

 

1. 모집단 상관계수

 

2. 표본 상관계수

 

3. 값에 따른 상관관계 판단 (선형일 때만)

0.2~0.4는 상관관계가 약하다고 판단
0.5~0.7은 상관관계가 중간 정도라고 판단
0.8~1.0은 상관관계가 강하다고 판단
상관계수는 선형일 때만 판단할 수 있기 때문에 비선형 상관관계 일 떄는 판단 기준을 적용하면 안됨.
비선형 상관관계기 때문에 값이 작게 나오겠지만, 그 전에 산점도 그래프로 찍어서 비선형인 것을 확인해야함!

 

 

 

 

 

참고로 비선형 관계일 때 상관계수는 0이다.

 

이것으로 연관성 척도에 대한 개념을 마치겠다.

'Statistics > 통계학 입문' 카테고리의 다른 글

베이즈 정리  (0) 2022.11.23
확률(probability)  (0) 2022.11.20
특이값과 Z-Score  (0) 2022.09.30
변동성 척도(4분위수를 배운 이유)  (0) 2022.09.18
중심위치 척도...  (0) 2022.09.15