목차
- 연관성 척도
- 연관성 척도의 예시
- 공분산(모집단/표본)
- 상관계수(모집단/표본)
- 상관계수 값의 판단 기준(선형일 때 / 비선형일 때)
#1 연관성 척도
연관성 척도란?
상관관계를 scatter plot으로 나타내는 것을 연관성 척도라고 한다
상관관계가 양의 관계일 때는 공분산이나 상관계수를 사용할 수 있지만 연관이 없다고 판단될 때는 사용할 수 없다
연관성 척도의 예시
이제 공분산에 대해서 알아보자.
공분산을 자세하기 살펴보기 전에 식과 특징만 간단하게 파악해보자
#2 공분산
1. 모집단 공분산
모집단 공분산 > 0 : 양의 선형관계
모집단 공분산 < 0 : 음의 선형관계
모집단 공분산 = 0 : 선형 관계를 갖지 않는다.
2. 표본 공분산
모집단 공분산 > 0 : 양의 선형관계
모집단 공분산 < 0 : 음의 선형관계
모집단 공분산 = 0 : 선형 관계를 갖지 않는다.
그래서 공분산이 뭔데?
즉 x자료와 y자료들의 떨어져있는 정도를 서로 곱한 후 더한다
이 때 모집단에서는 N으로 나누고
표본에서는 N-1로 나눈다
Q: 그러면 이 공분산으로 뭘 할 수 있는건데....
A: 상관계수를 구할 수 있지! 공분산을 표준편차로 나눈 값을 뜻해!
즉 상관계수는 공분산을 표준화 했다고 말할 수 있어
#3 상관계수
이 때, 상관계수를 구하는 식은
상관계수 = 공분산 / 분산x * 분산y
분산 x랑 분산 y를 어떻게 구하는지 까먹어도 괜찮아! (복습해라)
특별히 기억못하는 너를 위해 준비했어 !
분산 x를 구하는 식(Sx)과 분산 y를 구하는 식(Sy)은 다음과 같아(외워)
마찬가지로 모집단, 표본의 상관계수가 나누어져 있어
1. 모집단 상관계수
2. 표본 상관계수
3. 값에 따른 상관관계 판단 (선형일 때만)
0.2~0.4는 상관관계가 약하다고 판단
0.5~0.7은 상관관계가 중간 정도라고 판단
0.8~1.0은 상관관계가 강하다고 판단
상관계수는 선형일 때만 판단할 수 있기 때문에 비선형 상관관계 일 떄는 판단 기준을 적용하면 안됨.
비선형 상관관계기 때문에 값이 작게 나오겠지만, 그 전에 산점도 그래프로 찍어서 비선형인 것을 확인해야함!
참고로 비선형 관계일 때 상관계수는 0이다.
이것으로 연관성 척도에 대한 개념을 마치겠다.
'Statistics > 통계학 입문' 카테고리의 다른 글
베이즈 정리 (0) | 2022.11.23 |
---|---|
확률(probability) (0) | 2022.11.20 |
특이값과 Z-Score (0) | 2022.09.30 |
변동성 척도(4분위수를 배운 이유) (0) | 2022.09.18 |
중심위치 척도... (0) | 2022.09.15 |