본문 바로가기

Statistics/통계학 입문

basic - 표와 그래프(2) 줄기 잎 전시 ~ 특이값

1. 줄기 잎 전시..?(stem - and - leaf display...?)

그것은 히스토그램을 옆으로 돌려놓은 것과 같다...

 

 

 

...줄기의 증가속도... 그게 뭔데

 

줄기의 증가속도 = 2니까

잎은 (0,1) (2,3) (4,5) (6,7) (8,9) 이런식으로 나눌 수 있고

줄기의 증가속도  = 5 이라면

(0,1,2,3,4) (5,6,7,8,9) 로 나눌 수 있다

 

2. 상자(수염)그림(Box-and-whisker plot)

자료를 객관적으로 알아보기 위해 다섯숫자요약을 할 수 있다.

다섯숫자요약이란?
최솟값
일사분위수(first quartile)
중앙값
삼사분위수(third quartile)
최댓값

 

이것이...다섯숫자요약이다

그림으로 확인해보자

중앙값은 대칭성을 알기에 굉장히 유효하다.

 

 

3. 산점도(scatter plot / scatter diagram)

이건 그림으로 확인해야함 ㄹㅇ

왼쪽 아래에서 오른쪽 위로 가면 양의 선형관계(positive linear relationship)

왼쪽 위에서 오른쪽 아래로 가면 음의 선형관계(negative linear relationship)

 

변수가 3개 이상일 때는..?

변수 아무리 많아도 문제 없다는 말씀

 

4. 평행좌표그림(parallel coordinates plot)

다변량 자료를 이차원 평면에 나타내고 그 해석을 직관적으로 할 수 있다는 편리성이 있음

하지만 여러가지 단점이 있다는 사실...

장점과 단점을 알아보도록 하겠다

 

일단은 평행좌표그림이 어떤 것인지 사진에 쓰여있다.

 

 

평행좌표그림의 장점( 4, 5 번은 장점이라기엔  애매함)

 

 

단점

 

5. 분할표(contingency table, cross table)

 

<이차원 분할표(two - dimensional contingency table / two - way table)>에서는 부류/초능력

두가지 변수의 자료를 요약한 것이고

 

<삼차원 분할표(three -dimensional contingency table / three -way table)>에서는 학력/성별/믿는다 및 믿지 않는다

세가지 변수의 자료를 요약한 것이다.

 

6. 모자익그림(mosaic plot)

막대/파이 그림 VS 모자익 그림(장점단점)

 

막대 그림 / 파이 그림은 범주형 일차원 자료에 국한되어 있다.

 

모자익 그림의 장점은 범주형 일차원부터 다차원 자료까지

또한 각범주별 도수를 사각형의 크기로 나타내어 시각적인 비교가 가능하다

 

다만 모자익 그림의 단점은

그리는 사람의 기준에 따라 너무 여러 버전이 존재하며

그에 따라 오해의 여지가 다분하다.

 

7. 종횡비(aspect ratio)

종회비는 X축과 Y축의 척도에 대한 것이 아니고

실제 그려놓은 X축과 Y축의 비율을 뜻한다. 따라서 X축과 Y축의 눈금은 그대로 있고

그리고 난 후의 실제 그래프의 세로와 가로의 비율을 뜻한다.

 

 

 

그래서 종횡비는 1대 5로 그린 것과 7대 3으로 그린 그래프가 주는 시각적인 정보가 다를 수 있다.
아래의 사진을 통해 비교해보자

 

 

 

 

해당 그래프는 태양의 흑점을 1 : 1로 나타낸 종횡비이다.

최대, 최솟값을 찾기에 유리하다

 

 

해당 그래프는 태양의 흑점을 1 : 10 이상으로 나타낸 종횡비이다.

주기파악이 용이하며, 주기적인 특징을 파악하기 쉽다

 

 

8. 특이값

 

특이값이 특이값이 아닐 수도 있다.

따라서 신중히 분석해야 한다

 

 

특이값에 대한 주의사항을 알아보자

 

 

 

 

 

이것으로 표와 그래프 기술통계에 대한 내용을 마치겠다