살맛나는 인생 ♬

상관계수 해석 및 유의성 검정 본문

경영 마케팅 정보

상관계수 해석 및 유의성 검정

samickee 2019. 10. 24. 10:48

상관계수는 부호에 관계없이 상관계수의 절대값 크기는 변수들 간의 선형관계 정도를 나타내는 지표가 된다. 음의 상관계수라도 그 값이 -1에 가까우면 두 변수 간의 선형관계가 매우 높다고 판단할 수 있다. 예를 들어, 공기의 밀도를 나타내는 대기압과 해수면의로부터의 높이를 나타내는 해발고도는 서로 밀접한 선형관계에 있다. 즉, 해발고도가 높아질수록 대기압이 일정하게 낮아지는 매우 강한 음의 상관관계에 있다. 그러나 좌표평면상에 측정치들이 선형이 아닌 불규칙한 모양이나 원 모양으로 나타났을 경우, 두 변수 간에는 선형상관관계가 없다고 말할 수 있다. 그러나 선형관계가 아니라고 해서 두 변수가 서로 무관하다고 단정지을 수는 없다. 만일 두 변수의 관계가 원 모양으로 나타나는 경우에는 두 변수가 비록 선형관계는 아니더라도 거의 완벽한 관계에 있다고 볼 수 있다. 상관계수는 -1에서 +1 사이의 값을 가지며, 부호에 관계없이 상관계수의 절대값 크기가 변수들 간의 연관성 정도를 판단하는 기준이 된다. 그러나 어떠한 자료의 변수들간 연관성을 분석하는가에 다라 상관정도를 판단하는 기준은 서로 다를 수 있다. 예를 들어, 경제나 재무분야에 관한 자료에서는 변수간 상관계수의 절대값이 비교적 낮은 경우에도 의미있고 유의한 선형관계가 있는 것으로 평가할 수도 있다. 그러나 마케팅을 비롯한 다른 사회과학분야에서 설문으로 수집된 자료의 경우에는 상관계수값이 0.3이상이 되어야만 변수들 간에 상관관계가 존재한다고 평가하는 것이 일반적이다. 다음으로 상관분석을 통하여 얻은 상관계수가 과연 통계적으로도 유의한가를 검정할 필요가 있다. 통계적으로 유의하여야만 2개 변수 간의 상관계수를 일반화 하여 사용할 수 있기 때문이다. 유의성 검정에서는 연구가설은 '두 변수 간에는 선형관계가 존재하여 상관계수가 0이 아니다'가 되고, 반대로 귀무가설은 '두 변수는 선형관계가 없어 상관계수가 0이다'가 된다. 상관계수의 유의성 검정에서는 t값이 검정통계량으로 사용되며, 이러한 검정통계량은 자유도가 n-2인 t분포를 한다. 따라서 t검정으로 상관계수의 통계쩍 유의성을 검정한다. 일반적으로 상관분석은 등간척도나 비율척도를 이용하여 측정된 변수들 간의 선형관계를파악하는 데 사용된다. 그러나 비모수 통계분석을 이용하면 서열척도로 측정된 변수들 간의 연관성도 파악할 수 있다. 서열척도로 측정된 변수 간의 상관관계는 스피어만의 서열상관계수나 켄달의 타우기법으로 산출하는 서열상관계수를 이용하여 분석할 수 있다. 이들 두 가지 방법은 큰 차이가 없으므로 비교적 계산이 간편한 스피어만의 서열상관계수가 많이 사용된다. 스피어만의 서열상관계수는 분석하고자 하는 각각의 대상이 가지고 있는 속성에 대하여 서열척도로 측정한 2개 변수 간의 연관성, 즉 상관관계를 나타내는 계수로서 공식을 이용하여 구할 수 있다. 일반적으로 서열상관계수는 관심의 대상이 되는 집단 내의 개별 구성원이나 객체들을 두 개의 서로 다른 관점이나 특성에 대하여 평가한 순위값들을 이용해서 분석하는 경우에 사용된다. 이 경우 서로 다른 특성에 대하여 평가한 결과를 나타내는 두 변수는 서열척도로 측정한 값들을 갖게 된다. 스피어만 서열상관계쑤는 개별적인 관측대상에 대하여 서로 다른 기준으로 평가하여 얻은 두 변수값들 간의 차이, 즉 서열차이를 구한 후, 이 서열차이를 제곱한 값을 공식에 대입하여 구할 수도 있다. 또한 이렇게 공식을 이용해서 산출되는 스피어만 서열상관계수도 일반적인 피어슨 상관계수와 같이 -1에서 +1 사이의 값만을 갖는다. 편상관분석은 두 변수 간의 상관관계를 나타내는 상관계수에서 제3의 변수의 영향으로 인하여 발생할 수 있는 부분을 제거한 상테에서 두 변수 간의 순수한 상관관계를 분석하는 방법을 말한다. 여기서 제3의 변수를 통제하고 분석하는 이유는 제3의 변수가 두 변수 간의 관계에 미치는 영햐야을 통제함으로써 두 변수 간의 순수한, 즉 정확한 상관관계를 파악하기 위해서이다. 이 경우 두 변수 간의 관계에 미치는 영향력이 통제된 제 3의 변수를 통제변수라고 한다. 예를 들어, 두 변수 X와 Y간의 상관분석에서 만약 이 두 변수가 모두 제3의 변수 Z와 높은 상관관계가 있는 경우, 변수 Z가 두 변수 X와 Y간의 상관관계에 미치는 영향을 제외한 상태에서 변수 X와 Y간의 순수한 상관관계 정도를 분석하는 것을 편상관분석이라 한다. 이러한 편상관분석을 통하여 얻게 되는 상관계수를 편상관계수라 하며, 이때 두 변수에 동시에 영향을 미치는 변수 Z를 통제변수라 한다. 교차분석은 명목척도나 서열척도로 측정된 범주형 변수들 간의 연관성을 분석하는 방법이다. 등간척도나 비율척도로 측정된 연속변수 간의 선형적 연관성은 상관분석을 통하여 구할 수 있으나, 명목척도나 서열척도로 측정된 변수들, 특히 명목척도로 측정된 변수들 간의 연관성은 상과분석을 이용하여 분석하기 어렵다. 따라서 이러한 범주형 변수 간의 연관성분석은 교차분석을 통하여 이루어진다. 교차분석은 변수들 간의 범주를 교차시켜 얻은 각각의 셀에 해당하는 관측치 빈도를 나타내는 빈도교차표를 이용하여 두 변수 간의 상호독립성이나 관련성 정도를 분석하는 기법이다. 교차분석은 분류기준이 되는 두 변수의 수즌을 정하고 이들 두 변수의 수즌에 의해 구분되늰 각 셀에 해당하는 관측치의 수를 조사함으로써 두 개의 범주형 변수들을 이용한 빈도교차표를 작성한다. 둘째, 분석하고자 하는 두 변수 간의 관계에 대한 가설을 설정한다. 셋째, 두 변수가 서로 독립적이라는 가정하에 각 셀의 기대빈도를 구하여 기대빈도교차표를 작성한다. 넷째, 빈도교차표상의 실제빈도가 기대빈도의 차이를 제곱한 값을 기대빈도로 나는 값을 모든 셀에 대하여 구한 다음 이들을 모두 더하여 카이제곱 검정통계량값을 구한다. 마지막으로 자유도에 의하여 정의되는 카이제곱분포상에서 검정통계량값과 유의수준에 해당하는 임계치를 비교하여 가설검정을 수행한다. 

'경영 마케팅 정보' 카테고리의 다른 글

군집분석의 이론  (0) 2019.10.26
분산분석의 개념 및 정의  (0) 2019.10.25
공분산과 상관관계 정보  (0) 2019.10.23
상관분석의 정의  (0) 2019.10.22
내적 일관성과 신뢰성을 향상시키는 법  (0) 2019.10.21