선형 상관 계수를 계산하는 방법

작가: Eric Farmer
창조 날짜: 7 3 월 2021
업데이트 날짜: 1 칠월 2024
Anonim
rstat101 week5 - 상관계수(correlation coefficient) 손으로 구하기
동영상: rstat101 week5 - 상관계수(correlation coefficient) 손으로 구하기

콘텐츠

상관 계수(또는 선형 상관 계수)는 "r"(드물게 "ρ"로 표시)로 표시되고 둘 이상의 변수의 선형 상관(즉, 어떤 값과 방향에 의해 주어지는 관계)을 특성화합니다. 계수 값은 -1과 +1 사이에 있습니다. 즉, 상관 관계는 양수와 음수 모두일 수 있습니다. 상관 계수가 -1이면 완전한 음의 상관 관계가 있습니다. 상관 계수가 +1이면 완전한 양의 상관 관계가 있습니다. 그렇지 않으면 두 변수 간에 양의 상관 관계가 있거나 음의 상관 관계가 있거나 상관 관계가 없습니다. 상관 계수는 무료 온라인 계산기 또는 우수한 그래프 계산기를 사용하여 수동으로 계산할 수 있습니다.

단계

방법 1/4: 수동으로 상관 계수 계산

  1. 1 데이터를 수집합니다. 상관 계수 계산을 시작하기 전에 이러한 숫자 쌍을 연구하십시오. 세로 또는 가로로 배열할 수 있는 표에 적어 두는 것이 좋습니다. "x" 및 "y"로 각 행 또는 열에 레이블을 지정합니다.
    • 예를 들어, 변수 "x"와 "y"의 네 쌍의 값(숫자)이 주어집니다. 다음 테이블을 생성할 수 있습니다.
      • x || 와이
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 산술 평균 "x"를 계산합니다. 이렇게 하려면 모든 x 값을 더한 다음 결과를 값의 수로 나눕니다.
    • 이 예에서는 변수 "x"에 대해 4개의 값이 있습니다. 산술 평균 "x"를 계산하려면 이 값을 더한 다음 합계를 4로 나눕니다. 계산은 다음과 같이 작성됩니다.
    • μNS=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μNS=12/4{ displaystyle mu _ {x} = 12/4}
    • μNS=3{ displaystyle mu _ {x} = 3}
  3. 3 산술 평균 "y"를 찾으십시오. 이렇게 하려면 동일한 단계, 즉 모든 y 값을 더한 다음 합계를 값의 수로 나눕니다.
    • 이 예에서는 변수 "y"의 4가지 값이 제공됩니다. 이 값을 더한 다음 합계를 4로 나눕니다. 계산은 다음과 같이 작성됩니다.
    • μ와이=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μ와이=16/4{ displaystyle mu _ {y} = 16/4}
    • μ와이=4{ displaystyle mu _ {y} = 4}
  4. 4 표준 편차 "x"를 계산합니다. "x"와 "y"의 평균을 계산한 후 이러한 변수의 표준 편차를 찾으십시오. 표준 편차는 다음 공식을 사용하여 계산됩니다.
    • σNS=1NS1Σ(NSμNS)2{ displaystyle 시그마 _ {x} = { sqrt {{ frac {1} {n-1}} 시그마 (x- mu _ {x}) ^ {2}}}}
    • 이 예에서 계산은 다음과 같이 작성됩니다.
    • σNS=141((13)2+(23)2+(43)2+(53)2){ displaystyle 시그마 _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σNS=13(4+1+1+4){ displaystyle 시그마 _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σNS=13(10){ displaystyle 시그마 _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σNS=103{ displaystyle 시그마 _ {x} = { sqrt { frac {10} {3}}}}
    • σNS=1,83{ 디스플레이 스타일 시그마 _ {x} = 1.83}
  5. 5 표준 편차 "y"를 계산합니다. 이전 단계에서 설명한 단계를 따릅니다. 동일한 공식을 사용하지만 y 값을 연결합니다.
    • 이 예에서 계산은 다음과 같이 작성됩니다.
    • σ와이=141((14)2+(34)2+(54)2+(74)2){ displaystyle 시그마 _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σ와이=13(9+1+1+9){ displaystyle 시그마 _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σ와이=13(20){ displaystyle 시그마 _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σ와이=203{ displaystyle 시그마 _ {y} = { sqrt { frac {20} {3}}}}
    • σ와이=2,58{ 디스플레이 스타일 시그마 _ {y} = 2.58}
  6. 6 상관 계수를 계산하는 기본 공식을 작성하십시오. 이 공식에는 평균, 표준 편차 및 두 변수의 숫자 쌍의 수(n)가 포함됩니다. 상관 계수는 "r"(드문 경우 "ρ")로 표시됩니다. 이 기사에서는 공식을 사용하여 Pearson 상관 계수를 계산합니다.
    • ρ=(1NS1)Σ(NSμNSσNS)(와이μ와이σ와이){ displaystyle rho = 왼쪽 ({ frac {1} {n-1}} 오른쪽) 시그마 왼쪽 ({ frac {x- mu _ {x}} { 시그마 _ {x}} } 오른쪽) * 왼쪽({ frac {y- mu _ {y}} { 시그마 _ {y}}} 오른쪽)}
    • 여기와 다른 출처에서 수량은 다른 방식으로 표시될 수 있습니다. 예를 들어, 일부 공식에는 "ρ" 및 "σ"가 포함되고 다른 공식에는 "r" 및 "s"가 포함됩니다. 일부 교과서는 다른 공식을 제공하지만 위 공식과 수학적으로 대응됩니다.
  7. 7 상관 계수를 계산합니다. 두 변수의 평균과 표준 편차를 계산했으므로 공식을 사용하여 상관 계수를 계산할 수 있습니다. "n"은 두 변수에 대한 값 쌍의 수입니다. 다른 값은 이전에 계산되었습니다.
    • 이 예에서 계산은 다음과 같이 작성됩니다.
    • ρ=(1NS1)Σ(NSμNSσNS)(와이μ와이σ와이){ displaystyle rho = 왼쪽 ({ frac {1} {n-1}} 오른쪽) 시그마 왼쪽 ({ frac {x- mu _ {x}} { 시그마 _ {x}} } 오른쪽) * 왼쪽({ frac {y- mu _ {y}} { 시그마 _ {y}}} 오른쪽)}
    • ρ=(13){ displaystyle rho = 왼쪽 ({ frac {1} {3}} 오른쪽) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle 왼쪽 ({ frac {1-3} {1.83}} 오른쪽) * 왼쪽 ({ frac {1-4} {2.58}} 오른쪽) + 왼쪽 ({ frac {2 -3} {1.83}} 오른쪽) * 왼쪽({ frac {3-4} {2.58}} 오른쪽)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + 왼쪽 ({ frac {4-3} {1.83}} 오른쪽) * 왼쪽 ({ frac {5-4} {2.58}} 오른쪽) + 왼쪽 ( { frac { 5-3} {1.83}} 오른쪽) * 왼쪽({ frac {7-4} {2.58}} 오른쪽)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = 왼쪽 ({ frac {1} {3}} 오른쪽) * 왼쪽 ({ frac {6 + 1 + 1 + 6} {4.721}} 오른쪽)}
    • ρ=(13)2,965{ displaystyle rho = 왼쪽 ({ frac {1} {3}} 오른쪽) * 2.965}
    • ρ=(2,9653){ displaystyle rho = 왼쪽 ({ frac {2,965} {3}} 오른쪽)}
    • ρ=0,988{ 디스플레이 스타일 rho = 0.988}
  8. 8 결과를 분석합니다. 이 예에서 상관 계수는 0.988입니다. 이 값은 어떤 식으로든 주어진 숫자 쌍의 특성을 나타냅니다. 값의 부호와 크기에 주의하십시오.
    • 상관 계수의 값이 양수이므로 변수 "x"와 "y" 사이에는 양의 상관 관계가 있습니다. 즉, "x"의 값이 증가할수록 "y"의 값도 증가한다.
    • 상관 계수의 값이 +1에 매우 가깝기 때문에 변수 "x"와 "y"의 값은 높은 상관 관계가 있습니다. 좌표평면에 점을 놓으면 어떤 직선에 가깝게 위치하게 됩니다.

방법 2/4: 온라인 계산기를 사용하여 상관 계수 계산

  1. 1 상관 계수를 계산하기 위해 인터넷에서 계산기를 찾으십시오. 이 계수는 종종 통계에서 계산됩니다. 숫자 쌍이 많으면 상관 계수를 수동으로 계산하는 것이 거의 불가능합니다. 따라서 상관 계수를 계산하는 온라인 계산기가 있습니다. 검색 엔진에서 "상관 계수 계산기"(따옴표 제외)를 입력하십시오.
  2. 2 데이터를 입력합니다. 웹사이트의 지침을 확인하여 올바른 데이터(숫자 쌍)를 입력하십시오. 적절한 숫자 쌍을 입력해야 합니다. 그렇지 않으면 잘못된 결과를 얻게 됩니다. 웹사이트마다 입력 형식이 다릅니다.
    • 예를 들어 http://ncalculators.com/statistics/correlation-coefficient-calculator.htm에서 변수 x와 y의 값은 두 개의 가로줄에 입력된다. 값은 쉼표로 구분됩니다. 즉, 이 예에서 값 "x"는 1,2,4,5와 같이 입력되고 "y" 값은 1,3,5,7과 같이 입력됩니다.
    • 다른 사이트(http://www.alcula.com/calculators/statistics/correlation-coefficient/)에서는 데이터가 세로로 입력됩니다. 이 경우 해당 숫자 쌍을 혼동하지 마십시오.
  3. 3 상관 계수를 계산합니다. 데이터를 입력한 후 "계산", "계산" 또는 이와 유사한 버튼을 클릭하여 결과를 얻으십시오.

방법 3/4: 그래프 계산기 사용

  1. 1 데이터를 입력합니다. 그래프 계산기를 가지고 통계 계산 모드로 이동하여 "편집" 명령을 선택하십시오.
    • 계산기마다 다른 키를 눌러야 합니다. 이 기사에서는 Texas Instruments TI-86 계산기에 대해 설명합니다.
    • [2nd] - Stat(+ 키 위)을 눌러 통계 계산 모드로 들어갑니다. 그런 다음 F2 - 편집을 누릅니다.
  2. 2 이전에 저장한 데이터를 삭제합니다. 대부분의 계산기는 입력한 통계를 지울 때까지 유지합니다. 오래된 데이터와 새 데이터를 혼동하지 않으려면 먼저 저장된 정보를 삭제하십시오.
    • 화살표 키를 사용하여 커서를 이동하고 'xStat' 제목을 강조 표시합니다. 그런 다음 Clear 및 Enter를 눌러 xStat 열에 입력된 모든 값을 지웁니다.
    • 화살표 키를 사용하여 'yStat' 제목을 강조 표시합니다. 그런 다음 지우기 및 Enter 키를 눌러 yStat 열에 입력된 모든 값을 지웁니다.
  3. 3 초기 데이터를 입력합니다. 화살표 키를 사용하여 "xStat" 제목 아래의 첫 번째 셀로 커서를 이동합니다. 첫 번째 값을 입력하고 Enter 키를 누릅니다. 화면 하단에 "xStat (1) = __"이 표시되며 입력한 값이 공백을 대체합니다. Enter 키를 누르면 입력한 값이 테이블에 나타나고 커서가 다음 줄로 이동합니다. 그러면 화면 하단에 "xStat (2) = __"가 표시됩니다.
    • 변수 "x"의 모든 값을 입력하십시오.
    • x에 대한 모든 값을 입력한 후 화살표 키를 사용하여 yStat 열로 이동하고 y에 대한 값을 입력합니다.
    • 모든 숫자 쌍을 입력한 후 Exit를 눌러 화면을 지우고 집계 모드를 종료합니다.
  4. 4 상관 계수를 계산합니다. 데이터가 특정 직선에 얼마나 가까운지를 특성화합니다. 그래프 계산기는 적절한 직선을 빠르게 결정하고 상관 계수를 계산할 수 있습니다.
    • 통계 - 계산을 클릭합니다. TI-86에서 [2nd] - [Stat] - [F1]을 누릅니다.
    • 선형 회귀 함수를 선택합니다. TI-86에서 "LinR"이라고 표시된 [F3] 키를 누릅니다. 화면에 깜박이는 커서와 함께 "LinR _" 라인이 표시됩니다.
    • 이제 xStat 및 yStat의 두 변수 이름을 입력합니다.
      • TI-86에서 이름 목록을 엽니다. 이렇게 하려면 [2nd] - [List] - [F3] 키를 누릅니다.
      • 사용 가능한 변수는 화면 하단에 표시됩니다. [xStat]를 선택하고(이 작업을 수행하려면 F1 또는 F2를 눌러야 함) 쉼표를 입력한 다음 [yStat]를 선택합니다.
      • Enter를 눌러 입력된 데이터를 처리합니다.
  5. 5 결과를 분석합니다. Enter 키를 누르면 화면에 다음 정보가 표시됩니다.
    • 와이=NS+NSNS{ 디스플레이 스타일 y = a + bx}: 라인을 설명하는 함수입니다. 함수는 표준 형식(y = kx + b)으로 작성되지 않았습니다.
    • NS={ 디스플레이 스타일 a =}... 이것은 직선과 y축의 교차점의 y좌표입니다.
    • NS={ 디스플레이 스타일 b =}... 이것은 선의 기울기입니다.
    • 코르={ displaystyle { text {corr}} =}... 이것은 상관 계수입니다.
    • NS={ 디스플레이 스타일 n =}... 이것은 계산에 사용된 숫자 쌍의 수입니다.

방법 4/4: 기본 개념 설명

  1. 1 상관관계의 개념을 이해한다. 상관 관계는 두 수량 간의 통계적 관계입니다. 상관 계수는 두 데이터 세트에 대해 계산할 수 있는 숫자 값입니다. 상관 계수의 값은 항상 -1 ~ +1 범위에 있으며 두 변수 간의 관계 정도를 나타냅니다.
    • 예를 들어, 어린이(약 12세)의 키와 나이가 주어집니다. 대부분의 경우 아이들은 나이가 들수록 키가 커지기 때문에 강한 양의 상관관계가 있을 것입니다.
    • 음의 상관 관계의 예: 바이애슬론 훈련에 소요된 페널티 초와 시간, 즉 선수가 훈련을 많이 할수록 페널티 초가 더 적게 부여됩니다.
    • 마지막으로 신발 사이즈와 수학 ​​점수 사이에 상관관계(양수 또는 음수)가 거의 없는 경우가 있습니다.
  2. 2 산술 평균을 계산하는 방법을 기억하십시오. 산술 평균(또는 평균)을 계산하려면 이러한 모든 값의 합을 찾은 다음 값의 수로 나누어야 합니다. 상관 계수를 계산하려면 산술 평균이 필요하다는 것을 기억하십시오.
    • 변수의 평균값은 그 위에 가로 막대가 있는 문자로 표시됩니다. 예를 들어, 변수 "x"와 "y"의 경우, 그 평균값은 x̅와 y̅로 표시됩니다. 평균은 때때로 그리스 문자 "μ"(mu)로 표시됩니다. 변수 "x"값의 산술 평균을 쓰려면 μ 표기법을 사용하십시오.NS 또는 μ(x).
    • 예를 들어, 변수 "x"에 대해 1,2,5,6,9,10 값이 주어졌을 때. 이 값의 산술 평균은 다음과 같이 계산됩니다.
      • μNS=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μNS=33/6{ displaystyle mu _ {x} = 33/6}
      • μNS=5,5{ 디스플레이 스타일 뮤 _ {x} = 5.5}
  3. 3 표준 편차의 중요성에 유의하십시오. 통계에서 표준 편차는 평균과 관련하여 숫자가 흩어져 있는 정도를 나타냅니다. 표준 편차가 작으면 숫자가 평균에 가깝습니다. 표준 편차가 크면 숫자가 평균에서 멀리 떨어져 있습니다.
    • 표준 편차는 문자 "s" 또는 그리스 문자 "σ"(시그마)로 표시됩니다. 따라서 변수 "x"값의 표준 편차는 다음과 같이 표시됩니다.NS 또는 σNS.
  4. 4 합산 연산의 기호를 기억하십시오. 합계 기호는 수학에서 가장 일반적인 기호 중 하나이며 값의 합을 나타냅니다. 이 기호는 그리스 문자 "Σ"(대문자 시그마)입니다.
    • 예를 들어, 변수 "x"의 값이 1,2,5,6,9,10인 경우 Σx는 다음을 의미합니다.
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

  • 상관 계수는 개발자 Carl Pearson의 이름을 따서 "Pearson 상관 계수"라고도 합니다.
  • 대부분의 경우 상관 계수가 0.8(양수 또는 음수)보다 크면 강한 상관 관계가 있습니다. 상관 계수가 0.5(양 또는 음)보다 작으면 약한 상관 관계가 관찰됩니다.

경고

  • 상관 관계는 두 변수의 값 사이의 관계를 특성화합니다. 그러나 상관관계는 인과관계와 관련이 없음을 기억하십시오. 예를 들어, 사람들의 키와 신발 사이즈를 비교하면 강한 양의 상관 관계를 찾을 수 있습니다. 일반적으로 키가 큰 사람일수록 신발 사이즈가 커집니다. 그러나 이것이 키가 증가하면 신발 크기가 자동으로 증가하거나 발이 크다고 더 빨리 성장한다는 의미는 아닙니다. 이 양은 단순히 상호 연관되어 있습니다.