분산을 계산하는 방법

작가: Robert Simon
창조 날짜: 21 6 월 2021
업데이트 날짜: 1 칠월 2024
Anonim
조조쌤 중3 수학 평균, 분산, 표준편차, 이영상만 보면 이해 끝~!
동영상: 조조쌤 중3 수학 평균, 분산, 표준편차, 이영상만 보면 이해 끝~!

콘텐츠

분산은 데이터 세트의 분산을 측정합니다. 통계 모델을 구축하는 데 매우 유용합니다. 낮은 분산은 데이터의 기본 관계 대신 임의의 오류 또는 노이즈를 설명하고 있음을 나타낼 수 있습니다. 이 기사를 통해 wikiHow는 분산을 계산하는 방법을 알려줍니다.

단계

방법 1/2 : 표본의 분산 계산

  1. 샘플 데이터 세트를 작성하십시오. 대부분의 경우 통계학자는 연구중인 모집단의 일부 또는 표본에 대한 정보 만 가지고 있습니다. 예를 들어, 통계학자는 "독일의 모든 자동차 비용"에 대한 일반적인 분석을 수행하는 대신 수천 대의 자동차에 대한 무작위 샘플 비용을 찾을 수 있습니다. 통계학자는이 샘플을 사용하여 독일의 자동차 비용을 정확하게 추정 할 수 있습니다. 그러나 실제 숫자와 정확히 일치하지 않을 가능성이 더 큽니다.
    • 예를 들면 : 커피 숍에서 하루에 판매되는 머핀의 수를 분석 할 때 무작위 6 일 샘플을 추출하여 다음과 같은 결과를 얻었습니다. 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. 매장이 문을 여는 날마다 데이터가 없기 때문에 모집단이 아니라 샘플입니다.
    • 만약 ...마다 마스터의 데이터 포인트는 아래 방법으로 이동하십시오.

  2. 표본 분산 공식을 기록하십시오. 데이터 세트의 분산은 데이터 포인트의 분산 정도를 나타냅니다. 분산이 0에 가까울수록 데이터 포인트가 더 가깝게 그룹화됩니다. 샘플 데이터 세트로 작업 할 때 다음 공식을 사용하여 분산을 계산하십시오.
    • = /(n-1)
    • 분산입니다. 분산은 항상 제곱 단위로 계산됩니다.
    • 데이터 세트의 값을 나타냅니다.
    • "합계"를 의미하는 ∑는 각 값에 대해 다음 매개 변수를 계산 한 다음 함께 추가하도록 지시합니다.
    • x̅은 표본의 평균입니다.
    • n은 데이터 포인트의 수입니다.

  3. 샘플의 평균 계산. 기호 x̅ 또는 "x-horizontal"은 샘플의 평균을 나타내는 데 사용됩니다. 평균과 같이 계산하십시오. 모든 데이터 포인트를 더하고 포인트 수로 나눕니다.
    • 예를 들면 : 먼저 데이터 포인트를 더합니다 : 17 + 15 + 23 + 7 + 9 + 13 = 84
      다음으로 결과를 데이터 포인트 수로 나눕니다 (이 경우 6 개 : 84 ÷ 6 = 14).
      표본 평균 = x̅ = 14.
    • 평균을 데이터의 "중심점"으로 생각할 수 있습니다. 데이터가 평균을 중심으로하면 분산이 낮습니다. 평균에서 멀리 떨어져 있으면 분산이 높습니다.

  4. 각 데이터 포인트에서 평균을 뺍니다. 이제 데이터 세트의 각 점이있는 x̅을 계산할 시간입니다. 각 결과는 각 해당 지점의 평균에서 편차를 나타내거나 간단히 말하면 해당 지점에서 평균까지의 거리를 나타냅니다.
    • 예를 들면 :
      -x̅ = 17-14 = 3
      -x̅ = 15-14 = 1
      -x̅ = 23-14 = 9
      -x̅ = 7-14 = -7
      -x̅ = 9-14 = -5
      -x̅ = 13-14 = -1
    • 결과의 합이 0이되어야하므로 계산을 확인하는 것은 매우 쉽습니다. 이는 평균의 평균, 음의 결과 (평균에서 작은 숫자까지의 거리)이기 때문입니다. 긍정적 인 결과 (평균에서 큰 숫자까지의 거리)는 완전히 제거됩니다.
  5. 모든 결과를 제곱하십시오. 위에서 언급했듯이 현재 편차 목록 (-x̅)은 합계가 0이므로 "평균 편차"도 항상 0이되고 데이터 분산에 대해 말할 수 없습니다. 이 문제를 해결하기 위해 각 편차의 제곱을 찾습니다. 덕분에 모두 양수, 음수 및 양수 값은 더 이상 서로를 취소하지 않고 합계를 0으로 만듭니다.
    • 예를 들면 :
      (-x̅)
      -x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • 이제 샘플의 각 데이터 포인트에 대해 (-x̅)이 있습니다.
  6. 제곱 값의 합을 찾으십시오. 이제 공식의 전체 분자를 계산할 때입니다 : ∑. 큰 cyclo, ∑는 각 값에 대해 다음 요소 값을 추가해야합니다. 샘플의 각 값에 대해 (-x̅)을 계산 했으므로 결과를 모두 더하기 만하면됩니다.
    • 예를 들면 : 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. n-1로 나눕니다. 여기서 n은 데이터 포인트의 수입니다. 오래 전에 표본 분산을 계산할 때 통계학자는 n으로 만 나눴습니다. 이 분할은 해당 표본의 분산과 정확히 일치하는 제곱 편차의 평균을 제공합니다. 그러나 표본은 더 큰 모집단의 추정치 일뿐입니다. 다른 무작위 샘플을 취하고 동일한 계산을 수행하면 다른 결과를 얻을 수 있습니다. 결과적으로 n 대신 n -1로 나누면 더 큰 모집단의 분산에 대한 더 나은 추정치를 얻을 수 있습니다. 이 수정은 너무 일반적이어서 이제는 샘플 분산의 정의가 허용됩니다.
    • 예를 들면 : 샘플에는 6 개의 데이터 포인트가 있으므로 n = 6입니다.
      표본 분산 = 33,2
  8. 분산 및 표준 편차를 이해합니다. 공식에 검정력이 있으므로 분산은 원래 데이터 단위의 제곱으로 측정됩니다. 이것은 시각적으로 혼란 스럽습니다. 대신 종종 표준 편차가 매우 유용합니다. 그러나 표준 편차는 분산의 제곱근에 의해 결정되므로 노력을 낭비 할 필요가 없습니다. 이것이 표본 분산이 용어로 작성되고 표본의 표준 편차가 작성되는 이유입니다.
    • 예를 들어, 위 샘플의 표준 편차 = s = √33.2 = 5.76.
    광고

방법 2/2 : 모집단의 분산 계산

  1. 마스터 데이터 세트부터 시작합니다. "인구"라는 용어는 모든 관련 관찰을 나타내는 데 사용됩니다. 예를 들어 하노이 거주자의 연령을 조사하는 경우 전체 인구에는 하노이에 거주하는 모든 개인의 연령이 포함됩니다. 일반적으로 다음과 같이 큰 데이터 세트에 대한 스프레드 시트를 작성하지만 다음은 더 작은 데이터 세트의 예입니다.
    • 예를 들면 : 수족관의 방에는 정확히 6 개의 수족관이 있습니다. 이 6 개의 수조에는 다음과 같은 수의 물고기가 있습니다.





  2. 전체 분산에 대한 공식을 기록하십시오. 모집단에는 필요한 모든 데이터가 포함되어 있으므로이 공식은 모집단의 정확한 분산을 제공합니다. 표본 분산 (추정치 일뿐)과 구별하기 위해 통계학자는 다른 변수를 사용합니다.
    • σ = /
    • σ = 표본 분산. 이것은 일반적으로 사각형 소시지입니다. 분산은 제곱 단위로 측정됩니다.
    • 데이터 세트의 요소를 나타냅니다.
    • ∑의 요소는 각 값에 대해 계산 된 다음 합산됩니다.
    • μ는 전체 평균입니다.
    • n은 모집단의 데이터 포인트 수입니다.
  3. 모집단의 평균을 구하십시오. 모집단을 분석 할 때 기호 μ ( "mu")는 산술 평균을 나타냅니다. 평균을 찾으려면 모든 데이터 포인트를 더한 다음 포인트 수로 나눕니다.
    • 의미는 "평균"으로 생각할 수 있지만, 단어에는 많은 수학적 정의가 있으므로주의하십시오.
    • 예를 들면 : 평균값 = μ = = 10,5
  4. 각 데이터 포인트에서 평균을 뺍니다. 평균에 가까운 데이터 포인트는 0에 가까운 차이를 갖습니다. 모든 데이터 포인트에 대해 빼기 문제를 반복하면 아마도 데이터의 분산을 느끼기 시작할 것입니다.
    • 예를 들면 :
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. 각 기호를 제곱하십시오. 이 시점에서 이전 단계에서 얻은 결과 중 일부는 부정적이고 일부는 긍정적입니다.데이터를 동형 선으로 시각화하면이 두 항목은 평균의 왼쪽과 오른쪽에있는 숫자를 나타냅니다. 이 두 그룹이 서로를 상쇄하므로 분산을 계산하는 데는 쓸모가 없습니다. 대신, 그것들을 모두 제곱하여 모두 양성이되도록하십시오.
    • 예를 들면 :
      (-μ) 각 값 나는 1에서 6까지 실행됩니다.
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. 결과의 평균을 찾으십시오. 이제 데이터 포인트가 평균에서 얼마나 멀리 떨어져 있는지 (직접이 아닌) 각 데이터 포인트에 대한 값이 있습니다. 그들을 더하고 당신이 가진 값의 수로 나누어 평균을 내십시오.
    • 예를 들면 :
      전체 분산 = 24,25
  7. 레시피에 문의하십시오. 이것이 방법 시작 부분에 설명 된 공식에 얼마나 적합한 지 확실하지 않은 경우 전체 문제를 손으로 적고 축약하지 마십시오.
    • 평균과 제곱에서 차이를 찾은 후 마지막 데이터 포인트가있는 (-μ)까지 (-μ), (-μ) 등을 얻습니다. 데이터 세트에서.
    • 이 값의 평균을 찾으려면 값을 더하고 n으로 나눕니다. ((-μ) + (-μ) + ... + (-μ)) / n
    • 시그 모이 드 표기법으로 분자를 다시 작성하면 /, 공식 분산.
    광고

조언

  • 분산을 해석하기 어렵 기 때문에이 값은 종종 표준 편차를 찾기위한 시작점으로 계산됩니다.
  • 분모에 "n"대신 "n-1"을 사용하는 것은 Bessel 보정이라고하는 기술입니다. 표본은 전체 모집단의 추정치 일 뿐이며 표본 평균에는 해당 추정치와 일치하는 특정 편향이 있습니다. 이 보정은 위의 편향을 제거합니다. n-1 개의 데이터 포인트가 열거되면 마지막 번째 포인트가 분산 공식에서 표본의 평균 (x̅)을 계산하는 데 특정 값만 사용 되었기 때문에 상수였습니다.