숫자 집합의 최빈값을 찾는 방법

작가: John Stephens
창조 날짜: 1 1 월 2021
업데이트 날짜: 1 칠월 2024
Anonim
[EBS 수학의 답] 대푯값과 산포도- 3. 대푯값-최빈값
동영상: [EBS 수학의 답] 대푯값과 산포도- 3. 대푯값-최빈값

콘텐츠

통계에서 방법 일련의 숫자 중 숫자는 해당 인구에서 가장 자주 나타납니다.. 데이터 세트에 하나의 모드 만있을 필요는 없습니다. 두 개 이상의 값이 가장 일반적인 것으로 간주되는 경우 해당 데이터 세트를 호출 할 수 있습니다. 바이 모달 (두 가지 모드) 또는 멀티 모달 (다중 모드)-즉, 가장 일반적인 모든 값은 세트의 모드입니다. 데이터 세트 모드 결정에 대한 자세한 내용은 시작하려면 아래 1 단계를 참조하십시오.

단계

방법 1/2 : 데이터 세트의 최빈값 찾기

  1. 데이터 세트의 숫자를 나열하십시오. 모드는 종종 통계 데이터 포인트 세트 또는 숫자 값 목록에서 얻습니다. 따라서 모드를 찾으려면 찾을 데이터 세트가 있어야합니다. 너무 작은 데이터 세트를 제외하고 시각화만으로 모드 값을 계산하는 것은 어렵 기 때문에 대부분의 경우 가장 현명한 방법은 데이터 세트를 작성 (또는 입력)하는 것입니다. . 종이와 연필로 작업하는 경우 데이터 세트에 순서대로 값을 기록하고 계산기를 사용하는 동안 Excel 프로그램을 사용해야 할 수도 있습니다.
    • 데이터 세트의 모드를 찾는 프로세스는 예제로 설명 할 때 이해하기 더 쉽습니다. 이 섹션에서는 다음 값 세트를 예로 들어 보겠습니다. {18, 21, 11, 21, 15, 19, 17, 21, 17}. 다음 단계에서이 컬렉션의 모드를 찾습니다.

  2. 가장 작은 것부터 가장 큰 것까지 숫자를 정렬합니다. 데이터 세트의 값을 오름차순으로 정렬하는 것이 좋습니다. 이것은 선택 사항이지만 유사한 값을 나란히 그룹화하기 때문에 모드를 찾는 프로세스가 더 쉬워집니다. 대규모 데이터 세트의 경우 긴 목록을 분류하기 어렵고 각 숫자가 목록에 몇 번 나타나고 오류가 발생할 수 있는지 기억하기가 어렵 기 때문에 이것이 정말 필요합니다.
    • 종이와 연필로 작업하는 경우 적어두면 장기적으로 시간을 절약 할 수 있습니다. 숫자 집합을 살펴보고 어떤 숫자가 가장 작은 지 확인한 후 가장 작은 숫자로 새 데이터 집합을 시작한 다음 두 번째, 세 번째로 작은 숫자를 차례로 시작합니다. 각 숫자를 원래 데이터 세트에 나타난 횟수와 동일하게 작성해야합니다.
    • 계산기를 사용하면 몇 번의 클릭만으로 작은 값에서 큰 값으로 값 목록을 정렬 할 수 있습니다.
    • 위의 예에서 정렬 후 새 목록은 다음과 같습니다. {11, 15, 17, 17, 18, 19, 21, 21, 21}.

  3. 각 숫자가 반복되는 횟수를 세십시오. 다음 단계는 각 숫자가 세트에 나타나는 횟수를 세는 것입니다.데이터 세트에서 가장 자주 발생하는 값을 찾으십시오. 포인트가 오름차순으로 정렬 된 비교적 작은 데이터 세트의 경우 유사한 값의 "클러스터"를 찾고 발생 횟수를 계산하는 것은 비교적 간단합니다.
    • 종이와 연필로 작업하는 경우 카운트를 기억하고 각 값이 같은 숫자의 각 클러스터에서 발생하는 횟수를 기록하십시오. 데스크톱 엑셀 프로그램을 사용하는 경우 옆에있는 상자에 쓰거나 프로그램의 기능 중 하나를 사용하여 데이터 포인트를 계산하여 동일한 작업을 수행 할 수 있습니다.
    • 이 예에서 ({11, 15, 17, 17, 18, 19, 21, 21, 21}), 11은 한 번, 15는 한 번, 17은 두 번, 18은 한 번 발생합니다. 한 번, 19 번이 한 번 나타나고 21 세 번 등장. 21은이 데이터 세트에서 가장 빈번한 값입니다.

  4. 가장 자주 발생하는 값을 결정하십시오. 각 값이 발생하는 횟수를 알고 있으면 가장 많이 발생하는 값을 찾으십시오. 이것은 데이터 세트의 모드입니다.. 참고 데이터 세트에 둘 이상의 모드가있을 수 있습니다.. 두 값이 모집단에서 가장 많이 발생하는 경우 집합은 다음과 같습니다. 바이 모달 (두 가지 모드), 이러한 값이 세 개 있으면 설정은 삼봉 (세 가지 모드) 등.
    • 위의 예에서 ({11, 15, 17, 17, 18, 19, 21, 21, 21}), 21은 기껏해야 발생하므로 21은 모드.
    • 21보다 값이 하나 더 많은 경우 또한 세 번 나타나고 (예 : 세트에 17 개가 추가됨), 21과이 숫자 양자 모두 모드가됩니다.
  5. 모드를 평균 또는 중앙값과 혼동하지 마십시오. 자주 함께 언급되는 세 가지 통계 개념은 평균, 중앙값 및 모드입니다. 이러한 개념은 비슷한 소리 이름을 갖고 있고 데이터 세트에서 값이 닫힐 수 있기 때문입니다. 하나 이상 이 숫자에서 역할을하므로 혼동하기 쉽습니다. 그러나 데이터 세트에 모드가 있는지 여부에 관계없이 항상 중앙값 또는 평균이 있습니다. 이 세 가지 개념은 서로 완전히 독립적이라는 것을 이해하는 것이 중요합니다. 아래 참조 :
    • 평균 데이터 세트의 평균은 해당 세트의 평균입니다. 평균을 찾으려면 집합의 모든 값을 더한 다음 합계를 집합의 항 수로 나눕니다. 예를 들어 초기 숫자 집합 ({11, 15, 17, 17, 18, 19, 21, 21, 21}), 평균은 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17.78. 9는 세트에 9 자리 숫자가 있음을 의미합니다.

    • 중앙값 데이터 세트의 작은 값과 큰 값을 두 개의 동일한 반으로 나누는 "중간 숫자"입니다. 위의 예를 보자 ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 18 중간 숫자이기 때문에 중앙값입니다. 정확히 4 개의 숫자가 더 크고 4 개의 숫자가 더 적습니다. 집합의 값 수가 짝수이면 중앙값은 두 중간 숫자의 산술 평균입니다.

    광고

방법 2/2 : 특수한 경우 찾기 모드

  1. 각 값의 발생 횟수가 동일한 데이터 세트에는 모드가 없습니다. 주어진 세트의 값이 같은 횟수로 발생하면 다른 어떤 숫자보다 더 많이 발생하지 않기 때문에이 데이터 세트에는 모드가 없습니다. 예를 들어 각 값이 한 번만 발생하는 데이터 세트에는 모드가 없습니다. 값이 두 번, 세 번 발생하는 데이터 세트의 경우에도 마찬가지입니다.
    • 각 값이 한 번만 발생하도록 예제 데이터 세트를 {11, 15, 17, 18, 19, 21}로 변경하면 이제이 데이터 세트가 모드가 없습니다. 각 값이 {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21} 두 번 발생하도록 데이터 세트를 변경하는 경우에도 마찬가지입니다.
  2. 숫자가 아닌 데이터 세트의 모드는 숫자 데이터 세트와 동일한 방식으로 찾을 수 있습니다. 일반적으로 대부분의 데이터 세트는 정량적 -숫자 데이터를 포함합니다. 그러나 일부 데이터 세트에는 숫자로 표시되지 않는 정보가 포함되어 있습니다. 이 경우 "모드"는 숫자 데이터 세트와 마찬가지로 해당 데이터 세트에서 가장 자주 발생하는 값입니다. 이러한 경우 모드를 찾는 것은 가능하지만 중앙값 또는 평균을 찾는 것은 불가능합니다.
    • 이 지역의 수종을 식별하기 위해 생물학적 조사에서 예를 들어보십시오. 이 지역의 나무 종에 대한 데이터 세트는 {Bang, Phuong, Bang, Thong, Bang, Bang, Phuong, Phuong, Thong, Bang}입니다. 이러한 유형의 데이터 세트를 데이터 세트라고합니다. 이름 데이터 포인트는 이름만으로 구별되기 때문입니다. 데이터 세트의 모드는 다음과 같습니다. 가장 많이 나타나기 때문입니다 (5 번, Phuong은 3 번, Thong은 2 번).
    • 위의 예에서는 데이터 포인트가 숫자가 아니기 때문에 평균이나 중앙값을 계산할 수 없습니다.
  3. 최빈값이있는 대칭 분포의 경우 최빈값, 평균 및 중앙값이 일치합니다. 위에서 언급했듯이 모드, 중앙값 및 / 또는 평균은 특정 상황에서 동일 할 수 있습니다. 데이터 세트의 밀도 함수가 하나의 모드 (예 : 가우스 곡선 또는 "종 모양"곡선)로 완벽하게 대칭 곡선을 형성하는 경우 모드, 평균 및 중앙값은 다음과 같습니다. 같은 가치. 분포 함수는 데이터 포인트의 상대적 발생을 플로팅하기 때문에 자연 모드는 대칭 분포 곡선의 중간에 있습니다. 이는 그래프의 가장 높은 포인트이고 값에 해당하기 때문입니다. 가장 인기있는. 데이터 세트가 대칭이기 때문에 그래프의이 점은 중앙값 (데이터 세트의 중간 값) 및 평균 (데이터 세트의 평균)에 해당합니다.
    • 다음 예 {1, 2, 2, 3, 3, 3, 4, 4, 5}를 고려하십시오. 이 데이터 세트의 분포를 플로팅하면 x = 3에서 높이 3의 대칭 곡선을 얻고 x = 1 및 x = 5에서 1까지 내려갑니다. 3이 가격이므로 가장 자주 치료, 그것은 모드입니다. 세트의 중간 3 값은 양쪽에 4 개의 값이 있으므로 3 또한 중앙값. 마지막으로 모집단의 평균은 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27/9 = 3입니다. 3은 또한 평균입니다.
    • 이 규칙의 예외는 대칭 데이터 세트에 둘 이상의 모드가 있다는 것입니다.이 경우 해당 데이터 세트에 대해 중앙값과 평균이 하나뿐이므로 두 모드가 다른 점과 일치하지 않습니다. .
    광고

조언

  • 둘 이상의 모드를 가질 수 있습니다.
  • 모든 숫자가 한 번만 나타나면 모드가 없습니다.

필요한 것

  • 종이, 연필, 지우개