Поширені посилання на рядок меню

Публікації

Статистика: живлення з даних!

Заходи поширення

  • Вітальна сторінка
  • Ареал і квартилі
  • Дисперсія та стандартне відхилення
  • П’ятизначні зведення
  • Побудова ділянок коробки та вусів
  • Вправи
  • Відповіді

Архівний вміст

Інформація, ідентифікована як заархівована, надається для довідкових цілей, досліджень або ведення діловодства. Він не підпадає під дію веб-стандартів уряду Канади і не змінювався та не оновлювався з моменту архівування. Будь ласка, зв’яжіться з нами, щоб попросити формат, відмінний від наявного.

  • Властивості середньоквадратичного відхилення
  • Дискретні змінні
  • Приклад 1 - Стандартне відхилення
  • Таблиця частот (дискретні змінні)
  • Приклад 2 - Стандартне відхилення, розраховане за допомогою таблиці частот
  • Приклад 3 - Стандартне відхилення з використанням згрупованих змінних (безперервних або дискретних)
  • Приклад 4 - Стандартне відхилення
  • Приклад 5 - Стандартне відхилення

На відміну від діапазону та квартилів, дисперсія поєднує всі значення в наборі даних, щоб отримати міру поширення. Дисперсія (символізується символом S 2 ) та стандартне відхилення (квадратний корінь з дисперсії, символізований символом S) є найбільш часто використовуваними заходами поширення.

Ми знаємо, що дисперсія є мірою того, наскільки розподілений набір даних. Він обчислюється як середнє квадратичне відхилення кожного числа від середнього значення набору даних. Наприклад, для чисел 1, 2 та 3 середнє значення дорівнює 2, а дисперсія - 0,667.

[(1 - 2) 2 + (2 - 2) 2 + (3 - 2) 2] ÷ 3 = 0,667

[квадратичне відхилення від середнього] ÷ кількість спостережень = дисперсія

Дисперсія (S 2) = середнє квадратичне відхилення значень від середнього

Обчислення дисперсії передбачає квадратичні відхилення, тому воно не має тієї самої одиниці виміру, як вихідні спостереження. Наприклад, довжини, виміряні в метрах (м), мають дисперсію, виміряну в метрах у квадраті (м 2).

Беручи квадратний корінь з дисперсії, ми отримуємо одиниці виміру, що використовуються у вихідному масштабі, і це стандартне відхилення.

Стандартне відхилення (S) = квадратний корінь дисперсії

Стандартне відхилення - це показник поширення, який найчастіше використовується в статистичній практиці, коли середнє значення використовується для обчислення центральної тенденції. Таким чином, він вимірює розподіл середнього значення. Через його тісний зв’язок із середнім значенням на стандартне відхилення може сильно вплинути, якщо середнє дає поганий показник центральної тенденції.

На середньоквадратичне відхилення також впливають викиди, одне значення може в значній мірі сприяти результатам стандартного відхилення. У цьому сенсі середньоквадратичне відхилення є хорошим показником наявності відхилень. Це робить середньоквадратичне відхилення дуже корисною мірою поширення для симетричних розподілів без відхилень.

Стандартне відхилення також корисно при порівнянні розподілу двох окремих наборів даних, які мають приблизно однакове середнє значення. Набір даних із меншим стандартним відхиленням має більш вузький розподіл вимірювань навколо середнього значення, і тому, як правило, має порівняно менше високих або низьких значень. Елемент, вибраний випадковим чином із набору даних, стандартне відхилення якого є низьким, має більше шансів бути близьким до середнього, ніж елемент із набору даних, стандартне відхилення якого вище.

Як правило, чим ширше поширені значення, тим більшим є стандартне відхилення. Наприклад, уявімо, що ми маємо відокремити два різні набори результатів іспитів від класу з 30 студентів, перший іспит має оцінки від 31% до 98%, інші - від 82% до 93%. Враховуючи ці діапазони, стандартне відхилення було б більшим для результатів першого іспиту.

Стандартне відхилення може бути важко інтерпретувати з точки зору того, наскільки великим воно має бути, щоб врахувати широко поширені дані. Розмір середнього значення набору даних залежить від величини стандартного відхилення. Коли ви вимірюєте щось у мільйонах, наявність показників, "близьких" до середнього значення, не має того самого значення, як коли ви вимірюєте вагу двох людей. Наприклад, показник двох великих компаній з різницею в річному доході 10 000 доларів вважається досить близьким, тоді як показник двох осіб з різницею у вазі 30 кілограмів - далеко один від одного. Ось чому в більшості ситуацій корисно оцінити розмір стандартного відхилення відносно середнього значення набору даних.

Хоча стандартне відхилення менш сприйнятливе до екстремальних значень, ніж діапазон, стандартне відхилення все ще є більш чутливим, ніж напівквартильний діапазон. Якщо існує можливість високих значень (відхилень), тоді стандартне відхилення слід доповнити діапазоном напівквартилів.

Властивості середньоквадратичного відхилення

При використанні стандартного відхилення враховуйте наступні властивості.

  • Стандартне відхилення використовується лише для вимірювання розповсюдження або дисперсії навколо середнього значення набору даних.
  • Стандартне відхилення ніколи не є негативним.
  • Стандартне відхилення чутливе до викидів. Один окремий випадок може підвищити стандартне відхилення і, в свою чергу, спотворити картину поширення.
  • Для даних із приблизно однаковим середнім значенням, чим більший розкид, тим більше стандартне відхилення.
  • Якщо всі значення набору даних однакові, стандартне відхилення дорівнює нулю (оскільки кожне значення дорівнює середньому).

При аналізі нормально розподілених даних можна використовувати стандартне відхилення разом із середнім значенням для обчислення інтервалів даних.

Якщо = середнє, S = стандартне відхилення і х = значення в наборі даних, тоді

  • близько 68% даних лежить в інтервалі: - S 2).
  • Використовуйте додатний квадратний корінь (стандартне відхилення, S).
  • потужність

Приклад 1 - Стандартне відхилення

Курка несе вісім яєць. Кожне яйце зважували та реєстрували наступним чином:

60 г, 56 г, 61 г, 68 г, 51 г, 53 г, 69 г, 54 г.

  1. Спочатку обчисліть середнє:
  2. Тепер знайдіть стандартне відхилення.

Таблиця 1. Вага яєць, у грамах Вага (x) (x -) (x -) 2 60 56 61 68 51 53 69 54 472
1 1
-3 9
2 4
9 81
-8 64
-6 36
10 100
-5 25
320

Використовуючи інформацію з наведеної вище таблиці, ми можемо це побачити

Таблиця частот (дискретні змінні)

Формули дисперсії та стандартного відхилення дещо змінюються, якщо спостереження згруповано в таблицю частот. Квадратні відхилення множаться на значення кожної частоти, а потім обчислюється сума цих результатів.

У таблиці частот дисперсія для дискретної змінної визначається як

Приклад 2 - Стандартне відхилення, розраховане за допомогою таблиці частот

Тридцять фермерів запитали, скільки працівників ферм вони наймають під час типового сезону збору врожаю. Їх відповіді:

4, 5, 6, 5, 3, 2, 8, 0, 4, 6, 7, 8, 4, 5, 7, 9, 8, 6, 7, 5, 5, 4, 2, 1, 9, 3, 3, 4, 6, 4

Таблиця 2. Тридцять фермерів запитали, скільки працівників ферм вони наймають протягом типового сезону збору врожаю. Їх відповіді: Робочі (x) Загальна частота (f) (xf) (x -) (x -) 2 (x -) 2 f 0 1 2 3 4 5 6 7 8 9
1 0 -5 25 25
1 1 -4 16 16
2 4 -3 9 18
3 9 -2 4 12
6 24 -1 1 6
5 25 0 0 0
4 24 1 1 4
3 21 2 4 12
3 24 3 9 27
2 18 4 16 32
30 150 152

Приклад 3 - Стандартне відхилення з використанням згрупованих змінних (безперервних або дискретних)

220 студентів запитували кількість годин на тиждень, які вони витрачали на перегляд телевізора. За цією інформацією обчисліть середнє і стандартне відхилення годин, проведених 220 студентами за переглядом телевізора.

Таблиця 3. Кількість годин на тиждень, проведених за переглядом телевізора Кількість студентівВід 10 до 14Від 15 до 19Від 20 до 24Від 25 до 29Від 30 до 34Від 35 до 39Від 40 до 44
2
12
23
60
77
38
8
  1. Спочатку, використовуючи кількість студентів як частоту, знайдіть середню точку інтервалів часу.
  2. Тепер обчисліть середнє значення, використовуючи середню точку (х) і частота (f).

Примітка: У цьому прикладі ви використовуєте неперервну змінну, яка була округлена до найближчого цілого числа. Група Від 10 до 14 фактично становить 9,5 до 14,499 (оскільки 9,5 буде округлено до 10, а 14,499 буде округлено до 14). Інтервал має довжину 5, але середня точка 12 (9,5 + 2,5 = 12).

6560 = (2 X 12 + 12 X 17 + 23 X 22 + 60 X 27 + 77 X 32 + 38 X 37 + 8 X 42)

Потім обчисліть числа для xf, (х -), (х -) 2 і (х -) 2 f формули.

Додайте їх до таблиці частот нижче.

Таблиця 4. Кількість годин, проведених за переглядом телевізора Години Середня точка (x) Частота (f) xf (x -) (x -) 2 (x -) 2 f Від 10 до 14 Від 15 до 19 Від 20 до 24 Від 25 до 29 Від 30 до 34 Від 35 до 39 Від 40 до 44
12 2 24 -17,82 317,6 635,2
17 12 204 -12,82 164.4 1 972,8
22 23 506 -7,82 61.2 1407,6
27 60 1620 -2.82 8,0 480,0
32 77 2464 2.18 4.8 369,6
37 38 1 406 7.18 51.6 1960,8
42 8 336 12.18 148.4 1187,2
220 6560 8013,2

Приклад 4 - Стандартне відхилення

Використовуйте інформацію, наведену в таблиці вище, щоб знайти стандартне відхилення.

Примітка: Під час обчислень, коли змінна групується за інтервалами класів, середина інтервалу використовується замість кожного іншого значення в інтервалі. Таким чином, розподіл спостережень у межах кожного інтервалу ігнорується. Це робить стандартне відхилення завжди меншим від дійсного значення. Отже, це слід розглядати як наближення.

Приклад 5 - Стандартне відхилення

Припускаючи, що розподіл частоти є приблизно нормальним, обчисліть інтервал, протягом якого очікується 95% спостережень у попередньому прикладі.

= 29,82, s = 6,03

Розрахуйте інтервал за такою формулою: -