23 20 9 14 26 12 22 19 29 20
14 22 15 19 26 23 21 16 19 16
18 21 23 17 17 24 19 15 24 18
19 24 25 24 17 20 16 18 18 17
18 23 13 23 29 22 26 19 12 19
16 14 21 20 20 22 11 14 19 18
24 25 19 20 17 25 15 21 19 16
18 24 17 10 23 20 25 16 28 19
17 17 22 14 21 18 20 15 14 21
23 15 13 27 19 19 21 15 14 19
1) Осуществить первичную обработку статистических данных (составить интервальное статистическое распределение признака Х, построить гистограмму, найти эмпирическую функцию распределения и построить её график).
2) Вычислить числовые характеристики выборки (меры центральной тенденции, меры рассеивания, коэффициенты асимметрии и эксцесса).
3) Выдвинуть гипотезу о виде закона распределения.
4) Проверить гипотезу и сделать вывод в терминах исследуемого процесса.
Решение
1) Исследуемый ряд является непрерывным. Для представления его в интервальной форме необходимо сгруппировать данные. Рекомендуемое число интервалов вычисляется согласно формуле Стерджесса:
Тогда величина интервала (интервальная размерность, ширина интервала) рассчитывается по формуле:
Построим границы интервалов. Левая граница первого интервала будет равна 9, а далее . Далее, для каждого интервала определяется его срединное значение, как среднее арифметическое его концов.
Сгруппированный ряд представим в виде таблицы:
Таблица 1. Непрерывный вариационный ряд
i Уровень мотивации X: Середина интервала Частота
Частость (доля)
Накопленная частота
Накопленная частость
1 9–11,5 10,25 3 0,03 3 0,03
2 11,5–14 12,75 11 0,11 14 0,14
3 14–16,5 15,25 12 0,12 26 0,26
4 16,5–19 17,75 30 0,30 56 0,56
5 19–21,5 20,25 15 0,15 71 0,71
6 21,5–24 22,75 18 0,18 89 0,89
7 24–26,5 25,25 7 0,07 96 0,96
8 26,5–29 27,75 4 0,04 100 1,00
Итого: 100 1 - -
На одном чертеже изобразим гистограмму и полигон частот. По оси х отметим середины интервалов, по оси ординат - частоты:
Эмпирической функцией распределения называется относительная частота (частость) того, что случайная величина X примет значение, меньшее заданного , т.е.
Её значения записаны в последнем столбце таблицы 1.
График её представляется в виде ступенчатой фигуры или кумулятивной кривой. Кумулятивной кривой называется кривая накопленных частот (или накопленных частостей). Построение кумулятивной кривой начинают с точки, абсцисса которой равна началу первого интервала, а ордината равна нулю. Абсциссы следующих точек этой ломаной будут совпадать с концами интервалов, а ординаты – соответствующим им накопленным частотам (или частостям):
2) По сгруппированным данным вычислим числовые характеристики выборки: меры центральной тенденции (среднее арифметическое, моду и медиану), меры рассеивания (выборочную и исправленную дисперсии, среднее квадратичное отклонение, коэффициент вариации), коэффициенты асимметрии и эксцесса)
. При этом в качестве вариант используются середины соответствующих интервалов.
Основные характеристики вариационного ряда:
Средняя арифметическая
Выборочная дисперсия
Среднее квадратическое
отклонение
Коэффициент вариации
Центральный момент
порядка k
Коэффициент асимметрии
Коэффициент эксцесса
Вычисляем среднее и центральные моменты 2,3,4 - го порядка:
i
1 10,25 3 30,75 -8,6 223,17 -1924,86 16601,9
2 12,75 11 140,25 -6,1 412,67 -2527,62 15481,6
3 15,25 12 183 -3,6 157,69 -571,62 2072,1
4 17,75 30 532,5 -1,1 37,97 -42,71 48,1
5 20,25 15 303,75 1,4 28,36 38,99 53,6
6 22,75 18 409,5 3,9 270,28 1047,34 4058,4
7 25,25 7 176,75 6,4 284,48 1813,59 11561,6
8 27,75 4 111 8,9 315,06 2796,18 24816,1
сумма
100 1887,5
1729,69 629,30 74693,5
18,875
17,30 6,29 746,9
Среднее: (балл.)
Модой называется варианта, которой соответствует наибольшая частота.
Можно отметить, что уровень мотивации в выборке колеблется от 9 до 29 баллов, при этом чаще всего встречаются значения от 16,5 до 19 баллов (), что представляет собой модальный интервал исследуемого вариационного ряда.
Мода Мо интервального статистического распределения выборки :
Мо =
Здесь модальный интервал: 16,5–19, начало модального интервала=16,5; длина интервала h = 2,5 ; частота модального интервала =30; частота домодального интервала =12; послемодального интервала =15; тогда
Мо = балл.
Медиана Ме интервального статистического распределения выборки определяется по формуле: , где х0 – начало медианного интервала , то есть интервала, в котором находится серединный элемент, k – длина медианного интервала, n – объем выборки, – сумма частот интервалов, которые предшествуют медианному, nі – частота медианного интервала.
Вычислим позицию медианы в ранжированном вариационном ряду:
.
Для интервального ряда далее следует определить медианный интервал – интервал, в котором впервые накопленная частота превышает позицию медианы. Для исследуемого ряда таким является интервал 16,5–19, который содержит 30 вариант выборки