Определить закономерность изменения контролируемого параметра
Алгоритм решения: по каждому месяцу
провести группировку статистических данных, построить вариационный ряд и представить его графическую интерпретацию
найти среднюю величину;
определить моду и медиану и сделать вывод о близости статистических данных нормальному закону распределения;
определить дисперсию и среднеквадратичное отклонение;
найти аномальные значения статистических данных и, при их наличии, пересчитать среднюю величину;
найти коэффициент вариации и сделать вывод о типичности средней величины;
на основании полученных данных построить график изменения средней величины во времени сделать вывод о тенденции изменения контролируемого параметра.
Исходные статистические данные
Рабочие дни Среднее значение правонарушений за месяц Среднее значение правонарушений за месяц Среднее значение правонарушений за месяц Среднее значение правонарушений за месяц
январь февраль март апрель
1 778 768 1035 701
2 683 635 574 549
3 786 691 691 558
4 702 637 582 465
5 1013 646 612 595
6 716 646 629 695
7 723 649 653 506
8 728 834 899 788
9 952 677 672 513
10 1185 656 659 312
11 751 636 581 451
12 850 693 703 582
13 765 693 712 587
14 768 700 713 600
15 887 488 563 543
16 699 703 719 617
17 807 715 730 629
18 809 735 733 637
19 812 737 760 638
20 753 738 778 643
21 879 749 782 644
22 883 750 792 354
23 659 753 798 458
24 739 766 805 683
25 712 700 718 600
26 740 681 673 542
Решение
По каждому месяцу проведем группировку статистических данных, построим вариационный ряд и представим его графическую интерпретацию.
Рассчитаем количество интервалов по формуле Стерджеса
Число групп определяется по формуле Стерджесса
N=1+3,322lgn=1+3,322lg26≈5,68=6 групп
Проранжируем ряд по возрастанию признака - среднее значение правонарушений за месяц
Рабочие дни Среднее значение правонарушений за месяц Среднее значение правонарушений за месяц Среднее значение правонарушений за месяц Среднее значение правонарушений за месяц
январь февраль март апрель
1 659 488 563 312
2 683 635 574 354
3 699 636 581 451
4 702 637 582 458
5 712 646 612 465
6 716 646 629 506
7 723 649 653 513
8 728 656 659 542
9 739 677 672 543
10 740 681 673 549
11 751 691 691 558
12 753 693 703 582
13 765 693 712 587
14 768 700 713 595
15 778 700 718 600
16 786 703 719 600
17 807 715 730 617
18 809 735 733 629
19 812 737 760 637
20 850 738 778 638
21 879 749 782 643
22 883 750 792 644
23 887 753 798 683
24 952 766 805 695
25 1013 768 899 701
26 1185 834 1035 788
Январь:
Рассчитаем ширину интервала h.
Найдем шаг интервала по формуле h=xmax-xminN =1185-6596= 87,7
Начало
интервала, xi-1
Конец
интервала, xi+1
частота,
fi
Накопленная частота, wi
Середина интервала, xi=xi-1+xi+12
xifi
xi-x
(xi-x)2
(xi-x)2fi
1 2 3 4 5 6 7 8
659,0 746,7 10 10 702,83 7028,33 -97,78 9561,33 95613,3
746,7 834,3 9 19 790,50 7114,50 -10,12 102,32 920,8891
834,3 922,0 4 23 878,17 3512,67 77,55 6014,20 24056,81
922,0 1009,7 1 24 965,83 965,83 165,22 27296,97 27296,97
1009,7 1097,3 1 25 1053,50 1053,50 252,88 63950,63 63950,63
1097,3 1185,0 1 26 1141,17 1141,17 340,55 115975,18 115975,2
fi
26
xifi
20816
(xi-x)2fi
327813,8
x=xififi
800,62
D=(xi-x)2fifi
12608,22
Найдем среднее число правонарушений за январь как среднюю взвешенную (выборочная средняя)
x=xififi
x=2081626=800,62 – среднее число правонарушений за январь
Мода (М0) - варианта, встречающаяся в изучаемой совокупности чаще всего, т.е. варианта, которой соответствует наибольшая частота.
Вычисление моды в интервальном ряду с равными интервалами производится по следующей формуле:
,
где Мо– мода; модальный интервал (659-746,7)
Х0=659 – нижнее значение модального интервала;
fMo=10 – частота в модальном интервале;
fMo-1=0 – частота в предыдущем интервале;
fMo+1=9 – частота в следующем интервале за модальным;
h = 87,7– величина интервала.
Мо = 659+87,7*10-010-0+(10-9) =738,73
Наиболее часто встречающееся значение ряда – 738,73
Медиана.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше. Медиана (Ме)- варианта, находящаяся в средине ряда распределения.
Медиана соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером: Me = n2= 262=13
Медианным является интервал (746,7-834,3), так как в этом интервале накопленная частота (wi) больше медианного номера
.
где Ме– медиана;
X0 = 746,7 – нижняя граница интервала, в котором находится медиана;
H = 87,6 – шаг интервала;
=10 – накопленная частота в интервале, предшествующем медианному;
fMe = 9– частота в медианном интервале.
Ме = 746,7+87,6*0,5*26-109=775,9
Таким образом, за половину рабочих дней число правонарушений меньше 775,9, за другую половину – более
Различие между средней арифметической величиной (800,62) медианой (775,9) и модой (738,73) за январь достаточно велико. Чем ближе распределение по форме к нормальному закону, тем ближе значения медианы, моды и средней величины между собой, можно предположить, что данные выборки распределены не по нормальному закону, о чем также свидетельствует вид гистограммы распределения.
Дисперсия- характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
D=(xi-x)2fifi
D=327813,826=12608,22
Среднее квадратическое отклонение.
σ=D=12608,22 =112,3
Каждое значение ряда отличается от среднего значения 800,62 в среднем на 112,3
Если исключить аномальную величину выборки – 1185, то получим среднее значение x=19513,525=780,54
Коэффициент вариации- мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
v=σx*100%
v=112,3800,62*100%=14,02%
Так как v<33%, считаем, что выборка однородная
Февраль:
Найдем шаг интервала по формуле h=xmax-xminN =834-4886= 57,7
Начало
интервала, xi-1
Конец
интервала, xi+1
частота,
fi
Накопленная частота, wi
Середина интервала, xi=xi-1+xi+12
xifi
xi-x
(xi-x)2
(xi-x)2fi
1 2 3 4 5 6 7 8
488,0 545,7 1 1 516,83 516,83 -173,00 29929,00 29929
545,7 603,3 0 1 574,50 0,00 -115,33 13301,78 0
603,3 661,0 7 8 632,17 4425,17 -57,67 3325,44 23278,11
661,0 718,7 9 17 689,83 6208,50 0,00 0,00 0
718,7 776,3 8 25 747,50 5980,00 57,67 3325,44 26603,56
776,3 834,0 1 26 805,17 805,17 115,33 13301,78 13301,78
fi
26
xifi
17935,67
(xi-x)2fi
93112,44
x=xififi
689,83
D=(xi-x)2fifi
3581,248
Найдем среднее число правонарушений за февраль как среднюю взвешенную (выборочная средняя)
x=17935,726=689,83 – среднее число правонарушений за февраль
Мо– мода; модальный интервал (661-718,7)
Х0=661 – нижнее значение модального интервала;
fMo=9 – частота в модальном интервале;
fMo-1=7 – частота в предыдущем интервале;
fMo+1=8 – частота в следующем интервале за модальным;
h = 57,7– величина интервала.
Мо = 661+57,7*9-79-7+(9-8) =699,5
Наиболее часто встречающееся значение ряда – 699,5
Медиана.
Медианным является интервал (661-718,7), так как в этом интервале накопленная частота (wi) больше медианного номера.
X0 = 661 – нижняя граница интервала, в котором находится медиана;
H = 57,7 – шаг интервала;
=8 – накопленная частота в интервале, предшествующем медианному;
fMe = 9– частота в медианном интервале.
Ме = 661+57,7*0,5*26-89=693,06
Таким образом, за половину рабочих дней число правонарушений меньше 693,06, за другую половину – более
Различие между средней арифметической величиной (689,83) медианой (699,5) и модой (693,06) за февраль не велико