С целью определения средней величины транспортных затрат (тыс. руб.) на доставку одной тонны продукции предприятий пищевой промышленности к потребителям в некотором крупном мегаполисе, имеющем 2570 предприятий, по схеме собственно-случайной бесповторной выборки проведено обследование 240 предприятий. Распределение транспортных затрат (тыс. руб.) представлено в таблице:
10,3 8,8 6,8 14,0 8,8 13,2 8,2 9,5 9,9 14,0
13,2 14,4 11,7 10,7 6,8 11,5 10,8 8,2 8,2 6,2
5,3 11,7 4,0 6,2 13,6 18,1 7,6 10,7 13,0 14,8
10,0 11,2 6,2 9,3 11,6 6,6 10,1 6,5 9,1 11,9
10,2 9,7 11,0 4,3 8,6 12,9 15,9 9,7 12,7 6,0
9,6 14,0 7,9 10,6 8,8 11,9 15,6 8,3 6,8 3,4
5,1 11,5 12,8 12,6 9,8 12,0 7,7 6,7 9,6 11,8
10,5 10,7 10,3 6,8 13,0 7,5 9,1 11,0 8,0 10,0
9,5 4,6 6,6 9,5 10,2 9,5 14,7 16,3 17,8 9,5
10,0 7,6 11,9 10,6 3,8 10,9 7,9 14,4 8,0 9,7
12,6 14,4 8,2 13,9 6,2 9,9 7,1 12,1 7,6 9,0
6,4 10,9 8,4 13,5 8,3 4,5 5,9 15,6 13,7 12,6
8,4 11,3 12,8 12,8 7,7 14,0 8,9 9,7 9,8 14,1
7,0 8,2 8,4 13,9 7,9 11,7 8,5 9,7 2,6 11,5
6,6 8,4 0,6 12,2 12,1 12,4 11,3 11,7 6,5 12,9
10,6 8,8 12,0 11,0 9,4 7,0 13,0 14,4 9,3 13,6
12,7 5,7 5,8 9,5 11,0 11,8 9,9 7,9 12,4 9,0
10,6 10,9 9,8 10,9 10,9 5,7 11,6 8,7 12,5 7,0
13,6 10,3 11,1 13,5 12,0 9,1 9,3 7,3 15,3 12,1
3,7 10,7 9,4 7,4 14,5 9,5 10,5 9,1 8,5 12,8
11,8 1,9 13,4 12,9 11,2 9,4 15,0 12,7 10,5 10,0
16,1 11,5 11,1 10,4 4,8 13,0 7,7 9,0 11,1 10,0
17,0 9,6 8,7 9,4 15,6 9,6 9,3 9,4 13,9 12,1
8,2 2,0 12,5 10,0 11,2 8,2 5,8 11,3 8,2 9,4
Составить интервальный вариационный ряд. Записать эмпирическую функцию распределения и построить ее график. На одном чертеже изобразить гистограмму и полигон частот.
По сгруппированным данным вычислить выборочные числовые характеристики: среднее арифметическое, исправленную выборочную дисперсию, среднее квадратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду и медиану.
Заменив параметры генеральной совокупности соответственно их наилучшими выборочными числовыми характеристиками и используя χ2-критерий Пирсона, на уровне значимости =0,05 проверить две гипотезы о том, что изучаемая случайная величина ξ – величина транспортных затрат – распределена:
а) по нормальному закону распределения;
б) по равномерному закону распределения.
Построить чертёж, на котором изображена гистограмма эмпирического распределения и соответствующие графики равномерного и нормального распределений.
Нужно полное решение этой работы?
Решение
Исследуемый ряд является непрерывным. Для представления ряда в интервальной форме необходимо сгруппировать данные. Рекомендуемое число интервалов вычисляется согласно формуле Стерджесса:
Тогда величина интервала (интервальная размерность, ширина интервала) рассчитывается по формуле:
Построим границы интервалов. Для этого определим величину Δ, равную 0,1. Тогда границы искомых интервалов можно рассчитать по правилу: левая граница первого интервала будет равна 0,55, а далее при i =1,2,...,m. При таком выборе правая граница последнего интервала будет равна 18,15.
Далее, для каждого интервала определяется его срединное значение, как среднее арифметическое его концов.
Сгруппированный ряд представим в виде таблицы:
Таблица 1.2. Непрерывный вариационный ряд
i Продолжительность больничного X: Середи-на интервала Частота
Частость (доля)
Накопленная частота
Накоплен-ная частость
1 0,55–2,75 1,65 4 0,02 4 0,02
2 2,75–4,95 3,85 8 0,03 12 0,05
3 4,95–7,15 6,05 27 0,11 39 0,16
4 7,15–9,35 8,25 50 0,21 89 0,37
5 9,35–11,55 10,45 75 0,31 164 0,68
6 11,55–13,75 12,65 50 0,21 214 0,89
7 13,75–15,95 14,85 21 0,09 235 0,98
8 15,95–18,15 17,05 5 0,02 240 1,00
Итого: 240 1 - -
Эмпирической функцией распределения называется относительная частота (частость) того, что случайная величина X примет значение, меньшее заданного , т.е.
Её значения записаны в последнем столбце таблицы 1.2.
График её представляется в виде ступенчатой фигуры или кумулятивной кривой. Кумулятивной кривой называется кривая накопленных частот (или накопленных частостей). Построение кумулятивной кривой начинают с точки, абсцисса которой равна началу первого интервала, а ордината равна нулю. Абсциссы следующих точек этой ломаной будут совпадать с концами интервалов, а ординаты – соответствующим им накопленным частотам (или частостям):
На одном чертеже изобразим гистограмму и полигон частот. По оси х отметим середины интервалов:
2. По сгруппированным данным вычислим выборочные числовые характеристики: среднее арифметическое, исправленную выборочную дисперсию, среднее квадратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду и медиану.
При расчетах в качестве вариант используются середины соответствующих интервалов.
Основные характеристики вариационного ряда:
Средняя арифметическая
Выборочная дисперсия
Среднее квадратическое
отклонение
Коэффициент вариации
Начальный момент порядка k
Центральный момент
порядка k
Коэффициент асимметрии
Коэффициент эксцесса
Вычисляем начальные моменты 1,2,3,4 - го порядка:
i
1 1,65 4 6,6 10,89 17,9685 29,648025
2 3,85 8 30,8 118,58 456,533 1757,65205
3 6,05 27 163,35 988,2675 5979,018375 36173,06117
4 8,25 50 412,5 3403,125 28075,78125 231625,1953
5 10,45 75 783,75 8190,1875 85587,45938 894388,9505
6 12,65 50 632,5 8001,125 101214,2313 1280360,025
7 14,85 21 311,85 4630,9725 68769,94163 1021233,633
8 17,05 5 85,25 1453,5125 24782,38813 422539,7175
сумма 240 2426,6 26796,66 314883,3215 3888107,883
10,1 111,65 1312,01 16200,45
Вычисляем центральные моменты 1,2,3,4 - го порядка:
i
1 1,65 4 -8,5 -33,84 286,34 -2422,70 20498,05
2 3,85 8 -6,3 -50,09 313,58 -1963,30 12291,89
3 6,05 27 -4,1 -109,64 445,24 -1808,05 7342,17
4 8,25 50 -1,9 -93,04 173,14 -322,18 599,51
5 10,45 75 0,3 25,44 8,63 2,93 0,99
6 12,65 50 2,5 126,96 322,37 818,55 2078,43
7 14,85 21 4,7 99,52 471,65 2235,25 10593,20
8 17,05 5 6,9 34,70 240,76 1670,67 11593,09
сумма 240 0,00 2261,71 -1788,82 64997,33
0,00 9,42 -7,45 270,82
Среднее: (тыс.руб.)
Дисперсия 9,42
Исправленная дисперсия .
Соответствующее среднее квадратическое отклонение: 3,08 .
Следовательно средние транспортные затраты составляют 10,1 тыс.руб., а среднее отклонение от ожидаемого среднего значения составляет 3,08 тыс.руб.
Вычислим коэффициент вариации исследуемого ряда:
Так как значение коэффициента вариации менее 33%, можно говорить о том, совокупность является однородной.
Значения коэффициентов асимметрии и эксцесса равны:
Так как коэффициент асимметрии отрицателен и , то распределение размера транспортных расходов обладает несущественной левосторонней асимметрией
. Эксцесс - показатель, характеризующий остроту вершины распределения. Если он положительный, то распределение называется островершинным. Это означает, что частота появления наибольшего значения признака существенно больше частот появления всех других значений признака. У нас значение коэффициента эксцесса положительное, что показывает, что полигон вариационного ряда имеет более крутую вершину по сравнению с нормальной кривой. Распределение в нашем случае считается островершинным.
Модой называется варианта, которой соответствует наибольшая частота.
Можно отметить, что транспортные затраты в выборке колеблются от 0,6 до 18,1 тыс.руб., при этом чаще всего встречаются значения от 9,35 до 11,55 тыс.руб. ( или ), что представляет собой модальный интервал исследуемого вариационного ряда.
Мода Мо интервального статистического распределения выборки :
Мо =
Здесь модальный интервал: 9,35–11,55, начало модального интервала = 9,35; длина интервала h = 2,2 ; частота модального интервала =75; частота домодального интервала =50; послемодального - =50; тогда
Мо = тыс.руб.
Медиана Ме интервального статистического распределения выборки определяется по формуле: , где х0 – начало медианного интервала , то есть интервала, в котором находится серединный элемент, k – длина медианного интервала, n – объем выборки, – сумма частот интервалов, которые предшествуют медианному, nі – частота медианного интервала.
Вычислим позицию медианы в ранжированном вариационном ряду:
.
Для интервального ряда далее следует определить медианный интервал – интервал, в котором впервые накопленная частота превышает позицию медианы