С целью изучения размера потребительских кредитов, выданных банком в одном из крупных магазинов электронной техники в течении последнего месяца по схеме собственно-случайной бесповторной выборки было отобрано 180 кредитов из 2500 выданных. Величины сумм выданных кредитов (тыс. руб.) представлены в таблице:
22,9 26,6 18,0 25,2 28,9 30,3 21,1 13,5 15,7 22,2
18,6 28,8 11,5 26,7 31,6 14,1 26,7 22,2 19,9 23,4
16,0 17,9 17,0 20,3 10,5 26,8 13,9 18,1 19,6 12,7
20,7 17,8 19,5 24,4 21,8 23,3 18,6 24,1 19,6 20,8
15,8 14,0 20,5 18,2 17,8 20,7 21,9 28,0 17,5 11,2
12,2 24,7 14,9 19,3 23,6 22,3 20,1 19,1 21,9 25,2
22,2 18,0 16,3 18,3 18,6 13,5 28,0 15,2 22,1 24,7
20,1 14,0 17,3 17,6 18,9 22,4 20,9 15,1 11,9 21,8
23,4 18,2 21,0 22,7 23,2 19,9 26,1 21,3 21,2 16,1
27,6 17,5 18,1 13,0 23,9 11,2 22,5 19,5 19,2 24,2
29,7 22,7 12,7 26,4 16,8 14,7 21,3 18,5 22,3 15,3
14,0 23,1 25,8 27,9 17,5 24,9 25,6 32,4 17,9 19,7
11,9 17,6 15,0 19,0 22,1 14,0 27,5 18,6 19,5 25,5
19,5 25,3 27,9 24,9 15,5 13,8 24,2 23,8 25,8 18,9
8,3 24,6 18,7 24,2 16,3 18,9 22,4 15,6 25,6 16,6
19,6 20,0 20,2 9,9 22,0 19,2 14,5 12,6 13,0 20,1
22,7 20,7 20,2 12,9 21,1 19,0 20,2 28,0 20,2 21,8
14,8 17,3 17,4 14,1 13,8 19,2 17,0 22,0 17,1 17,2
Составить интервальный вариационный ряд. Записать эмпирическую функцию распределения и построить ее график. На одном чертеже изобразить гистограмму и полигон частот.
По сгруппированным данным вычислить выборочные числовые характеристики: среднее арифметическое, исправленную выборочную дисперсию, среднее квадратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду и медиану.
Заменив параметры генеральной совокупности соответственно их наилучшими выборочными числовыми характеристиками и используя 2 - критерий Пирсона, на уровне значимости =0,05 проверить две гипотезы о том, что изучаемая случайная величина ξ – величина выданных кредитов – распределена:
а) по нормальному закону распределения;
б) по равномерному закону распределения.
Построить на чертеже, на котором изображена гистограмма эмпирического распределения и соответствующие графики равномерного и нормального распределений.
Нужно полное решение этой работы?
Решение
Составим интервальный вариационный ряд.
Для построения вариационного ряда необходимо произвести ранжирование исходных данных – упорядочивание их в порядке возрастания. Такая операция позволяет нам определить наименьшее xmin и наибольшее xmax значения среди представленных данных, а также произвести их группировку. В нашем случае наименьшее и наибольшее значения оказались равными xmin 8,3 и xmax 32,4. Для разбиения представленных данных на отдельные группы или интервалы найдем число интервалов, которое определим по формуле Стерджеса
m = 1 +[3,322*lgn] = 1 + [3,322*lg180] = 8,
где квадратные скобки x обозначают целую часть числа.
Длину интервалов разбиения возьмем одинаковую и определим по формуле:
Левая граница первого интервала будет равна , а его конец a1 a0 h 8,3+3=11,3. Начало второго интервала будет совпадать с концом первого, а его конец a2 11,3 3 14,3. И так далее находим границы всех 8 интервалов. Очевидно, что a8 32,4.
Далее, для каждого интервала определяется его срединное значение, как среднее арифметическое его концов.
Определив границы интервалов, можно найти для каждого интервала число данных, принадлежащих ему.
Подсчитав их количество, приходим к следующему вариационному ряду
Интервалы Середина интервала, xi Частоты, fi Накопленная частота, S Относительная частота, fi/f Накопленная относительная частота
8,3 - 11,3 9,8 5 5 0,027777778 0,027778
11,3 - 14,3 12,8 21 26 0,116666667 0,144444
14,3 - 17,3 15,8 22 48 0,122222222 0,266667
17,3 - 20,3 18,8 53 101 0,294444444 0,561111
20,3 - 23,3 21,8 36 137 0,2 0,761111
23,3 - 26,3 24,8 25 162 0,138888889 0,9
26,3 - 29,3 27,8 14 176 0,077777778 0,977778
29,3 - 32,4 30,85 4 180 0,022222222 1
Итого
180 1
В данной таблице кроме частот отображены накопленные частоты, определяемые как сумма частот вариант, не превышающих данного варианта. Для первого интервала накопленная частота совпадает просто с частотой. Для каждого последующего интервала накопленная частота равна сумме текущей частоты и накопленной частоты предыдущего интервала. Аналогично и с относительными частотами
Эмпирическая функция распределения F(X) определяется по последнему столбцу.
F(x≤9.8) = 0
F(9.8< x ≤12.8) = 0.0278
F(12.8< x ≤15.8) = 0.117 + 0.0278 = 0.144
F(15.8< x ≤18.8) = 0.122 + 0.144 = 0.267
F(18.8< x ≤21.8) = 0.294 + 0.267 = 0.561
F(21.8< x ≤24.8) = 0.2 + 0.561 = 0.761
F(24.8< x ≤27.8) = 0.139 + 0.761 = 0.9
F(27.8< x ≤30.85) = 0.0778 + 0.9 = 0.978
F(x>30.85) = 1
Рис. 3 Эмпирическая функция распределения
Для графического изображения полученного интервального вариационного ряда построим гистограмму. На каждом интервале построим столбик, высота которого равна частоте попадания в этот интервал (рис. 4). Чтобы получить полигон того же распределения, соединим середины верхних оснований прямоугольников отрезками прямых (рис. 4).
Рис. 4 Гистограмма и полигон
По сгруппированным данным вычислим выборочные числовые характеристики: среднее арифметическое, исправленную выборочную дисперсию, среднее квадратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду и медиану.
Таблица для расчета
Интервалы Середина интервала, xi Частоты, fi xi·fi
(x-)2·fi (x-xср)3·fi (x-xср)4·fi
8,3 - 11,3 9,8 5 49 508,48 -5127.7 51710.4
11,3 - 14,3 12,8 21 268,8 1053,976 -7466.8 52898.4
14,3 - 17,3 15,8 22 347,6 367,019 -1499.1 6122.9
17,3 - 20,3 18,8 53 996,4 62,329 -67.6 73.3
20,3 - 23,3 21,8 36 784,8 132,097 253 484.7
23,3 - 26,3 24,8 25 620 604,067 2969.3 14595.9
26,3 - 29,3 27,8 14 389,2 877,184 6943.4 54960.9
29,3 - 32,4 30,85 4 123,4 480,974 5274.1 57833.9
Итого
180 3579,2 4086,126 1278.7 238680.3
Для оценки ряда распределения найдем следующие показатели:
среднее арифметическое
x=xifif=3579,2180 = 19,884
Дисперсия
EQ D = \f(∑(xi - \x\to(x))2 fi;∑fi) = \f(4086.126;180) = 22.701
Несмещенная оценка дисперсии (исправленная дисперсия).
EQ S2 = \f(∑(xi - \x\to(x))2 fi;∑fi-1) = EQ \f(4086.126;179) = 22.828
Среднее квадратическое отклонение
.
EQ σ = \r(D) = \r(22.701) = 4.765
Коэффициент вариации
EQ v = \f(σ;\x\to(x)) = \f(4.765;19.9)100% = 23.96%
Асимметрия.
As = M3/σ3
где M3 - центральный момент третьего порядка.
σ - среднеквадратическое отклонение.
M3 = 1278.67/180 = 7.1
EQ As = \f(7.1;4.7653) = 0.0657
Эксцесс оценивается с помощью показателя:
EQ Ex = \f(M4;s4) - 3
M4/σ4 = 3.
M4 = 238680.34/180 = 1326
EQ Ex = \f(1326;4.7654) - 3 = 2.5732 - 3 = -0.43
Мода.
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
EQ Mo = x0 + h \f(f2 - f1; (f2 - f1) + (f2 - f3))
где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.
Выбираем в качестве начала интервала 17.3, так как именно на этот интервал приходится наибольшее количество.
EQ Mo = 17.3 + 3 \f( 53 - 22; (53 - 22) + (53 - 36)) = 19.2
Наиболее часто встречающееся значение ряда – 19.2
Медиана.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 17.3 - 20.3, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
EQ Me = x0 + \f(h;fme) \b( \f( ∑fi;2) - Sme-1 )
EQ Me = 17.3 + \f(3;53) \b( \f( 180;2) - 48 ) = 19.7
Таким образом, 50% единиц совокупности будут меньше по величине 19.7.
Заменив параметры генеральной совокупности соответственно их наилучшими выборочными числовыми характеристиками и используя 2 - критерий Пирсона, на уровне значимости =0,05 проверим две гипотезы о том, что изучаемая случайная величина ξ – величина выданных кредитов – распределена:
а) по нормальному закону распределения;
б) по равномерному закону распределения.
Проверка гипотез о виде распределения.
Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона