На территории Калужской области было замечено увеличение задолженности по коммунальным услугам. В связи, с чем было принято решение о проведении рейдов и разъяснительной работы среди граждан. Было намечено определенное количество мероприятий в течении кварталов – X. В результате чего произошло уменьшение количества неплательщиков в этот же период от своего среднего значения – также случайная величина Y.
По таблицам данных требуется проанализировать: является ли распределение этих случайных величин нормальным и найти уравнение регрессии - числа уменьшения количества неплательщиков на территории Калужской области. По уравнению регрессии сделать прогноз уменьшения нарушений, если число мероприятий будет равно 20.
№ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
xi
6 2 5 7 4 1 8 1 2 6 1 9 6 3 6
yi
3 7 4 2 5 7 7 8 5 6 4 7 5 9 1
где xi – число мероприятий, yi – величина, на которую уменьшилось число неплательщиков.
Необходимо:
По заданным в условии выборкам построить вариационный ряд.
Найти среднее выборочное, выборочную дисперсию, исправленную дисперсию, с.к.о. и исправленное с.к.о. выборок Х и Y по формулам:
(1)
где -число вариант вариационного ряда.
Найти доверительный интервал для математического ожидания а с доверительной вероятностью по формуле:
(2)
где постоянная находится по таблицам распределения Стьюдента.
Построить гистограммы случайных величин Х и Y, разделив размах выборки на 5 равных интервалов. По найденным средней выборочной и исправленной с.к.о. на гистограмме изобразить график функции плотности нормального распределения.
(3)
С помощью критерия Пирсона проверить гипотезу о нормальности распределения случайной величины Х и Y.
Найти выборочный коэффициент корреляции между случайными величинами Х и Y по формулам:
(4)
И проверить гипотезу о его значимости, используя распределение критических точек Стьюдента для уровня значимости .
(5)
На плоскости ХOY отметить точки (,) i=1,2,3,..,15.
Считая, что случайная величина линейно зависит от случайной величины Х как
(6)
Дать прогноз числа продукции в сопоставимых ценах, если число заводов равно 22.
1.2
Решение
2.1 Доверительный интервал
Построение вариационного ряда.
1). Строим вариационный ряд для случайной величины Х.
Таблица 1. kx=9
xi
1 2 3 4 5 6 7 8 9
ni
3 2 1 1 1 4 1 1 1
2). Строим вариационный ряд для случайной величины Y.
Таблица 2. ky=9
yi
1 2 3 4 5 6 7 8 9
ni
1 1 1 2 3 1 4 1 1
Находим среднее выборочное, выборочную дисперсию и исправленную дисперсию. Объем выборки: n=15.
1) По формулам (1) и вариационному ряду таблицы 1 находим среднее выборочное, выборочную дисперсию и исправленную дисперсию выборки X.
x=1151∙3+2∙2+3∙1+4∙1+5∙1+6∙4+7∙1+8∙1+9∙1=6715=4,47
Dxv=39915=26,6; σx=26,6=5,16; Sx=1514∙26,6=28,5; sx=28,5=5,34.
2) Объем выборки: n=15. По формулам (1) и вариационному ряду таблицы 2 находим среднее выборочное, выборочную дисперсию и исправленную дисперсию выборки Y.
y=1151∙1+2∙1+3∙1+4∙2+5∙3+6∙1+7∙4+8∙1+9∙1=8015=5,33
Dyv=49815=33,2; σy=33,2=5,76; Sy=1514∙33,2=35,57; sy=35,57=5,96.
Нахождение доверительного интервала для математического ожидания с доверительной вероятностью при n=15. По таблице распределения Стьюдента находим .
1). Найдём нижнюю и верхнююграницы интервала математического ожидания случайной величины Х:
α=x-tγ,nsxn=4,47-2,15∙5,3415=1,51
β=x+tγ,nsxn=4,47-2,15∙5,3415=7,43
Откуда находим, что доверительный интервал для математического ожидания случайной величины Х с доверительной вероятностью имеет вид ax1,51;7,43.
2). Найдём нижнюю и верхнююграницы интервала математического ожидания случайной величины Y:
α=y-tγ,nsyn=5,33-2,15∙5,9615=2,02
β=y+tγ,nsyn=5,33-2,15∙5,9615=8,64
Откуда находим, что доверительный интервал для математического ожидания случайной величины Y с доверительной вероятностью имеет вид ay2,02;8,64.
1.2.2 Построение гистограмм
1). Построим гистограмму для случайной величины Х.
a). Находим размах выборки H=xmax-xmin=9-1=8
b). Находим длину интервала h=H5=85=1,6
c). Строим интервальный ряд плотностей относительных частот, группируя варианты по интервалам.
Таблица 3.
[1; 2,6) [2,6; 4,2) [4,2; 5,8) [5,8; 7,4) [7,4; 9)
0,208 0,083 0,042 0,208 0,083
d)
. По интервальному ряду таблицы 3 строим гистограмму относительный частот. (Площадь каждого прямоугольника равна относительной частоте . Полная площадь под графиком равна единице.)
Рис. 1.
На построенную гистограмму накладываем график функции плотности нормального распределения с полученными значениями: в качестве математического ожидания возьмём среднее выборочное αX=x=4,47, а С.К.О=sx=5,34.
Так как αX=x=4,47, то максимальное значение, равное 0,042 будет достигаться в точке 4,47. Так как С.К.О=sx=5,34, то в точках a-sx=4,47-5,34=-0,87 и a+sx=4,47+5,34=9,81 значения функции достигает 60% от максимума, то есть 0,042∙0,6=0,0252 и в этих точках возникает перегиб функции.
Из вида гистограммы на рис 1 и наложенной на неё соответствующей функции плотности нормального распределения делаем вывод, что для предположения о нормальности распределения случайной величины Х необходимо иметь большее число данных наблюдения.
2). Построим гистограмму для случайной величины Y.
a). Находим размах выборки H=ymax-ymin=9-1=8
b). Находим длину интервала h=H5=85=1,6
c). Строим интервальный ряд плотностей относительных частот, группируя варианты по интервалам.
Таблица 4.
[1; 2,6) [2,6; 4,2) [4,2; 5,8) [5,8; 7,4) [7,4; 9)
0,083 0,125 0,125 0,208 0,083
d). По интервальному ряду таблицы 3 строим гистограмму относительный частот. (Площадь каждого прямоугольника равна относительной частоте . Полная площадь под графиком равна единице.)
Рис2
На построенную гистограмму накладываем график функции плотности нормального распределения с полученными значениями: в качестве математического ожидания возьмём среднее выборочное αY=y=5,33, а С.К.О=sy=5,96.
Так как αX=x=5,33, то максимальное значение, равное 0,125 будет достигаться в точке 5,33. Так как С.К.О=sx=5,96, то в точках a-sx=5,33-5,96=-0,63 и a+sx=5,33+5,96=11,29 значения функции достигает 60% от максимума, то есть 0,125∙0,6=0,075 и в этих точках возникает перегиб функции.
Из вида гистограммы на рис 2 и наложенной на неё соответствующей функции плотности нормального распределения делаем вывод, что для предположения о нормальности распределения случайной величины Y необходимо иметь большее число данных наблюдения