Задана двумерная выборка XY. Для выборок X и Y необходимо:
1) составитьинтервальный ряд распределения;
2) найти выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение;
3) найти эмпирическую функцию распределения и построить ее график;
4) построить гистограмму относительных частот;
5) проверитьгипотезу о нормальном распределении генеральной совокупности с помощью критерия Пирсона при уровне значимости 0,05;
6) построить график теоретической плотности вероятности;
7) найти доверительный интервал для оценки неизвестного математического ожидания генеральной совокупности с надежностью 0,95;
8) составитькорреляционную таблицу и впредположении олинейной зависимости междуХи Унайти выборочный коэффициент корреляции;
9) проверить гипотезу о значимости выборочного коэффициента корреляции при уровне значимости 0,05;
10) найти выборочные уравнения прямой линии регерессии У на Х и прямой линии регрессии Х на У и построить их графики на корреляционном поле.
Решение
Определяем объем выборки n=100.
Производим расчет выборки Х.
1. По значениям выборки Х составляем вариационный ряд (тал.1).
Таблица 1
xi
53 54 55 56 57 58 59 60 61 62 63 64 65
mi
2 2 1 7 1 4 3 3 9 6 8 5 10
xi
66 67 68 69 70 71 72 73 74 75 76 83 ∑
mi
6 6 7 4 3 3 3 2 1 2 1 1 100
Определяем минимальное и максимальное значение выборки Х:
xmin=53 и xmax=83
Длину интервала находим по формуле Стерджеса
hx=xmax-xmin1+3.332lgn=83-531+3.332∙lg100=301+3.332∙2=307.664=3.914≈4
За начало первого интервала примем значение
xнач=xmin-hx2=53-42=51
Составляем интервальный ряд распределения. Варианту, значение которой совпадает с нижней границей интервала, включаем в i-й интервала, а варианту, значение которой совпадает с верхней границей интервала, включаем в следующий (i+1)-й интервал. Данные заносим в расчетную таблицу (табл. 2)
Таблица 2
Начало интервала
xi
Конец интервала
xi+1
Середина интервала
xi
Частота интервала
mi
Относительная частота
wi=min
Плотность частоты
wihx
Накопленная частота
wiнак
51 55 53 4 0,04 0,01 0,04
55 59 57 13 0,13 0,0325 0,17
59 63 61 21 0,21 0,0525 0,38
63 67 65 29 0,29 0,0725 0,67
67 71 69 20 0,2 0,05 0,87
71 75 73 9 0,09 0,0225 0,96
75 79 77 3 0,03 0,0075 0,99
79 83 81 1 0,01 0,0025 1
2. Находим выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение для выборки Х.
xв=ximin=1100∙(53∙4+57∙13+61∙21+65∙29+69∙20+
+73∙9+77∙3+81∙1)=6468100=64,68
Dв=xi-xв2min=1100∙(53-64,682∙4+57-64,682∙13+
+61-64,682∙21+65-64,682∙29+69-64,682∙20+
+73-64,682∙9+77-64,682∙3+81-64,682∙1)=
=3317.76100=33,1776
σв=Dв=33,1776=5,76
3. Записываем эмпирическую функцию распределения (по значениям столбца «wiнак» табл.2).
F*x=0 x≤530,04 53<x≤570,17 57<x≤610,38 61<x≤650,67 65<x≤690,87 69<x≤730,96 73<x≤770,99 77<x≤811 x>81
Строим график эмпирической функции распределения (рис.1)
Рис.1
4. По интервальному ряду распределения (значения столбца «wihx» табл.2) строим гистограмму относительных частот для выборки Х рис.2.
Рис. 2
5. Проверяем гипотезу нормальном законе распределения случайной величины Х. Теоретические (выравнивающие) частоты находятся по формуле
miТ=npi=nФzi+1-Фzi
где Фzi - значение функции Лапласа
zi=xi-xвσв, zi+1=xi+1-xвσв
Составляем расчетную таблицу (табл.3)
Таблица 3
xi
xi+1
zi
zi+1
Фzi
Фzi+1
pi=Фzi+1-Фzi
miТ=npi
51 55
-1,6806 -0,5000 -0,4536 0,0464 4,64
55 59 -1,6806 -0,9861 -0,4536 -0,3380 0,1156 11,56
59 63 -0,9861 -0,2917 -0,3380 -0,1147 0,2232 22,32
63 67 -0,2917 0,4028 -0,1147 0,1564 0,2712 27,12
67 71 0,4028 1,0972 0,1564 0,3637 0,2073 20,73
71 75 1,0972 1,7917 0,3637 0,4634 0,0997 9,97
75 79 1,7917 2,4861 0,4634 0,4935 0,0301 3,01
79 83 2,4861
0,4935 0,5000 0,0065 0,65
∑=100
Получаем таблицу для эмпирических и теоретических частот (табл.4)
Таблица 4
mi
4 13 21 29 20 9 3 1
miТ
4,64 11,56 22,32 27,12 20,73 9,97 3,01 0,65
Проверяем гипотезу о нормальном распределении выборки Х с помощью критерия Пирсона.
Объединяем малочисленные эмпирические (mi<5) и соответствующие им теоретические частоты (табл.5).
Таблица 5
mi
17 21 29 20 13 17
miТ
16,2 22,32 27,12 20,73 13,63 16,2
Вычисляем наблюдаемое значение критерия Пирсона
χнабл2=mi-miТ2miТ=17-16,2216,2+21-22,32222,32+29-27,12227,12+
+20-20,73220,73+13-13,63213,63+17-16,2216,2=0,3027
По таблице критических точек распределения χ2 по заданному уровню значимости α=0,05 и числу степеней свободы k=s-3 (s - число интервалов оставшихся после объединения малочисленных частот) находим критическую точку правосторонней критической области.
χкр20,05;3=7,8
Так как χнабл2<χкр2, то гипотеза о нормальном распределении исследуемой случайной величины принимаем.
6
. Теоретическая плотность нормального распределения определяется формулой
fx=1σx2π e-(x-ax)22σx2, где ax=xв, σx=σв
Таким образом, теоретическая плотность случайной величины Х запишется в виде:
fx=15,762π e-(x-64,68)266,4
Для построения графика плотности распределения составим расчетную таблицу (табл.6).
Таблица 6
x
ax-3σx
ax-2σx
ax-σx
ax
ax+σx
ax+2σx
ax+3σx
f(x)
0,0008 0,0094 0,0420 0,0693 0,0420 0,0094 0,0008
График теоретической плотности строим на одном рисунке с гистограммой (рис.2)
7. Для оценки неизвестного математического ожидания при неизвестном среднем квадратическом отклонении генеральной совокупности служит интервал
xв-tγ∙σвn<ax<xв+tγ∙σвn
где tγ=tγ;n - критическая точка распределения Стьюдента. По условию γ=0,95, n=100. Отсюда tγ=t0,95;100=1,984
Находим искомый интервал
64,68-1,984∙5,76100<ax<64,68+1,984∙5,76100
64,68-11,427810<ax<64,68+11,427810
64,68-1,1428<ax<64,68+1,1428
63,5372<ax<65,8228
Производим расчет выборки Y.
1. По значениям выборки Х составляем вариационный ряд (тал.1).
Таблица 1
yi
67 68 69 70 71 72 73 74 75
mi
1 1 5 6 5 10 10 8 8
yi
76 77 78 79 80 81 82 83 87 ∑
mi
10 10 8 6 3 3 4 1 1 100
Определяем минимальное и максимальное значение выборки Y:
ymin=67 и ymax=87
Длину интервала находим по формуле Стерджеса
hy=ymax-ymin1+3.332lgn=87-671+3.332∙lg100=201+3.332∙2=207.664≈3
За начало первого интервала примем значение
yнач=ymin-hy2=67-32=65.5
Составляем интервальный ряд распределения. Варианту, значение которой совпадает с нижней границей интервала, включаем в i-й интервала, а варианту, значение которой совпадает с верхней границей интервала, включаем в следующий (i+1)-й интервал. Данные заносим в расчетную таблицу (табл. 8)
Таблица 8
Начало интервала
yi
Конец интервала
yi+1
Середина интервала
yi
Частота интервала
mi
Относительная частота
wi=min
Плотность частоты
wihy
Накопленная частота
wiнак
65,5 68,5 67 2 0,02 0,007 0,02
68,5 70,5 69,5 11 0,11 0,037 0,13
70,5 72,5 71,5 15 0,15 0,050 0,28
72,5 74,5 73,5 18 0,18 0,060 0,46
74,5 76,5 75,5 18 0,18 0,060 0,64
76,5 78,5 77,5 18 0,18 0,060 0,82
78,5 80,5 79,5 9 0,09 0,030 0,91
80,5 82,5 81,5 7 0,07 0,023 0,98
82,5 84,5 83,5 1 0,01 0,003 0,99
84,5 87 85,75 1 0,01 0,003 1
2