Пусть двумерная случайная величина X,Y – генеральная совокупность, где X – вес (в килограммах), а Y – рост (в сантиметрах) случайно взятого человека.
Для статистической обработки этих данных требуется:
Для величин X и Y составить группированные ряда. Построить полигоны, гистограммы относительных частот.
Вычислить точечные оценки: выборочные средние x и y; несмещенные выборочные средние квадратические отклонения sx и sy.
Проверить гипотезы о нормальном законе распределения случайных величин X и Y при уровне значимости α=0,05.
Найти доверительный интервал для MX,MY,DX,DY с надежностью γ=0,95.
Составить корреляционную таблицу. Вычислить выборочный коэффициент корреляции rв.
Найти выборочные уравнения прямых линий регрессии Y на X и X на Y. Построить графики этих прямых на одном рисунке с наблюдаемыми точками xi,yi, i=1,…,n.
Дана выборочная совокупность объема n=50, где величина xi – вес (в килограммах), а yi – рост (в сантиметрах) i-го человека. Произвести статистическую обработку этих данных согласно заданию.
xi
yi
xi
yi
xi
yi
xi
yi
xi
yi
78,9 174 50,4 158 68,2 171 70,4 168 60,6 164
80,5 180 63,4 158 66,4 164 68,4 162 67,8 163
60 159 64,4 162 49,3 152 74,1 174 80,5 179
66,1 165 60,8 156 64,4 155 74,5 170 57,7 161
78,2 173 70,8 167 63,8 159 45,7 143 71,5 175
83,9 183 59,9 153 63,4 165 49,2 150 68,4 167
71,5 170 56,9 159 61,3 164 70,2 163 75,2 170
58,6 160 58,5 159 72,8 174 74,5 172 76,5 170
72,1 170 69,1 167 51,9 150 70,1 164 66,3 167
50,6 152 66,2 164 74 174 63,6 161 60,3 161
Решение
Для величин X и Y составить группированные ряда. Построить полигоны, гистограммы относительных частот.
Составим группированный ряд для величины X. Для этого найдем наибольшее xmax=83,9 и наименьшее xmin=45,7 значения величины X, встречающиеся в выборке. Вычислим размах
Rx=xmax-xmin=83,9-45,7=38,2
Число интервалов
r=1+3,3lgn=1+3,3lg50≈6,6066=6
где [a] означает целую часть числа a.
Промежуток 45,7;83,9 изменения выборочных данных величина X разобьет на r=6 интервалов. Тогда шаг разбиения hx=Rxr=38,26≈6,367. Для удобства возьмем hx=6,4. Тогда расширение промежутка разбиения составит h∙r-R=6,4∙6-38,2=0,2.
Для определения границ интервалов ai-1, ai, i=1,…,6, сдвинем начало первого интервала в точку a0=xmin-0,22=45,7-0,1=45,6. Остальные границы вычисляются так: ai=ai-1+hx, i=1,…,6.
Для каждого i-го интервала ai-1, ai определим его середину xi* по формуле xi*=12ai-1+ai и найдем частоты ni – количество выборочных значений X, попавших в i-й интервал.
Результаты группировки выборочных значений для X сведем в таблицу
i
ai-1, ai
xi*
ni
nin
ninhx
1 [45,6, 52,0) 48,8 6 0,12 0,019
2 [52,0, 58,4) 55,2 2 0,04 0,006
3 [58,4, 64,8) 61,6 14 0,28 0,044
4 [64,8, 71,2) 68 13 0,26 0,041
5 [71,2, 77,6) 74,4 10 0,2 0,031
6 [77,6, 84,0] 80,8 5 0,1 0,016
Используя полученные результаты для xi* и nin (столбец 3-й и 5-й), строим полигон относительных частот
Используя столбец 2-й и 6-й, строим гистограмму относительных частот
Составим группированный ряд для величины Y. Для этого найдем наибольшее ymax=143 и наименьшее ymin=183 значения величины Y, встречающееся в выборке. Вычислим размах
Ry=ymax-ymin=183-143=40
Число интервалов
r=1+3,3lgn=1+3,3lg50=6
Промежуток 143;183 изменения выборочных данных величина Y разобьет на r=6 интервалов. Тогда шаг разбиения hy=Ryr=406≈6,667. Для удобства возьмем hy=7. Тогда расширение промежутка разбиения составит h∙r-R=7∙6-40=2.
Для определения границ интервалов bi-1, bi, i=1,…,6, сдвинем начало первого интервала в точку b0=ymin-22=143-1=142. Остальные границы вычисляются так: bi=bi-1+hy, i=1,…,6.
Для каждого i-го интервала bi-1, bi определим его середину yi* по формуле yi*=12bi-1+bi и найдем частоты ni – количество выборочных значений Y, попавших в i-й интервал.
Результаты группировки выборочных значений для Y сведем в таблицу:
i
bi-1, bi
yi*
mi
min
minhy
1 [142, 149) 145,5 1 0,02 0,003
2 [149, 156) 152,5 6 0,12 0,017
3 [156, 163) 159,5 13 0,26 0,037
4 [163, 170) 166,5 14 0,28 0,04
5 [170, 177) 173,5 13 0,26 0,037
6 [177, 184] 180,5 3 0,06 0,009
Используя полученные результаты для yi* и min (столбец 3-й и 5-й), строим полигон относительных частот
Используя столбец 2-й и 6-й, строим гистограмму относительных частот
Вычислить точечные оценки: выборочные средние x и y; несмещенные выборочные средние квадратические отклонения sx и sy.
Точечные оценки x, y, sx2,sy2 вычислим по группированным данным
. Для удобства вычисления перейдем к условным вариантам
cx=61,6 , cy=166,5 - середины наиболее часто встречающихся интервалов.
ui=xi*-cxhx , vi=yi*-cyhy
Составим таблицу
i
ui
ni
uini
ui2ni
vi
mi
vimi
vi2mi
1 -2 6 -12 24 -3 1 -3 9
2 -1 2 -2 2 -2 6 -12 24
3 0 14 0 0 -1 13 -13 13
4 1 13 13 13 0 14 0 0
5 2 10 20 40 1 13 13 13
6 3 5 15 45 2 3 6 12
Σ
- 50 34 124 - 50 -9 71
Вначале вычислим
u=1ni=16uini=150∙34=0,68
v=1ni=16vimi=150∙-9=-0,18
su2=nn-11ni=16ui2ni-u2=5050-1∙12450-0,682≈2,06
su=su2=2,06≈1,44
sv2=mm-11mi=16vi2mi-v2=5050-1∙7150--0,182≈1,42
sv=sv2=1,42≈1,19
Искомые оценки
x=u∙hx+cx=0,68∙6,4+61,6=65,952
sx2=hx2∙su2=6,42∙2,06≈84,38
sx≈9,19
y=v∙hy+cy=-0,18∙7+166,5=165,24
sy2=hy2∙sv2=72∙1,42=69,58
sy≈8,34
Проверить гипотезы о нормальном законе распределения случайных величин X и Y при уровне значимости α=0,05.
Проверим с помощью критерия χ2 гипотезу H0: распределение генеральной совокупности X имеет нормальный закон Nmx, σx.
Здесь k=2 неизвестные параметра mx и σx (математическое ожидание и среднее квадратическое отклонение) заменяются соответствующими оценками x=65,952 и sx=9,19.
Возьмем интервалы ai-1, ai, i=1,…,6, приняв a0=-∞, a6=+∞.
Результаты расчетов выборочной величины χв2 приведем в таблице
i
ai-1,ai
ni
zi=ai-xsx
Фzi
pi=Фzi-Фzi-1
npi
ni-npi2npi
1 (-∞, 52) 6 -1,52 -0,4357 0,0643 3,215 0,5156
2 [52, 58,4) 2 -0,82 -0,2939 0,1418 7,09
3 [58,4, 64,8) 14 -0,13 -0,0517 0,2422 12,11 0,2950
4 [64,8, 71,2) 13 0,57 0,2157 0,2674 13,37 0,0102
5 [71,2, 77,6) 10 1,27 0,398 0,1823 9,115 0,0859
6 [77,6, +∞) 5 +∞ 0,5 0,102 5,1 0,002
Σ - 50 - - 1 50 χв2=0,9087
Пришлось произвести объединение первых двух интервалов из-за малости теоретических частот (должно выполняться npi≥5)