Исследователь пытается выявить взаимосвязь между количеством времени X
.pdf
Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥
Исследователь пытается выявить взаимосвязь между количеством времени X, бесполезно потраченного студентами, и средним баллом Y их академической успеваемости, который варьируется в пределах от 2,0 до 5,0. Под потраченным без пользы временем понимается количество часов определенного соответствующего времяпровождения в неделю (например, занятого просмотром «мыльных» телесериалов). Требуется построить линейную регрессионную зависимость среднего балла успеваемости от показателя бесполезно потраченного времени, а также выполнить прогноз успеваемости для значений X, равных 20, 30 и 40 часов. В ответе к задаче приведите: а) скорректированный процент объясняемой моделью дисперсии отклика, б) оценку уровня значимости регрессии по F-критерию, в) нестандартизованные коэффициенты регрессионного уравнения и оценки их значимости по t-критерию, г) номер наблюдения, имеющего наибольший по модулю остаток, д) прогнозируемые значения отклика. Сделать содержательный вывод.
Нужно полное решение этой работы?
Решение
Вносим данные в таблицу SPSS
Описание переменных
Изучаем зависимость переменной Y от переменной Х, уравнение этой зависимости пытаемся найти в виде Y=b0+b1∙X.
Проверяемая гипотеза: Средний балл успеваемости Y связан с количеством часов впустую потраченного времени X уравнением Y=b0+b1∙X, причем с увеличением X значение Y снижается (то есть коэффициент b1 отрицателен).
Выполняем АНАЛИЗ РЕГРЕССИЯ ЛИНЕЙНАЯ
Зависимая переменная Y – Средний балл успеваемости
Независимая переменная X – Количество часов пустого времени
По кнопке Статистики выбираем (так как в задании в пунктах г) и д) требуется проанализировать остатки и вывести прогнозируемые значения отклика)
РЕЗУЛЬТАТЫ
1. Коэффициенты уравнения зависимости Y=b0+b1∙X отклика Y от переменной Х выведены в таблице Коэффициенты в столбце “Нестандартизованные коэффициенты”
b0=5,521
b1=-0,060
Получаем уравнение Y=5,521-0,060∙X
Коэффициент b1=-0,060 при переменной X (количество часов потраченного без пользу времени) означает, что каждый час, потраченный студентом впустую, уменьшает средний академический балл Y на 0,060.
Проверка значимости коэффициентов (то есть проверка нулевой гипотезы о незначимом отличии коэффициентов от нуля при альтернативной гипотезе о значимом отличии коэффициентов от нуля) проводится t-критерием
. Величина t-критерия выведена в столбце “т”, а в столбце “Значимость” – вероятность выполнения нулевой гипотезы.
Так как “значимость” для обоих коэффициентов < 0,05, следовательно нужно принять альтернативную гипотезу и сделать вывод: коэффициенты уравнения b0 и b1 значимо отличны от нуля.
2. Качество найденного уравнения оцениваем по коэффициентам R-квадрат и Скорректированный R-квадрат – они показывают, сколько процентов разброса (дисперсии) зависимой переменной Y (средний академический балл) объясняется моделью. R2=79,5%, Rскорр2=76,6%:
3. Проверка значимости уравнения регрессии (то есть проверка нулевой гипотезы о незначимом отличии R-квадрат от нуля при альтернативной гипотезе о значимом отличии R-квадрат от нуля) проводится F-критерием.
В таблице ANOVA выведена величина F-критерия в столбце “F”, а в столбце “Значимость” – вероятность выполнения нулевой гипотезы.
Так как “значимость” < 0,05, следовательно нужно принять альтернативную гипотезу и сделать вывод: коэффициент R-квадрат значимо отличен от нуля, уравнение регрессии значимо.
Таким образом, в результате анализа в пунктах 1-3 подтверждается гипотеза:
средний балл успеваемости Y связан с количеством часов впустую потраченного времени X уравнением Y=5,521-0,060∙X;
уравнение регрессии значимо;
с увеличением X значение Y снижается на 0,060;
76,6% вариации среднего балла успеваемости Y объясняется фактором X – количеством часов впустую потраченного времени.
4