Логотип Автор24реферат
Задать вопрос
%
уникальность
не проверялась
Решение задач на тему:

Sales Aptitude Age Anxiety Exp. GPA

уникальность
не проверялась
Аа
6604 символов
Категория
Информатика
Решение задач
Sales Aptitude Age Anxiety Exp. GPA .pdf

Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥

Условие

Sales Aptitude Age Anxiety Exp. GPA 44 10 22,1 4,9 0 2,4 47 19 22,5 3 1 2,6 60 27 23,1 1,5 0 2,8 71 31 24 0,6 3 2,7 61 64 22,6 1,8 2 2 60 81 21,7 3,3 1 2,5 58 42 23,8 3,2 0 2,5 56 67 22 2,1 0 2,3 66 48 22,4 6 1 2,8 61 64 22,6 1,8 1 3,4 51 57 21,1 3,8 0 3 47 10 22,5 4,5 1 2,7 53 48 22,2 4,5 0 2,8 74 96 24,8 0,1 3 3,8 65 75 22,6 0,9 0 3,7 33 12 20,5 4,8 0 2,1 54 47 21,9 2,3 1 1,8 39 20 20,5 3 2 1,5 52 73 20,8 0,3 2 1,9 30 4 20 2,7 0 2,2 58 9 23,3 4,4 1 2,8 59 98 21,3 3,9 1 2,9 52 27 22,9 1,4 2 3,2 56 59 22,3 2,7 1 2,7 49 23 22,6 2,7 1 2,4 63 90 22,4 2,2 2 2,6 61 34 23,8 0,7 1 3,4 39 16 20,6 3,1 1 2,3 62 32 24,4 0,6 3 4 78 94 25 4,6 5 3,6 Пэм Вейганд (Pam Wiegand), менеджер отдела кадров компании Zurenko Pharmaceutical, заинтересована в получении обоснованного прогноза, сможет ли определенный кандидат стать хорошим продавцом. Для этой цели в качестве зависимой переменной (Sales) она выбрала данные об объеме продаж за первый месяц работы и решила принять к рассмотрению следующие независимые переменные. Aptitude — результат теста способностей к продаже Age — возраст Anxiety — результат теста тревожности Exp — опыт работы GPA — средний балл школьного аттестата Пэм собрала данные и поставила перед аналитиком задачу найти “наилучший” набор независимых переменных для составления прогноза способности кандидата стать хорошим продавцом. Выполните анализ данных с помощью модели множественных регрессий. Составьте прогнозную модель. Можно ли отбросить часть объясняющих переменных без ущерба для качества модели?

Нужно полное решение этой работы?

Решение

Потяни, чтобы посмотреть
Используем надстройку анализа данных Microsoft Excel «Регрессия».
Получаем следующие результаты:
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,946329
R-квадрат 0,895539
Нормированный R-квадрат 0,873776
Стандартная ошибка 3,96738
Наблюдения 30
Дисперсионный анализ
  df
SS MS F Значимость F
Регрессия 5 3238,537 647,7075 41,15014 5,26E-11
Остаток 24 377,7625 15,7401
Итого 29 3616,3      
  Коэфф-ты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение -90,6292 17,84109 -5,0798 3,4E-05 -127,451 -53,807
Aptitude
0,202915 0,028221 7,190144 1,98E-07 0,144669 0,26116
Age
6,154295 0,921462 6,67884 6,58E-07 4,252492 8,056099
Anxiety
0,112319 0,503071 0,223266 0,825218 -0,92597 1,150607
Exp. -0,0132 0,785811 -0,0168 0,986738 -1,63503 1,608635
GPA -0,58648 1,76209 -0,33283 0,742152 -4,22325 3,050298
Получили прогнозную модель:
Sales=-90.63+0.203Aptitude+6.15Age+0.112Anxiety-0.0132Exp-
-0.586GPA.
Значимость каждого фактора в отдельности по t-критерию можно оценить по столбцам t-стат и P-Значение. (Реально достигнутый уровень значимости - РДУЗ). Если в случае вышеприведенного критерия при некоторой выборке статистика приняла расчетное значение ρ, то реально достигнутый уровень значимости — это вероятность того, что при верной гипотезе H0 статистика ρ превысит данной расчетное значение:
РДУЗ=Pρ>ρH0 верна=1-F0(ρ) .
где F0y — функция распределения F0; таким образом, РДУЗ — это не что иное, как «вероятность хвоста» распределения статистики, на которой основан критерий, при верной нулевой гипотезе.
Проверяем совместную значимость всех факторов по F-критерию (нулевая гипотеза – все коэффициенты при факторах равны нулю) . Статистика Fнабл (F) равна 41.15, а соответствующий РДУЗ (Значимость F) близок к нулю, следовательно, нулевая гипотеза отвергается – полученное уравнение регрессии статистически значимо.
Квадрат эмпирического коэффициента корреляции называется коэффициентом детерминации. Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т.е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него фактора X.
Следовательно, около 89.95% вариаций зависимой переменной учтено в модели и обусловлено влиянием всех факторов. Таким образом, качество модели очень высокое.
Нулевая гипотеза при применении t-критерия Стьюдента заключается в равенстве нулю коэффициентов линейной регрессии ai. В данном примере видно, что РДУЗ напротив трёх факторов Aptitude и Age (константа на значимость традиционно не проверяется) «достаточно мал» (составляет менее одного из стандартных приемлемых уровней допустимой вероятности ошибки первого уровня — 0.1 и 0.05)
50% задачи недоступно для прочтения
Переходи в Кампус, регистрируйся и получай полное решение
Получить задачу
Больше решений задач по информатике:
Все Решенные задачи по информатике
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач