Пошаговая регрессия
=608,02662+0,63617X1+249,35156 X2-262,50298X3+5,39506X4-40,59804X5 Проанализировав эту модель мы можем сделать выводы. Коэффициенты регрессии при переменной X1 показывает, что с ростом среднедневного душевого дохода на 1 ед. общий объем кредитования растет в среднем на 0,636 млн. руб., с ростом, при переменной X5 показывает, что с ростом среднегодовой процентной ставки по ипотечным кредитам на 1 % общий объем кредитования снижается в среднем на 40,598 млн. руб. Проанализируем качество постулируемой модели. Значимость уравнения множественной регрессии в целом оценим с помощью F -критерия Фишера. Задача состоит в проверке нулевой гипотезы Но о статистической не значимости уравнения регрессии в целом. Анализ выполняется при сравнении фактического и табличного значения F-критерия Фишера Fтабл и Fфакт. Сравнивая Fтабл и Fфакт. получим: Fфакт. = 22,65616; Fтабл (5,54)=2,39, следовательно Fфакт.> Fтабл . С вероятностью -α=0,95 приходим к выводу о необходимости отклонить гипотезу Но и делаем заключение о статистической значимости уравнения. Оценим уравнение регрессии о возможности использовать для прогноза. Для этого воспользуемся следующей формулой: Fфакт.>4Fтабл. В нашем уравнении: Fфакт =22,65616, а 4Fтабл=4·2,39=9,56, следовательно с вероятностью 1-α=0,95 приходим к выводу о значимости уравнения в целом и уравнение следует использовать для прогноза. Оценим модель по коэффициенту детерминации. Для оценки качества подбора функции рассчитывается коэффициент детерминации (R2). Величина коэффициента детерминации служит одним из критериев оценки качества модели. Он характеризует долю дисперсии результативного признака Y объясняемую регрессией в общей дисперсии результативного признака. В нашем случае R2 = 0, 67906710. Следовательно уравнением регрессии объясняется 68%, дисперсии результативного признака, а на долю прочих факторов приходится 32% ее дисперсии. Результаты диагностики: По результатам диагностики <2.1> мы можем сделать следующий вывод, что модель линейна по b; в ней нет лишних слагаемых и все регрессоры присутствуют. Результаты диагностики <3.1 >. По значениям коэффициентов парной корреляции мультиколлениарность обнаружена (коэффициенты rx1x2, rx1x3, rx1x4, rx1x5 значимо отличаются от нуля) Результаты диагностики <4.2>. Данное нарушение проверили по графикам остатков. Сделаем вывод о том, что условие не нарушено Результаты диагностики <4.4>. Данное нарушение проверили по графикам остатков. Явного нарушения условия нет. Результаты диагностики <4.5>. Для проверки данного условия независимости ошибок из-за неучёта фактора времени воспользуемся графиком остатков (d,T), где Т - время или номер наблюдения, а также статистику Дарбина - Уотсона. В нашем примере Авторегрессия положительна, т.к. D находится в интервале 0-2. Выводы для пошаговой регрессии. Во втором случае, когда используем пошаговую регрессию, регрессоры Х2, Х3, Х4 оказались не значимыми. Результат улучшения модели: =734,19553+0,75448 X1-39,75302X5 Проанализируем качество постулируемой модели. Значимость уравнения множественной регрессии в целом оценим с помощью F -критерия Фишера. Задача состоит в проверке нулевой гипотезы Но о статистической не значимости уравнения регрессии в целом. Анализ выполняется при сравнении фактического и табличного значения F-критерия Фишера Fтабл и Fфакт. Сравнивая Fтабл и Fфакт. получим: Fфакт. = 47,82385, a Fтабл (2,57)=3,16, следовательно Fфакт.> Fтабл С вероятностью 1-α=0,95 приходим к выводу о необходимости отклонить гипотезу Но и делаем заключение о статистической значимости уравнения. Оценим уравнение регрессии о возможности использовать для прогноза. Для этого воспользуемся следующей формулой: Fфакт.>4Fтабл. В нашем уравнении: Fфакт =47,82385, а 4Fтабл=4·3,16=12,64, следовательно с вероятностью 1-α=0,95 приходим к выводу о значимости уравнения в целом и уравнение следует использовать для прогноза. Оценим модель по коэффициенту детерминации. Для оценки качества подбора функции рассчитывается коэффициент детерминации (R2). Величина коэффициента детерминации служит одним из критериев оценки качества модели. Он характеризует долю дисперсии результативного признака Y объясняемую регрессией в общей дисперсии результативного признака. В нашем случае R2 =0,62659117. |