Реферат: Cols=3 gutter=308> множественная


4.множественнаярегрессия

e,

(4.3)




че а е
Линейная модель множественной регрессии имеет вид:

щх

п

a2xi2

(4.1)

я.

amxim

Коэффициент регрессии ау- показывает, на какую величину в среднем изменится результативный признак ^ Y, если перемен­ную Xj увеличить на единицу измерения, т.е. с^- является нормативным коэффициентом. Обычно предполагается, что случайная величина е,- имеет нормальный закон распределения с математическим ожиданием, равным нулю, и с дисперсией а2»

Анализ уравнения (4.1) и методика определения параметров становятся более наглядными, а расчетные процедуры существен­но упрощаются, если воспользоваться матричной формой записи уравнения (4.2):

fe, (4.2).

где Г

^ X

вектор зависимой переменной размерности п х 1, представляющий собой п наблюдений значений у,-; матрица п наблюдений независимых переменных X], Х2, Х3, ..., Хт, размерность матрицы X равна пх (т + 1);

а —

подлежащий оцениванию вектор неизвестных • параметров размерности (т + 1) х 1;

вектор случайных отклонений (возмущений) размер­ности п х 1.

a0

У2

Уп,

Таким образом,



1

хп .

- Х\т

1

х21 .

.. х2т

1

Хп\ '

*• хпт

Уравнение (4.1) содержит значения неизвестных параметров a0, aha2, ..., ат. Эти величины оцениваются на основе выбороч­ных наблюдений, поэтому полученные расчетные показатели не являются истинными, а представляют собой лишь их статисти­ческие оценки. Модель линейной регрессии, в которой вместо истинных значений параметров подставлены их оценки (а имен­но такие регрессии и применяются на практике), имеет вид

■ вектор оценок параметров;

- вектор «оцененных» отклонений регрессии, остатки регрессии e—Y-Xa\

^ Y — оценка значений Y, равная Ха.

Оценка параметров модели множественной регрессии с помощью метода наименьших квадратов

Формулу для вычисления параметров регрессионного уравне­ния приведем без вывода: \. ■ ■ '-. .•

а - (XTXflXTY, (4.4)

Одним из условий регрессионной модели является предпо­
ложение о линейной независимости объясняющих переменных,
т.е. решение задачи возможно лишь тогда, когда столбцы и строки
матрицы исходных данных линейно независимы. Для экономи­
ческих показателей это условие выполняется не всегда. Линей­
ная или близкая к ней связь между факторами, называется
мультиколлинеарностью и приводит к линейной зависимости
нормальных уравнений, что делает-вычисление параметров либо
невозможным, либо затрудняет содержательную интерпретацию
параметров модели. Мультиколлинеарность может возникать, в
силу разных причин. Например, несколько независимых пере­
менных могут иметь общий временной тренд, относительно ко­
торого они совершают малые колебания..В частности,,так может
случиться, когда значения одной независимой переменной яв­
ляются лагированными значениями другой.. Считают явление
мультиколлинеарности в исходных данных установленным, если
коэффициент парной- корреляции между двумя переменными
больше 0,8.. Чтобы избавиться от мультиколлинеарности, в мо­
дель включают лишь один из линейно связанных между собой
факторов, причем тот, который в больше^ степени связан с зави­
симой, переменной.. '■ . .

' В качестве критерия мультиколлинеарности может быть при­
нято соблюдение следующих неравенств: . , . • ; .

rxixk < 058,

г У г

'yxi

rxixk>

1yxk ' xixfa

Если приведенные неравенства (или хотя бы одно из них) не выполняются, то в модель включают тот фактор, который наибо­лее тесно связан с Y.


50

4*-1924

51

Оценка качества модели регрессии

Качество модели регрессии оценивается по следующим на­правлениям:

проверка качества всего уравнения регрессии;

проверка значимости всего уравнения регрессии;

проверка статистической значимости коэффициентов уравне­
ния регрессии;

проверка выполнения предпосылок МНК.

Проверка качества всего уравнения регрессии

Для оценки качества модели множественной регрессии вычис­ляют коэффициент множественной корреляции {индекс корреля­ции) R и коэффициент детерминации R2 (см. формулы (3.12) и (3.13)). Чем ближе к 1 значение этих характеристик, тем выше качество модели.

В многофакторной регрессии добавление дополнительных объ­ясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скор­ректирован с учетом числа независимых переменных. Скоррек­тированный R2, или R2, рассчитывается так:

R

(4.5)

n-k-V где п — число наблюдений;

к — число независимых переменных.

Проверка значимости модели регрессии

Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый по формуле

(4.6)

(l-R2)/(n-k-lY

Если расчетное значение с v,=£ и v2 = (n-к- 1) степенями свободы, где к — количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.

Анализ статистической значимости параметров модели

Значимость отдельных коэффициентов регрессии проверяется по /-статистике путем проверки гипотезы о равенстве нулю /-го параметра уравнения (кроме свободного члена):

52

taJ=aj/SaJ, (4.7)

|.де SaJ — стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии а у

Величина SaJ представляет собой квадратный корень из произве­дения несмещенной оценки дисперсии S2 и/-го диагонального эле­мента матрицы, обратной матрице системы нормальных уравнений:

# (4.8)

где bjj — диагональный элемент матрицы (ХТХ)~1.

Если расчетное значение /-критерия с (п - к - 1) степенями свободы превосходит его табличное значение при заданном уров­не значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффи­циенту, следует исключить из модели, при этом оставшиеся в мо­дели параметры должны быть пересчитаны.

Проверка выполнения предпосылок МНК

Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты.

Анализ остатков позволяет получить представление, насколь­ко хорошо подобрана сама модель и насколько правильно вы­бран метод оценки коэффициентов. Согласно общим предполо­жениям регрессионного анализа остатки должны вести себя как независимые (в действительности почти независимые) одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения остатков.

Исследование остатков полезно начинать с изучения их гра­фика. Он может показать наличие какой-то зависимости, не учтенной в модели. Скажем, при подборе простой линейной зависимости между Y и X график остатков может показать не­обходимость перехода к нелинейной модели (квадратичной, полиномиальной, экспоненциальной) или включения в модель периодических компонент.

График остатков хорошо показывает и резко отклоняющиеся от модели наблюдения — выбросы. Подобным аномальным на­блюдениям надо уделять особо пристальное внимание, так как их присутствие может грубо искажать значения оценок. Устранение эффектов выбросов может проводиться либо с помощью удаления этих точек из анализируемых данных (эта процедура называется

53



цензурированием), либо с помощью применения методов оцени­вания параметров, устойчивых к подобным грубым отклонениям.

Независимость остатков проверяется с помощью критерия Дарбина—Уотсона.

Корреляционная зависимость между текущими уровнями не­которой переменной и уровнями этой же переменной, сдвину­тыми на несколько шагов, называется автокорреляцией.

Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.

Наличие (отсутствие) автокорреляции в отклонениях проверя­ют с помощью критерия Дарбина—Уотсона. Численное значение коэффициента равно

dw

(4.9)

где

у,- - yi

Значение dw статистики близко к величине 2(1 - г(1)), где — выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики Дарбина—Уотсона распределено в интервале 0—4. Соответственно идеальное значе­ние статистики — 2 (автокорреляция отсутствует). Меньшие зна­чения критерия соответствуют положительной автокорреляции остатков, большие значения — отрицательной. Статистика учи­тывает только автокорреляцию первого порядка. Оценки, полу­чаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (rf5) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа неза­висимых переменных модели. Значения этих границ для уровня значимости а - 0,05 даны в специальных таблицах (см. Прило­жение 2). При сравнении расчетного значения dw статистики с табличным могут возникнуть такие ситуации: d2 < dw < 2 — ряд остатков не коррелирован; dw < d] — остатки содержат автокорреляцию; dx < dw < d2 — область неопределенности, когда кет оснований ни принять, ни отвергнуть гипотезу о существова­нии автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с таб­личными значениями dw критерий следует преобразовать по формуле dw' = 4 - dw.

Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (dl < dw< d2), то применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции



(4.10)

Для принятия решения о наличЛ* или отсутствии автокорре­ляции в исследуемом ряду фактическое значение коэффициента автокорреляции г(1) сопоставляется с табличным (критическим) значением для 5%-ного уровня значимости (вероятности до­пустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если фактическое значение коэффициента авто­корреляции меньше табличного, то гипотеза об отсутствии ав­токорреляции в ряду может быть принята, а если фактическое значение больше табличного — делают вывод о наличии автокор­реляции в ряду динамики.

Обнаружение гетероскедастичности. Для обнаружения гетеро-скедастичности обычно используют три теста, в которых делают­ся различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест Голдфельда—Квандта и тест Глейзера.

При малом объеме выборки для оценки гетероскедастичности может использоваться метод Голдфельда—Квандта.

Данный тест используется для проверки такого типа гетеро­скедастичности, когда дисперсия остатков возрастает пропорци­онально квадрату фактора. При этом делается предположение, что случайная составляющая распределена нормально.

Чтобы оценить нарушение гомоскедастичности по тесту Голд­фельда—Квандта, необходимо выполнить следующие шаги.

Упорядочение п наблюдений по мере возрастания перемен­
ной х,

Разделение совокупности на две группы (соответственно с
малыми и большими значениями фактора х) и определение
по каждой из групп уравнений регрессии.

Определение остаточной суммы квадратов для первой регрессии

s\y = 2 {}'i ~Уи) и второй регрессии S2p = 2 [Уг -Уц) ■


54

55

4. Вычисление отношений S2pjSXp (или S^jS^}. В числителе

должна быть большая сумма квадратов.

Полученное отношение имеет ^ F распределение со степенями свободы кх = «j — т и к2 = n-nl-m (т — число оцениваемых параметров в уравнении регрессии).


ЕСЛИ
то гетероскедастичность имеет

переменная ^ Y с изменением соответствующей независимой пере­менной Xj на величину своего среднеквадратического откло­нения при фиксированном на постоянном уровне значении остальных независимых переменных.

Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную.

Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта-коэффициентов АО'):


место.

Чем больше величина F превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дис­персий остаточных величин.

Оценка влияния отдельных факторов

на зависимую переменную на основе модели

(коэффициенты эластичности, ^-коэффициенты)

Важную роль при оценке влияния факторов играют коэффи­циенты регрессионной модели. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(у) и бета-коэффициенты j5(y), которые рассчи­тываются соответственно по формулам:

(4.11)

у

(4Л2)

где

Sx_ — среднеквадратическое отклонение фактора у,


Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Однако он не учитывает степень колеблемости фак­торов.

Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy изменится зависимая

где гух — коэффициент парной корреляции между фактором J (/~'Ь •••> т) и зависимой переменной.

Использование многофакторных моделей для анализа и прогнозирования развития экономических систем

Одна из важнейших целей моделирования заключается в про­гнозировании поведения исследуемого объекта. Обычно термин «прогнозирование» используется в тех ситуациях, когда требуется предсказать состояние системы в будущем. Для регрессионных моделей он имеет, однако, более широкое значение. Как уже отме­чалось, данные могут не иметь временной структуры, но ив этих случаях вполне может возникнуть задача оценки значения зависи­мой переменной для некоторого набора независимых, объясняю­щих переменных, которых нет в исходных наблюдениях. Именно в этом смысле — как построение оценки зависимой переменной — и следует понимать прогнозирование в эконометрике.

При использовании построенной модели для прогнозирова­ния делается предположение о сохранении в период прогнозиро­вания существовавших ранее взаимосвязей переменных.

Построение точечных и интервальных прогнозов на основе регрессионной модели. Какие факторы влияют на ширину доверительного интервала

Для того чтобы определить область возможных значений результативного показателя, при рассчитанных значениях факто­ров следует учитывать два возможных источника ошибок: рассе­ивание наблюдений относительно линии регрессии и ошибки, обусловленные математическим аппаратом построения самой линии регрессии. Ошибки первого рода измеряются с помощью характеристик точности, в частности, величиной Sy. Ошибки вто-

57



56

рого рода обусловлены фиксацией численного значения коэф­фициентов регрессии, в то время как они в действительности являются случайными, нормально распределенными.

Для линейной модели регрессии доверительный интервал рассчитывается следующим образом. Оценивается величина от­клонения от линии регрессии (обозначим ее U):

(4.13)

/„ ^ 1 + 4,0ГН• (х

где л

прогн

2nporH

,...,ArJ

J.

JfcnpOrH

(l,A'lnpOrH,jr

Пример 4.1.

Задача состоит в построении модели для предсказания объе­ма реализации одного из продуктов фирмы.

Объем реализации — это зависимая переменная ^ У (млн руб.). В качестве независимых, объясняющих переменных выбраны: время Xlt расходы на рекламу Х2 (тыс. руб.), цена товара Хъ (руб.), средняя цена товара у конкурентов Х4 (руб.), индекс потребительских расходов Х5 (%).

Требуется:

1.

2. 3.

Осуществить выбор факторных признаков для построения

двухфакторной регрессионной модели.

Рассчитать параметры модели.

Для оценки качества всего уравнения регрессии определить:

4. 5.

линейный коэффициент множественной корреляции;

коэффициент детерминации.

Осуществить оценку значимости уравнения регрессии. Оценить с помощью /-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной ре­грессии.

6.

Оценить влияние факторов на зависимую переменную по модели.

7.

Построить точечный и интервальный прогноз результирую­щего показателя на два шага вперед а = 0,1.

1. Построение системы показателей (факторов).

Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели

Статистические данные по всем переменным приведены в табл. 4.1. В этом примере п— 16, т = 5.

58

Таблица АЛ



У




хг

х,

х4

х5

Объем

реализации

Время

Реклама

Цена

Цена конкурента

Индекс потре­бительских расходов

126

1

4

15

17

100

137

2

4,8

14,8

17,3

98,4

148

3

3,8

15,2

16,8

101,2

191

4

8,7

15,%

16,2

103,5

274

5

8,2

15,5

16

104,1

370

6

9,7

16

18

107

432

7

14,7

18,1

20,2

107,4

445

8

18,7

13

15,8

108,5

367

9

19,8

15,8

18,2

108,3

367

10

10,6

16,9

16,8

109,2

321

11

8,6

16,3

17

110,1

307

12

6,5

16,1

18,3

110,7

331

13

12,6

15,4

16,4

110,3

345

14

6,5

15,7

16,2

111,8

364

15

5,8

16

17,7

112,3

384

16

5,7

15,1

16,2

112,9

Использование инструмента Корреляция [Анализ данных в EXCEL)

Для проведения корреляционного анализа выполните следу­ющие действия:

Данные для корреляционного анализа должны располагаться
в смежных диапазонах ячеек.

Выберите команду Сервис=>Анализ данных.

В диалоговом окне Анализ данных выберите инструмент
Корреляция, а затем щелкните на кнопке ОК.

В диалоговом окне Корреляция в поле Входной интервал необ­
ходимо ввести диапазон ячеек, содержащих исходные данные.
Если выделены и заголовки столбцов, то установить флажок
Метки в первой строке.

Выберите параметры вывода. В данном примере Новый рабочий
лист.

ОК.

59

:

■'■;■'

&


ifr

I.

CN

О

о

■а§1

lit

СО

."Г1I в

«о

ON

б



.ев






















































иС Си

■■«













N-f. S*

IfOJ
















S

о


















Цена

Столбец 4













0,698

0,235



се

m



















«













§






















и










Sf



















ю









о, ш-

тол










и










—• 00

S










S '


















о

% п

ё










■■ ч







О 5

3






















и







Анализ матрицы коэффициентов парной корреляции пока­зывает, что зависимая переменная, т.е. объем реализации, имеет тесную связь с индексом потребительских расходов (гух5 = 0,816), с расходами на рекламу (гух2 = 0,646) и со временем (гух] = 0,678). Однако факторы Х2 и Х5 тесно связаны между собой (гХ\Х5 = 0,96), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели ^ — индекс потребительских расходов. В этом примере «=16, т = 5, после исключения не­значимых факторов и =16, к = 2.

2. Выбор вида модели и оценка ее параметров

Оценка параметров регрессии осуществляется по методу наи­меньших квадратов по формуле А = (X'X)~lX'Y, используя дан­ные1, приведенные в табл. 4.3.

Таблица 4.3



Y










Объем реализации




Реклама

Индекс потребительских расходов

126

1

4

100

137

1

4,8

98,4

148

1

3,8

101,2

191

1

8,7

103,5

274

1

8,2

104,1

370

1

9,7

107

432

1

14,7

107,4

445

1

18,7

108,5

367

1

19,8

108,3

367

1

10,6

109,2

321

1

8,6

110,1

307

1

6,5

110,7

331

1

32,6

110,3

345

1

6,5

111,8

364

1

5,8

132,3

384

1

5,7

112,9





CQ

Для вычисления а0 добавлен столбец Хо.

61



1 X

4х al

\а2/
1,1 *2,1 *2,2

1,1 Xl2

X

2,16

2,1 *2,2

Уг

1 1

*l,l X\,2

*

2,16

(\6 148,7 1715,7 x148,7 1744,03 16036,2 41715,7 1603,2 184 282,13;

Применение инструмента Регрессия {Анализ донных в EXCEL)

Для проведения регрессионного анализа выполните следую­щие действия:

Выберите команду Сервис=>Анализ данных.

В диалоговом окне Анализ данных выберите инструмент
Регрессия, а затем щелкните на кнопке ОК.

В диалоговом окне Регрессия в поле Входной интервал Y вве­
дите адрес одного диапазона ячеек, который представляет
зависимую переменную. В поле Входной интервал X введите
адреса одного или нескольких диапазонов, которые содержат
значения независимых переменных (рис. 4.1).

Если выделены и заголовки столбцов, то установить флажок
Метки в первой строке.

Выберите параметры вывода. В данном примере Новая рабо­
чая книга.

В поле Остатки поставьте необходимые флажки.

ОК.


а = (ХТХ)~1XTY

^39,2314 0,06752 -0,3711 ^ 0,06752 0,00299 -0,00088 -0,3711 -0,00088 0,00354 )









f-1471,314^

а\

=

9,568

Ка2,




,15,754 ,

Уравнение регрессии зависимости объема реализации от за­трат на рекламу и индекса потребительских расходов можно записать в следующем виде:

у = -1471,314 + 9,568xj + 15,754 х2.

Расчетные значения Yопределяются путем последовательной подстановки в эту модель значений факторов, взятых для каждо­го наблюдения.

JL Ж 11-

Ж ж и ж ж

17-

ж

ж

ж-

22

71


G

в

Объем ре;Реклама Индекс потребительских расходов
126, " " 4 100

137е4.8 ' 98.4*


148

191

"274

" 370|

432

445

367

367

321

307

"331

345 364 384

ОК
Регрессия

Оттена

i Входной интервал Y: | Входной интеовап &

Справка

Г~ Константа - ноль ] Г" Уровень надежности: J93 %

i Параметры вывода - - - .,
<"" Выходной интервал: i 1

Г Новый рабочий лист. |

i (* Новая рабочая книга
f Остатки - - - --

11 Ф Оа гки Г ГэзсЬич остатков

I Г" Стандартизованные ocTOTft Г™ График подбор =з

,i Нормальная вероятность

1' Г" График нормальной вероятности

Рис, АЛ. Диалоговое окно Регрессия подготовлено к выполнению анализа данных

Н L


62

63





Таблица 4.5

Результат регрессионного анализа содержится в табл. 4.4—4.7.

Рассмотрим содержание этих таблиц.

Таблица АЛ

Множественный R


R-квадрат


Нормированный /?-квадрат


Стандартная ошибка


Наблюдения


Регрессионная статистика


SS

136358,334 22360,104

df_

2 13 15

Дисперсионный анализ Регрессия




Остаток

^ Продолжение табл, 4,7



Наблюдение

Предсказанное

Остатки

5

247,02

26,98

6

307,06

62,94

7

361,20

70,80

8

416,80

28,20

9

424, if

-57,18

10

350,32

16,68

И

345,37

-24,37

12

334,72

-27,72

13

386,79

-55,79

14

352,05

-7,05

\5

353,23

10,77

16

361,73

22,27


Таблица 4.6

График остатков изображен на рис. 4.2,




Стандартная ошибка

259,766 2,266

2,467

70,80


22,27


-55,79




К-пересечение Реклама

Индекс потреби­тельских расходов

Коэффициенты

-1471,314 9,568

15,753

Вывод остатка

Предсказанное

/-статистика

-5,664 4,223

6,386

Таблица 4.7

-57,18 Рис. 4.2. График остатков


64

5-1924

65

Пояснения к табл. 4.4

Регрессионная статистика



Наименование в отчете EXCEL

Принятые наименования

Формула


I ,

Множественный R

Коэффициент множественной корреляции, индекс корреляции


iJ-квадрат

Коэффициент детерминации, R2

R2 =1-

• 2 в?

-\2

-\2


Нормированный Я-квадрат

Скорректированный R2


Стандартная ошибка

Стандартная ошибка оценки

п-к-1


Наблюдения

Количество наблюдений, п

п

Пояснения к табл. 4.5



; -

Df— число степеней свободы

SS — сумма квадратов




F-критерий Фишера

Регрессия




Ну,-у)2

2(у,-й2/^




f-(l-JP)/(«-*-l)



Остаток

„ _ к -г 1 = 13




2е?/л-Л;-1

1

Итого

л - 1 = 15

2U-7)2









где Ьм
Пояснения к табл. 4.6

Во втором столбце табл. 4.6 содержатся коэффициенты уравнения регрессии а0, а,, а2, В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии, а в четвертом — /-статистика, используемая для проверки значи­мости коэффициентов уравнения регрессии.

Уравнение регрессии зависимости объема реализации от за­трат на рекламу и индекса потребительских расходов можно записать в следующем виде:

У = -1471,314 + 9,568xj + 15,754х2.

3. Оценка качества всего уравнения регрессии

В табл. 4.7 приведены вычисленные (предсказанные) по мо­дели значения зависимой переменной 7и значения остаточной

компоненты e/t

Значение коэффициентов детерминации и множественной корреляции можно найти в таблице ^ Регрессионная статистика.

Коэффициент детерминации:

1

?2

= 1 - 22360,104/158718,44 = 136358,3/158718,44 = 0,859.

Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Коэффициент множественной корреляции Я:

R = 4¥ = 0,927.

Он показывает тесноту связи зависимой переменной Yc дву­мя включенными в модель объясняющими факторами.

4, Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:

Я2А 0,859/2

F =

= 39,6.

О - 0,859)/(16 ^

составляет 3,81. Табличное значение /-критерия можно найти с помощью функции FPACnOBP (рис. 4.3).

Поскольку jppac > /табл, уравнение регрессии следует признать адекватным.

5. Оценить с помощью f-критерия Стьюдента

статистическую значимость коэффициентов уравнения множественной регрессии

Значимость коэффициентов уравнения регрессии а0, ах, а2 оценим с использованием f-критерия Стьюдента. Значения /-критерия вычЛлим по формулам:

— диагональный элемент матрицы (ХТХ) ';

/39,2314 0,06752 -0,3711 \ Г)"' = 0,06752 0,00299 -0,00088 ; (-0,3711 -0,00088 0,00354 ,

Ь22= Ь33 =

39,2314; 0,00299; 0,00354;

= -1471,314/259,766 = -1471,314/41,473-^39,2314 =-5,664;

9,5684/2,2659 = 9,5684/41,473^0,00299 - 4,223;

15,7529/2,4669 = 15,7529/41,473^0,00354 = 6,3858.

^PjO П5 ?

^ Г -■"П«Ч1И_ЕВЯЙРД|>| 1 | _

\ 7J

I J

»; v-

\ FrA <■ & э

"О Т 1 ДП




T1 I J
Значение /-критерия Фишера можно найти в табл. 4.6 прото­кола EXCEL.

Табличное значение F-критерия при доверительной вероят­ности 0,95 при v, = fc=2 и v2=n-k- 1 = 16-2-1 = 13


L-U

Рис. 4,3. Определение табличного значения /^-критерия


88

69

Расчетные значения /-критерия Стьюдента для коэффи­циентов уравнения регрессии ах, а2 приведены в четвертом столб­це табл. 4.7 протокола EXCEL. Табличное значение /-критерия Стьюдента можно найти с помощью функции СТЬЮДРАСПОБР (рис. 4.4).

Табличное значение /-критерия при 5%-ном уровне значи­мости и степенях свободы (16-2-1 = 13) составляет 2,16. Так как > ^табл» то коэффициенты ах, а2 существенны (значимы).

6, Проанализировать влияние факторов на зависимую переменную по модели (для каждого коэффициента регрессии вычислить коэффициент эластичности, Р-коэффициент)

Учитывая, что коэффициент регрессии невозможно использо­вать для непосредственной оценки влияния факторов на зависи­мую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э) и бета-коэффициент, которые соответственно рассчитываются по формулам:

3j - Qj'>

Э, = 9,568 ■ 9,294/306,813 = 0,2898;

Э2 = 15,7529 • 107,231/306,813 = 5,506;

Pi " ai' $xi '' $y>

p, = 9,568 • 4,913/102,865 = 0,457;

62 = 15,7529 • 4,5128/102,865 = 0,691.

Коэффициент эластичности показывает, на сколько процен­тов изменяется зависимая переменная при изменении фактора на один процент,

0F

]7~

31

ржпредмеьие Сгьюзднта

Отче it,

' ^лозлчтэяьноэ цалзе члчо с i >»Р9чей ейободы, /вр*<п гр-*- '•« -ее расгредечение

Значен te 2 16036324

Рис, 4,4. Определение табличного значения ^-критерия Стьюдента

Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением не­зависимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных. Это означает, что при увеличении затрат на рекламу в нашем примере на 4,91 тыс. руб. объем реализации увеличится на 47 тыс. руб. (0,457 • 102,865).

^ 7, Определить точечные и интервальные прогнозные оценки объема реализации на два квартала вперед [}qj= 1/12)

Исходные данные представлены временными рядами, поэто­му прогнозные значения Х1]7,Х2гп и XX\8,X2j$ можно определить с помощью методов экспертных оценок, с помощью средних аб­солютных приростов или вычислить на основе экстраполяционных методов.

Для фактора Хх Затраты на рекламу выбрана модель

Х{ = 12,83 - 11,616/ + 4,319/2 - 0,552/3 + 0.020/4 - 0,0006/5,

по которой получен прогноз на 2 месяца вперед*. График модели временного ряда Затраты на рекламу приведен на рис. 4.5.



Упреждение

Прогноз

1

5,75

2

4,85

у =-ОДЮОбх5 + 0,292х4 - 0,5515л3 + 4,319х2- 11,616*+ 12,831

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Рис. 4.5. Прогноз показателя Затраты на рекламу


* Внимание!!! Полиномы таких высоких порядков редко используются при прогнозировании экономических показателей.


R2 = 0,7008


70

71


1,77 (Значение /кр получено с помощью функции

tKpЮ
Для временного ряда Индекс потребительских расходов в ка­честве аппроксимирующей функции выбран полином второй сте­пени (парабола), по которой построен прогноз на 2 шага вперед. На рис. 4.6 приведен результат построения тренда для временно­го ряда Индекс потребительских расходов.

Х2 = 97,008 + 1,739/- 0,0488?2.



Упреждение

Прогноз

1

112,468

2

112,488

Н 1 i 1 i i 1 1 1 ! 1 i

у= -0,0488х2 + 1,739х + 97,008 R2 = 0,9664

1 2 3 4 5 6 7 8 9 30 11 12 13 1415 16 17 18 Рис. 4.6, Прогноз показателя Индекс потребительских расходов

Для получения прогнозных оценок зависимостей переменной по модели

^ Y= -1471,438 + 9,568^ + 15,754Jf2

подставим в нее найденные прогнозные значения факторов Хх и Х2: Г/= ,7 = -1471,438 + 9,568 • 5,75 + 15,754 • 112,468 = 355,399; Yt= ,8 = -1471,438 + 9,568 • 4,85 + 15,754 ■ 112,488 = 344,179,

Доверительный интервал прогноза будет иметь следующие гра­ницы:

Верхняя граница прогноза: Yp{n + 1) + U{\).

Нижняя граница прогноза: Yp(n + 1) - if(l).



СТЬЮДРАСПРОБР(0.1;13) для выбранной вероятности 90% с числом степеней свободы, равным 13.)

На первый шаг:

1=1;

^О; 5,75; 112,468);

/39,2314 0,06752 -0,371 Г\ '- 0,06752 0,00299 -0,00g8 ^-0,3711 -0,00088 0,00354,1

ы(1) = 81,45.

На второй шаг:

1 = 2;

^пГРогн = (1; 4,85; 112,488);

ы(2) = 82,47.

Результаты прогнозных оценок модели регрессии представим в табл. 4.8.

Таблица 4.3



Таблица прогнозов (р = 90%)

Упреждение

Прогноз

Нижняя граница

Верхняя граница

1

355,399

273,94

436,85

2

344,179

261,71

426,65


прогн

1прогн


72

41,473.

Тема 5. СИСТЕМЫ ЛИНЕЙНЫХ

^ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ

Экономические показатели, часто оказываются взаимозависи­мы. Структура связей между такими показателями (переменными) может быть описана с помощью системы одновременных (струк­турных) уравнений, В этих уравнениях присутствуют переменные

следующих типов:

• эндогенные, зависимые переменные у, определяемые внутри

системы;

экзогенные, независимые переменные х, значения которых
задаются извне, они являются управляемыми, планируемыми;

предопределенные, включающие в себя как экзогенные
переменные за текущий период времени, так и лаговые переменные (т.е. экзогенные и эндогенные переменные за преды­дущие периоды времени).

Выделяют следующие виды эконометрических систем.

Системы независимых уравнений, в которых каждая зависимая переменная у,-(/= 1, ..., п) представлена как функция одного и того же набора независимых переменных Xj(j= 1,..., m):

y1=a11x1+a12x2+…+a1mxm+E1

y2=a21x1+a22x2+…+a2mxm+E2

……………………………. (5.1)

yn=an1x1+an2x2+…anmxm+En

Каждое уравнение этой системы можно рассматривать само­стоятельно как уравнение регрессии. В него может быть введен свободный член, и коэффициенты регрессии могут быть найде­ны методом наименьших квадратов (МНК).

Системы рекурсивных уравнений, в которых зависимые переменные yi(i=1, ...,п) представлены как функции независи­мых переменных Xj(j= 1,..., т) и определенных ранее зависимых переменных

y1, y2,…,yi-1

y1=a11x1+a12x2+…+a1mxm+E1

y2=b21y1+a21x1+a22x2+…+a2mxm+E2

……………………………. (5.2)

yn=bn1y1+bn2y2+…+bnn-1yn-1+an1x1+an2x2+…anmxm+En

Параметры каждого уравнения системы определяются отдель­но, в последовательном порядке, начиная с первого уравнения, методом наименьших квадратов.

Системы взаимозависимых уравнений, в которых каждая за­висимая переменная yi(i= 2, ..., п) представлена как функция остальных зависимых переменных yk{ki) и независимых (пред­определенных) переменных xj(j= 1,..., т):

y1=b12y2+b13y3+…+b1nyn+a11x1+a12x2+…+a1mxm+E1

y2=b21y1+b23y3+…+b2nyn+a21x1+a22x2+a2mxm+E2 (5.3)

……………………………………………………..

yn=bn1y1+bn2y2+…+bnm-1yn-1+an1x1+an2x2+…+anmxm+En

Эта система наиболее распространенная, она получила назва­ние системы совместных, одновременных уравнений. Ее также на­зывают структурной формой модели (СФМ).

Отдельные коэффициенты при переменных СФМ могут быть равны нулю, что означает отсутствие в уравнении этих перемен­ных. Например, модель динамики цены и заработной платы мо­жет быть описана СФМ вида:

y1=b12y2+a11x1+E1;

y2=b21y1+a22x2+a23x3+E3 (5.4)

еще рефераты
Еще работы по разное