Реферат: Эконометрика
Контрольнаяработа
По эконометрики
Обзор корреляционногополя
Эти данные скорее всегоможно аппроксимировать при помощи линейной регрессии вида ŷ = а — b·x, как самой простой.
Рассчитаем необходимые суммыи запишем их в таблице № 1:
Таблица №1:
i
x
y
x²
y²
x·y
ŷ
e
e²
A(%)
1
2,5 69 6,25 4761 172,5 66,40 2,60 6,75 3,76 2 3 65 9 4225 195 64,85 0,15 0,02 0,23 3 3,4 63 11,56 3969 214,2 63,61 -0,61 0,37 0,97 4 4,1 59 16,81 3481 241,9 61,44 -2,44 5,94 4,13 5 5 57 25 3249 285 58,65 -1,65 2,71 2,89 6 6,3 55 39,69 3025 346,5 54,61 0,39 0,15 0,70 7 7 54 49 2916 378 52,44 1,56 2,43 2,89Сумма:
31,3 422 157,31 25626 1833,1 422,00 0,00 18,38 15,57Среднее:
4,471 60,286 22,473 3660,857 261,871 - - - 2,22%Ковариация между y и x рассчитывается по формуле />,где />, />, />. Дисперсия и среднееквадратическое отклонение для xи y находим по формулам:
/>= 2,479, />=26,490, />1,575, />5,147.
/> = -7,692 / 2,479 = -3,103; />= 60,286 + 3,103 · 4,471 =74,159
Получили уравнениерегрессии: ŷ = 74,159 — 3,103·х (округлено до сотых).
Оцениваем качествополученной линейной модели:
а) TSS = 25624 — (31,3²): 7 = 185,492;RSS = TSS — ESS =185,429 — 18,38 = 176,051, где ESS = />= 18,38 (в таблице №1); F — статистика = RSS · (n — m — 1): ESS = 176,051 · ·5 :18,38 = 45,45.
Табличное значение на 1%уровне значимости равно 16,26 (см. таблицу распределения Фишера — Снедекора).Фактическое значение F — статистики больше табличного на 1% уровне значимости, следовательно уравнениерегрессии в целом значимо и на 5% уровне значимости.
б) Средняя ошибкааппроксимации равна (ΣА)/7 = ((ΣIy-ŷI: y) · 100%) / 7 = 15,57 / 7 = =2,22%,что говорит о хорошей аппроксимации зависимости моделью (2,22% < 6%).
Вывод: модель получиласьприемлемая (в смысле аппроксимации).
в) Коэффициент корреляциинаходим по формуле: />= -0,949: сильнаяобратная линейная зависимость.
г) Коэффициент детерминациинаходим следующим образом: /> = 0,901или вариация x определяет вариацию y на 90,1%.
Проверкана соответствие условиям теоремы Гаусса — Маркова
а) По таблице №2рассчитаем статистику Дарбина — Уотсона:
Таблица №2
i
e²
e
ei-1
(ei-ei-1)²
/>=16,050: 18,38 = 0,8734.
1 6,75 2,60 - - 2 0,02 0,15 2,598 5,996 3 0,37 -0,61 0,149 0,576 4 5,94 -2,44 -0,610 3,342 5 2,71 -1,65 -2,438 0,628 6 0,15 0,39 -1,646 4,134 7 2,43 1,56 0,388 1,373 Итого: 18,38 - -1,559 16,050Полученное значениепопадает в область неопределённости: DW/>(0,7; 1,35). Это значит, что для прояснения вопросаотносительно автокорреляции остатков необходимо дальнейшее исследование рядаостатков другими методами, в которых отсутствует зона неопределённости.
б) Воспользуемся тестомсерий Бройша — Годфри:
Таблица №3
t
et
et-1
e²t-1
et·et-1
êt
(y-bx)²
1 2,598 0,149 0,022 0,387 0,074 6,371 2 0,149 -0,610 0,372 -0,091 -0,302 0,204 3 -0,610 -2,438 5,944 1,487 -1,208 0,358 4 -2,438 -1,646 2,709 4,013 -0,816 2,632 5 -1,646 0,388 0,151 -0,639 0,192 3,379 6 0,388 1,559 2,430 0,605 0,773 0,148 Итого:-1,559
-2,598
11,628
5,763
-1,287 13,092На основании полученных данныхпостроим уравнение регрессии без свободного члена вида ŷ=b·x. Приэтом стандартная ошибка коэффициента регрессии b, рассчитанная по формуле:
/>,
/>, />= 1,181,
что меньше значения t табл. =2,57. Это означает, что автокорреляция первого уровняотсутствует.
Однако следует отметить,что и тест Дарбина — Уотсона и тест серий Бройша — Годфри применяются толькодля выборок достаточно большого размера[1], в то время какпредложенная нам для анализа выборка состоит только лишь из семи значений.
в) При помощи критериясерий проверим случайность распределения уровней ряда остатков. С 95%вероятностью распределение ряда остатков считается случайным, если одновременновыполняются два неравенства:
1) />
общее число серий должнобыть больше двух, и 2) /> -максимальная длина серии должна быть строго меньше пяти.
Данные для расчётовполучаем из таблицы № 4.
Таблица № 4. Критерий серий линейная модель непроходит:
ei
ei — ei-1
серииЧисло серий = 2, Продолжительность самой длинной серии
равна 3.
2 = />= [2.079] = 2. (не выполняется),
хотя 3 < 5. Значит уровни распределены не случайно.
0,149 -2,449 + -0,610 -0,759 + -2,438 -1,828 + -1,646 0,792 - 0,388 2,033 - 1,559 1,172 -г) Соответствие рядаостатков нормальному закону распределения проверяем, используем RS-критерий:
/>= 2,63, где />.
Значение нашего RS-критерия для 7 наблюденийпрактически попадает в интервал [2,67 3,69], (для 10 наблюдений) хотя и этоткритерий определён для выборок более 10 единиц.
д) При помощи теста ранговойкорреляции Спирмена определяем отсутствие или наличие гетероскедастичности.
Таблица № 5.
РангХ
Х
IeiI
Рангеi
Di
D²i
Коэффициент ранговой кореляции определяется по формуле: />
1 2,5 2,60 7 -6 36 2 3 0,15 4 -2 4 3 3,4 0,61 3 4 4,1 2,44 1 3 9 5 5 1,65 2 3 9 6 6,3 0,39 5 1 1 7 7 1,56 6 1 1Так как абсолютноезначение статистики коэффициента ранговой корелляции />=0,175 оказаласьзначительно меньше табличного значения />,то гетероскедастичность отсутствует.
Вывод: линейная модель несоответствует всем предпосылкам регрессионного анализа (условиям теоремыГаусса-Маркова) и, хотя она пригодна для прогнозирования, но возникает вопрос оеё значимости.
Доверительныеинтервалы для параметра bрегрессии
Стандартные ошибки дляпараметров регрессии находим по формулам:
/>= 0,46,
/>= 2,18.
Проверим настатистическую значимость коэффициент bмодели, для чего рассчитаем t-статистику по формуле />. Полученнаяt-статистика равна -6,742, что помодулю больше табличного значения t=2,57. Экономически этот параметр интерпретируется так: при изменении дохода потребителейна одну единицу объёмы продаж изменятся на -3,103 ед.
Проверим настатистическую значимость коэффициент aмодели, для чего рассчитаем t-статистику по формуле />. Полученная t-статистика равна 33,992, что большетабличного значения t= 2,57. Доверительныйинтервал параметраbопределяем по формуле:
/>;
s = />= 1,917,
Доверительный интервалпараметраb составляет />; или />(tтабл. = 2.57, Δ = 2,57 · 0,4602 =1,1827).
Проведённый анализкоэффициентов регрессии говорит о том, что параметры регрессии значимы, крометого и уравнение регрессии в целом значимо на 1% уровне значимости (cм. выше). Это позволяет использоватьпостроенную нами модель для получения прогнозов.
Точечный иинтервальный прогнозы
Вначале находим точечныйпрогноз для значения х, на 25% превышающего среднее значение /> = 4,47 ( т.е. при /> = 5,589), />. Тогда стандартная ошибкапрогноза составит:
/>,
tтабл. = 2.57, Δ = 2,57 · 2,18 =5,604.
Интервальный прогноз дляточечного прогноза при /> = 5,589 (/>) составит: /> или />.