Реферат: Линейные уравнения парной и множественной регрессии

--PAGE_BREAK--Задача №2


Используя данные, приведенные в таблице: построить линейное уравнение множественной регрессии;

1)                оценить значимость параметров данного уравнения и построить доверительные интервалы для каждого из параметров, оценить значимость уравнения в целом, пояснить экономический смысл полученных результатов;

2)                рассчитать линейные коэффициенты частной корреляции и коэффициент множественной детерминации, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними;

3)                вычислить прогнозное значение yпри уменьшении вектора xна 6 % от максимального уровня, оценить ошибку прогноза и построить доверительный интервал прогноза;
Таблица №5



Таблица №6Параметры (коэффициенты) уравнения регрессии



Множественная регрессия широко используется в решении проблем спроса, доходности акций, изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия — один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

На основании этих данных запишем уравнение регрессии:
<img width=«196» height=«23» src=«ref-1_1280247732-319.coolpic» v:shapes="_x0000_i1040">.
Таблица №7 Регрессионная статистика



! Параметр R-квадрат, представляет собой квадрат коэффициента корреляции rxy2 и называется коэффициентом детерминации. Величина данного коэффициента характеризует долю дисперсии зависимой переменной y, объясненную регрессией (объясняющей переменной x). Соответственно величина 1 — rxy2 характеризует долю дисперсии переменной y, вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных. Доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет: 0,663668, или 66,3%.

Находим, что численное значение <img width=«76» height=«24» src=«ref-1_1280248051-187.coolpic» v:shapes="_x0000_i1041">, а скорректированный (нормированный, исправленный) коэффициент детерминации равен <img width=«76» height=«25» src=«ref-1_1280248238-186.coolpic» v:shapes="_x0000_i1042">

1) Для оценки качества уравнения регрессии в целом необходимо проверить статистическую значимость индекса детерминации <img width=«21» height=«20» src=«ref-1_1280248424-104.coolpic» v:shapes="_x0000_i1043">: проверяется нулевая гипотеза <img width=«77» height=«25» src=«ref-1_1280247082-182.coolpic» v:shapes="_x0000_i1044">, используется <img width=«99» height=«20» src=«ref-1_1280247264-207.coolpic» v:shapes="_x0000_i1045">.

Наблюдаемое значение критерия <img width=«33» height=«24» src=«ref-1_1280248917-128.coolpic» v:shapes="_x0000_i1046">и оценку его значимости находим в Таблице №8
Таблица №8Дисперсионный анализ:



! Включаемые в уравнение множественной регрессии факторы должны объяснить вариацию зависимой переменной. Если строится модель с некоторым набором факторов, то для нее рассчитывается показатель детерминации, который фиксирует долю объясненной вариации результативного признака (объясняемой переменной) за счет рассматриваемых в регрессии факторов. А оценка влияния других, неучтенных в модели факторов, оценивается вычитанием из единицы коэффициента детерминации, что и приводит к соответствующей остаточной дисперсии.

Таким образом, при дополнительном включении в регрессию еще одного фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит и данные показатели практически недостаточно значимо отличаются друг от друга, то включаемый в анализ дополнительный фактор не улучшает модель и практически является лишним фактором.

Если модель насыщается такими лишними факторами, то не только не снижается величина остаточной дисперсии и не увеличивается показатель детерминации, но, более того, снижается статистическая значимость параметров регрессии по критерию Стьюдента вплоть до статистической незначимости.

2) Для статистической оценки значимости коэффициентов регрессии (<img width=«83» height=«24» src=«ref-1_1280249045-174.coolpic» v:shapes="_x0000_i1047">) используем <img width=«23» height=«16» src=«ref-1_1280249219-94.coolpic» v:shapes="_x0000_i1048">статистику Стьюдента.

Проверяется нулевая гипотеза <img width=«188» height=«24» src=«ref-1_1280249313-289.coolpic» v:shapes="_x0000_i1049">.

Для проверки нулевой гипотезы необходимо знать величину наблюдаемых значений критерия <img width=«70» height=«24» src=«ref-1_1280249602-201.coolpic» v:shapes="_x0000_i1050">. Их значения и оценки их статистической значимости найдем в Таблице №9



Таблица №9



В этой же таблице находим границы доверительных интервалов для каждого из параметров:





3. Значения парных коэффициентов корреляции найдем из соответствующей матрицы.
Таблица №10 Корреляционная матрица



По величине парных коэффициентов корреляции может обнаруживаться лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга.

Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК).

Частные коэффициенты корреляции найдем по формулам
<img width=«440» height=«55» src=«ref-1_1280249803-1292.coolpic» v:shapes="_x0000_i1051">,

<img width=«437» height=«55» src=«ref-1_1280251095-1298.coolpic» v:shapes="_x0000_i1052">,
их значения показывают, что при отсутствии влияния других факторов, связь с рассматриваемым фактором усиливается т.е. мультиколлинеарность между ними существует.

4. Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 110% их максимального значения. Найдем прогнозные значения факторов и подставим их в полученное уравнение регрессии.

По условию прогнозные значения составляют 110% их максимального значения.


Таблица №11



Далее вычисляем прогнозные значения факторов: <img width=«376» height=«25» src=«ref-1_1280252393-505.coolpic» v:shapes="_x0000_i1053">. Затем, подставив эти значения в уравнение регрессии, получим прогнозное (предсказанное) значение фактора<img width=«357» height=«25» src=«ref-1_1280252898-555.coolpic» v:shapes="_x0000_i1054">. Доверительный интервал прогноза оценивается формулой: <img width=«157» height=«28» src=«ref-1_1280253453-313.coolpic» v:shapes="_x0000_i1055">, где <img width=«271» height=«32» src=«ref-1_1280253766-486.coolpic» v:shapes="_x0000_i1056">  — ошибка прогноза,<img width=«24» height=«15» src=«ref-1_1280254252-92.coolpic» v:shapes="_x0000_i1057">стандартная ошибка регрессии.
Таблица №12



<img width=«45» height=«21» src=«ref-1_1280254344-128.coolpic» v:shapes="_x0000_i1058">;

<img width=«236» height=«21» src=«ref-1_1280254472-372.coolpic» v:shapes="_x0000_i1059">  — коэффициент Стьюдента, который в данном случае имеет смысл кратности случайной (стандартной) ошибки прогноза <img width=«23» height=«25» src=«ref-1_1280254844-107.coolpic» v:shapes="_x0000_i1060">;

<img width=«135» height=«27» src=«ref-1_1280254951-271.coolpic» v:shapes="_x0000_i1061">  — число, которое получим в результате операций над матрицами:
<img width=«110» height=«271» src=«ref-1_1280255222-1337.coolpic» v:shapes="_x0000_i1062">  —
матрица значений факторных переменных <img width=«96» height=«24» src=«ref-1_1280256559-269.coolpic» v:shapes="_x0000_i1063">,

<img width=«40» height=«20» src=«ref-1_1280256828-120.coolpic» v:shapes="_x0000_i1064"> транспонированная матрица <img width=«19» height=«16» src=«ref-1_1280245645-97.coolpic» v:shapes="_x0000_i1065">;

<img width=«51» height=«20» src=«ref-1_1280257045-138.coolpic» v:shapes="_x0000_i1066">  — произведение матриц <img width=«67» height=«24» src=«ref-1_1280257183-155.coolpic» v:shapes="_x0000_i1067">;

<img width=«72» height=«24» src=«ref-1_1280257338-176.coolpic» v:shapes="_x0000_i1068">  — матрица, обратная к матрице <img width=«51» height=«20» src=«ref-1_1280257045-138.coolpic» v:shapes="_x0000_i1069">;

<img width=«24» height=«25» src=«ref-1_1280257652-111.coolpic» v:shapes="_x0000_i1070">  — матрица прогнозных значений факторов;

<img width=«25» height=«27» src=«ref-1_1280257763-123.coolpic» v:shapes="_x0000_i1071">  — транспонированная матрица прогнозов.

Фактор <img width=«43» height=«24» src=«ref-1_1280257886-126.coolpic» v:shapes="_x0000_i1072">представляет собой фиктивную переменную, которую необходимо ввести в уравнение регрессии для того, чтобы преобразовать его в «приведенную» форму вида <img width=«152» height=«24» src=«ref-1_1280258012-281.coolpic» v:shapes="_x0000_i1073">.
<img width=«397» height=«75» src=«ref-1_1280258293-1112.coolpic» v:shapes="_x0000_i1074">

<img width=«413» height=«75» src=«ref-1_1280259405-1640.coolpic» v:shapes="_x0000_i1075">
Максимальную ошибку прогноза<img width=«23» height=«25» src=«ref-1_1280261045-108.coolpic» v:shapes="_x0000_i1076">=11,07714043: 1) нижняя граница прогноза <img width=«56» height=«25» src=«ref-1_1280261153-158.coolpic» v:shapes="_x0000_i1077">=44,92285957, 2) верхнюю границу прогноза <img width=«56» height=«25» src=«ref-1_1280261311-163.coolpic» v:shapes="_x0000_i1078">=67,07714043. Интервал прогнозных значений результативного признака
<img width=«157» height=«28» src=«ref-1_1280253453-313.coolpic» v:shapes="_x0000_i1079">=><img width=«209» height=«21» src=«ref-1_1280261787-366.coolpic» v:shapes="_x0000_i1080">


    продолжение
--PAGE_BREAK--Задача № 3


Используя данные, представленные в таблице проверить наличие гетероскедастичности, применяя тест Голдфельда-Квандта.



Таблица№13. Данные



1) Найдем параметры линейного уравнения множественной регрессии и значения остатков.

Определим остаточные суммы квадратов <img width=«71» height=«45» src=«ref-1_1280262153-325.coolpic» v:shapes="_x0000_i1081"> и <img width=«73» height=«45» src=«ref-1_1280262478-339.coolpic» v:shapes="_x0000_i1082">, то есть суммы квадратов остатков регрессии по «урезанным выборкам».
Таблица№14



1)                Находим наблюдаемое значение критерия <img width=«241» height=«44» src=«ref-1_1280262817-656.coolpic» v:shapes="_x0000_i1083">. По условию задачи <img width=«155» height=«23» src=«ref-1_1280263473-257.coolpic» v:shapes="_x0000_i1084">. Из таблицы значений <img width=«99» height=«20» src=«ref-1_1280263730-206.coolpic» v:shapes="_x0000_i1085"> Фишера находим, что <img width=«192» height=«24» src=«ref-1_1280263936-345.coolpic» v:shapes="_x0000_i1086"> 

Вывод: отвергаем нулевую гипотезу <img width=«24» height=«24» src=«ref-1_1280264281-109.coolpic» v:shapes="_x0000_i1087"> на принятом уровне значимости <img width=«59» height=«20» src=«ref-1_1280264390-151.coolpic» v:shapes="_x0000_i1088">, т.к. наблюдаемое значение критерия больше табличного.

Следовательно, предположение об однородности дисперсий ошибок, при условии, что выполнены стандартные предположения о модели наблюдений, включая предположение о нормальности ошибок, неверно. Наблюдается гетероскедастичность, что приводит к ошибочным статистическим выводам при использовании МНК. Следовательно, полученные оценки не являются состоятельными.


    продолжение
--PAGE_BREAK--Задача № 4


По данным таблицы построить уравнение регрессии, выявить наличие автокорреляции остатков, используя критерий Дарбина — Уотсона, и проанализировать пригодность полученного уравнения для построения прогнозов.
Таблица №15



Найдем параметры линейного уравнения множественной регрессии и значения остатков.

Дополним таблицу данных столбцами "<img width=«25» height=«24» src=«ref-1_1280264541-105.coolpic» v:shapes="_x0000_i1089">", «Квадрат разности остатков <img width=»75" height=«25» src=«ref-1_1280264646-176.coolpic» v:shapes="_x0000_i1090">" и «Квадрат остатка <img width=»19" height=«25» src=«ref-1_1280264822-105.coolpic» v:shapes="_x0000_i1091">" и заполним их.
Таблица №16



По формуле <img width=«141» height=«91» src=«ref-1_1280264927-638.coolpic» v:shapes="_x0000_i1092">вычислим значение статистики <img width=«33» height=«17» src=«ref-1_1280265565-120.coolpic» v:shapes="_x0000_i1093">:

Так как <img width=«237» height=«45» src=«ref-1_1280265685-690.coolpic» v:shapes="_x0000_i1094">, то значение статистики

равно <img width=«140» height=«44» src=«ref-1_1280266375-377.coolpic» v:shapes="_x0000_i1095">.

По таблице критических точек Дарбина Уотсона определим значения критерия Дарбина-Уотсона <img width=«17» height=«24» src=«ref-1_1280266752-100.coolpic» v:shapes="_x0000_i1096"> (нижнее) и <img width=«19» height=«24» src=«ref-1_1280266852-102.coolpic» v:shapes="_x0000_i1097"> (верхнее) для заданного числа наблюдений <img width=«43» height=«19» src=«ref-1_1280266954-125.coolpic» v:shapes="_x0000_i1098">, числа независимых переменных модели <img width=«35» height=«19» src=«ref-1_1280267079-113.coolpic» v:shapes="_x0000_i1099">и уровня значимости <img width=«59» height=«20» src=«ref-1_1280264390-151.coolpic» v:shapes="_x0000_i1100">. Итак, находим, что <img width=«69» height=«24» src=«ref-1_1280267343-170.coolpic» v:shapes="_x0000_i1101">, <img width=«69» height=«24» src=«ref-1_1280267513-174.coolpic» v:shapes="_x0000_i1102">.

По этим значениям числовой промежуток <img width=«32» height=«23» src=«ref-1_1280267687-138.coolpic» v:shapes="_x0000_i1103"> разбиваем на пять отрезков:
<img width=«164» height=«24» src=«ref-1_1280267825-338.coolpic» v:shapes="_x0000_i1104">,

<img width=«195» height=«24» src=«ref-1_1280268163-388.coolpic» v:shapes="_x0000_i1105">,

<img width=«227» height=«24» src=«ref-1_1280268551-426.coolpic» v:shapes="_x0000_i1106">,

<img width=«248» height=«24» src=«ref-1_1280268977-452.coolpic» v:shapes="_x0000_i1107">,

<img width=«195» height=«24» src=«ref-1_1280269429-377.coolpic» v:shapes="_x0000_i1108">.
На основании выполненных расчетов находим, что наблюдаемое значение статистики <img width=«85» height=«21» src=«ref-1_1280269806-199.coolpic» v:shapes="_x0000_i1109">принадлежит первому интервалу.

Вывод: существует отрицательная автокорреляция, то есть гипотеза <img width=«24» height=«24» src=«ref-1_1280264281-109.coolpic» v:shapes="_x0000_i1110">отклоняется и с вероятностью <img width=«57» height=«21» src=«ref-1_1280270114-156.coolpic» v:shapes="_x0000_i1111"> принимается гипотеза <img width=«23» height=«23» src=«ref-1_1280270270-110.coolpic» v:shapes="_x0000_i1112">.

Следовательно, полученное уравнение регрессии <img width=«123» height=«21» src=«ref-1_1280270380-237.coolpic» v:shapes="_x0000_i1113">не может быть использовано для прогноза, так как в нем не устранена автокорреляция в остатках, которая может иметь разные причины. Автокорреляция в остатках может означать, что в уравнение не включен какой-либо существенный фактор. Возможно также, что форма связи неточна.


    продолжение
--PAGE_BREAK--Задача № 5


В таблице приводятся данные о динамике выпуска продукции Финляндии (млн. долл.).
Таблица №17



Задание:

1.                 Постройте график временного ряда.

2.                 Сделайте вывод о присутствии или отсутствии тренда при доверительной вероятности 0,95.

3.                 Найдите среднее значение, среднеквадратическое отклонение и коэффициенты автокорреляции (для лагов <img width=«47» height=«20» src=«ref-1_1280270617-128.coolpic» v:shapes="_x0000_i1114">) заданного ВР.

4.                 Проведите сглаживание данного ВР методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания <img width=«41» height=«19» src=«ref-1_1280270745-122.coolpic» v:shapes="_x0000_i1115">;

5.                 Найдите уравнение тренда ВР <img width=«17» height=«24» src=«ref-1_1280270867-97.coolpic» v:shapes="_x0000_i1116">, предполагая, что он линейный, и проверьте его значимость на уровне <img width=«60» height=«20» src=«ref-1_1280270964-154.coolpic» v:shapes="_x0000_i1117">.

6.                 Дайте точечный и интервальный (с надежностью 0,95) прогнозы индивидуального значения выпуска продукции на 2003 год.
Таблица №18



<img width=«340» height=«217» src=«ref-1_1280271118-2735.coolpic» v:shapes=«Рисунок_x0020_110»>


2. Для обнаружения тенденции в данном ВР воспользуемся критерием «восходящих и нисходящих» серий.

Критерий «восходящих и нисходящих» серий

1) Для исследуемого ВР определяется последовательность знаков, исходя из условий: (+), если <img width=«108» height=«24» src=«ref-1_1280273853-186.coolpic» v:shapes="_x0000_i1119">, (-), если <img width=«107» height=«24» src=«ref-1_1280274039-184.coolpic» v:shapes="_x0000_i1120">.

При этом, если последующее наблюдение равно предыдущему, то учитывается только одно наблюдение.

2) Подсчитывается число серий <img width=«32» height=«21» src=«ref-1_1280274223-121.coolpic» v:shapes="_x0000_i1121">. Под серией понимается последовательность подряд расположенных плюсов или минусов, причем один плюс или один минус считается серией.

3) Определяется протяженность самой длинной серии <img width=«48» height=«24» src=«ref-1_1280274344-150.coolpic» v:shapes="_x0000_i1122">.

4) Значение <img width=«29» height=«21» src=«ref-1_1280274494-120.coolpic» v:shapes="_x0000_i1123"> находят из следующей таблицы:
Таблица №25





5) Если нарушается хотя бы одно из следующих неравенств, то гипотеза об отсутствии тренда отвергается с доверительной вероятностью 0,95
<img width=«180» height=«63» src=«ref-1_1280275318-629.coolpic» v:shapes="_x0000_i1129">
Определим последовательность знаков:




Таблица №19



Определим число серий <img width=«32» height=«21» src=«ref-1_1280274223-121.coolpic» v:shapes="_x0000_i1130">: <img width=«56» height=«21» src=«ref-1_1280276161-154.coolpic» v:shapes="_x0000_i1131">. Определим протяженность самой длинной серии <img width=«48» height=«24» src=«ref-1_1280274344-150.coolpic» v:shapes="_x0000_i1132">: <img width=«73» height=«24» src=«ref-1_1280276465-178.coolpic» v:shapes="_x0000_i1133">. <img width=«53» height=«21» src=«ref-1_1280276643-152.coolpic» v:shapes="_x0000_i1134">, так как <img width=«77» height=«19» src=«ref-1_1280276795-166.coolpic» v:shapes="_x0000_i1135">. Проверим выполнение неравенств:
<img width=«413» height=«61» src=«ref-1_1280276961-1143.coolpic» v:shapes="_x0000_i1136">
Вывод: второе неравенство не выполняются, следовательно, тренд (тенденция) в динамике выпуска продукции имеется на уровне значимости 0,05. Среднее значение <img width=«145» height=«24» src=«ref-1_1280278104-286.coolpic» v:shapes="_x0000_i1137">. Среднее значение <img width=«157» height=«24» src=«ref-1_1280278390-298.coolpic» v:shapes="_x0000_i1138">. Вычислим коэффициенты автокорреляции первого и второго порядков, то есть для лагов <img width=«47» height=«20» src=«ref-1_1280270617-128.coolpic» v:shapes="_x0000_i1139">. Подготовим данные для вычисления коэффициентов автокорреляции первого и второго порядков. Дополним таблицу данных двумя столбцами <img width=«91» height=«24» src=«ref-1_1280278816-177.coolpic» v:shapes="_x0000_i1140">.


Таблица №20



<img width=«84» height=«23» src=«ref-1_1280278993-196.coolpic» v:shapes="_x0000_i1141">.

<img width=«77» height=«23» src=«ref-1_1280279189-188.coolpic» v:shapes="_x0000_i1142">.
Вывод:

1) высокое значение коэффициента автокорреляции первого порядка <img width=«60» height=«23» src=«ref-1_1280279377-158.coolpic» v:shapes="_x0000_i1143">свидетельствует об очень тесной зависимости между выпуском продукции текущего и непосредственно предшествующего годов, и, следовательно, о наличии в исследуемом временном ряде сильной линейной тенденции;

2) исследуемый ряд содержит только тенденцию, так как наиболее высоким оказался коэффициент автокорреляции первого порядка (0,85>0,83).


Скользящие средние найдем по формуле: <img width=«91» height=«47» src=«ref-1_1280279535-392.coolpic» v:shapes="_x0000_i1144">, здесь <img width=«67» height=«20» src=«ref-1_1280279927-152.coolpic» v:shapes="_x0000_i1145">. При <img width=«99» height=«23» src=«ref-1_1280280079-171.coolpic» v:shapes="_x0000_i1146">

Вычисляем:
<img width=«379» height=«81» src=«ref-1_1280280250-1212.coolpic» v:shapes="_x0000_i1147">
и так далее.

Результаты вычислений занесем в таблицу и построим графики исходного<img width=«17» height=«24» src=«ref-1_1280270867-97.coolpic» v:shapes="_x0000_i1148">и сглаженного <img width=«17» height=«24» src=«ref-1_1280281559-102.coolpic» v:shapes="_x0000_i1149"> рядов в одной координатной плоскости.
Таблица №21



<img width=«389» height=«220» src=«ref-1_1280281661-3373.coolpic» v:shapes=«Рисунок_x0020_142»>


Таблица № Параметры (коэффициенты) уравнения тренда.
Таблица №22



Анализ данных таблицы Дисперсионного анализа показывает, что получено статистически значимое уравнение, так как наблюдаемое значение <img width=«99» height=«20» src=«ref-1_1280263730-206.coolpic» v:shapes="_x0000_i1151">
    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по математике