Реферат: Парная регрессия

Контрольнаяработа

по теме: «Парная линейная регрессия»


Данные,характеризующие прибыль торговой компании «Все для себя» запервые 10 месяцев 2004 года (в тыс. руб.), даны в следующей таблице:

январь февраль март апрель май июнь июль август сентябрь октябрь 367 418 412 470 485 470 525 568 538 558

 

Вконтрольной работе с использованием табличного процессора Ехсеlнеобходимо выполнить следующиевычисления и построения:

1.Построить диаграмму рассеяния.

2.Убедится в наличии тенденции (тренда) в заданных значениях прибыли фирмы ивозможности принятия гипотезы о линейном тренде.

3.Построить линейную парную регрессию (регрессию вида />).Вычисление коэффициентов b, b1 выполнить методом наименьших квадратов.

4.Нанести график регрессии на диаграмму рассеяния.

5.Вычислить значения статистики Fи коэффициента детерминации R2. Проверить гипотезу о значимостипостроенного уравнения регрессии.

6.Вычислить выборочный коэффициент корреляции и проверить гипотезу о ненулевомего значении.

7.Вычислить оценку дисперсии случайной составляющей эконометрической модели.

8.Проверить гипотезы о значимости вычисленных коэффициентов b, b1 .

9.Построить доверительные интервалы для коэффициентов b, b1.

10.Построить доверительные интервалы для дисперсии случайной составляющейэконометрической модели.

11.Построить доверительную область для условного математического ожидания М(/>)( по оси Х откладыватьмесяцы январь — декабрь). Нанести границы этой области на диаграмму рассеяния.

12. Спомощью линейной парной регрессии сделать прогноз величины прибыли на ноябрь идекабрь месяц и нанести эти значения на диаграмму рассеяния. Сопоставить этизначения с границами доверительной области для условного математическогоожидания М(/>) исделать вывод о точности прогнозирования с помощью построенной регрессионноймодели.

Решение.

Используя исходныеданные, строим диаграмму рассеяния:

/>

Наоснове анализа диаграммы рассеяния убеждаемся в наличии тенденции увеличенияприбыли фирмы и выдвигаем гипотезу о линейном тренде.

Полагаем, что связь между факторами Х и У может бытьописана линейной функцией/>. Решение задачи нахождения коэффициентов b, b1 основывается на применении методанаименьших квадратов и сводится к решению системы двух линейныхуравнений с двумя неизвестными b, b1 :

bn + b1 Уxi = Уyi,

b0 Уxi + b1 Уxi2 = Уxiyi.


Составляем вспомогательную таблицу:

№ х y

x2

ху

y2

1 1 367 1 367 134689 2 2 418 4 836 174724 3 3 412 9 1236 169744 4 4 470 16 1880 220900 5 5 485 25 2425 235225 6 6 470 36 2820 220900 7 7 525 49 3675 275625 8 8 568 64 4544 322624 9 9 538 81 4842 289444 10 10 558 100 5580 311364 сумма 55 4811 385 28205 2355239

Для нашей задачи системаимеет вид:

/>

Решение этой системыможно получить по правилу Крамера:

/>

Получаем:

/>, />.

Таким образом, искомое уравнениерегрессии имеет вид:

y =364,8 + 21,145x.


4.   Нанесем график регрессии на диаграммурассеяния.

/>

5.        Вычислим значениястатистики F и коэффициента детерминации R2. Коэффициент детерминации рассчитаем по формуле R2 = rxy2= 0,9522 = 0,907. Проверим адекватность модели (уравнениярегрессии) в целом с помощью F-критерия. Рассчитаем значениестатистики F через коэффициент детерминации R2по формуле:

/>

Получаем: />. Зададим уровеньзначимости б =0,01, по таблице находим квантиль распределения Фишера F0,01;1;8 = 11,26, где 1 – число степенейсвободы.

Fфакт. > F0,01;1;8, т.к. 78,098 > 11,26.

Следовательно, делаем вывод означимости уравнения регрессии при 99% — м уровне значимости.

6.        Вычислимвыборочный коэффициент корреляции и проверим гипотезу о ненулевом его значении.

Рассчитаем выборочныйкоэффициент корреляции по формуле:


/>

Получаем:

/>

Проверка существенностиотличия коэффициента корреляции от нуля проводится по схеме: если />, то гипотеза осущественном отличии коэффициента корреляции от нуля принимается, в противномслучае отвергается.

Здесь t1-б/2,n-2 – квантиль распределения Стьюдента, б- уровень значимости или уровень доверия, n – число наблюдений, (n-2) – число степеней свободы. Значение б задается. Примем б =0,05, тогда t1-б/2,n-2 = t0,975,8 = 2,37. Получаем:

/>.

Следовательно,коэффициент корреляции существенно отличается от нуля и существует сильнаялинейная связь между х и у.

Сиспользованием табличного процессора Ехсеl проведем регрессионную статистику:

Выводитогов:

Регрессионная статистика Множественный R 0,952409 R-квадрат 0,907083 Нормированный R-квадрат 0,895468 Стандартная ошибка 21,7332 Наблюдения 10
Дисперсионный анализ /> df SS MS F Значимость F Регрессия 1 36888,245 36888,25 78,09816 2,119E-05 Остаток 8 3778,6545 472,3318 Итого 9 40666,9 /> /> /> /> Коэфф. Станд. ошибка t-статистика P-Значение Нижние 95% Верхние 95% Y-пересечение 364,8 14,846599 24,57128 8,04E-09 330,56368 399,0363 Переменная X 1 21,14545 2,3927462 8,837316 2,12E-05 15,627772 26,66314

Вычисленныезначения коэффициентов b, b1,<sub/>значения статистики F, коэффициента детерминации R2 выборочного коэффициента корреляции rxy совпадают с выделенными в таблице.

7.Оценка дисперсии случайной составляющей эконометрической модели вычисляется поформуле />.

Используярезультаты регрессионнойстатистики, получаем:

/>.

8. Проверим значимость вычисленных коэффициентов b, b1 по t-критерию Стьюдента. Дляэтого проверяем выполнение неравенств:

/> и />,

где

/>, />,/>, />.

Используемрезультаты регрессионнойстатистики:


Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Y-пересечение 364,8 14,846599 24,57128 8,04E-09 330,56368 399,0363 Переменная X 1 21,14545 2,3927462 8,837316 2,12E-05 15,627772 26,66314

Получаем: />; /> Примемб = 0,05, тогда t1-б/2,n-2 = t0,975,8 = 2,37.

Так как /> и />, делаем вывод о значимостикоэффициентов линейного уравнения регрессии.

9.Доверительные интервалы для коэффициентов b, b1 получаем с помощью результатов регрессионной статистики.

Доверительный интервал для коэффициента b0 уравнения регрессии:

/>

Доверительный интервал для коэффициента b1 уравнения регрессии:

/>

10.Построим доверительный интервал для дисперсии случайной составляющейэконометрической модели по формуле:

/>.

Примемб = 0,05, тогда по таблице для 10-элементной выборки q<sub/>= 0,65.

Получаем:


/>,

/>.

11.Построим доверительную область для условного математического ожидания М(/>).

Доверительные интервалы дляуравнения линейной регрессии: /> находятся по формуле:

/>

где /> соответственно верхняя инижняя границы доверительного интервала; />значениенезависимой переменной /> для которогоопределяется доверительный интервал, />квантильраспределения Стьюдента, />доверительнаявероятность, (n-2) – число степеней свободы;

/> />

Рассмотрим уравнение: y=364,8 + 21,145x. Пусть /> тогда />. Зная /> и />, заполним таблицу:

/>

/>

/>

/>

/>

/>

1 385,95 20,25 4,634 377,327 394,564 2 407,09 12,25 5,215 397,391 416,791 3 428,24 6,25 5,738 417,564 438,908 4 449,38 2,25 6,217 437,819 460,945 5 470,53 0,25 6,661 458,138 482,917 6 491,67 0,25 7,078 478,508 504,838 7 512,82 2,25 7,471 498,921 526,715 8 533,96 6,25 7,845 519,372 548,556 9 555,11 12,25 8,202 539,854 570,365 10 576,25 20,25 8,544 560,363 592,146 сумма 82,5 11 597,4 30,25 8,873 580,897 613,903 12 618,55 42,25 9,190 601,453 635,638

График уравнениярегрессии, доверительная полоса, диаграмма рассеяния:

/>

12. С помощью линейнойпарной регрессии сделаем прогноз величины прибыли на ноябрь и декабрь месяц:

/>597,4, />618,55.

Нанесем эти значения надиаграмму рассеяния.


/>

Этизначения сопоставимы с границами доверительной области для условногоматематического ожидания М(/>).

Точностьпрогнозирования: с вероятностью 0,95 прибыль в ноябре находится в интервале (487,292; 515,508); прибыль в декабре находится винтервале (497,152;526,376).

еще рефераты
Еще работы по экономико-математическому моделированию