Реферат: Парная регрессия

Смыслрегрессионного анализа – построение функциональных зависимостей между двумягруппами переменных величин Х1, Х2, … Хр и Y.При этом речь идет о влиянии переменных Х (это будут аргументы функций) назначения переменной Y (значение функции). Переменные Х мы будем называтьфакторами, а Y – откликом.

Наиболеепростой случай – установление зависимости одного отклика y от одного фактора х.Такой случай называется парной (простой) регрессией.

Парная регрессия – уравнениесвязи двух переменных у иx:

/>,

где у – зависимая переменная (результативный признак);

х – независимая, объясняющаяпеременная (признак-фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия:/>.

Нелинейные регрессии делятся надва класса: регрессии, нелинейные относительно включенных в анализ объясняющихпеременных, но линейные по оцениваемым параметрам, и регрессии, нелинейные пооцениваемым параметрам.

Регрессии, нелинейные по объясняющим переменным:

•        полиномы разных степеней />

•равносторонняя гипербола />

Регрессии, нелинейные по оцениваемым параметрам:

•     степенная />;

•     показательная />

•     экспоненциальная />

Построение уравнения регрессии сводится к оценке ее параметров.Для оценки параметров регрессий, линейных по параметрам, используют методнаименьших квадратов (МНК). МНК позволяет получить такие оценки параметров,при которых сумма квадратов отклонений фактических значений результативногопризнака у от теоретических />минимальна, т.е.

/>

Для линейных и нелинейных уравнений, приводимых к линейным,решается следующая система относительно а и b:

/>

Можно воспользоваться готовыми формулами, которые вытекают из этойсистемы:

/>

Тесноту связи изучаемых явлений оценивает линейный коэффициентпарной корреляции /> для линейной регрессии />

/>

и индекс корреляции /> — для нелинейной регрессии(/>):


/>

Оценку качества построенной модели даст коэффициент (индекс)детерминации, а также средняя ошибка аппроксимации.

Средняя ошибка аппроксимации – среднееотклонение расчетных значений от фактических:

/>

Допустимый предел значений /> – неболее 8 – 10%.

Средний коэффициент эластичности /> показывает, на сколько процентов всреднем по совокупности изменится результат у от своей средней величиныпри изменении фактора xна 1% от своего среднегозначения:

/>

Задача дисперсионного анализа состоит в анализе дисперсиизависимой переменной:

/>

где /> – общая сумма квадратов отклонений;

/> – сумма квадратов отклонений, обусловленнаярегрессией («объясненная» или «факторная»);

/> – остаточная сумма квадратов отклонений.

Долю дисперсии, объясняемую регрессией, в общей дисперсиирезультативного признака у характеризует коэффициент (индекс)детерминации R2:

 

/>

Коэффициент детерминации – квадрат коэффициента или индексакорреляции.

F-тест – оценивание качества уравнения регрессии – состоит в проверкегипотезы Ноо статистической незначимости уравнениярегрессии и показателя тесноты связи. Для этого выполняетсясравнение фактического Fфакт и критического (табличного)Fтаблзначений F-критерия Фишера. Fфактопределяется из соотношения значений факторной и остаточнойдисперсий, рассчитанных на одну степень свободы:

/>

 

п – число единиц совокупности;

т – число параметров припеременных х.

Fтабл – это максимально возможное значение критерия под влияниемслучайных факторов при данных степенях свободы и уровне значимости а. Уровеньзначимости а – вероятность отвергнуть правильную гипотезу при условии, что онаверна. Обычно а принимается равной 0,05 или 0,01.

Если Fтабл < Fфакт, то H0– гипотеза о случайнойприроде оцениваемых характеристик отклоняется и признается их статистическаязначимость и надежность. Если Fтабл> Fфакт, то гипотеза Н0не отклоняется и признаетсястатистическая незначимость, ненадежность уравнения регрессии.

Для оценки статистической значимости коэффициентов регрессии икорреляции рассчитываются t-критерий Стьюдента и доверительныеинтервалы каждого из показателей. Выдвигается гипотеза Н0ослучайной природе показателей, т.е. о незначимом их отличии от нуля. Оценказначимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента проводится путемсопоставления их значений с величиной случайной ошибки:

/>

 

Случайные ошибки параметровлинейной регрессии и коэффициента корреляции определяются по формулам:

/>

/>

/>

Сравнивая фактическое и критическое (табличное) значения t-статистики – tтабл и tфакт– принимаем или отвергаем гипотезу Hо.

Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством


/>

Если tтабл < tфакт, то Hо отклоняется, т.е. а, bи /> не случайно отличаются отнуля и сформировались под влиянием систематически действующего фактора х. Еслиtтабл > tфакт, то гипотеза Ноне отклоняется и признается случайная природа формирования a, bили />.

Для расчета доверительного интервала определяем предельнуюошибку ∆ для каждого показателя:

/>

Формулы для расчета доверительных интервалов имеютследующий вид:

/>/>

Если в границы доверительного интервала попадает ноль, т.е. нижняяграница отрицательна, а верхняя положительна, то оцениваемый параметрпринимается нулевым, так как он не может одновременно принимать иположительное, и отрицательное значения.

Прогнозное значение /> определяетсяпутем подстановки в уравнение регрессии /> соответствующего(прогнозного) значения />. Вычисляется средняя стандартнаяошибка прогноза />:

/> где />


и строится доверительный интервал прогноза:

/> где />

Задача:

По 22регионам страны изучается зависимость розничной продажи телевизоров, y от среднедушевых денежных доходов вмесяц, x (табл. 1):

№ региона X Y 1,000 2,800 28,000 2,000 2,400 21,300 3,000 2,100 21,000 4,000 2,600 23,300 5,000 1,700 15,800 6,000 2,500 21,900 7,000 2,400 20,000 8,000 2,600 22,000 9,000 2,800 23,900 10,000 2,600 26,000 11,000 2,600 24,600 12,000 2,500 21,000 13,000 2,900 27,000 14,000 2,600 21,000 15,000 2,200 24,000 16,000 2,600 34,000 17,000 3,300 31,900 19,000 3,900 33,000 20,000 4,600 35,400 21,000 3,700 34,000 22,000 3,400 31,000

Задание

1.               Постройте поле корреляции и сформулируйте гипотезу о форме связи.

2.               Рассчитайте параметры уравнений линейной, степенной,экспоненциальной, полулогарифмической, обратной, гиперболической парнойрегрессий.

3.               Оцените тесноту связи с помощью показателей корреляции идетерминации.

4.               С помощью среднего (общего) коэффициента эластичности дайтесравнительную оценку силы связи фактора с результатом.

5.               Качество уравнений оцените с помощью средней ошибки аппроксимации.

6.               С помощью F-критерия Фишера определите статистическую надежность результатоврегрессионного моделирования. Выберите лучшее уравнение регрессии и дайте егообоснование.

7.               Рассчитайте прогнозное значение результата по линейному уравнению регрессии,если прогнозное значение фактора увеличится на 7% от его среднего уровня.Определите доверительный интервал прогноза для уровня значимости α=0,05.

8.               Оцените полученные результаты, выводы оформите в аналитическойзаписке.

1. Поле корреляции для:

·       Линейной регрессии y=a+b*x:

·        

/>


Гипотеза оформе связи: чем больше размер среднедушевого денежного дохода в месяц(факторный признак), тем больше при прочих равных условиях розничная продажателевизоров (результативный признак). В данной модели параметр b называется коэффициентомрегрессии и показывает, насколько в среднем отклоняется величинарезультативного признака у при отклонении величины факторного признаках на однуединицу.

·       Степенной регрессии />:

 

/>

 

Гипотеза оформе связи: степенная функция имеетвид Y=axb.

Параметр bстепенного уравнения называется показателем эластичности и указывает, насколько процентов изменится у при возрастании х на 1%. При х = 1 a = Y.

·       Экспоненциальная регрессия />:


/>

 

·       Равносторонняя гипербола />:

/>

 

Гипотеза оформе связи: В ряде случаев обратнаясвязь между факторным и результативным признаками может быть выраженауравнением гиперболы: Y=a+b/x.

·       Обратная гипербола />:


/>

·       Полулогарифмическая регрессия />:

/>

 

2. Рассчитайтепараметры уравнений линейной, степенной, экспоненциальной, полулогарифмической,обратной, гиперболической парной регрессий.

·                  Рассчитаем параметры уравнений линейной парной регрессии. Длярасчета параметров a и b линейной регрессии y=a+b*x решаем систему нормальных уравнений относительно a и b:


/>

По исходнымданным рассчитываем ∑y, ∑x, ∑yx, ∑x2, ∑y2 (табл. 2):

№ региона X Y XY X^2 Y^2 Y^cp Y-Y^cp Ai 1 2,800 28,000 78,400 7,840 784,000 25,719 2,281 0,081 2 2,400 21,300 51,120 5,760 453,690 22,870 -1,570 0,074 3 2,100 21,000 44,100 4,410 441,000 20,734 0,266 0,013 4 2,600 23,300 60,580 6,760 542,890 24,295 -0,995 0,043 5 1,700 15,800 26,860 2,890 249,640 17,885 -2,085 0,132 6 2,500 21,900 54,750 6,250 479,610 23,582 -1,682 0,077 7 2,400 20,000 48,000 5,760 400,000 22,870 -2,870 0,144 8 2,600 22,000 57,200 6,760 484,000 24,295 -2,295 0,104 9 2,800 23,900 66,920 7,840 571,210 25,719 -1,819 0,076 10 2,600 26,000 67,600 6,760 676,000 24,295 1,705 0,066 11 2,600 24,600 63,960 6,760 605,160 24,295 0,305 0,012 12 2,500 21,000 52,500 6,250 441,000 23,582 -2,582 0,123 13 2,900 27,000 78,300 8,410 729,000 26,431 0,569 0,021 14 2,600 21,000 54,600 6,760 441,000 24,295 -3,295 0,157 15 2,200 24,000 52,800 4,840 576,000 21,446 2,554 0,106 16 2,600 34,000 88,400 6,760 1156,000 24,295 9,705 0,285 17 3,300 31,900 105,270 10,890 1017,610 29,280 2,620 0,082 19 3,900 33,000 128,700 15,210 1089,000 33,553 -0,553 0,017 20 4,600 35,400 162,840 21,160 1253,160 38,539 -3,139 0,089 21 3,700 34,000 125,800 13,690 1156,000 32,129 1,871 0,055 22 3,400 31,000 105,400 11,560 961,000 29,992 1,008 0,033 Итого 58,800 540,100 1574,100 173,320 14506,970 540,100 0,000 сред значение 2,800 25,719 74,957 8,253 690,808 0,085 станд. откл 0,643 5,417

Системанормальных уравнений составит:

/>

/>

/>

/>Ур-ие регрессии: = 5,777+7,122∙x. Данное уравнение показывает, что сувеличением среднедушевого денежного дохода в месяцна 1 тыс. руб. доля розничных продаж телевизоров повышается в среднем на 7,12%.

·                  Рассчитаем параметры уравнений степенной парной регрессии.Построению степенной модели /> предшествует процедуралинеаризации переменных. В примере линеаризация производится путемлогарифмирования обеих частей уравнения:

/> где />

Для расчетов используем данные табл. 3:

№ рег X Y XY X^2 Y^2 Yp^cp y^cp 1 1,030 3,332 3,431 1,060 11,104 3,245 25,67072 2 0,875 3,059 2,678 0,766 9,356 3,116 22,56102 3 0,742 3,045 2,259 0,550 9,269 3,004 20,17348 4 0,956 3,148 3,008 0,913 9,913 3,183 24,12559 5 0,531 2,760 1,465 0,282 7,618 2,827 16,90081 6 0,916 3,086 2,828 0,840 9,526 3,150 23,34585 7 0,875 2,996 2,623 0,766 8,974 3,116 22,56102 8 0,956 3,091 2,954 0,913 9,555 3,183 24,12559 9 1,030 3,174 3,268 1,060 10,074 3,245 25,67072 10 0,956 3,258 3,113 0,913 10,615 3,183 24,12559 11 0,956 3,203 3,060 0,913 10,258 3,183 24,12559 12 0,916 3,045 2,790 0,840 9,269 3,150 23,34585 13 1,065 3,296 3,509 1,134 10,863 3,275 26,4365 14 0,956 3,045 2,909 0,913 9,269 3,183 24,12559 15 0,788 3,178 2,506 0,622 10,100 3,043 20,97512 16 0,956 3,526 3,369 0,913 12,435 3,183 24,12559 17 1,194 3,463 4,134 1,425 11,990 3,383 29,4585 19 1,361 3,497 4,759 1,852 12,226 3,523 33,88317 20 1,526 3,567 5,443 2,329 12,721 3,661 38,90802 21 1,308 3,526 4,614 1,712 12,435 3,479 32,42145 22 1,224 3,434 4,202 1,498 11,792 3,408 30,20445 итого 21,115 67,727 68,921 22,214 219,361 67,727 537,270 сред зн 1,005 3,225 3,282 1,058 10,446 3,225 стан откл 0,216 0,211

Рассчитаем Си b:

/>

/>

Получим линейное уравнение: />. Выполнивего потенцирование, получим: />

Подставляяв данное уравнение фактические значения х, получаем теоретическиезначения результата y.

·                  Рассчитаем параметры уравнений экспоненциальной парной регрессии.Построению экспоненциальной модели /> предшествует процедуралинеаризации переменных. В примере линеаризация производится путемлогарифмирования обеих частей уравнения:

/> где />

Для расчетов используем данные табл. 4:


№ региона X Y XY X^2 Y^2 Yp y^cp 1 2,800 3,332 9,330 7,840 11,104 3,225 25,156 2 2,400 3,059 7,341 5,760 9,356 3,116 22,552 3 2,100 3,045 6,393 4,410 9,269 3,034 20,777 4 2,600 3,148 8,186 6,760 9,913 3,170 23,818 5 1,700 2,760 4,692 2,890 7,618 2,925 18,625 6 2,500 3,086 7,716 6,250 9,526 3,143 23,176 7 2,400 2,996 7,190 5,760 8,974 3,116 22,552 8 2,600 3,091 8,037 6,760 9,555 3,170 23,818 9 2,800 3,174 8,887 7,840 10,074 3,225 25,156 10 2,600 3,258 8,471 6,760 10,615 3,170 23,818 11 2,600 3,203 8,327 6,760 10,258 3,170 23,818 12 2,500 3,045 7,611 6,250 9,269 3,143 23,176 13 2,900 3,296 9,558 8,410 10,863 3,252 25,853 14 2,600 3,045 7,916 6,760 9,269 3,170 23,818 15 2,200 3,178 6,992 4,840 10,100 3,061 21,352 16 2,600 3,526 9,169 6,760 12,435 3,170 23,818 17 3,300 3,463 11,427 10,890 11,990 3,362 28,839 19 3,900 3,497 13,636 15,210 12,226 3,526 33,978 20 4,600 3,567 16,407 21,160 12,721 3,717 41,140 21 3,700 3,526 13,048 13,690 12,435 3,471 32,170 22 3,400 3,434 11,676 11,560 11,792 3,389 29,638 Итого 58,800 67,727 192,008 173,320 219,361 67,727 537,053 сред зн 2,800 3,225 9,143 8,253 10,446 стан откл 0,643 0,211

РассчитаемС и b:

/>

/>

Получим линейное уравнение: />. Выполнивего потенцирование, получим: />

Для расчетатеоретических значений y подставим в уравнение /> значения x.

·                  Рассчитаем параметры уравнений полулогарифмической парнойрегрессии. Построению полулогарифмической модели /> предшествуетпроцедура линеаризации переменных. В примере линеаризация производится путемзамены:

/> где />

Для расчетов используем данные табл. 5:

№ региона X Y XY X^2 Y^2 y^cp 1 1,030 28,000 28,829 1,060 784,000 26,238 2 0,875 21,300 18,647 0,766 453,690 22,928 3 0,742 21,000 15,581 0,550 441,000 20,062 4 0,956 23,300 22,263 0,913 542,890 24,647 5 0,531 15,800 8,384 0,282 249,640 15,525 6 0,916 21,900 20,067 0,840 479,610 23,805 7 0,875 20,000 17,509 0,766 400,000 22,928 8 0,956 22,000 21,021 0,913 484,000 24,647 9 1,030 23,900 24,608 1,060 571,210 26,238 10 0,956 26,000 24,843 0,913 676,000 24,647 11 0,956 24,600 23,506 0,913 605,160 24,647 12 0,916 21,000 19,242 0,840 441,000 23,805 13 1,065 27,000 28,747 1,134 729,000 26,991 14 0,956 21,000 20,066 0,913 441,000 24,647 15 0,788 24,000 18,923 0,622 576,000 21,060 16 0,956 34,000 32,487 0,913 1156,000 24,647 17 1,194 31,900 38,086 1,425 1017,610 29,765 19 1,361 33,000 44,912 1,852 1089,000 33,351 20 1,526 35,400 54,022 2,329 1253,160 36,895 21 1,308 34,000 44,483 1,712 1156,000 32,221 22 1,224 31,000 37,937 1,498 961,000 30,406 Итого 21,115 540,100 564,166 22,214 14506,970 540,100 сред зн 1,005 25,719 26,865 1,058 690,808 стан откл 0,216 5,417

Рассчитаем a и b:

/>

/>

Получим линейное уравнение: />.

·                  Рассчитаем параметры уравнений обратной парной регрессии. Дляоценки параметров приведем обратную модель /> клинейному виду, заменив />, тогда />

Для расчетов используем данные табл. 6:

№ региона X Y XY X^2 Y^2 Y^cp 1 2,800 0,036 0,100 7,840 0,001 24,605 2 2,400 0,047 0,113 5,760 0,002 22,230 3 2,100 0,048 0,100 4,410 0,002 20,729 4 2,600 0,043 0,112 6,760 0,002 23,357 5 1,700 0,063 0,108 2,890 0,004 19,017 6 2,500 0,046 0,114 6,250 0,002 22,780 7 2,400 0,050 0,120 5,760 0,003 22,230 8 2,600 0,045 0,118 6,760 0,002 23,357 9 2,800 0,042 0,117 7,840 0,002 24,605 10 2,600 0,038 0,100 6,760 0,001 23,357 11 2,600 0,041 0,106 6,760 0,002 23,357 12 2,500 0,048 0,119 6,250 0,002 22,780 13 2,900 0,037 0,107 8,410 0,001 25,280 14 2,600 0,048 0,124 6,760 0,002 23,357 15 2,200 0,042 0,092 4,840 0,002 21,206 16 2,600 0,029 0,076 6,760 0,001 23,357 17 3,300 0,031 0,103 10,890 0,001 28,398 19 3,900 0,030 0,118 15,210 0,001 34,844 20 4,600 0,028 0,130 21,160 0,001 47,393 21 3,700 0,029 0,109 13,690 0,001 32,393 22 3,400 0,032 0,110 11,560 0,001 29,301 Итого 58,800 0,853 2,296 173,320 0,036 537,933 сред знач 2,800 0,041 0,109 8,253 0,002 стан отклон 0,643 0,009

Рассчитаем a и b:

/>

/>

Получим линейное уравнение: />. Выполнивего потенцирование, получим: />

Для расчетатеоретических значений y подставим в уравнение /> значенияx.

·                  Рассчитаем параметры уравнений равносторонней гиперболы парнойрегрессии. Для оценки параметров приведем модель равносторонней гиперболы /> к линейному виду, заменив />, тогда />

Для расчетов используем данные табл. 7:

№ региона X=1/z Y XY X^2 Y^2 Y^cp 1 0,357 28,000 10,000 0,128 784,000 26,715 2 0,417 21,300 8,875 0,174 453,690 23,259 3 0,476 21,000 10,000 0,227 441,000 19,804 4 0,385 23,300 8,962 0,148 542,890 25,120 5 0,588 15,800 9,294 0,346 249,640 13,298 6 0,400 21,900 8,760 0,160 479,610 24,227 7 0,417 20,000 8,333 0,174 400,000 23,259 8 0,385 22,000 8,462 0,148 484,000 25,120 9 0,357 23,900 8,536 0,128 571,210 26,715 10 0,385 26,000 10,000 0,148 676,000 25,120 11 0,385 24,600 9,462 0,148 605,160 25,120 12 0,400 21,000 8,400 0,160 441,000 24,227 13 0,345 27,000 9,310 0,119 729,000 27,430 14 0,385 21,000 8,077 0,148 441,000 25,120 15 0,455 24,000 10,909 0,207 576,000 21,060 16 0,385 34,000 13,077 0,148 1156,000 25,120 17 0,303 31,900 9,667 0,092 1017,610 29,857 19 0,256 33,000 8,462 0,066 1089,000 32,564 20 0,217 35,400 7,696 0,047 1253,160 34,829 21 0,270 34,000 9,189 0,073 1156,000 31,759 22 0,294 31,000 9,118 0,087 961,000 30,374 Итого 7,860 540,100 194,587 3,073 14506,970 540,100 сред знач 0,374 25,719 9,266 0,146 1318,815 стан отклон 0,079 25,639

Рассчитаем a и b:

/>

/>

Получим линейное уравнение: />. Получимуравнение регрессии: />.

3. Оценкатесноты связи с помощью показателей корреляции и детерминации:

·                  Линейная модель. Тесноту линейной связи оценит коэффициенткорреляции. Был получен следующий коэффициент корреляции rxy=b/>=7,122*/>, что говорит о прямой сильной связи фактораи результата. Коэффициент детерминации r²xy=(0,845)²=0,715. Этоозначает, что 71,5% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариациейфактора х – среднедушевой денежный доход в месяц.

·                  Степенная модель. Тесноту нелинейной связи оценит индекскорреляции. Был получен следующий индекс корреляции />=/>, что говорит о очень сильной тесной связи, но немного больше чемв линейной модели. Коэффициент детерминации r²xy=0,7175. Это означает, что 71,75%вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход вмесяц.

·                  Экспоненциальная модель. Был получен следующий индекс корреляции ρxy=0,8124, что говорит о том,что связь прямая и очень сильная, но немного слабее, чем в линейной и степенноймоделях. Коэффициент детерминации r²xy=0,66. Это означает, что 66% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариациейфактора х – среднедушевой денежный доход в месяц.

·                  Полулогарифмическая модель. Был получен следующий индекскорреляции ρxy=0,8578, что говорит о том, что связь прямая и очень сильная, нонемного больше чем в предыдущих моделях. Коэффициент детерминации r²xy=0,7358. Это означает, что 73,58%вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход вмесяц.

·                  Гиперболическая модель. Был получен следующий индекс корреляции ρxy=0,8448 и коэффициенткорреляции rxy=-0,1784 что говорит о том, что связь обратная очень сильная.Коэффициент детерминации r²xy=0,7358. Это означает, что 73,5% вариации результативного признака(розничнаяпродажа телевизоров, у) объясняется вариациейфактора х – среднедушевой денежный доход в месяц.

·                  Обратная модель. Был получен следующий индекс корреляции ρxy=0,8114 и коэффициенткорреляции rxy=-0,8120, что говорит о том, что связь обратная очень сильная.Коэффициент детерминации r²xy=0,6584. Это означает, что 65,84% вариации результативногопризнака (розничнаяпродажа телевизоров, у) объясняется вариациейфактора х – среднедушевой денежный доход в месяц.

Вывод: по полулогарифмическомууравнению получена наибольшая оценка тесноты связи: ρxy=0,8578 (по сравнению слинейной, степенной, экспоненциальной,гиперболической, обратной регрессиями).

4. Спомощью среднего (общего) коэффициента эластичности дайте сравнительную оценкусилы связи фактора с результатом.

Рассчитаемкоэффициент эластичности для линейной модели:

·                  Для уравнения прямой: y = 5,777+7,122∙x

/>

·                  Для уравнения степенной модели />:

/>

·                  Для уравнения экспоненциальной модели/>:

/>


Дляуравнения полулогарифмической модели />:

/>

·                  Для уравнения обратнойгиперболической модели />:

/>

·                  Для уравнения равностороннейгиперболической модели />:

/>

Сравнивая значения />, характеризуем оценку силы связи фактора срезультатом:

·                  />

·                  />

·                  />

·                  />

·                  />

·                  />

Известно, что коэффициент эластичности показывает связь междуфактором и результатом, т.е. на сколько% изменится результат y от своей средней величиныпри изменении фактора х на 1% от своего среднего значения. В данномпримере получилось, что самая большая сила связи между фактором и результатом в полулогарифмической модели, слабая сила связи в обратнойгиперболической модели.

5. Оценкакачества уравнений с помощью средней ошибки аппроксимации.

Подставляя в уравнение регрессии фактические значения х, определимтеоретические (расчетные) значения />. Найдем величинусредней ошибки аппроксимации />:

/>

В среднем расчетные значения отклоняются от фактических на:

·                  Линейная регрессия. /> =/> *100%= 8,5%, что говорит о повышенной ошибке аппроксимации, но вдопустимых пределах.

Качество построенной модели оценивается как хорошее, так как /> не превышает 8 -10%.

·                  Степенная регрессия. />=/>*100%= 8,2%, что говорит о повышенной ошибке аппроксимации, но вдопустимых пределах.

Качество построенной модели оценивается как хорошее, так как /> не превышает 8 -10%.

·                  Экспоненциальная регрессия. />=/>*100%= 9%, что говорит о повышенной ошибке аппроксимации, но вдопустимых пределах.

Качество построенной модели оценивается как хорошее, так как /> не превышает 8 -10%.

·                  Полулогарифмическая регрессия. />=/>*100%= 7,9 что говорит о повышенной ошибке аппроксимации, но вдопустимых пределах.

Качество построенной модели оценивается как хорошее, так как /> не превышает 8 -10%.

·                  Гиперболическая регрессия. />=/>*100%= 9,3 что говорит о повышенной ошибке аппроксимации, но вдопустимых пределах.

Качество построенной модели оценивается как хорошее, так как /> не превышает 8 -10%.

·                  Обратная регрессия. />=/>*100%= 9,9 3 что говорит о повышенной ошибке аппроксимации, но вдопустимых пределах.

Качество построенной модели оценивается как хорошее, так как /> не превышает 8 -10%.

6. Рассчитаем F-критерий:

/>

·                  Линейная регрессия. />= />*19= 47,579

где />=4,38< />

·                  Степенная регрессия. /> =/>*19= 48,257


где />=4,38< />

 

·                  Экспоненциальная регрессия. />=/>*19= 36,878

где />=4,38< />

 

·                  Полулогарифмическая регрессия. />=/>*19= 52,9232

где />=4,38< />

·                  Гиперболическая регрессия. /> =/>*19= 47,357

где />=4,38< />

 

·                  Обратная регрессия. />=/>*19= 36,627

где />=4,38< />

Для всех регрессий/>=4,38< />, из чегоследует, что уравнения регрессии статистически значимы.

Вывод:/> остаетсяна допустимом уровне для всех уравнений регрессий.


А R^2 Fфакт Линейная модель 8,5 0,714 47,500 Степенная модель 8,2 0,718 48,250 Полулогарифмическая модель 7,9 0,736 52,920 Экспоненциальная модель 9,0 0,660 36,870 Равносторонняя гипербола 9,3 0,714 47,350 Обратная гипербола 9,9 0,453 15,700

Все уравнения регрессии достаточно хорошо описывают исходныеданные. Некоторое предпочтение можно отдать полулогарифмической функции, длякоторой значение R^2 наибольшее, а ошибка аппроксимации – наименьшая

7. Рассчитаем прогнозное значение результата по линейномууравнению регрессии, если прогнозное значение фактора увеличится на 7% от егосреднего уровня. Определим доверительный интервал прогноза для уровнязначимости α=0,05:

Прогнозное значение /> определяется путем подстановки в уравнение регрессии /> соответствующего (прогнозного) значения />.
/> 5,777+7,122*2,996=27,114

где />= />=2,8*1,07=2,996

Средняя стандартная ошибка прогноза />:

/>=/>=3,12

где />=/> =0,697886


Предельная ошибка прогноза:

/>/>/>

Доверительный интервал прогноза

/> где />

/>=27,11/>6,53;

/>

/>27,11–6,53 = 20,58

27,11+6,53 = 33,64

Выполненный прогноз среднедушевыхденежных доходов в месяц, xоказался надежным (р = 1 – α= 1 – 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границдоверительного интервала /> составляет 2,09 раза:

/>=/> =/> =1,63

еще рефераты
Еще работы по экономико-математическому моделированию