Реферат: Корреляционно-регрессионный анализ взаимосвязи производственных показателей предприятия организ

--PAGE_BREAK--xфакторов, которая характеризует отклонение эмпирических (фактических) значений результативного признака yiот их выровненных значений yxi.

Соотношение между факторной и общей дисперсиями характеризует меру тесноты связи между признаками xи y

<img width=«65» height=«51» src=«ref-2_457790962-364.coolpic» v:shapes="_x0000_i1030">                                           (3)

Этот показатель называется индексом детерминации (причинности). Он выражает долю факторной дисперсии, т.е. характеризует, какая часть общей вариации результативного признака yобъясняется изменением факторного признака x. На основе предыдущей формулы определяется индекс корреляции R:

<img width=«89» height=«72» src=«ref-2_457791326-501.coolpic» v:shapes="_x0000_i1031">                                                (4)

Используя правило сложения дисперсий, можно вычислить индекс корреляции.

<img width=«175» height=«57» src=«ref-2_457791827-744.coolpic» v:shapes="_x0000_i1032">                           (5)

При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:

<img width=«276» height=«116» src=«ref-2_457792571-1643.coolpic» v:shapes="_x0000_i1033">                                     (6)

Для оценки значимости коэффициента корреляции rприменяется t-критерий Стьюдента с учетом заданного уровня значимости <img width=«19» height=«17» src=«ref-2_457794214-182.coolpic» v:shapes="_x0000_i1034"> и числа степеней свободы k.

Если <img width=«48» height=«31» src=«ref-2_457794396-147.coolpic» v:shapes="_x0000_i1035">, то величина коэффициента корреляции признается существенной.

Для оценки значимости индекса корреляции Rприменяется F-критерий Фишера. Фактическое значение критерия FRопределяется по формуле:

<img width=«139» height=«48» src=«ref-2_457794543-503.coolpic» v:shapes="_x0000_i1036">,                                              (7)

 где m– число параметров уравнения регрессии.

Величина FRсравнивается с критическим значением FK, которое определяется по таблице F– критерия с учетом принятого уровня значимости <img width=«19» height=«17» src=«ref-2_457794214-182.coolpic» v:shapes="_x0000_i1037"> и числа степеней свободы k1=m-1и k2=n-m.

Если FR> FK, то величина индекса корреляции признается существенной.

По степени тесноты связи различают количественные критерии оценки тесноты связи.

Таблица Чэддока





С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности:

<img width=«88» height=«63» src=«ref-2_457795228-280.coolpic» v:shapes="_x0000_i1038">                                                                        (8)

Он показывает, насколько процентов в среднем изменится значение результативного признака при изменении факторного на 1%.


4.     Пример для теоретической части
Имеются следующие данные о производстве молочной продукции и стоимости основных производственных фондов по 15 предприятиям Московской области. Произведем синтез адекватной экономико-математической модели между изучаемыми признаками на базе метода наименьших квадратов. С экономической точки зрения сформулируем выводы относительно исследуемой связи.

Зависимость yот xнайдем с помощью корреляционно-регрессионного анализа. Рассмотрим прямолинейную форму зависимости yот x: <img width=«99» height=«25» src=«ref-2_457788424-210.coolpic» v:shapes="_x0000_i1039">





Параметры этого уравнения найдем с помощью метода наименьших квадратов и, произведя предварительные расчеты, получим:

<img width=«543» height=«67» src=«ref-2_457795718-2907.coolpic» v:shapes="_x0000_i1040">

<img width=«467» height=«60» src=«ref-2_457798625-2514.coolpic» v:shapes="_x0000_i1041">

Получаем следующее уравнение регрессии:

<img width=«156» height=«25» src=«ref-2_457801139-548.coolpic» v:shapes="_x0000_i1042">

Далее определим адекватность полученной модели. Определим фактические значения t-критерия для aи a1.

для параметра a0:

<img width=«131» height=«61» src=«ref-2_457801687-526.coolpic» v:shapes="_x0000_i1043">

для параметра a1:         

<img width=«157» height=«61» src=«ref-2_457802213-595.coolpic» v:shapes="_x0000_i1044"> 

где στ – среднее квадратическое отклонение результативного признака  от выровненных значений ŷ ;

      σх – среднее квадратическое отклонение факторного признака x от

общей средней <img width=«17» height=«22» src=«ref-2_457802808-95.coolpic» v:shapes="_x0000_i1045">.                

<img width=«295» height=«151» src=«ref-2_457802903-2532.coolpic» v:shapes="_x0000_i1046">

Данные подставляем  в формулы и получаем:

<img width=«329» height=«61» src=«ref-2_457805435-1288.coolpic» v:shapes="_x0000_i1047">

<img width=«392» height=«61» src=«ref-2_457806723-1431.coolpic» v:shapes="_x0000_i1048">

По таблице распределения Стьюдента я нахожу критическое значение t-критерия для  ν= 15-2 = 13. Вероятность α я принимаю 0,05. tтабл равно 2,1604. Так как, оба значения ta0 и ta1 больше tтабл, то оба параметра а0 и а1 признаются значимыми и отклоняется гипотеза о том, что каждый из этих параметров в действительности равен 0, и лишь в силу случайных обстоятельств оказался равным проверяемой величине.

Из полученного уравнения следует, что с увеличением основных производственных фондов на 1 млн. руб., стоимость молочной продукции возрастает в среднем на 1,311 млн. руб.
II. 
Расчетная часть

Имеются исходные выборочные данные по организациям одной из отраслей хозяйствования в отчетном году (выборка 20%-ная, бесповторная) о результатах производственной деятельности организаций:












Задание 1.
По исходным данным табл. Исходные данные:

1.     Построить статистический ряд распределения организаций по     продолжение
--PAGE_BREAK--уровню производительности труда, образовав, пять групп с равными интервалами.

2.     Постройте графики полученного ряда распределения.

3.     Рассчитайте характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.


4.     Вычислите среднюю арифметическую по исходным данным (табл. Х), сравните её с аналогичным показателем, рассчитанным в п. 3 настоящего задания. Объясните причину их расхождения.

Сделайте выводы по результатам выполнения Задания.
Выполнение Задания 1.

1. Решение:

Для построения интервального ряда распределения определяем величину интервала hпо формуле:

<img width=«135» height=«49» src=«ref-2_457808154-510.coolpic» v:shapes="_x0000_i1049">,                                              (1)

где <img width=«132» height=«33» src=«ref-2_457808664-330.coolpic» v:shapes="_x0000_i1050">– наибольшее и наименьшее значения признака в исследуемой совокупности,kчисло групп интервального ряда.

При заданных k= 5,  xmax= 360тыс.руб./чел  и xmin= 120 тыс.руб./чел

<img width=«12» height=«23» src=«ref-2_457808994-73.coolpic» v:shapes="_x0000_i1051"><img width=«295» height=«57» src=«ref-2_457809067-1457.coolpic» v:shapes="_x0000_i1052">

При h= 48 тыс. руб./чел  границы интервалов ряда распределения имеют следующий вид (табл. 1):




Определяем количество организаций, входящих в каждую группу, используя принцип полуоткрытого интервала [ ), согласно которому организации со значениями признаков, служащие одновременно верхними и нижними границами смежных интервалов (168, 216, 264, 312 и 360), будем относить ко второму из смежных интервалов.
Для определения числа организаций в каждой группе строим таблицу 2.



На основе групповых итоговых строк «Всего» табл. 2 формируем итоговую таблицу 3, представляющую интервальный ряд распределения организаций по уровню производительности труда.





Приведем еще три характеристики полученного ряда распределения — частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1)интервалов, и накопленные частости, рассчитываемые по формуле

<img width=«89» height=«85» src=«ref-2_457810524-663.coolpic» v:shapes="_x0000_i1053">.                                               (2)

Вывод.Анализ интервального ряда распределения изучаемой совокупности организаций показывает, что распределение организаций по уровню производительности труда не является равномерным: преобладают организации с уровнем производительности труда от 216 до 264 тыс.руб./чел (это 12 организаций, доля которых составляет 40%); самая малочисленная группа организаций имеет уровень производительности труда от 120 до 168 тыс. руб./чел, которая включает 3 организации, что составляет 10% от общего числа организаций.

2. Решение:

По данным таблицы 3 (графы 2 и 3) строим график распределения организаций по уровню производительности труда.
<img width=«500» height=«321» src=«ref-2_457811187-6024.coolpic» v:shapes="_x0000_i1054">    продолжение
--PAGE_BREAK--

Рис. 1. График полученного ряда распределения

Мода (Мо) – значение случайной величины, встречающееся с наибольшей вероятностью в дискретном вариационном ряду – вариант, имеющий наибольшую частоту. Наибольшей частотой является число 12. Этой частоте соответствует модальное значение признака, т.е. количество предприятий. Мода свидетельствует, что в данном примере чаще всего встречаются группы предприятий, входящие в интервал от 216 до 264.

В интервальных рядах распределения с равными интервалами мода вычисляется по формуле:

<img width=«360» height=«60» src=«ref-2_457817211-1454.coolpic» v:shapes="_x0000_i1055">                                         (3)

где хМo– нижняя граница модального интервала,

h– величина модального интервала,

fMo– частота модального интервала,

fMo-1– частота интервала, предшествующего модальному,

fMo+1– частота интервала, следующего за модальным.

<img width=«546» height=«53» src=«ref-2_457818665-1825.coolpic» v:shapes="_x0000_i1056">

Вывод.В данном случае наибольший процент предприятий по уровню производительности труда приходится на интервал от 216 до 264, а само значение средней характеризуется 246 (тыс.руб./чел)

Медиана (Ме) – это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы. Чтобы найти медианы, необходимо отыскать значение признака, которое находится в середине упорядоченного ряда.

<img width=«466» height=«340» src=«ref-2_457820490-9695.coolpic» v:shapes=«Диаграмма_x0020_3»>
Определяем медианный интервал, используя графу 5 табл. 4. Медианным интервалом является интервал 216-264 тыс.руб./чел, т.к. именно в этом интервале накопленная частота Sj=19впервые превышает  полу-сумму всех частот <img width=«121» height=«82» src=«ref-2_457830185-500.coolpic» v:shapes="_x0000_i1058">.

В интервальных рядах распределения медианное значение (поскольку оно делит всю совокупность на две равные по численности ряды) оказывается в каком-то из интервалов признака х. Этот интервал характерен тем, что его кумулятивная частота (накопленная сумма частот) равна или превышает полу-сумму всех частот ряда. Значение медианы вычисляется линейной интерполяцией по формуле:

<img width=«488» height=«108» src=«ref-2_457830685-2025.coolpic» v:shapes="_x0000_i1059">               (4)
Вывод:Полученный результат говорит о том, что из 30 организаций половина организаций имеют уровень производительности труда менее 248 тыс. руб./чел, а вторая свыше.
3. Решение:

Для расчета характеристик ряда распределения <img width=«17» height=«25» src=«ref-2_457832710-175.coolpic» v:shapes="_x0000_i1060">, σ, σ2, на основе табл. 4 строим вспомогательную таблицу 5 (xj– середина интервала).





Средняя арифметическая взвешенная– средняя сгруппированных величин x1, x2, …, xn– вычисляется по формуле:

<img width=«330» height=«112» src=«ref-2_457834001-1585.coolpic» v:shapes="_x0000_i1065">                                               (5)


Среднее квадратическое отклонение– это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные варианты от среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

Рассчитаем среднее квадратическое отклонение, которое равно корню квадратному из дисперсии:

<img width=«376» height=«97» src=«ref-2_457835586-1964.coolpic» v:shapes="_x0000_i1066">                                         (6)

Рассчитаем дисперсию:

σ2 = 54,14052=2931,2

Коэффициент вариации представляет собой выраженное в процентах отношение средне квадратического отклонения к средней арифметической.

Рассчитаем коэффициент вариации:

<img width=«318» height=«42» src=«ref-2_457837550-1575.coolpic» v:shapes="_x0000_i1067">                                            (7)

Вывод. Анализ полученных значений показателей <img width=«17» height=«25» src=«ref-2_457832710-175.coolpic» v:shapes="_x0000_i1068"> и σ говорит о том, что средняя величина уровня производительности труда составляет 248 тыс.руб./чел отклонение от этой величины в ту или иную сторону составляет 54,1405 (или 21,83%), наиболее характерный уровень производительности труда находится в пределах от 194 до 302 тыс.руб./чел (диапазон <img width=«49» height=«19» src=«ref-2_457839300-231.coolpic» v:shapes="_x0000_i1069">).

Значение = 21,83% не превышает 33%, следовательно, вариация уровня производительности труда в исследуемой совокупности организаций незначительна и совокупность по данному признаку однородна. Расхождение между значениями незначительно (<img width=«17» height=«25» src=«ref-2_457832710-175.coolpic» v:shapes="_x0000_i1070">=248 тыс.руб./чел, Мо=246 тыс.руб./чел, Ме=248 тыс. руб./чел), что подтверждает вывод об однородности совокупности организаций. Таким образом, найденное среднее значение уровня типичной производительности является типичной, надежной характеристикой исследуемой совокупности организаций.

4. Решение:

Для расчета средней арифметической по исходным данным по уровню производительности труда применяется формула средней арифметической простой:

<img width=«315» height=«105» src=«ref-2_457839706-1258.coolpic» v:shapes="_x0000_i1071">,                                                 (8)

Причина расхождения средних величин, рассчитанных по исходным данным (247 тыс.руб./чел) и по интервальному ряду распределения (248 тыс.руб./чел), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти организаций, а во втором случае в качестве значений признака берутся середины интервалов хjи, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают, что говорит о достаточно равномерном распределении уровня производительности труда внутри каждой группы интервального ряда.
Задание 2.

По исходным данным табл. Исходные данные с использованием результатов выполнения Задания 1 необходимо выполнить следующее:

1. Установить наличие и характер корреляционной связи между признаками фондоотдача и уровень производительности труда, образовав пять групп с равными интервалами по каждому из признаков, используя метод аналитической группировки;

2. Измерить тесноту корреляционной связи, между фондоотдачей и уровнем производительности труда с использованием коэффициента детерминации и эмпирического корреляционного отношения.

3. Оценка значимости (неслучайности) полученных характеристик

связи признаков <img width=«26» height=«30» src=«ref-2_457840964-151.coolpic» v:shapes="_x0000_i1072"> и  <img width=«21» height=«23» src=«ref-2_457841115-124.coolpic» v:shapes="_x0000_i1073">

Сделать выводы.

Выполнение Задания 2:

По условию Задания 2 факторным является признак Фондоотдача, результативным – признак Уровень производительности труда.

1. Решение:

Аналитическая группировка строится по факторному признаку Х и для каждой j-ой группы ряда определяется средне групповое значение <img width=«22» height=«33» src=«ref-2_457841239-193.coolpic» v:shapes="_x0000_i1074"> результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения <img width=«26» height=«38» src=«ref-2_457841432-214.coolpic» v:shapes="_x0000_i1075"> систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную таблицу 2, строим вспомогательную таблицу 6 для проведения в дальнейшем аналитической группировки.



Используя таблицу 6, строим аналитическую группировку, характеризующую зависимость между факторным признаком     продолжение
--PAGE_BREAK--ХФондоотдача
и результативным признаком YУровень производительности труда.
Групповые средние значения yj получаем из таблицы 6 (графа 5), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 7.:



Вывод.Анализ данных табл. 7 показывает, что с увеличением фондоотдачи от группы к группе систематически возрастает и средний уровень производительности труда по каждой группе организаций, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.







2. Решение:

Коэффициент детерминации <img width=«25» height=«32» src=«ref-2_457841646-216.coolpic» v:shapes="_x0000_i1076"> характеризует силу влияния факторного (группировочного) признака Х на результативный признак Yи рассчитывается как доля межгрупповой дисперсии <img width=«23» height=«25» src=«ref-2_457841862-114.coolpic» v:shapes="_x0000_i1077"> признака Yв его общей дисперсии<img width=«24» height=«25» src=«ref-2_457841976-114.coolpic» v:shapes="_x0000_i1078">:

  <img width=«77» height=«59» src=«ref-2_457842090-443.coolpic» v:shapes="_x0000_i1079">,                                                                                                 (9)                                                                                                 

где  <img width=«27» height=«31» src=«ref-2_457842533-210.coolpic» v:shapes="_x0000_i1080"> – общая дисперсия признака Y, <img width=«25» height=«31» src=«ref-2_457842743-218.coolpic» v:shapes="_x0000_i1081"> – межгрупповая (факторная) дисперсия признака Y.

Общая дисперсия<img width=«27» height=«31» src=«ref-2_457842533-210.coolpic» v:shapes="_x0000_i1082"> характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих наYфакторов (систематических и случайных) и вычисляется по формуле

                                                                                    <img width=«156» height=«72» src=«ref-2_457843171-969.coolpic» v:shapes="_x0000_i1083">,                                                            (10)
где  yi– индивидуальные значения результативного признака;

<img width=«27» height=«32» src=«ref-2_457844140-209.coolpic» v:shapes="_x0000_i1084">– общая средняя значений результативного признака;

n– число единиц совокупности.

Межгрупповая дисперсия<img width=«25» height=«31» src=«ref-2_457842743-218.coolpic» v:shapes="_x0000_i1085"> измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х(по которому произведена группировка) и вычисляется по формуле:

                                                                           <img width=«145» height=«96» src=«ref-2_457844567-651.coolpic» v:shapes="_x0000_i1086">,                                                    (11)

где <img width=«25» height=«37» src=«ref-2_457845218-200.coolpic» v:shapes="_x0000_i1087"> –групповые средние,

<img width=«28» height=«37» src=«ref-2_457845418-217.coolpic» v:shapes="_x0000_i1088"> – общая средняя,

<img width=«25» height=«29» src=«ref-2_457845635-210.coolpic» v:shapes="_x0000_i1089">–число единиц в j-ой группе,

k– число групп.

Для расчета показателей <img width=«27» height=«31» src=«ref-2_457842533-210.coolpic» v:shapes="_x0000_i1090"> и <img width=«25» height=«31» src=«ref-2_457842743-218.coolpic» v:shapes="_x0000_i1091"> необходимо знать величинуобщей средней <img width=«24» height=«30» src=«ref-2_457846273-197.coolpic» v:shapes="_x0000_i1092">, которая вычисляется как средняя арифметическая простая по всем единицам совокупности:

<img width=«95» height=«83» src=«ref-2_457846470-573.coolpic» v:shapes="_x0000_i1093">,                                             (12)

Значения числителя и знаменателя формулы имеются в табл. 7 (графы 3 и 4 итоговой строки). Используя эти данные, получаем общую среднюю <img width=«27» height=«32» src=«ref-2_457844140-209.coolpic» v:shapes="_x0000_i1094">:
<img width=«336» height=«83» src=«ref-2_457847252-1424.coolpic» v:shapes="_x0000_i1095">
Для расчета общей дисперсии <img width=«27» height=«31» src=«ref-2_457842533-210.coolpic» v:shapes="_x0000_i1096"> применяется вспомогательная табл. 8.






Рассчитаем общую дисперсию по формуле (10):

<img width=«283» height=«75» src=«ref-2_457849357-1460.coolpic» v:shapes="_x0000_i1099">                                                            

Для расчета межгрупповой дисперсии <img width=«25» height=«31» src=«ref-2_457842743-218.coolpic» v:shapes="_x0000_i1100">    продолжение
--PAGE_BREAK-- строим вспомогательную таблицу 9. При этом используются  групповые средние значения <img width=«25» height=«37» src=«ref-2_457845218-200.coolpic» v:shapes="_x0000_i1101"> из табл. 7 (графа 5).





Рассчитаем межгрупповую дисперсию по формуле (11):

<img width=«292» height=«99» src=«ref-2_457851873-1497.coolpic» v:shapes="_x0000_i1104">

Определяем коэффициент детерминации по формуле (9):

<img width=«312» height=«59» src=«ref-2_457853370-1593.coolpic» v:shapes="_x0000_i1105">

Вывод.93,53% вариации уровня производительности труда обусловлено вариацией уровня фондоотдачи, а 6,47% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение<img width=«24» height=«32» src=«ref-2_457854963-183.coolpic» v:shapes="_x0000_i1106"> оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле:

<img width=«116» height=«55» src=«ref-2_457855146-380.coolpic» v:shapes="_x0000_i1107">                                          (13)

Рассчитаем показатель <img width=«24» height=«32» src=«ref-2_457854963-183.coolpic» v:shapes="_x0000_i1108">:

<img width=«321» height=«54» src=«ref-2_457855709-1236.coolpic» v:shapes="_x0000_i1109">
Для оценки тесноты связи с помощью корреляционного отношения используется шкала Чэддока (см. теоретическую часть стр. 14):
Вывод: согласно шкале Чэддока связь между средним уровнем производительности труда и фондоотдачей по организациям является весьма тесной.
3. Решение:

Показатели <img width=«15» height=«17» src=«ref-2_457856945-88.coolpic» v:shapes="_x0000_i1110"> и <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1111"> рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли  иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи  <img width=«15» height=«17» src=«ref-2_457856945-88.coolpic» v:shapes="_x0000_i1112">, <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1113"> несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.

Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации  <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1114"> служит дисперсионный F-критерий Фишера, который рассчитывается по формуле

<img width=«132» height=«59» src=«ref-2_457857442-491.coolpic» v:shapes="_x0000_i1115">,                                           (14)

где    n– число единиц выборочной совокупности,

         m– количество групп,

         <img width=«19» height=«24» src=«ref-2_457857933-108.coolpic» v:shapes="_x0000_i1116"> – межгрупповая дисперсия,

         <img width=«20» height=«27» src=«ref-2_457858041-112.coolpic» v:shapes="_x0000_i1117"> – дисперсия j-ой группы (j=1,2,…,m),

         <img width=«23» height=«29» src=«ref-2_457858153-119.coolpic» v:shapes="_x0000_i1118"> – средняя арифметическая групповых дисперсий.

Величина <img width=«23» height=«29» src=«ref-2_457858153-119.coolpic» v:shapes="_x0000_i1119">рассчитывается, исходя из правила сложения дисперсий:

<img width=«87» height=«29» src=«ref-2_457858391-218.coolpic» v:shapes="_x0000_i1120">,

где <img width=«20» height=«25» src=«ref-2_457858609-111.coolpic» v:shapes="_x0000_i1121"> – общая дисперсия.

Для проверки значимости показателя <img width=«24» height=«28» src=«ref-2_457858720-146.coolpic» v:shapes="_x0000_i1122"> рассчитанное значение F-критерия Fрасч сравнивается с табличным Fталдля принятого уровня значимости <img width=«16» height=«15» src=«ref-2_457858866-90.coolpic» v:shapes="_x0000_i1123"> и параметров k1, k2, зависящих от величин nи m: k1=m-1, k2=n-m.Величина Fтаблдля значений <img width=«16» height=«15» src=«ref-2_457858866-90.coolpic» v:shapes="_x0000_i1124">, k1,k2определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия  для  различных  комбинаций  значений  <img width=«16» height=«12» src=«ref-2_457859046-84.coolpic» v:shapes="_x0000_i1125">, k1,k2.Уровень значимости <img width=«16» height=«15» src=«ref-2_457858866-90.coolpic» v:shapes="_x0000_i1126"> в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).

Если Fрасч>Fтабл, коэффициент детерминации <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1127">признается статистически значимым, т.е. практически невероятно, что найденная оценка <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1128"> обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков,  сделанные на основе выборки, можно распространить на всю генеральную совокупность.

Если Fрасч<Fтабл, то показатель <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1129"> считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.

Фрагмент таблицы Фишера критических величин F-критерия для  значений <img width=«16» height=«15» src=«ref-2_457858866-90.coolpic» v:shapes="_x0000_i1130">=0,05; k1=3,4,5; k2=24-35 представлен ниже:
Таблица 10



k2

k1

24

25

26

27

28

29

30

31

32

33

34

35

3

3,01

2,99

2,98

2,96

2,95

2,93

2,92

2,91

2,90

2,89

2,88

2,87

4

2,78

2,76

2,74

2,73

2,71

2,70

2,69

2,68

2,67

2,66

2,65

2,64

5

2,62

2,60

2,59

2,57

2,56

2,55

2,53

2,52

2,51

2,50

2,49

2,48



Рассчитаем дисперсионный F-критерия Фишера для оценки <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1131">=93,53%, полученной при <img width=«20» height=«25» src=«ref-2_457859738-109.coolpic» v:shapes="_x0000_i1132">=3386,83; <img width=«19» height=«24» src=«ref-2_457857933-108.coolpic» v:shapes="_x0000_i1133">=3167,73 по формуле (14):

Fрасч<img width=«483» height=«75» src=«ref-2_457859955-2336.coolpic» v:shapes="_x0000_i1134">
Табличное значение F-критерия при <img width=«16» height=«15» src=«ref-2_457858866-90.coolpic» v:shapes="_x0000_i1135">= 0,05:

n

m

k1=m-1

k2=n-m

Fтабл(<img width=«16» height=«12» src=«ref-2_457859046-84.coolpic» v:shapes="_x0000_i1136">,4, 25)

30

5

4

25

2,76

 

ВЫВОД: поскольку Fрасч>Fтабл, то величина коэффициента детерминации <img width=«20» height=«24» src=«ref-2_457857033-107.coolpic» v:shapes="_x0000_i1137">=93,53% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками фондоотдача  иуровнем производительности труда правомерны не только для выборки, но и для всей генеральной совокупности фирм.
Задание 3:
По результатам выполнения Задания 1 с вероятностью 0,683 определите:

1. ошибку выборки среднего уровня производительности труда и границы, в которых будет находиться средний уровень производительности труда в генеральной совокупности.

2. ошибку выборки доли организаций с уровнем производительности труда 264 тыс. руб. и более и границы, в которых будет находиться генеральная доля.

Выполнение Задания 3.

1. Решение:

Применяя выборочный метод наблюдения, необходимо рассчитать ошибки выборки (ошибки репрезентативности), т.к. генеральные и выборочные характеристики, как правило, не совпадают, а отклоняются на некоторую величину ε.

Принято вычислять два вида ошибок выборки — среднюю <img width=«33» height=«37» src=«ref-2_457862572-269.coolpic» v:shapes="_x0000_i1138"> и предельную <img width=«31» height=«27» src=«ref-2_457862841-255.coolpic» v:shapes="_x0000_i1139">    продолжение
--PAGE_BREAK--.

Для расчета средней ошибки выборки <img width=«33» height=«37» src=«ref-2_457862572-269.coolpic» v:shapes="_x0000_i1140"> применяются различные формулы в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка <img width=«33» height=«37» src=«ref-2_457862572-269.coolpic» v:shapes="_x0000_i1141"> для выборочной средней <img width=«16» height=«17» src=«ref-2_457863634-159.coolpic» v:shapes="_x0000_i1142"> определяется по формуле

                                                                  <img width=«126» height=«44» src=«ref-2_457863793-801.coolpic» v:shapes="_x0000_i1143">,                                                                               (15)

где <img width=«29» height=«29» src=«ref-2_457864594-223.coolpic» v:shapes="_x0000_i1144"> – общая дисперсия изучаемого признака,

N– число единиц в генеральной совокупности,

n– число единиц в выборочной совокупности.

Предельная ошибка выборки <img width=«31» height=«27» src=«ref-2_457862841-255.coolpic» v:shapes="_x0000_i1145"> определяет границы, в пределах которых будет находиться генеральная средняя:
<img width=«79» height=«30» src=«ref-2_457865072-388.coolpic» v:shapes="_x0000_i1146">,

                                          <img width=«142» height=«35» src=«ref-2_457865460-555.coolpic» v:shapes="_x0000_i1147">,                                           (16)

где     <img width=«15» height=«21» src=«ref-2_457866015-182.coolpic» v:shapes="_x0000_i1148">– выборочная средняя,

          <img width=«17» height=«25» src=«ref-2_457832710-175.coolpic» v:shapes="_x0000_i1149"> – генеральная средняя.

Предельная ошибка выборки <img width=«31» height=«27» src=«ref-2_457862841-255.coolpic» v:shapes="_x0000_i1150"> кратна средней ошибке <img width=«33» height=«37» src=«ref-2_457862572-269.coolpic» v:shapes="_x0000_i1151"> с коэффициентом кратности t(называемым также коэффициентом доверия):

<img width=«110» height=«33» src=«ref-2_457866896-600.coolpic» v:shapes="_x0000_i1152">                                     (17)

Коэффициент кратности  tзависит от  значения  доверительной вероятности Р, гарантирующей вхождение генеральной средней в интервал<img width=«50» height=«28» src=«ref-2_457867496-309.coolpic» v:shapes="_x0000_i1153">, называемый доверительным интервалом.
Наиболее часто используемые доверительные вероятности Р и соответствующие им значения tзадаются следующим образом (табл. 11):
Таблица 11



По условию Задания 2 выборочная совокупность насчитывает 30 организаций, выборка 20% бесповторная, следовательно, генеральная совокупность включает 150 организаций. Выборочная средняя <img width=«15» height=«21» src=«ref-2_457866015-182.coolpic» v:shapes="_x0000_i1154">, дисперсия <img width=«24» height=«23» src=«ref-2_457867987-183.coolpic» v:shapes="_x0000_i1155"> определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 12:

Таблица 12

Рассчитаем среднюю ошибку выборки по формуле (15):

<img width=«615» height=«48» src=«ref-2_457868533-1619.coolpic» v:shapes="_x0000_i1158">

Рассчитаем предельную ошибку выборки по формуле (17):

<img width=«189» height=«31» src=«ref-2_457870152-630.coolpic» v:shapes="_x0000_i1159">тыс.руб./чел

Определим доверительный интервал для генеральной средней по формуле (16):

248- 8,8411<img width=«43» height=«23» src=«ref-2_457870782-207.coolpic» v:shapes="_x0000_i1160">248+8,8411

239тыс.руб/чел  <img width=«43» height=«23» src=«ref-2_457870782-207.coolpic» v:shapes="_x0000_i1161">257 тыс.руб./чел
Вывод.На основании проведенного выборочного обследования с вероятностью 0,683 можно утверждать, что для генеральной совокупности организаций средняя величина среднего уровня производительности труда находится в пределах от 239 до 257 тыс.руб./чел.
2. Решение:

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой

                                                       <img width=«58» height=«49» src=«ref-2_457871196-353.coolpic» v:shapes="_x0000_i1162">,                                                  (18)

где  m– число единиц совокупности, обладающих заданным свойством;

        n– общее число единиц в совокупности.
Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки <img width=«29» height=«27» src=«ref-2_457871549-217.coolpic» v:shapes="_x0000_i1163"> доли единиц, обладающих заданным свойством, рассчитывается по формуле

<img width=«210» height=«62» src=«ref-2_457871766-1168.coolpic» v:shapes="_x0000_i1164">,                             (19)

где  w– доля единиц совокупности, обладающих заданным свойством;

       (1-w)– доля единиц совокупности, не обладающих заданным свойством,

        N– число единиц в генеральной совокупности,

        n– число единиц в выборочной совокупности.

Предельная ошибка выборки <img width=«29» height=«27» src=«ref-2_457871549-217.coolpic» v:shapes="_x0000_i1165"> определяет границы, в пределах которых будет находиться генеральная доля рединиц, обладающих исследуемым признаком:

                                                                  <img width=«150» height=«28» src=«ref-2_457873151-596.coolpic» v:shapes="_x0000_i1166">                                                                                                                  (20)

По условию Задания 3 исследуемым свойством организаций является равенство или превышение среднего уровня производительности труда 264 тыс. руб/чел.

Число организаций с данным свойством определяется из табл. 2 (графа 2):

m=11

Рассчитаем выборочную долю по формуле (18):

<img width=«127» height=«49» src=«ref-2_457873747-655.coolpic» v:shapes="_x0000_i1167">

Рассчитаем предельную ошибку выборки для доли по формуле (19):

<img width=«293» height=«55» src=«ref-2_457874402-1414.coolpic» v:shapes="_x0000_i1168">

Определим доверительный интервал генеральной доли по формуле (20):

<img width=«203» height=«24» src=«ref-2_457875816-754.coolpic» v:shapes="_x0000_i1169">

0,32 <img width=«52» height=«23» src=«ref-2_457876570-260.coolpic» v:shapes="_x0000_i1170"> 0,48

или

32% <img width=«52» height=«23» src=«ref-2_457876570-260.coolpic» v:shapes="_x0000_i1171"> 48%
Вывод.С вероятностью 0,683 можно утверждать, что в генеральной совокупности организаций региона доля организаций с средним уровнем производительности труда 264 тыс.руб./чел и более будет находиться в пределах от 32% до 48%.



Задание 4.



По результатам расчетов заданий 1 и 2 найдите уравнение корреляционной связи между фондоотдачей и производительностью труда, изобразите корреляционную связь графически.

Для определения тесноты корреляционной связи рассчитайте коэффициент корреляции. Сделайте выводы.

Выполнение задания 4.
1. Решение:

Имеются данные по 30 предприятиям по уровню производительности труда и фондоотдачи.

Уравнение корреляционной связи (уравнение регрессии, модели) выражает количественное соотношение между факторным (x – фондоотдача) и результативным (y– уровень производительности труда) признаками. Рассмотрим прямолинейную форму зависимости yот x: <img width=«99» height=«25» src=«ref-2_457788424-210.coolpic» v:shapes="_x0000_i1172">

Поскольку для установления наличия корреляционной связи между признаками применялся метод аналитической группировки, то параметры для уравнения регрессии рационально определить по сгруппированным данным (табл. 7). В таком случае система нормальных уравнений для уравнения прямой будет иметь вид:

<img width=«266» height=«109» src=«ref-2_457877300-2215.coolpic» v:shapes="_x0000_i1173">                                             (21)

где <img width=«16» height=«29» src=«ref-2_457879515-101.coolpic» v:shapes="_x0000_i1174"> – групповые средние результативного признака, x– середина интервалов факторного признака. Используя данные табл. 7 строим расчетную таблицу 13, чтобы получить численные значения параметров уравнения регрессии а0 и а1:



Данные подставим в систему уравнений (21) и решим:

<img width=«309» height=«65» src=«ref-2_457880554-2090.coolpic» v:shapes="_x0000_i1178">

<img width=«442» height=«280» src=«ref-2_457882644-6372.coolpic» v:shapes="_x0000_i1179">
Итак, получилось, что а0= -388,45, а а1=580,92. Нас интересует именно параметр а1, показывающий изменение результативного признака при изменении факторного признака на единицу. Коэффициент регрессии  показывает, что при увеличении фондоотдачи на единицу значение уровня производительности труда увеличивается в среднем на 580,92 тыс.руб./чел

Итак, уравнение корреляционной связи между фондоотдачей и производительностью труда выглядит так:

<img width=«238» height=«32» src=«ref-2_457889016-1043.coolpic» v:shapes="_x0000_i1180">

В моей работе графически корреляционная связь выглядит так
<img width=«392» height=«250» src=«ref-2_457890059-3719.coolpic» v:shapes="_x0000_i1181">

<img width=«393» height=«239» src=«ref-2_457893778-4316.coolpic» v:shapes="_x0000_i1182">    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по маркетингу