Реферат: Автоматизированный априорный анализ статистической совокупности в среде MS Excel

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ


Лабораторная работа по теме:

Автоматизированный априорный анализстатистической совокупности в среде MSExcel

Москва 2010 г.


Постановка задачи

При проведениистатистического наблюдения за деятельностью предприятий корпорации полученывыборочные данные о среднегодовой стоимости основных производственных фондов ивыпуске продукции за год по 32-м предприятиям, выпускающим однотипную продукцию(выборка 10%-ная, механическая).

В статистическомисследовании эти предприятия выступают как единицы выборочнойсовокупности. Генеральную совокупность образуют всепредприятия корпорации. Анализируемые признаки предприятий – Среднегодоваястоимость основных производственных фондов иВыпуск продукции –изучаемые признаки единиц совокупности.

Для автоматизациистатистических расчетов используются средства электронных таблиц процессораExcel.

Выборочные данныепредставлены на Листе 1 Рабочего файла в табл. 1(ячейки B4:C35):

Таблица 1

Исходные данные Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб. 1

/>/>1286.00

1236.00

2 1514.00 1356.00 3 1562.00 1512.00 4 1646.00 1680.00 5 1070.00 840.00 6 1730.00 1440.00 7 1778.00 1944.00 8 1334.00 1320.00 9 1634.00 1548.00 10 1886.00 1932.00 11 710.00 1800.00 12 2066.00 2040.00 13 1574.00 1608.00 14 1730.00 1752.00 15 1982.00 2124.00 16 2270.00 2280.00 17 1694.00 1536.00 18 1874.00 1824.00 19 1490.00 1140.00 20 1898.00 1560.00 21 2114.00 2100.00 22 1454.00 1188.00 23 1154.00 1116.00 24 1934.00 1788.00 25 1730.00 1560.00 26 1610.00 1476.00 27 1250.00 960.00 28 1682.00 1500.00 29 1946.00 1644.00 30 2270.00 600.00 31 1850.00 1560.00 32 1358.00 1392.00

В процессе исследованиясовокупности необходимо решить ряд задач.

I. Статистический анализ выборочнойсовокупности

1.  Выявить наличие среди исходных данныхрезко выделяющихся значений признаков (аномалий в данных) и исключить их извыборки.

2.  Рассчитать обобщающие статистическиепоказатели совокупности по изучаемым признакам: среднюю арифметическую (/>), моду (Мо),медиану (Ме), размах вариации (R), дисперсию(/>), среднее квадратическоеотклонение (/>),коэффициент вариации (Vσ).

3.  На основе рассчитанных показателей впредположении, что распределения единиц по обоим признакам близки кнормальному, оценить:

а) степень колеблемостизначений признаков в совокупности;

б) степень однородностисовокупности по изучаемым признакам;

в) количество попаданий индивидуальных значений признаков вдиапазоны (/>),(/>), (/>)..

4.  Сравнить распределения единицсовокупности по двум изучаемым признакам на основе анализа:

а) колеблемостипризнаков;

б) однородности единиц;

в) надежности (типичности)средних значений признаков.

5.  Построить интервальный вариационныйряд и гистограмму распределения единиц совокупности по признаку Среднегодоваястоимость основных производственных фондов и установить характер (тип)этого распределения.

II. Статистический анализ генеральнойсовокупности

1.  Рассчитать генеральную дисперсию />, генеральноесреднее квадратическое отклонение /> и ожидаемый размахвариации признаков RN. Сопоставить значения генеральной и выборочной дисперсий.

2.  Для изучаемых признаков рассчитать:

а) среднюю ошибкувыборки;

б) предельные ошибки выборки для уровней надежности P=0,683,P=0,954 и границы, в которых будут находиться средние значения признака вгенеральной совокупности при заданных уровнях надежности.

3.  Рассчитать коэффициенты асимметрии Asи эксцесса Ek. На основе полученных оценок охарактеризовать особенностиформы распределения единиц генеральной совокупности по каждому из изучаемыхпризнаков.

III. Экономическая интерпретациярезультатов статистического исследования предприятий

В этой части исследованиянеобходимо ответить на ряд вопросов.

1. Типичны лиобразующие выборку предприятия по значениям изучаемых экономическихпоказателей?

2. Каковы наиболеехарактерные для предприятий значения показателей среднегодовой стоимостиосновных фондов и выпуска продукции?

3. Насколько сильныразличия в экономических характеристиках предприятий выборочной совокупности?Можно ли утверждать, что выборка сформирована из предприятий с достаточноблизкими значениями по каждому из показателей?

4. Какова структурапредприятий выборочной совокупности по среднегодовой стоимости основных фондов?Каков удельный вес предприятий с наибольшими, наименьшими и типичнымизначениями данного показатели? Какие именно это предприятия?

5. Носит лираспределение предприятий по группам закономерный характер и какие предприятия(с более высокой или более низкой стоимостью основных фондов) преобладают всовокупности?

6. Каковы ожидаемыесредние величины среднегодовой стоимости основных фондов и выпуска продукции напредприятиях корпорации в целом? Какое максимальное расхождение в значениях каждогопоказателя можно ожидать?

2. Выводы порезультатам выполнения лабораторной работы

I. Статистический анализ выборочнойсовокупности

Задача 1. Рассчитанные выборочные показателипредставлены в двух таблицах — табл. 3 и табл. 5. На основе этих таблиц формируетсяединая таблица (табл. 2) значений выборочных показателей,перечисленных в условии Задачи 2.

Таблица 2 — Описательныестатистики выборочной совокупности

Обобщающие статистические показатели совокупности по изучаемым признакам Признаки

Среднегодовая стоимость основных производственных фондов

Выпуск продукции

Средняя арифметическая (/>), млн. руб.

 

 

Мода (Мо), млн. руб.

 

 

Медиана (Ме), млн. руб.

 

 

Размах вариации (R), млн. руб.

 

 

Дисперсия (/>)

 

 

Среднее квадратическое отклонение (/>),млн. руб.

 

 

Коэффициент вариации (Vσ), %

 

 

 

Задача 2.

3а). Степеньколеблемости признака определяется по значению коэффициента вариации Vs<sub/>в соответствии с оценочной шкалойколеблемости признака:

0%<Vs/>40% — колеблемость незначительная;

40%< Vs/>60% — колеблемость средняя (умеренная);

Vs>60% — колеблемость значительная.

3б). Степеньоднородности совокупности по изучаемому признакудлянормального и близких к нормальному распределений устанавливается по значениюкоэффициента вариации Vs. Если Vs/>33%, то по данному признаку расхождения между значениямипризнака невелико. Если при этом единицы наблюдения относятся к одномуопределенному типу, то изучаемая совокупность однородна.

3в). Для оценкиколичества попаданий индивидуальных значений признаков xi в тот или иной диапазон отклоненияот средней />,а также для выявления структуры рассеяния значений xi по 3-м диапазонам формируется табл.3 (с конкретными числовыми значениями границ диапазонов).

Таблица 3 — Распределение значенийпризнака по диапазонам рассеяния признака относительно /> Границы диапазонов, млн. руб.

Количество значений xi, находящихся в диапазоне

Процентное соотношение рассеяния значений xi по диапазонам, %

Первый признак Второй признак Первый признак Второй признак Первый признак Второй признак А 1 2 3 4 5 6

/>

[………….;………….] [………….;……….]

/>

[………….;………….] [………….;……….]

/>

[………….;………….] [………….;……….]

На основе данных табл. 9структура рассеяния значений признака по трем диапазонам (графы 5 и 6)сопоставляется со структурой рассеяния по правилу «трех сигм»,справедливому для нормальных и близких к нему распределений:

68,3% значений располагаются в диапазоне (/>),

95,4% значений располагаются в диапазоне (/>),

99,7% значений располагаются в диапазоне (/>).

Если полученная в табл. 9структура рассеяния хi<sub/>по 3-м диапазонам незначительнорасходится с правилом «трех сигм», можно предположить, что распределение единицсовокупности по данному признаку близко к нормальному.

Расхождение справилом «трех сигм» может быть существенным. Например, менее 60% значений хi попадают в центральный диапазон (/>) илизначительно более 5% значения хi выходит за диапазон (/>). В этих случаяхраспределение нельзя считать близким к нормальному.

Задача 3. Для ответа на вопросы 4а) – 4в)необходимо воспользоваться табл.8 и сравнить величины показателейдля двух признаков.

Для сравнения степениколеблемости значений изучаемых признаков, степени однородности совокупности поэтим признакам, надежности их средних значений используются коэффициентывариации Vs признаков.

Задача 4. Интервальный вариационный рядраспределения единиц совокупности по признаку Среднегодовая стоимостьосновных производственных фондов представлен в табл.7, а его гистограмма икумулята – на рис.2.

Возможность отнесенияраспределения признака «Среднегодовая стоимость основных производственныхфондов» к семейству нормальных распределений устанавливается путем анализаформы гистограммы распределения. Анализируются количество вершин в гистограмме,ее асимметричность и выраженность «хвостов», т.е. частоты появления враспределении значений, выходящих за диапазон (/>).

1. При анализе формыгистограммы прежде всего следует оценить распределение вариантов признакапо интервалам (группам). Если на гистограмме четко прослеживаются два-три«горба» частот вариантов, это говорит о том, что значения признакаконцентрируются сразу в нескольких интервалах, что не соответствует нормальномузакону распределения.

Если гистограмма имеет одновершиннуюформу, есть основания предполагать, что выборочная совокупность может иметьхарактер распределения, близкий к нормальному.

2. Для дальнейшегоанализа формы распределения используются описательные параметры выборки –показатели центра распределения (/>, Mo, Me) и вариации(/>). Совокупностьэтих показателей позволяет дать качественную оценку близости эмпирическихданных к нормальной форме распределения.

Нормальноераспределение является симметричным, и для него выполняются соотношения:

/>=Mo=Me

Нарушениеэтих соотношений свидетельствует о наличии асимметриираспределения. Распределения с небольшой или умеренной асимметрией вбольшинстве случаев относятся к нормальному типу.

3. Для анализа длины«хвостов» распределения используется правило «трех сигм». Согласно этомуправилу в нормальном и близким к нему распределениях крайние значения признака(близкие к хmin и хmax) встречаются много реже (5-7% всех случаев), чем лежащие в диапазоне (/>). Следовательно, попроценту выхода значений признака за пределы диапазона (/>) можно судить осоответствии длины «хвостов» распределения нормальному закону.

II. Статистический анализ генеральнойсовокупности

Задача 1. Рассчитанные в табл.3 генеральныепоказатели представлены в табл. 4.

Таблица 4 — Описательные статистики генеральной совокупностиОбобщающие статистические показатели совокупности по изучаемым признакам Признаки

Среднегодовая стоимость основных производственных фондов

Выпуск продукции

Стандартное отклонение />, млн. руб.

Дисперсия />

Асимметричность As

Эксцесс Ek

Для нормальногораспределения справедливо равенство

RN=6sN.

В условиях близостираспределения единиц генеральной совокупности к нормальному это соотношениеиспользуется для прогнозной оценки размаха вариации признака вгенеральной совокупности.

Задача 2. Применение выборочного методанаблюдения связано с измерением степени достоверности статистическиххарактеристик генеральной совокупности, полученных по результатам выборочногонаблюдения. Достоверность генеральных параметров зависит от репрезентативностивыборки, т.е. от того, насколько полно и адекватно представлены ввыборке статистические свойства генеральной совокупности.

Как правило,статистические характеристики выборочной и генеральной совокупностей несовпадают, а отклоняются на некоторую величину ε, которуюназывают ошибкой выборки (ошибкой репрезентативности).Ошибка выборки – это разность между значением показателя, который был полученпо выборке, и генеральным значением этого показателя. Например, разность

/>= |/>-/>|

определяет ошибкурепрезентативности для средней величины признака.

Так как ошибки выборкивсегда случайны, вычисляют среднюю и предельную ошибки выборки.

1. Для среднего значенияпризнака средняя ошибка выборки /> (ее называют также стандартнойошибкой) выражает среднее квадратическое отклонение sвыборочной средней /> от математического ожидания M[/>]генеральной средней />.

Для изучаемых признаковсредние ошибки выборки /> даны в табл. 3:

— для признака Среднегодоваястоимость основных производственных фондов

/>=……………….,

— для признака Выпускпродукции

/>=………………..

2.Предельнаяошибка выборки /> определяет границы, впределах которых лежит генеральная средняя />. Эти границы задают такназываемый доверительный интервал генеральной средней /> – случайную областьзначений, которая с вероятностью P, близкой к 1, гарантированносодержит значение генеральной средней. Эту вероятность называют доверительнойвероятностью или уровнем надежности.

Для уровней надежности P=0,954;P=0,683 оценки предельных ошибок выборки /> даны в табл. 3 и табл.4.

Для генеральной среднейпредельные значения и доверительные интервалы определяются выражениями:

/>,

/>

Предельные ошибки выборкии ожидаемые границы для генеральных средних представлены в табл. 5.

Таблица 5 — Предельныеошибки выборки и ожидаемые границы для генеральных средних

Доверительная

вероятность

Р

Коэффициент

доверияt

Предельные ошибки выборки, млн. руб.

Ожидаемые границы для средних />, млн. руб.

для первого

признака

для второго

признака

для первого

признака

для второго

признака

0,683 1

/>

/>

0,954 2

/>

/>

 

Задача 3. Рассчитанныев табл.3значениякоэффициентов асимметрии Asи эксцесса Ek даны в табл.10.

1. Показательасимметрии Asоценивает смещение ряда распределения влево или вправо поотношению к оси симметрии нормального распределения.

Если асимметрия правосторонняя (As>0) то правая часть эмпирической кривойоказывается длиннее левой, т.е. имеет место неравенство />>Me>Mo,что означает преимущественное появление в распределении более высокихзначений признака (среднее значение /> больше серединного Meи модальногоMo).

Если асимметрия левосторонняя (As<0), то левая часть эмпирической кривойоказывается длиннее правой и выполняется неравенство /><Me<Mo, означающее,что в распределении чаще встречаются более низкие значения признака (среднеезначение /> меньшесерединного Me и модальногоMo).

Чем больше величина |As|,тем более асимметрично распределение. Оценочная шкала асимметрии:

|As|/>0,25- асимметрия незначительная;

0,25<|As|/>0,5- асимметрия заметная(умеренная);

|As|>0,5- асимметрия существенная.

2. Показательэксцесса Ekхарактеризует крутизну кривой распределения — ее заостренность или пологость посравнению с нормальной кривой.

Как правило, коэффициентэксцесса вычисляется только для симметричных или близких к ним распределений.

Если Ek>0, товершина кривой распределения располагается выше вершины нормальной кривой, аформа кривой является более островершинной, чем нормальная. Это говорит оскоплении значений признака в центральной зоне ряда распределения, т.е. опреимущественном появлении в данных значений, близких к средней величине.

Если Ek<0, товершина кривой распределения лежит ниже вершины нормальной кривой, а формакривой более пологая по сравнению с нормальной. Это означает, что значенияпризнака не концентрируются в центральной части ряда, а рассеяны по всемудиапазону от xmax до xmin.

Для нормальногораспределения Ek=0. Чем больше абсолютная величина |Ek|, темсущественнее распределение отличается от нормального.

При незначительном отклоненииEkот нуля форма кривой эмпирического распределения незначительноотличается от формы нормального распределения.

III. Экономическая интерпретациярезультатов статистического исследования предприятий.

1. Типичны лиобразующие выборку предприятия по значениям изучаемых экономическихпоказателей?

2. Каковынаиболее характерные для предприятий значения показателей среднегодовойстоимости основных производственных фондов и выпуска продукции?

Ответ на вопрос следуетиз анализа данных табл.9, где приведен диапазон значений признака (/>),содержащий наиболее характерные для предприятий значения показателей.

3. Насколькосильны различия в экономических характеристиках предприятий выборочнойсовокупности? Можно ли утверждать, что выборка сформирована из предприятий сдостаточно близкими значениями по каждому из показателей?

Ответы на вопросы следуютиз значения коэффициента вариации (табл.8), характеризующего степеньоднородности совокупности (см. вывод к задаче 3б). Максимальное расхождение взначениях показателей определяется размахом вариации Rn. (табл.8).

4. Каковаструктура предприятий выборочной совокупности по среднегодовой стоимостиосновных производственных фондов? Каков удельный вес предприятий с наибольшими,наименьшими и типичными значениями данного показатели? Какие именно этопредприятия?

Структура предприятийпредставлена в табл. 7 Рабочего файла.

5. Носит лираспределение предприятий по группам закономерный характер и какие предприятия(с более высокой или более низкой стоимостью основных фондов) преобладают всовокупности?

Ответ на вопрос следуетиз вывода к задаче 5 и значения коэффициента асимметрии (табл. 8).

6. Каковыожидаемые средние величины среднегодовой стоимости основных фондов и выпускапродукции на предприятиях корпорации в целом? Какое максимальное расхождение взначениях каждого показателя можно ожидать?

Ответ на первый вопросследует из данных табл.11. Максимальное расхождение в значениях показателяопределяется величиной размаха вариации RN.


Приложение

 

Результативные таблицыи графики

 

Аномальные единицы наблюдения Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб. 11 710,00 1800,00 30 2270,00 600,00 Таблица 3 Описательные статистики По столбцу «Среднегодовая стоимость основных производственных фондов, млн.руб.» x По столбцу «Выпуск продукции, млн.руб», y

Столбец1

 

Столбец2

 

Среднее 1670 Среднее 1565,2 Стандартная ошибка 52,99212694 Стандартная ошибка 63,21505713 Медиана 1688 Медиана 1554 Мода 1730 Мода 1560 Стандартное отклонение 290,2498329 Стандартное отклонение 346,2431277 Дисперсия выборки 84244,96552 Дисперсия выборки 119884,3034 Эксцесс -0,344943844 Эксцесс -0,205332365 Асимметричность -0,152503649 Асимметричность 0,042954448 Интервал 1200 Интервал 1440 Минимум 1070 Минимум 840 Максимум 2270 Максимум 2280 Сумма 50100 Сумма 46956 Счет 30 Счет 30 Уровень надежности(95.0%) 108,3810672 Уровень надежности(95.0%) 129,2893067 Предельные ошибки выборки По столбцу «Среднегодовая стоимость основных производственных фондов, млн.руб.» По столбцу «Выпуск продукции, млн.руб»

Столбец1

 

Столбец2

 

Уровень надежности(68.0%) 53,61761954 Уровень надежности(68.0%) 63,9612161 Выборочные показатели вариации По столбцу «Среднегодовая стоимость основных производственных фондов, млн.руб.» По столбцу «Выпуск продукции, млн.руб» Стандартное отклонение 285,371337 Стандартное отклонение 340,423501 Дисперсия 81436,8 Дисперсия 115888,16 Коэффициент вариации, % 17,08810401 Коэффициент вариации, % 21,74952089

Карман

Частота

 

1 1310 3 1550 5 1790 11 2030 7   2270 3 Интервальный ряд распределения предприятий по стоимости основных производственных фондов

Группа предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы.%

1070-1310 4 13,33% 1310-1550 5 30,00% 1550-1790 11 66,67% 1790-2030 7 90,00% 2030-2270 3 100,00%

 

/>

Рис. 1


/>

Рис. 2

еще рефераты
Еще работы по экономико-математическому моделированию