Реферат: Курс лекций за первый семестр

--PAGE_BREAK--§2. Признаки единиц статистической совокупности, их классификация.
ЕСС обладают определенными свойствами которые называются признаками. Статистика изучает явления через их признаки, чем более однородна совокупность тем больше общих признаков имеют ее единицы и тем меньше варьируют значения этих признаков.
<img width=«702» height=«237» src=«ref-1_470487805-6342.coolpic» v:shapes="_x0000_s1088 _x0000_s1026 _x0000_s1034 _x0000_s1027 _x0000_s1028 _x0000_s1029 _x0000_s1030 _x0000_s1031 _x0000_s1032 _x0000_s1033 _x0000_s1036 _x0000_s1038 _x0000_s1039 _x0000_s1040 _x0000_s1041 _x0000_s1042 _x0000_s1044 _x0000_s1046 _x0000_s1048 _x0000_s1050 _x0000_s1052 _x0000_s1053 _x0000_s1057 _x0000_s1058 _x0000_s1059 _x0000_s1061 _x0000_s1062 _x0000_s1063 _x0000_s1064 _x0000_s1065 _x0000_s1066 _x0000_s1067 _x0000_s1068 _x0000_s1069 _x0000_s1070 _x0000_s1071 _x0000_s1072 _x0000_s1073 _x0000_s1074 _x0000_s1075 _x0000_s1076 _x0000_s1078 _x0000_s1079 _x0000_s1080 _x0000_s1081 _x0000_s1082 _x0000_s1083 _x0000_s1084 _x0000_s1085 _x0000_s1086">


Описательный признак – признак, который может быть выражен только словесно. Количественный признак – признак, который может быть выражен численно. Прямой признак – свойство непосредственно присуще характерному объекту. Косвенный признак – свойства не самого характеризуемого объекта, а объекта связанного с ним либо входящих в него. первичный признак – абсолютная величина, может быть измерен. вторичный признак – результат сопоставления первичных признаков, он измеряется непосредственно. натуральный признак – измеряется  в штуках, кг, тоннах, литрах и т.д. трудовой признак – измеряется в человеко-днях, человеко-часах. стоимостной признак -  измеряется в рублях, $, €, ₤. безразмерный признак – измерение в долях, % альтернативный признак – признак, который принимает только одно значение из нескольких возможных. дискретный признак – принимает только целое значение, без промежуточного. непрерывный признак – признак, принимающий любые значения в определенном диапазоне. факторный признак – признак, под действием которого изменяется другой признак. результативный признак – признак, который изменяется под признаком другого моментный признак – признак, измеренный на определенный момент времени. интервальный признак – признак за определенный интервал времени.


Один и тот же признак может быть классифицирован одновременно по разным классификациям.

§3. Предмет и метод статистики.

Предметом статистического исследования являются статистические совокупности – множество одно-качественных варьирующих предметов.

Специфика предмета статистики обуславливает специфику метода, они включают в себя:
сбор данных (статистическое наблюдение, публикация) обобщение данных (сводка, группировка) представление данных (таблицы и графики) анализ и интерпретация числовых данных (расчет средних, вариационных анализ, КРА, ряды динамики, индексы)

тема 2: Организация статистического наблюдения. Сводка и группировка данных.
§1. Понятие статистического наблюдения, его подготовка.

§2. Виды статистического наблюдения.

§3 Ошибки наблюдения.

§4 Сводка и группировка

§5 Виды статистических группировок.

§6 Статистические таблицы.

§7 Статистические графики.


§1. Понятие статистического наблюдения, его подготовка.
Любое статистическое исследование начинается со сбора данных.

Источники информации:

1.      различные публикации (газеты, журналы, и т.д.)

2.      главный источник опубликованной статистической информации – издания органов государственной статистики («РФ в 2001 году» издательство ГОСКОМСТАТ).

3.      проведение статистического наблюдения, т.е. научно организованного сбора данных.
Статистическое наблюдение – массовое, плановое, научно организованное наблюдение за явлением социальной и экономической жизни, которая заключается в регистрации признаков у каждой единицы изучаемой совокупности.

Процесс проведения наблюдения:
Подготовка к наблюдению Проведение массового сбора данных Подготовка данных к обработке Разработка предложений по совершенствованию статистического наблюдения.
Подготовка наблюдения:
Определение цели  и объекта наблюдения Определение состава признаков подлежащих регистрации Разработка документов для сбора данных Выбор отчетной единицы и единицы относительно которой будет проводится наблюдение. Необходимо определить методы и средства получения данных.
Необходимо решить организационные проблемы:
необходимо определить состав служб проводящих исследование проинструктировать персонал составить календарный план работы провести тиражирование документов для сбора данных


Объектом наблюдения являются социально-экономические явления и процессы.

Необходимо четко выделить признаки для регистрации.

Программа наблюдения – перечень признаков подлежащих регистрации признаков в процессе наблюдения.

Требования к программе наблюдения:
Программа должна содержать существенные признаки, непосредственно характеризующие изучаемое явление, не следует включать в программу признаки, имеющие второстепенные явления или признаки, значения которых будут заведомо недостоверны или будут вообще отсутствовать. Вопросы программы наблюдения должны быть точными и не двусмысленными, а также легкими для понимания во избежании трудностей при получении ответов. Следует определить последовательность вопросов. В программу наблюдения следует включать вопросы непосредственного характера для проведения и уточнения  собираемых данных. для обеспечения единообразия получаемых сведений программа оформляется в виде документа – называемый статистическим формуляром.
Статистический формуляр — это документ единого образца содержащий программу и результаты наблюдений.

Различают индивидуальный формуляр (ответы на вопросы по одной единице наблюдения) и списанный (сведения по нескольким  единицам статистической совокупности).

Формуляр и инструкция по его заполнению являются инструментарием статистического наблюдения.

Выбор времени наблюдения заключается в решении 2х вопросов: установлении критической даты либо интервала, определением периода наблюдения.

Критическая дата – конкретный день года, час дня по состоянию на который должны быть зарегистрированы признаки по каждой единице изучаемой совокупности.

Период наблюдения – время в течении которого происходит заполнение статистических формуляров т.е. время необходимое для сбора данных.

Следует учитывать, что отдаление периода наблюдения от критической даты или интервала может привести к снижению достоверности получаемых сведений.
    продолжение
--PAGE_BREAK--§2. Виды статистического наблюдения.
В отечественной статистике используются три формы статистических наблюдений.
статистическая отчетность предприятий, организаций, учреждений. специально организованное статистическое наблюдение (перепись и т.д.) регистр – форма непрерывного статистического наблюдения за долговременными процессами
Статистическое наблюдение классифицируется :

По времени наблюдения:
текущее наблюдение – производится непрерывная регистрация признаков (загс, преступление, и т.д.). периодическое наблюдение – производится через определенные интервалы времени (уровень жизни в городе Челябинске, стоимость потребительской корзины, перепись населения). Единовременный – наблюдение, производимое один раз под конкретную цель.
По охвату единиц совокупности:
Сплошное наблюдение – должна быть получена информация обо всех ЕСС Не сплошное наблюдение: Способ основного массива – обследованию подвергаются самые существенные единицы изучаемой совокупности (изучить предприятие машиностроения Челябинской области). Выборочное наблюдение – случайный отбор ЕСС подлежащих наблюдению. Монографическое наблюдение – когда наблюдению подвергается одна ЕСС, часто используются для составления программы массового наблюдения.
По способу сбора данных:
Непосредственное наблюдение – сами регистраторы путем непосредственного замера, взвешивания устанавливают факт подлежащей регистрации (ребенок в возрасте до 1 года в поликлинике). Документальное наблюдение – используются различные документы (составление декларации)
Опрос – необходимые сведения получают со слов респондента.
Экспедиционный опрос – осуществляется специально подготовленными работниками которые получают необходимую информацию на основе опроса соответствующих лиц и сами фиксируют ответы в формуляре. Экспедиционный опрос может быть прямым (лицом к лицу) и опосредованным (опрос по телефону) Корреспондентский опрос – сведения сообщает штат добровольных корреспондентов, данный способ требует малых финансовых затрат,  но не дает точного значения проводимого наблюдения. Саморегистрация – формуляры заполняются самими респондентами, а регистраторы лишь раздают им бланки опросных листов и объясняют заполнение их.

§3. Ошибки наблюдения
Основное требование, применяемое к статистическому наблюдению — это точность.

Точность – степень соответствия какого-либо показателя признака определенным по материалам статистического наблюдения  действительной величине.

Расхождение между расчетным и действительным значением называется ошибкой наблюдения в зависимости от причин возникновения  различают: ошибки регистрации и ошибки репрезентативности. Ошибки регистрации делятся на случайные и систематические.

Случайные ошибки – результат действий случайных факторов (перепутаны строки, столбцы)

Систематические ошибки – всегда имеют тенденцию либо к завышению либо к занижению показателя. (возраст)

Ошибки репрезентативности – характер для не сплошного наблюдения и возникают в результате неточного воспроизведения  выборной всей исходной совокупности.

После получения статистических формуляров необходимо:

1.      провести проверку полноты собранных данных.

2.      провести арифметический контроль, основанный на связи различных признаков между собой.

3.      провести логический контроль основанный на знании логических связей между признаками.


§4. Сводка и группировка
На основе собранных данных нельзя произвести расчет и сделать выводы, для начала их нужно обобщить и свести в единую таблицу. Для этих целей служат сводка и группировка.

Сводка – комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность и выявление типичных черт и закономерностей присущих изучаемому явлению в целом.

Простая водка – подсчет общих итогов по совокупности.

Сложная сводка – комплекс операций по группировке единичных наблюдений, подсчет итогов по каждой группе и по всему объекту в целом и представлении результатов в виде статистических таблиц.

По форме обработки материала сводка бывает  децентрализованная, централизованная – такая сводка проводится при единовременном статистическом наблюдении.

Группировка – расчленение множества единиц изучаемой совокупности на группы по определенным признакам.


§5. Виды статистических группировок
Группировки могут быть классифицированы по структуре и по содержанию.

<img width=«698» height=«219» src=«ref-1_470494147-5706.coolpic» v:shapes="_x0000_s1102 _x0000_s1111 _x0000_s1089 _x0000_s1090 _x0000_s1091 _x0000_s1093 _x0000_s1094 _x0000_s1095 _x0000_s1096 _x0000_s1097 _x0000_s1098 _x0000_s1099 _x0000_s1100 _x0000_s1103 _x0000_s1104 _x0000_s1105 _x0000_s1106 _x0000_s1107 _x0000_s1108 _x0000_s1109">



Типологическая – разделение совокупности на классы, социально-экономические типы (государственные предприятия, ОАО, ООО, ЗАО)

Структурная – разделение совокупности по какому-либо одному признаку.

Возраст

<трудоспособный

трудоспособный

трудоспособный>

<img width=«167» height=«44» src=«ref-1_470499853-672.coolpic» v:shapes="_x0000_s1114 _x0000_s1112 _x0000_s1113">Аналитическая группировка характеризует взаимосвязь между признаками один из которых является факторным другой результативным.



образование

0-5000

5000-10000

От 10000

Среднее

2

1

-

Незаконченное высшее

10

20

5

Высшее

7

15

25


    продолжение
--PAGE_BREAK--§6. Статистические таблицы
Результаты сводки и группировки должны быть представлены так, чтобы ими можно было пользоваться.

Существует 3 способа представления данных:
данные могут быть включены в текст. представление в таблицах. графический способ
Статистическая таблица – система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.

Различают подлежащее и сказуемое таблицы.

Подлежащим называется объект характеризующийся числами, обычно подлежащее дается в левой части таблицы.

Сказуемое – система показателей с помощью которых характеризуется объект.

Город

Численность

Плотность населения чел/км2

Площадь города км2

Москва







Челябинск







Статистическая таблица содержит 3 вида заголовков: общее, боковое

Общий заголовок должен отражать содержание всей таблицы, располагается над таблицей по центру.

Правило составления таблиц.

1.      обязательны все три вида заголовков без сокращений слов, общие единицы измерения можно вынести в заголовок.

2.      в таблице не должно быть лишних линий, вертикальная разметка может отсутствовать.

3.        Итоговая строка обязательна. Она может быть как в начале так и в конце документа. Если в начале документа то                                   если в конце то ИТОГО:

4.      цифровые данные в пределах одной графы записываются с одной степенью точности. Разряды записываются строго под разрядами, целая часть отделяется запятой.

5.      в таблице не должно быть пустых клеток, если данные отсутствуют, то пишут «Сведений нет» или «…», если данные равны нулю, то «–». Если значение не равно нулю но первая значащая цифра появляется после заданной точности 0,01®0,0 – если принятая точность до десятых.

6.      если в таблице много граф, то графы подлежащего обозначаются заглавными буквами, а графы сказуемого цифрами.

7.      если таблица основана на заимствованных данных, то под таблицей указывается источник данных, в случае необходимости таблица может сопровождаться примечаниями.


§7. Статистические графики
            Статистические таблицы могут дополняться графиками.

Статистические графики – условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков.

Плюсы графического изображения

1.      наглядно, обозримо, выразительно.

2.      сразу видны пределы изменения показателя, сравнительная скорость изменения и колеблемость

Минусы графического изображения
Включают меньшее количество данных чем в таблице. на графике показываются округленные данные, общая ситуация, но не детали.
<img width=«584» height=«275» src=«ref-1_470500525-5507.coolpic» v:shapes="_x0000_s1158 _x0000_s1116 _x0000_s1117 _x0000_s1118 _x0000_s1119 _x0000_s1120 _x0000_s1121 _x0000_s1123 _x0000_s1124 _x0000_s1125 _x0000_s1126 _x0000_s1127 _x0000_s1128 _x0000_s1129 _x0000_s1130 _x0000_s1131 _x0000_s1132 _x0000_s1133 _x0000_s1134 _x0000_s1135 _x0000_s1136 _x0000_s1137 _x0000_s1138 _x0000_s1139 _x0000_s1140 _x0000_s1141 _x0000_s1143 _x0000_s1144 _x0000_s1145 _x0000_s1146 _x0000_s1147 _x0000_s1148 _x0000_s1149 _x0000_s1150 _x0000_s1151 _x0000_s1152 _x0000_s1153 _x0000_s1154 _x0000_s1155 _x0000_s1156 _x0000_s1157">


Тема 3: Статистические показатели.
§1. Сущность и значение статистического показателя, его атрибуты.

§2. Классификация статистических показателей.

§3. Виды относительных показателей. Принципы построения.

§4. Системы статистических показателей.
§1.

Статистический признак – свойство присущее ЕСС, он существует объективно от того изучает его как наука или нет

Статистический показатель – обобщающая характеристика какого-либо свойства совокупности.

Структура статистического показателя (его атрибуты):

Качественная сторона: объект и его свойства

Количественная сторона: число и ед. измерения

Территориальные, отраслевые, либо др. границы

Интервал или момент времени

Ввод в действие жилых домов

40800,5 млн./м2

РФ

1993 год



§2.

<img width=«528» height=«448» src=«ref-1_470506032-6432.coolpic» v:shapes="_x0000_s1188 _x0000_s1185 _x0000_s1159 _x0000_s1160 _x0000_s1161 _x0000_s1162 _x0000_s1163 _x0000_s1165 _x0000_s1166 _x0000_s1167 _x0000_s1168 _x0000_s1169 _x0000_s1170 _x0000_s1171 _x0000_s1172 _x0000_s1173 _x0000_s1174 _x0000_s1175 _x0000_s1176 _x0000_s1177 _x0000_s1178 _x0000_s1179 _x0000_s1180 _x0000_s1181 _x0000_s1182 _x0000_s1183 _x0000_s1184 _x0000_s1187 _x0000_s1164 _x0000_s1186">



·         Средние величины

·         Показатели вариации

·         Показатели связи признаков

·         Показатели структуры и характера распределения

·         Показатели динамики

·         Показатели колебимости

·         Показатели точности и надежности выборочных оценок

·         Показатели точности и надежности прогнозов

По виду: суммарное количество  единиц либо суммарное свойство объекта. Это сумма первичных признаков, измеряется в шт., кг, м, $, и т.д.

Относительный показатель – получаемый путем сопоставления абсолютных или относительных показателей в пространстве, во времени или в сравнении показателей разных свойств изучаемого объекта.

Относительный показатель  1го порядка получается путем сопоставления 2х абсолютных показателей. Относительный показатель  2го порядка получается путем сопоставления относительных показателей  1го порядка и т.д.

Относительный показатель 3го порядка и выше встречаются очень редко.

Прямые показатели – такие показатели величина  которых увеличивается с увеличением исследуемого явления .

Обратные показатели – показатели величина которых уменьшается с увеличением исследуемого явления.

<img width=«416» height=«117» src=«ref-1_470512464-2138.coolpic» v:shapes="_x0000_s1194 _x0000_s1189 _x0000_s1190 _x0000_s1191 _x0000_s1192 _x0000_s1193">Пример:

    продолжение
--PAGE_BREAK--§3. Относительные показатели
<img width=«512» height=«219» src=«ref-1_470514602-4194.coolpic» v:shapes="_x0000_s1210 _x0000_s1195 _x0000_s1196 _x0000_s1197 _x0000_s1198 _x0000_s1199 _x0000_s1200 _x0000_s1201 _x0000_s1202 _x0000_s1203 _x0000_s1204 _x0000_s1205 _x0000_s1206 _x0000_s1207 _x0000_s1208 _x0000_s1209">



Показатели структуры получаются путем отношения части к целому.

Относительные показатели динамики

ü  Показатели динамики (темпы роста, прироста)

ü  Индексы


Показатели взаимосвязи характеризуют связи между признаками:

ü  Коэффициент корреляции

ü  Аналитические индексы

Показатели  интенсивности характеризуют  отношение двух объектов по  разным признакам.

ü  Трудоемкость – количество времени используемое для изготовления одной единицы изделия

ü  Выработка – количество продукции произведенное в единицу времени

ВЫРАБОТКА = 1/трудоемкость

Показатели отношения к нормативу – соотношение фактических величин признака показателя к нормативным, плановым, оптимальным.

Показатели сравнения – сравнение разных объектов по одному признаку.

Общие принципы построения статистических показателей:

1.      статистические показатели объективно связаны.

2.      сравниваемые показатели могут отличаться только одни атрибутом, нельзя сопоставлять показатель по двум и более атрибутам.

3.      необходимо знать и учитывать границы показателя.
§4.

Для каждой характеристики объекта необходима система статистических показателей.

1.      функция позновательская – основывается на анализе данных

2.      пропагандистская

3.      стимулирующая функция


тема 4: Средние величины
§1. понятие средней величины

§2. виды средних величин

§3. средняя арифметическая и ее свойства

§4. среднее гармоническое, геометрическое, квадратическое.

§5. многомерная средняя
§1.

Наиболее распространенной формой статистических показателей является средняя  величина.

Важнейшее свойство средней заключается в том, что  она отражает то общее, что присуще  каждой единице изучаемой совокупности, хотя значение признака отдельных единиц совокупности могут колебаться в ту или иную сторону.

Типичность средней непосредственно связана с однородностью изучаемой совокупности. В случае не однородной совокупности необходимо провести  разбивку ее на качественно однородные группы и рассчитать среднюю по каждой по каждой из однородных групп.

Определить среднюю можно  через исходное соотношение  средней (ИСС) ее логическую формулу.
<img width=«437» height=«73» src=«ref-1_470518796-1328.coolpic» v:shapes="_x0000_s1215 _x0000_s1211 _x0000_s1212 _x0000_s1213 _x0000_s1214">



От того в каком виде представлены данные  для расчета средней, зависит каким именно будет ИСС.
§2.
Средняя арифметическая Средне гармоническая Средне квадратическая, кубическая Средне геометрическое


Правило мажерантности средних.

<img width=«421» height=«25» src=«ref-1_470520124-573.coolpic» v:shapes="_x0000_i1025">

<img width=«114» height=«41» src=«ref-1_470520697-515.coolpic» v:shapes="_x0000_s1218 _x0000_s1216 _x0000_s1217">Структурные средние

Мода – Мо

Медиана – Ме

В рядах динамики рассчитывается средняя арифметическая, средняя хронологическая.

Средней арифметической называется такое среднее значение признака при вычислении которого общий объем признака не изменяется.

Пример: вес.

<img width=«204» height=«41» src=«ref-1_470521212-421.coolpic» v:shapes="_x0000_i1026">

<img width=«80» height=«64» src=«ref-1_470521633-343.coolpic» v:shapes="_x0000_i1027">  — ср. арифметическое простое

xi – индивидуальное значение признака

n – общее число изучаемой совокупности

<img width=«103» height=«89» src=«ref-1_470521976-429.coolpic» v:shapes="_x0000_i1028"> ср. арифметическое взвешенное

Свойства ср. арифметической.
Сумма отклонений индивидуальных значений признака от его средней величины равно нулю
<img width=«491» height=«67» src=«ref-1_470522405-795.coolpic» v:shapes="_x0000_i1029">


если каждое индивидуальное значение признака умножить или разделить на одно и тоже постоянное число, то среднее увеличится или уменьшится во столько же раз.
<img width=«307» height=«64» src=«ref-1_470523200-673.coolpic» v:shapes="_x0000_i1030">
если к каждому индивидуальному значению признака прибавить одно и тоже постоянное число, то средняя величина изменится соответственно на тоже самое число.
Доказательство
<img width=«383» height=«64» src=«ref-1_470523873-681.coolpic» v:shapes="_x0000_i1031">
если веса f средней взвешенной умножить или разделить на одно и тоже число, то средняя не изменится.
<img width=«403» height=«88» src=«ref-1_470524554-1203.coolpic» v:shapes="_x0000_i1032">


сумма квадратов отклонений признака меньше чем от любого другого числа.


Другие виды средних

Вид средней

Простая средняя

Взвешенная средняя

гармоническая

<img width=«166» height=«80» src=«ref-1_470525757-452.coolpic» v:shapes="_x0000_i1033">

<img width=«101» height=«89» src=«ref-1_470526209-457.coolpic» v:shapes="_x0000_i1034">

геометрическое

<img width=«199» height=«51» src=«ref-1_470526666-492.coolpic» v:shapes="_x0000_i1035">

<img width=«143» height=«45» src=«ref-1_470527158-412.coolpic» v:shapes="_x0000_i1036">

Квадратическая

<img width=«95» height=«69» src=«ref-1_470527570-400.coolpic» v:shapes="_x0000_i1037">

<img width=«105» height=«93» src=«ref-1_470527970-485.coolpic» v:shapes="_x0000_i1038">



§5.

Очень трудно охарактеризовать группировку по одному признаку и мало остается информации в памяти.

Сохранить сложность описания групп и одновременно преодолеть недостатки  комбинированной группировки позволяют многомерные группировки. Простейшим вариантом многомерной группировки является многомерная средняя.

Многомерная средняя – средняя величина для нескольких признаков Е.С.С.

Т.к. нельзя рассчитать ср. величину абсолютных значений разных признаков выраженных  в разных единицах измерения, то многомерная средняя вычисляется из относительных величин.

Из отношений значений признака для Е.С. к средним значениям этих признаков.

<img width=«141» height=«69» src=«ref-1_470528455-546.coolpic» v:shapes="_x0000_i1039">

<img width=«16» height=«24» src=«ref-1_470529001-203.coolpic» v:shapes="_x0000_i1040">  — многомерная средняя для i единицы

xij – значение признака j для i единицы

<img width=«19» height=«25» src=«ref-1_470529204-201.coolpic» v:shapes="_x0000_i1041">  — среднее значение признака j

k – число признаков

j – номер признака и номер его совокупности


    продолжение
--PAGE_BREAK--тема 5: Вариационный анализ
§1. Вариация признаков и ее причины

§2. Ряды распределения

§3. Структурные характеристики вариационного ряда.

§4. Показатели силы вариации.

§5. Показатели интенсивности вариации

§6. виды дисперсии. Правило сложения дисперсии.
§1.

Вариацией значения какого-либо признака  в совокупности  называется различие его значений  у разных единиц данной совокупности в один и тот же период или момент времени.

Причина вариации: разные условия существования ЕСС именно вариация порождает необходимость в такой науке как статистика.
§2.

Проведение вариационного анализа начинается с построения вариационного ряда – упорядоченное распределение единиц совокупности по возрастающим или по убывающим признакам и подсчет соответствующих частот.

Ряды распределения

ü  ранжированные

ü  дискретные

ü  интервальные

Ранжированный вариационный ряд – перечень отдельных ед. совокупности в порядке возрастания убывания ранжированного признака

БАНК

Капитал тыс. руб.

СБ РФ

96007237

Внешторгбанк

47991724

Дискретный вариационный ряд – таблица состоящая из 2х строк – полимерных значений варьирующего признака и кол-во единиц  с данным значением признака.

Кол-во детей в семье

0

1

2

3

4

Кол-во семей

20

40

45

10

5

Интервальный вариационный ряд строится в случаях:

1.      признак принимает дискретные значения, но кол-во их слишком велико

2.      признака принимает любые значения в определенном диапазоне

Размер собственного капитала тыс. руб.

0 — 10000

10000-50000

Свыше 50000

Количество банков

20

40

10

При построении интервального вариационного ряда необходимо выбрать оптимальное количество групп, самый распространенный способ по формуле Стерджесса

k=1+3.32lgn

k – количество интервалов

n – объем совокупности

При расчетах почти всегда получают дробные значения, округления производить до целого числа.

Длина интервала – l

<img width=«103» height=«43» src=«ref-1_470529405-302.coolpic» v:shapes="_x0000_i1042">

Виды  интервалов

1.      нижняя граница последующего интервала повторяет верхнюю границу последующего интервала



0 — 10

10 — 20

20 — 30









2.      С индивидуальными границами в интервал входят верхняя и нижняя границы


0 — 9

10 — 19

20 — 29









3.      открытый интервал, интервал с одной границей



До 5

5 — 10

10 – 15







В случае открытого интервала lпринимается равной длине смежного с ним интервала, либо исходя из логических соображений.



Стаж

До 5

5-7

7-9

Кол-во рабочих









При расчетах по интервальному  вариационному ряду за xi  принимается середина интервала.

<img width=«195» height=«139» src=«ref-1_470529707-1778.coolpic» v:shapes="_x0000_s1238 _x0000_s1236 _x0000_s1231 _x0000_s1221 _x0000_s1219 _x0000_s1220 _x0000_s1222 _x0000_s1223 _x0000_s1224 _x0000_s1225 _x0000_s1226 _x0000_s1227 _x0000_s1228 _x0000_s1229 _x0000_s1230 _x0000_s1232 _x0000_s1235 _x0000_s1237">
Интервалы могут быть как равные так и нет. При изучении вариационного ряда существенную помощь оказывает графическое изображение. Дискретный вариационный ряд изображается с помощью полигона.
Интервальный вариационный ряд изображается с помощью гистограммы.

<img width=«288» height=«185» src=«ref-1_470531485-1658.coolpic» v:shapes="_x0000_s1258 _x0000_s1256 _x0000_s1241 _x0000_s1239 _x0000_s1240 _x0000_s1242 _x0000_s1244 _x0000_s1245 _x0000_s1246 _x0000_s1247 _x0000_s1248 _x0000_s1249 _x0000_s1250 _x0000_s1251 _x0000_s1252 _x0000_s1253 _x0000_s1255 _x0000_s1257">
Накопленная частота

xi



1

2

3

4

fi

20

40

45

10

5



NME=60  медиана = 1

Кумулята – распределение меньше чем

<img width=«306» height=«139» src=«ref-1_470533143-2056.coolpic» v:shapes="_x0000_s1284 _x0000_s1282 _x0000_s1262 _x0000_s1263 _x0000_s1264 _x0000_s1265 _x0000_s1266 _x0000_s1267 _x0000_s1268 _x0000_s1269 _x0000_s1270 _x0000_s1271 _x0000_s1274 _x0000_s1275 _x0000_s1276 _x0000_s1278 _x0000_s1279 _x0000_s1280 _x0000_s1281 _x0000_s1283">
Огива – распределение больше чем
§3.

Медиана – значение признака делящее всю совокупность на две равные части.

Для дискретного вариационного ряда расчет медианы: если n-четное, то №Ме медианой единицы

<img width=«140» height=«41» src=«ref-1_470535199-373.coolpic» v:shapes="_x0000_i1043">

<img width=«175» height=«41» src=«ref-1_470535572-410.coolpic» v:shapes="_x0000_i1044">

Интервальный вариационный ряд:

<img width=«196» height=«68» src=«ref-1_470535982-553.coolpic» v:shapes="_x0000_i1045">

k – количество интервалов

х0– нижняя граница медианного интервала

l – длина медианного интервала

<img width=«37» height=«45» src=«ref-1_470536535-283.coolpic» v:shapes="_x0000_i1046">  — сумма частот

<img width=«48» height=«25» src=«ref-1_470536818-236.coolpic» v:shapes="_x0000_i1047">  — накопленная частота интервала предшествующая медианному.

<img width=«27» height=«24» src=«ref-1_470537054-218.coolpic» v:shapes="_x0000_i1048">  — частота медианного интервала

Медианный интервал – первый интервал накопленная частота которого превышает половину от общей суммы частот.

0-5

5-10

<img width=«325» height=«77» src=«ref-1_470537272-878.coolpic» v:shapes="_x0000_s1289 _x0000_s1285 _x0000_s1286 _x0000_s1287 _x0000_s1288">10-15

15-20

15

20

40

25


Графически медиана находится по кумуляте.

2.      Квартили – значение признака делящее совокупность на 4 равные части.

1ый квартиль <img width=«171» height=«71» src=«ref-1_470538150-514.coolpic» v:shapes="_x0000_i1049">

3ий квартиль <img width=«175» height=«71» src=«ref-1_470538664-509.coolpic» v:shapes="_x0000_i1050">

2ой квартиль – медиана.

xQ
1  
xQ3 – нижняя граница интервала содержащего 1го и 3го квартили.


l – длина интервала

<img width=«33» height=«27» src=«ref-1_470539173-231.coolpic» v:shapes="_x0000_i1051"> и <img width=«33» height=«27» src=«ref-1_470539404-231.coolpic» v:shapes="_x0000_i1052">  — накопленные частоты интервалов предшествующих интервалов содержащих 1 и 3 квартили.

<img width=«24» height=«27» src=«ref-1_470539635-219.coolpic» v:shapes="_x0000_i1053">  — частоты квартильных интервалов.

Для характеристики вариационного ряда используются:

Децили – делят совокупность на 10 равных частей, Перцитили – делят совокупность на 100 равных частей.

3.      Мода – часто встречающаяся характеристика признака. Для дискретного вариационного ряда – наибольшая частота. Для интервального вариационного ряда мода рассчитывается по следующей формуле:

<img width=«192» height=«29» src=«ref-1_470539854-452.coolpic» v:shapes="_x0000_i1054">


<img width=«19» height=«24» src=«ref-1_470540306-197.coolpic» v:shapes="_x0000_i1055">  — нижняя граница модального интервала

l – длина модального интервала

fMo – частота модального интервала

fMo+1 – частота интервала следующего за модальным

Модальный интервал – интервал с наибольшей частотой. Графически мода находится по гистограмме.

§4.

1.      Размах вариации <img width=«99» height=«24» src=«ref-1_470540503-275.coolpic» v:shapes="_x0000_i1056">

2.      Среднее линейное отклонение

<img width=«96» height=«64» src=«ref-1_470540778-379.coolpic» v:shapes="_x0000_i1057">

<img width=«119» height=«88» src=«ref-1_470541157-501.coolpic» v:shapes="_x0000_i1058">  — взвешенная

3.      Дисперсия:

<img width=«120» height=«47» src=«ref-1_470541658-373.coolpic» v:shapes="_x0000_i1059">

<img width=«141» height=«52» src=«ref-1_470542031-447.coolpic» v:shapes="_x0000_i1060">  — взвешенная

4.       Средне квадратическое отклонение

<img width=«64» height=«27» src=«ref-1_470542478-262.coolpic» v:shapes="_x0000_i1061">

Свойство дисперсии.

1.      <img width=«95» height=«24» src=«ref-1_470542740-292.coolpic» v:shapes="_x0000_i1062">

<img width=«93» height=«47» src=«ref-1_470543032-353.coolpic» v:shapes="_x0000_i1063">

1.      уменьшение всех значений признака на одну и ту же величину не меняет величину дисперсии.

<img width=«121» height=«37» src=«ref-1_470543385-369.coolpic» v:shapes="_x0000_i1064">

2.      Уменьшение всех значений признаков в к раз  уменьшает величину дисперсии в к2 раз, а СКО в к раз

3.      <img width=«41» height=«115» src=«ref-1_470543754-289.coolpic» alt=«Подпись: Правило 3 сигм» v:shapes="_x0000_s1292" v:dpi=«96»><img width=«48» height=«115» src=«ref-1_470544043-448.coolpic» v:shapes="_x0000_s1290 _x0000_s1291">если исчислить средний квадрат отклонений  от любой величины А отличающийся от средней арифметической, то он всегда будет больше среднего квадрата отклонений исчисленного из средней арифметической. Таким образом <img width=«23» height=«21» src=«ref-1_470544491-202.coolpic» v:shapes="_x0000_i1065"> от средней всегда меньше <img width=«23» height=«21» src=«ref-1_470544491-202.coolpic» v:shapes="_x0000_i1066"> исчисленной от любой другой  величины т.е. она имеет свойство минимальности. СКО=1,25<img width=«16» height=«21» src=«ref-1_470544895-203.coolpic» v:shapes="_x0000_i1067"> -при распределениях близких к нормальному.

В условиях нормального распределения существует следующая зависимость между <img width=«21» height=«21» src=«ref-1_470545098-170.coolpic» v:shapes="_x0000_i1068"> и количеством наблюдений в пределах <img width=«45» height=«19» src=«ref-1_470545268-220.coolpic» v:shapes="_x0000_i1069">находится 68,3% наблюдений.

В пределах <img width=«48» height=«19» src=«ref-1_470545488-234.coolpic» v:shapes="_x0000_i1070"> находится 95,4% наблюдений

В пределах <img width=«48» height=«19» src=«ref-1_470545722-228.coolpic» v:shapes="_x0000_i1071"> находится 99,7% наблюдений
§5.

Для сравнения вариации признаков в разных совокупностях или для сравнения вариации разных признаков в одной совокупности используются относительные показатели, базой служит средняя арифметическая.

1.      Относительный размах вариации.

<img width=«153» height=«27» src=«ref-1_470545950-380.coolpic» v:shapes="_x0000_i1072">

2.      Относительное линейное отклонение

<img width=«97» height=«44» src=«ref-1_470546330-332.coolpic» v:shapes="_x0000_i1073">

3.      Коэффициент вариации

<img width=«85» height=«24» src=«ref-1_470546662-286.coolpic» v:shapes="_x0000_i1074">

данные показатели дают не только сравнительную оценку но и образуют однородность совокупности. Совокупность считается однородной если коэффициент вариации не превышает 33%.
§6

На ряду с изучением вариации признака по всей совокупности в целом, часто бывает необходимо проследить количественные изменения признака, но группам, на которые делится совокупность и между ними. Эта достигается путем вычисления <img width=«23» height=«21» src=«ref-1_470544491-202.coolpic» v:shapes="_x0000_i1075">разных видов.

Виды дисперсии:

1.      Общая дисперсия <img width=«33» height=«27» src=«ref-1_470547150-231.coolpic» v:shapes="_x0000_i1076">

2.      Межгрупповая дисперсия <img width=«28» height=«29» src=«ref-1_470547381-238.coolpic» v:shapes="_x0000_i1077">

3.      Внутригрупповая дисперсия (остаточная) <img width=«32» height=«25» src=«ref-1_470547619-225.coolpic» v:shapes="_x0000_i1078">
1.      измеряет вариацию признака во всей совокупности под влиянием все факторов обусловивших данную вариацию

Пример: потребление йогурта: при выборке 100 человек
<img width=«239» height=«62» src=«ref-1_470547844-789.coolpic» v:shapes="_x0000_s1295 _x0000_s1293 _x0000_s1294">Возраст

Доход

Социальное положение

<img width=«144» height=«52» src=«ref-1_470548633-472.coolpic» v:shapes="_x0000_i1079">

xi –индивидуальное значение признака

<img width=«15» height=«17» src=«ref-1_470549105-193.coolpic» alt="*" v:shapes="_x0000_i1080">  — среднее значение признака по всей совокупности

<img width=«17» height=«24» src=«ref-1_470549298-209.coolpic» v:shapes="_x0000_i1081">  — частота этого признака.

2.      характеризует вариацию признака под влиянием признака фактора положенного в основу группировки.

<img width=«144» height=«52» src=«ref-1_470549507-480.coolpic» v:shapes="_x0000_i1082">

<img width=«19» height=«25» src=«ref-1_470549987-202.coolpic» v:shapes="_x0000_i1083">  — средняя по группе

<img width=«17» height=«25» src=«ref-1_470550189-193.coolpic» v:shapes="_x0000_i1084">  — общая средняя по группе

<img width=«19» height=«25» src=«ref-1_470550382-212.coolpic» v:shapes="_x0000_i1085">  — частота по группе

3.      <img width=«32» height=«25» src=«ref-1_470547619-225.coolpic» v:shapes="_x0000_i1086"> характеризует вариацию признака под влиянием факторов не включенных в группировку

<img width=«155» height=«52» src=«ref-1_470550819-498.coolpic» v:shapes="_x0000_i1087">

xij
i значение признака в j группе


<img width=«19» height=«25» src=«ref-1_470549987-202.coolpic» v:shapes="_x0000_i1088">  — среднее значение признака в j группе

fij – частота
i-го признака в
j группе


            Существует правило которое связывает 3 вида дисперсии, оно называется правило сложения дисперсии.

<img width=«119» height=«29» src=«ref-1_470551519-355.coolpic» v:shapes="_x0000_i1089">

<img width=«109» height=«47» src=«ref-1_470551874-359.coolpic» v:shapes="_x0000_i1090">

<img width=«35» height=«27» src=«ref-1_470552233-236.coolpic» v:shapes="_x0000_i1091">  — остаточная дисперсия по j группе

<img width=«19» height=«25» src=«ref-1_470552469-203.coolpic» v:shapes="_x0000_i1092">  — сумма частот по j группе

n – общая сумма частот
§7

основная задача анализа вариационных рядов – выявление закономерности распределения частот.

Кривая распределения – графическое изображение в виде непрерывной линии  изменения частот в вариационном ряду в функционально связанным изменением значения признака.

<img width=«246» height=«152» src=«ref-1_470552672-1871.coolpic» v:shapes="_x0000_s1323 _x0000_s1321 _x0000_s1318 _x0000_s1316 _x0000_s1309 _x0000_s1299 _x0000_s1296 _x0000_s1298 _x0000_s1303 _x0000_s1300 _x0000_s1301 _x0000_s1302 _x0000_s1304 _x0000_s1305 _x0000_s1306 _x0000_s1307 _x0000_s1308 _x0000_s1311 _x0000_s1312 _x0000_s1313 _x0000_s1314 _x0000_s1315 _x0000_s1317 _x0000_s1320 _x0000_s1322">



Кривую распределения можно построить с помощью полигона и гистограммы. Целесообразно свести эмпирическое распределение к теоретическому, к одному из хорошо изученных виду.

Кривая нормального распределения.

            Различают следующие разновидности кривых распределения:
одновершинные много вершинные
Для однородных совокупностей характерны одновершинные кривые, много вершинная кривая говорит о неоднородности совокупности и необходимости перегруппировки.

            Выяснение общего характера распределения предполагает оценку его однородности, и расчет асимметрии и эксцесса. Для симметричных распределений <img width=«91» height=«19» src=«ref-1_470554543-280.coolpic» v:shapes="_x0000_i1093">

Для сравнительного изучения асимметрии различных распределений вычисляется коэффициент асимметрии As.

<img width=«61» height=«43» src=«ref-1_470554823-280.coolpic» v:shapes="_x0000_i1094">  где <img width=«131» height=«52» src=«ref-1_470555103-444.coolpic» v:shapes="_x0000_i1095">

<img width=«20» height=«24» src=«ref-1_470555547-204.coolpic» v:shapes="_x0000_i1096">  — центральный момент третьего порядка; <img width=«21» height=«21» src=«ref-1_470555751-204.coolpic» v:shapes="_x0000_i1097">  — СКО в кубе;

Если <img width=«63» height=«27» src=«ref-1_470555955-259.coolpic» v:shapes="_x0000_i1098">, то асимметрия значительная

Если As<0, то As – левосторонняя, если As>0, то As – правосторонняя.

Если <img width=«72» height=«27» src=«ref-1_470556214-276.coolpic» v:shapes="_x0000_i1099">, то As незначительная. Для симметричных и умеренно асимметричных рассчитывается показатель эксцесса: <img width=«84» height=«43» src=«ref-1_470556490-315.coolpic» v:shapes="_x0000_i1100">, если Ек>0, то распределение островершинное, если Ek<0, то распределение плосковершинное.

§8.

Вариация альтернативного признака количественно проявляется следующим образом.

0 – единицы не обладающие данным признаком;

1 – единицы обладающие данным признаком;

Пусть:

р – доля единиц обладающих данным признаком;

q – доля единиц не обладающих данным признаком;

тогда
p+
q=1.


            Альтернативный признак принимает 2 значения 0 и 1 с весами p и q.

<img width=«117» height=«44» src=«ref-1_470556805-374.coolpic» v:shapes="_x0000_i1101">;  <img width=«249» height=«47» src=«ref-1_470557179-551.coolpic» v:shapes="_x0000_i1102">

Прямые признаки – это такие признаки, величина которых увеличивается с увеличением исследуемого явления.

Обратные признаки – признаки, величина которых уменьшается с увеличением исследуемого явления.

<img width=«301» height=«112» src=«ref-1_470557730-2136.coolpic» v:shapes="_x0000_s1329 _x0000_s1324 _x0000_s1325 _x0000_s1326 _x0000_s1327 _x0000_s1328">



Максимальная дисперсия доли равна 0,25.
    продолжение
--PAGE_BREAK--Тема 6: Моделирование рядов распределения.
§1. Фактическое и теоретическое распределение

§2. Кривая нормального распределения.

§3. Проверка гипотезы о нормальном распределении.

§4. Критерии согласия: Пирсона, Романовского, Колмогорова.

§5. Практическое значение моделирования рядов распределения.


§1. Фактическое и теоретическое распределение
Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер. Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений.

Фактическое распределение может быть изображено графически с помощью кривой распределения – графически изображается в виде непрерывной линии изменения частот в вариационном ряду функционально связанного с изменением варианта.

Под теоретической кривой распределения понимается кривая данного типа распределения в общем виде исключающего влияние случайных для закономерности факторов.

Теоретическое распределение может быть выражено аналитической формулой которая называется аналитической формулой. Наиболее распространенным является нормальное распространение.
§2. Кривая нормального распределения.
Закон нормального распределения:

<img width=«88» height=«44» src=«ref-1_470559866-328.coolpic» v:shapes="_x0000_i1103">;

у – ордината нормального распределения

t – нормированное отклонение.

<img width=«67» height=«43» src=«ref-1_470560194-269.coolpic» v:shapes="_x0000_i1104">;  е=2,7218; xi– варианты вариационного ряда; <img width=«15» height=«17» src=«ref-1_470549105-193.coolpic» v:shapes="_x0000_i1105">  — среднее;

Свойства:

Функция нормального распределения – четная, т.е. f(t)=f(-t), <img width=«91» height=«19» src=«ref-1_470554543-280.coolpic» v:shapes="_x0000_i1106">. Функция нормального распределения полностью определяется  <img width=«15» height=«17» src=«ref-1_470549105-193.coolpic» v:shapes="_x0000_i1107"> и СКО.
§3. Проверка гипотезы о нормальном распределении.
Причиной частого обращения к закону распределения является то, что зависимость возникающая  в результате  действия  множества случайных причин ни одна из которых не является преобладающей. Если в вариационном ряду рассчитали Мо=Ме, то это может указывать на близость к нормальному распределению. Наиболее точная проверка соответствия нормальному закону производится с помощью специальных критериев.
§4. Критерии согласия: Пирсона, Романовского, Колмогорова.
Критерий Пирсона.

<img width=«129» height=«48» src=«ref-1_470561129-418.coolpic» v:shapes="_x0000_i1108">

<img width=«20» height=«23» src=«ref-1_470561547-208.coolpic» alt="*" v:shapes="_x0000_i1109"> — теоретическая частота

<img width=«20» height=«24» src=«ref-1_470561755-211.coolpic» v:shapes="_x0000_i1110"> — эмпирическая частота

Методика расчета теоретических частот.
Определяется среднее арифметическое и <img width=«16» height=«15» src=«ref-1_470561966-188.coolpic» v:shapes="_x0000_i1111"> по интервальному вариационному ряду, считается t по каждому интервалу. Находим значение плотности вероятности для нормированного  закона распределения.<img width=«95» height=«45» src=«ref-1_470562154-353.coolpic» v:shapes="_x0000_i1112"> СТР.49 Находим теоретическую частоту. <img width=«109» height=«45» src=«ref-1_470562507-373.coolpic» v:shapes="_x0000_i1113">
l – длина интервала

<img width=«37» height=«27» src=«ref-1_470562880-247.coolpic» v:shapes="_x0000_i1114">  — сумма эмпирических частот

<img width=«32» height=«21» src=«ref-1_470563127-226.coolpic» alt="*" v:shapes="_x0000_i1115">    — плотность вероятности

округлить значение до целых

4.      Расчет коэффициента Пирсона

<img width=«47» height=«27» src=«ref-1_470563353-244.coolpic» v:shapes="_x0000_i1116">

5.      табличное значение <img width=«23» height=«27» src=«ref-1_470563597-215.coolpic» v:shapes="_x0000_i1117">

d.f. – количество интервалов – 3

d.f. – количество степеней свободы.

6.      если <img width=«47» height=«27» src=«ref-1_470563353-244.coolpic» v:shapes="_x0000_i1118">><img width=«36» height=«25» src=«ref-1_470564056-233.coolpic» v:shapes="_x0000_i1119">, то распределение  не является нормальным, т.е. гипотеза о нормальном распределении отменяется. Если <img width=«47» height=«27» src=«ref-1_470563353-244.coolpic» v:shapes="_x0000_i1120"><<img width=«36» height=«25» src=«ref-1_470564056-233.coolpic» v:shapes="_x0000_i1121">, то распределение является  нормальным.

Критерий Романовского.

<img width=«103» height=«53» src=«ref-1_470564766-379.coolpic» v:shapes="_x0000_i1122">

<img width=«47» height=«27» src=«ref-1_470563353-244.coolpic» v:shapes="_x0000_i1123">  — критерий Пирсона расчетный;

<img width=«13» height=«17» src=«ref-1_470565389-194.coolpic» v:shapes="_x0000_i1124">   — число степеней.

Если С<3, то распределение близко к нормальному.

Критерий Колмогорова

<img width=«81» height=«52» src=«ref-1_470565583-343.coolpic» v:shapes="_x0000_i1125">, D – максимальное значение между накопленными эмпирическими и теоретическими частотами. Необходимое условие для использования  Колмогорова: Число наблюдений более 100. По  специальной таблице вероятностей <img width=«37» height=«21» src=«ref-1_470565926-236.coolpic» v:shapes="_x0000_i1126"> с которой  можно утверждать, что данное распределение  является нормальным.
    продолжение
--PAGE_BREAK--§5. Практическое значение моделирования рядов распределения.
1.      возможность применить к эмпирическому распределению законов нормального распределения.

2.      возможность использования правила 3х сигм.

3.      Возможность избежать  дополнительных трудоемких и затратных расчетов, по исследованию совокупности зная, что распределение нормальное.


Тема 7: Выборочное наблюдение.
§1. Понятие выборочного наблюдения. Причины его применения.

§2. Виды выборочного наблюдения.

§3. Ошибки выборочного наблюдения.

§4. Задачи выборочного наблюдения

§5. Распространение данных выборочного наблюдения на генеральную совокупность.

§6. Малая выборка.


§1. Понятие выборочного наблюдения. Причины его применения.
Выборочное наблюдение – такое не сплошное наблюдение, при котором  статистическому обследованию подвергаются единицы изучаемой совокупности, отобранные определенным образом.

Цель (задача) выборочного наблюдения:  по обследуемой части  дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов статистического наблюдения.
Причины применения выборочного наблюдения: экономия материальных, трудовых затрат и времени; возможность более детально и подробно изучит отдельные единицы статистической совокупности и их группы. некоторые специфические задачи можно решить только с применением выборочного наблюдения. грамотное и хорошо организованное выборочное наблюдение дает высокую точность результатов.
Генеральная совокупность – совокупность единиц, из которых производится отбор.

Выборочная совокупность – совокупность отобранных для обследования единиц. В статистике принято различать параметры генеральной совокупности и выборочной совокупности.

Совокупность

Средняя

Дисперсия

Объем

Доля

Генеральная

m

s2

N

p

Выборочная

<img width=«15» height=«17» src=«ref-1_470549105-193.coolpic» v:shapes="_x0000_i1127">

S2

n

p


Виды выборочного наблюдения По методу отбора: Повторное
Попавшая в выборку единица после регистрации наблюдаемых признаков возвращаются в генеральную совокупность для участия в дальнейшей процедуре отбора.

Объем генеральной совокупности остается неизменным, что обуславливает постоянное попадание в выборку какой-либо единицы.
Бесповторное
Попавшая в выборку единица не возвращается в совокупность, из которой происходит отбор.

По способу отбора:

Собственно-случайная заключается в отношении единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Однако прежде чем проводить такую выборку, нужно  убедиться, что все единицы генеральной совокупности имеют равные шансы попасть в выборку, т.е. в полном перечне единиц статистической совокупности отсутствуют пропуски или игнорирования отдельных единиц. Следует, также, четко установить границы  генеральной совокупности. Технически сложившейся отбор осуществляется методом жеребьевки или с помощью таблицы случайных чисел.

Механическая выборка(каждый 5 по списку) применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в распределении единиц. При проведении механической выборки устанавливается пропорция отбора, которая устанавливается соотношением генеральной совокупности и выборочной совокупности.

Опасность ошибки при механической выборке может появляться вследствие: случайного совпадения выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности.

Районированная выборка используется когда все единицы генеральной совокупности можно разбить на группы (районы, страны) по какому-либо признаку.

Комбинированная выборка.

            Отбор единиц может быть произведен:

1.      либо пропорционально объему группы

2.      либо пропорционально внутригрупповой дифференциации признака

1.      <img width=«67» height=«43» src=«ref-1_470566355-301.coolpic» v:shapes="_x0000_i1128">, где n– объем выборочной совокупности, N– объем генеральной совокупности, niобъем выборки i-группы, Niобъем iвыборки.

2.      <img width=«100» height=«48» src=«ref-1_470566656-391.coolpic» v:shapes="_x0000_i1129">  — этот способ является более точным, но в ходе проведения выборочного наблюдения очень трудно определить заранее о вариации. (до проявления наблюдения).
Серийный отбор.

Используется когда  ЕСС объединены в небольшие группы (серии), например упаковка с готовой продукцией, студенческие группы. Сущность серийной выборки – серии отбираются собственно случайным, либо механическим способом, а затем осуществляется сплошное обследование внутри отобранной  серии.

Комбинированный отбор.

Это комбинация рассмотренных выше способов отбора чаще применяется комбинация типичных и серийных серии, т.е. отбор серий из нескольких типических групп.

Отбор моет быть еще многоступенчатым и одноступенчатым, многофразным и однофразным.

Многоступенчатый отбор:из генеральной совокупности сначала извлекаются укрупненные группы, затем более мелкие, и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

Многофразная выборка:предполагает сохранение одной и той же единицы отбора на всех этапах его проведения. При этом отобранные на каждой  последующей стадии единицы отбора подвергаются обследованию, программа которого расширяется (Пример: студенты всего института, затем студенты каких-то факультетов).
    продолжение
--PAGE_BREAK--§3. Ошибки выборочного наблюдения.
<img width=«486» height=«142» src=«ref-1_470567047-3017.coolpic» v:shapes="_x0000_s1347 _x0000_s1338 _x0000_s1339 _x0000_s1340 _x0000_s1341 _x0000_s1342 _x0000_s1343 _x0000_s1344 _x0000_s1345 _x0000_s1346">



Ошибки репрезентативности возникают только при выборочном наблюдении. Возникают в силу того, что  выборочная совокупность не может в точности воспроизвести  генеральную совокупность. Избежать их нельзя, но они легко поддаются прогнозированию и при необходимости их можно свести к минимуму.

Ошибка выборочного наблюдения – это разности между величиной  параметра в генеральной совокупности и его величиной вычисленной по результатам выборочного наблюдения. Dх=-m+<img width=«15» height=«17» src=«ref-1_470549105-193.coolpic» v:shapes="_x0000_i1130">, Dх – предельная ошибка в выборке, m — генеральная средняя; <img width=«15» height=«17» src=«ref-1_470549105-193.coolpic» v:shapes="_x0000_i1131">  — выборочная средняя.

                     Предельная ошибка выборки – величина случайная исследованию закономерностей случайны ошибок выборки посвящены работы Чебышева. В теореме Чебышева доказано, что Dх не превышает: <img width=«77» height=«48» src=«ref-1_470570450-319.coolpic» v:shapes="_x0000_i1132">  — средняя ошибка выборки.t-коэффициент доверия указывает на вероятность данной ошибки. Стр 42-43.

В случае, когда нужно определить t по известной  F(t) берем F(t) ближайшую большую и по ней определяем t.

Предельная ошибка доль

<img width=«112» height=«47» src=«ref-1_470570769-374.coolpic» v:shapes="_x0000_i1133">, р – доля.

Если отбор был осуществлен бесповторным способом, то в формулы предельных ошибок добавляется

<img width=«127» height=«48» src=«ref-1_470571143-415.coolpic» v:shapes="_x0000_i1134">  — поправка на бес повторность.

Для каждого вида выборочного наблюдения представленная ошибка, рассчитываются по разному:
собственно случайное и механическое наблюдение <img width=«137» height=«51» src=«ref-1_470571558-442.coolpic» v:shapes="_x0000_i1135">; <img width=«160» height=«47» src=«ref-1_470572000-464.coolpic» v:shapes="_x0000_i1136"> Районированное наблюдение
<img width=«136» height=«49» src=«ref-1_470572464-430.coolpic» v:shapes="_x0000_i1137">

<img width=«160» height=«47» src=«ref-1_470572000-464.coolpic» v:shapes="_x0000_i1138">
Серийная выборка
<img width=«129» height=«53» src=«ref-1_470573358-422.coolpic» v:shapes="_x0000_i1139"> 

r – количество серий в выборке;

R – количество серий в генеральной совокупности;

<img width=«135» height=«52» src=«ref-1_470573780-441.coolpic» v:shapes="_x0000_i1140">;

<img width=«35» height=«29» src=«ref-1_470574221-244.coolpic» v:shapes="_x0000_i1141">  — меж групповая дисперсия доли.
§4. Задачи выборочного наблюдения
Применяется для следующих задач:
n —? для определения объема выборки по известной F(t), Dx. определение Dx выборки по известной F(t), n определение F(t) по известным Dx и n


1 задача n —? Сначала n  определяется по формуле повторного отбора <img width=«79» height=«48» src=«ref-1_470574465-323.coolpic» v:shapes="_x0000_i1142">, <img width=«179» height=«44» src=«ref-1_470574788-448.coolpic» v:shapes="_x0000_i1143"> для бесповторного отбора: <img width=«133» height=«51» src=«ref-1_470575236-458.coolpic» v:shapes="_x0000_i1144">

Способы для определения дисперсии:
ее берут из предыдущих аналогичных исследований. СКО»<img width=«25» height=«41» src=«ref-1_470575694-227.coolpic» v:shapes="_x0000_i1145"> СКО при нормальном распределении » 1/6 размаха вариации. если распределение заведомо асимметричное, то СКО » 1/5 размаха вариации Для доли применяется дисперсия максимально возможная р(1-р)=0,25 при n³100, то  s2=S2 – выборочная дисперсия
30£ n£100, то s2=S2(n/n-1), s2 – генеральная дисперсия

n<30, то S2 ( малая, т.к. дисперсия выборочная) и все расчеты ведутся по S2

При расчете n не следует гнаться за большим значением  t и за малыми предельными ошибками, т.к. это ведет к увеличению n следовательно, к увеличению затрат. По следующему закону аналогично.
    продолжение
--PAGE_BREAK--§5. Распространение данных выборочного наблюдения на генеральную совокупность.
Конечной целью любого ВН является  характеристика генеральной совокупности.

Величины, рассчитанные по результатам ВН распространяются на  генеральную совокупность с учетом предела их предельной ошибки.

Предположим, что потребление йогурта в месяц одним человеком.

<img width=«132» height=«21» src=«ref-1_470575921-321.coolpic» v:shapes="_x0000_i1146">

250-20£m£250+20;       230£m£270

А всего 1000 человек

<img width=«156» height=«21» src=«ref-1_470576242-362.coolpic» v:shapes="_x0000_i1147">

230000£m£270000

Для доли

p-Dp£p£p+Dp

48%-5%£p£48%+5%

43%£p£53%
§6. Малая выборка.
В практике статистического исследования в современных условиях все чаще приходится сталкиваться с небольшими по объему выборками.

Малая выборка – выборка наблюдения численность единиц которого не превышает 30, n£30/

Разработка теории малой выборки была проделана английским статистом Госсет, писавшим под псевдонимом student в 1908 году.

Он доказал, что оценка расхождения между средствами малой выборки и генеральной выборки имеет особый закон распределения. При расчетах по малой выборке величина s2 не рассчитывается. tст для возможных пределов ошибки пользуются критерием student. Стр.44-45. <img width=«80» height=«21» src=«ref-1_470576604-271.coolpic» v:shapes="_x0000_i1148">  — вероятность обратного события.

Количество степеней свободы

d.f=n-1,

предельная ошибка малой выборки

<img width=«100» height=«48» src=«ref-1_470576875-351.coolpic» v:shapes="_x0000_i1149">

предельная ошибка доли

<img width=«127» height=«47» src=«ref-1_470577226-402.coolpic» v:shapes="_x0000_i1150">
Тема 8: Корреляционно-регрессионный анализ и моделирование.
§1. Понятие корреляционной связи и КРА.

§2. Условия применения и ограничения КРА.

§3. Парная регрессия на основе метода наименьших квадратов.

§4. Применение парного линейного уравнения регрессии.

§5. Показатели тесноты связи и силы связи.

§6. Множественная корреляция.
§1. Понятие корреляционной связи и КРА.
Функциональная связь y=5x

Корреляционная связь <img width=«47» height=«21» src=«ref-1_470577628-233.coolpic» v:shapes="_x0000_i1151">

Различают 2 типа связей меду различными явлениями и их признаком функциональную и статистическую.

Функциональной называется такая связь когда с изменением значения одной из переменных вторая изменяется строго определенным образом, т.е., значению одной переменной  соответствует одно или несколько точно заданных значений другой переменной. Функциональная связь возможна лишь в том случае, когда переменная у зависит от переменной х и не от каких других факторов не зависит, но  в реальной жизни такое невозможно.

Статистическая связь существует в том случае, когда с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения, но ее статистические характеристики изменяются по определенному закону.

            Важнейший частный случай статистической связи – корреляционная связь. При корреляционной связи разным значениям  одной переменной соответствуют  различные средние значения другой переменной, т.е. с изменением значения признака  х  закономерным образом изменяется среднее значение признака у.

            Слово корреляция ввел английский биолог и статист  Френсис Галь (correlation)

Корреляционная связь может возникнуть разными путями:
причинная зависимость вариации результативного признака от вариации факторного признака. Корреляционная связь может возникнуть между 2 следствиями одной причины (пожары, кол-во пожарников, размер пожара) Взаимосвязь признаков каждый из которых и причина и следствие одновременно (производительность труда и з/плата)


В статистике  принято различать следующие виды зависимости:
парная корреляция – связь между 2мя признаками результативным и факторным, либо между двумя факторными. частная корреляция – зависимость между результативным и одним факторным признаком при фиксированном значении другого факторного признака. множественная корреляция – зависимость результативного признака от двух и более факторных признаков включенных в исследование.
Задачей корреляционного анализа является количественная оценка тесноты связи между признаками. В конце 19 века Гальтон и Пирсон исследовали  зависимость между ростом отцов и детей.

Регрессия исследует форму связи. Задача регрессионного анализа – определение аналитического выражения связи.

Корреляционно-регрессионный анализ как общее понятие включает в себя  изменение тесноты связи и установления аналитического выражения связи.
    продолжение
--PAGE_BREAK--§2. Условия применения и ограничения КРА.
1.      наличие массовых данных, т.к. корреляционная связь является статистической

2.      необходима качественная однородность совокупности.

3.      подчинение распределения совокупности по результативному и факторному признаку, нормальному закону распределения, что связано с применением метода наименьших квадратов.
§3. Парная регрессия на основе метода наименьших квадратов.
Регрессионный анализ заключается  в определении аналитического выражения связи. По форме различают линейную регрессию, которая выражается уравнением прямой <img width=«71» height=«21» src=«ref-1_470577861-260.coolpic» v:shapes="_x0000_i1152">, и не линейную регрессию <img width=«105» height=«24» src=«ref-1_470578121-303.coolpic» v:shapes="_x0000_i1153"> или <img width=«67» height=«41» src=«ref-1_470578424-276.coolpic» v:shapes="_x0000_i1154">.

По направлению связи различают на прямую т.е. с увеличением признака х увеличивается признак у.

<img width=«445» height=«126» src=«ref-1_470578700-1900.coolpic» v:shapes="_x0000_s1357 _x0000_s1348 _x0000_s1349 _x0000_s1351 _x0000_s1352 _x0000_s1353 _x0000_s1354 _x0000_s1355 _x0000_s1356">



Обратная т.е. с увеличением х уменьшается у.

1.      способ графический – нанеся эмпирические данные на поле корреляции, но более точная оценка производится с помощью метода наименьших квадратов.

2.      МНК

Х – признак фактический

У — признак результативный

<img width=«71» height=«21» src=«ref-1_470577861-260.coolpic» v:shapes="_x0000_i1155">

<img width=«124» height=«28» src=«ref-1_470580860-352.coolpic» v:shapes="_x0000_i1156">

Разница между фактическим значением и значением рассчитанным по уравнению связи возведенное в квадрат должна стремиться к минимуму.

При МНК min сумма квадратов отклонений эмпирических значений у от теоретических полученных по выбранному уравнению регрессии.

            Для линейной зависимости

<img width=«230» height=«68» src=«ref-1_470581212-709.coolpic» v:shapes="_x0000_i1157"><img width=«108» height=«52» src=«ref-1_470581921-542.coolpic» v:shapes="_x0000_s1360 _x0000_s1358 _x0000_s1359">

для параболы

<img width=«297» height=«85» src=«ref-1_470582463-1087.coolpic» v:shapes="_x0000_i1158">

Для гиперболы

<img width=«207» height=«88» src=«ref-1_470583550-713.coolpic» v:shapes="_x0000_i1159">

параметры a,b,c  записываются в уравнение, затем подставляем полученное уравнение эмпирическое значение xi и находим теоретическое значение yi.  Затем сравниваем yi теоретическое и
yi
эмпирическое. Сумма квадратов разности между ними должна  быть минимальна. Выбираем тот вид зависимости при котором выполняется данная зависимость.

В уравнении парной линейной регрессии:

b – коэффициент парной линейной регрессии, он измеряет силу связи, т.е. характеризует среднее по совокупности отклонение у  от его средней величины на принятую единицу измерения.

b=20 при изменении х на 1 признак  у отклониться от своего среднего значения  на 20 в среднем по совокупности.

Положительный знак при коэффициенте регрессии говорит о прямой связи между признаками, знак «-» говорит об обратной связи между признаками.
§4. Применение парного линейного уравнения регрессии.
Основное применение – прогнозирование по уравнению регрессии. Ограничением при прогнозировании служат условия стабильности  других факторов и условий процесса. Если резко измениться в нем среда  протекающего процесса, то данное уравнение регрессии не будет иметь места.

Точечный прогноз  получается подстановкой в уравнение  регрессии ожидаемого значения  фактора. Вероятность точной реализации такого прогноза крайне мала.

Если точечный прогноз сопровождается значением средней ошибки прогноза, то такой прогноз называется  интервальным.

Средняя ошибка прогноза образуется из двух видов ошибок:

1.      ошибок 1 рода – ошибка линии регрессии

2.      ошибка 2 рода – ошибка связанная  с ошибкой вариации.

Средняя ошибка прогноза.

<img width=«184» height=«139» src=«ref-1_470584263-961.coolpic» v:shapes="_x0000_i1160">

<img width=«31» height=«28» src=«ref-1_470585224-220.coolpic» v:shapes="_x0000_i1161"> — ошибка положения линии регрессии в генеральной совокупности

n -  объем выборки

xk – ошибочное значение фактора

<img width=«32» height=«25» src=«ref-1_470585444-220.coolpic» v:shapes="_x0000_i1162">  — СКО результативного признака от линии регрессии в генеральной совокупности

Корреляционный анализ предполагает оценку тесноты связи. Показатели:
линейные коэффициент корреляции – характеризует тесноту и направление связи между двумя признаками в случае наличия между ними линейной зависимости
<img width=«207» height=«132» src=«ref-1_470585664-837.coolpic» v:shapes="_x0000_i1163">

при <img width=«20» height=«25» src=«ref-1_470586501-198.coolpic» v:shapes="_x0000_i1164">=-1 связь функциональная обратная, <img width=«20» height=«25» src=«ref-1_470586501-198.coolpic» v:shapes="_x0000_i1165">=1 связь функциональная прямая, при <img width=«20» height=«25» src=«ref-1_470586501-198.coolpic» v:shapes="_x0000_i1166">=0 связь отсутствует.

МИНУСЫ

Применяется только для линейных связей,  используется для оценки связей между количественными признаками. Рассчитываются только по индивидуальным значениям.

Корреляционное отношение:

Эмпирическое: <img width=«76» height=«59» src=«ref-1_470587095-372.coolpic» v:shapes="_x0000_i1167"> оба вида дисперсии рассчитываются по результативному признаку.

Теоретическое: <img width=«65» height=«53» src=«ref-1_470587467-330.coolpic» v:shapes="_x0000_i1168">

<img width=«23» height=«25» src=«ref-1_470587797-215.coolpic» v:shapes="_x0000_i1169">  — дисперсия значений  результативного признака рассчитанных по уравнению регрессии

<img width=«23» height=«25» src=«ref-1_470588012-210.coolpic» v:shapes="_x0000_i1170">  — дисперсия эмпирического значения результативного признака

<img width=«60» height=«21» src=«ref-1_470588222-247.coolpic» v:shapes="_x0000_i1171">

ПЛЮСЫ

·         высокая степень точности

·         подходит для оценки  тесноты связи между описательным и количественным признаком, но количественный должен быть результативным

·         подходит для любых типов связей

Коэффициент корреляции Спирмена

xi

yi

10

1

20

7

30

4

Ранги – порядковые номера единиц совокупности в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же порядке от меньших к большим или наоборот. Если ранги единиц совокупности  обозначить рх и ру, то коэффициент корреляции рангов примет следующий вид:

<img width=«237» height=«104» src=«ref-1_470588469-989.coolpic» v:shapes="_x0000_i1172">

Преимущества коэффициента корреляционного ряда:
Ранжировать можно и по описательным признакам, которые нельзя выразить численно, следовательно расчет коэффициента Спирмена возможен для следующих пар признаков:            кол-во – кол-во; описательный – количественный; Описательный – описательный. (образование – описательный признак) показывает направление связи
Недостатки коэффициента Спирмена.

1.      одинаковым разностям рангов могут соответствовать совершенно отличные разности значения признака (в случае количественных признаков). Пример: Выработка электроэнергии страны в год

США           2400 кВт/ч     1

РФ               800  кВт/ч      2

Канада        600 кВт/ч       3

Если среди значения Спирмена встречаются несколько одинаковых, то образуются связанные ранги т.е. одинаковые средние номера

800 1

600 2,5

600 2,5

400 4

В данном случае коэффициент Спирмена рассчитывается следующим образом:

<img width=«267» height=«151» src=«ref-1_470589458-1096.coolpic» v:shapes="_x0000_i1173">

j – номера связок по порядку для признака х

Aj – число одинаковых рангов в j связи по х

k – номера связок по порядку признака у

Bk – число одинаковых рангов в к-ой связке по у

4.     
Коэффициент корреляции ранга Кендалла


<img width=«93» height=«44» src=«ref-1_470590554-329.coolpic» v:shapes="_x0000_i1174">  — максимальная сумма ранга

S – фактическая сумма рангов

<img width=«68» height=«19» src=«ref-1_470590883-235.coolpic» v:shapes="_x0000_i1175">

Дает более строгую оценку чем коэффициент Спирмена. <img width=«72» height=«27» src=«ref-1_470591118-280.coolpic» v:shapes="_x0000_i1176">

Для расчета <img width=«13» height=«15» src=«ref-1_470591398-187.coolpic» v:shapes="_x0000_i1177"> все единицы ранжируются по признаку х  по признаку у для каждого ранга подсчитывается число  последующих рангов превышающих данный их сумму обозначим Р и число последующих рангов ниже данного обозначения Q.

S=P-Q

P+Q=1/2n(n-1)

<img width=«69» height=«44» src=«ref-1_470591585-293.coolpic» v:shapes="_x0000_i1178">

5.      Коэффициент корреляции ранга Фехнера.

<img width=«55» height=«19» src=«ref-1_470591878-229.coolpic» v:shapes="_x0000_i1179">

х

у

<img width=«48» height=«21» src=«ref-1_470592107-232.coolpic» v:shapes="_x0000_i1180">

<img width=«43» height=«24» src=«ref-1_470592339-227.coolpic» v:shapes="_x0000_i1181">

<img width=«44» height=«24» src=«ref-1_470592566-238.coolpic» v:shapes="_x0000_i1182">

600

50

+

+ — C

700

40

+

0 – C

300

20

-

— — C

400

50

-

+ — H

<img width=«87» height=«41» src=«ref-1_470592804-323.coolpic» v:shapes="_x0000_i1183">

Коэффициент Фехнера – мера тесноты связи в виде отношения разности числа пар совпадающих и не совпадающих знаков к сумме этих чисел.

1.      расчет средних по х и у

2.      сравниваются индивидуальные значения xi yi  со  средними значениями с обязательным указанием знака «+» или «-». Если знаки совпадают по х и у, то мы относим их числу «С» если, нет, то к «Н».

3.      подсчитываем количество совпадающих и несовпадающих пар.

<img width=«112» height=«60» src=«ref-1_470593127-308.coolpic» v:shapes="_x0000_s1388 _x0000_s1386 _x0000_s1387">Коэффициент Фехнера очень грубый коэффициент оценки связи, не учитывающий величину отклонений от среднего значения, но он может служить ориентиром для оценки интенсивности связи.



Часто а

Редко в

Есть А

Аа 5

Ав 10

Нет В

Ва 7

Вв 4

Задача измерения связи становится перед статисткой по отношению к описательным признакам, важным частным случаем такой задачи, измерения связи между 2 альтернативными признаками один из которых причина другой последствие.

Теснота связи между 2 альтернативными признаками может быть измерена с помощью 2х коэффициентов:

1.      коэффициент ассоциации

2.      коэффициент контингенции

<img width=«204» height=«96» src=«ref-1_470593435-841.coolpic» v:shapes="_x0000_i1184">

Коэффициент контингенции имеет недостаток: при равных нулю одного из двух гетерогенных сочетаний Ав или Ва коэффициент обращается в единицу. Очень либерально оценивает тесноту связи – завышает ее.

Коэффициент Пирсона

При наличии не двух, а более возможных значений каждого из взаимосвязанных признаков рассчитываются следующие коэффициенты:
Коэффициент Пирсона Коэффициент Чупрова для описательного признака
Коэффициент Пирсона рассчитывается по квадратным матрицам

доход

Ниже нормы

Норма

2 нормы

3 нормы

1-3 ПМ

2

4

  —

-

3-7 ПМ

5

3

5

-

7-12 ПМ

10

7

6

1

Св. 12 ПМ











<img width=«141» height=«105» src=«ref-1_470594276-697.coolpic» v:shapes="_x0000_i1185">

к1 и к2 – число группы по признакам 1 и 2 соответственно. Минус коэффициента Пирсона в том, он не достигает 1 даже при увеличении количества групп.

Коэффициент Чупрова (1874 –1926)

<img width=«171» height=«55» src=«ref-1_470594973-473.coolpic» v:shapes="_x0000_i1186"> коэффициент Чупрова более строже оценивает тесноту связи.
    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по маркетингу