Реферат: Статистические наблюдения
ТЕМА1. ПРЕДМЕТ, МЕТОД И ЗАДАЧИ СТАТИСТИКИ
Gegenstand, Methoden und Aufgaben der Statistik
Subject matter, methods and tasks of statistics
1.1. Предмет статистики
Статистика (Statistik, Statistics) – этосамостоятельная наука, которая изучает количественную сторонусоциально-экономических явлений и процессов, их закономерности, влияниеобщественной жизни на окружающую среду и обратное влияние.
В научныйобиход термин «статистика» был введен в середине ХVIIIвека немецким ученым Г. Ахенвалем.
Статистика занимаетсяанализом, представлением и интерпретацией числовых данных.
Своеобразиестатистических закономерностей проявляется в том, что:
1) мы имеем дело с массой случаев. В единичных случаях они могут и недействовать;
2) механизм действия статистических закономерностей не всегда ясен, но онинастолько устойчивы, что мы можем ими пользоваться.
Пример. На 12девочек рождается 13 мальчиков.
Приисследовании тенденций и закономерностей статистика опирается на закон большихчисел. Сущность закона больших чисел: при суммировании данных по достаточнобольшому числу случаев (единиц статистической совокупности) различия отдельныхединиц взаимно погашаются и в общих средних числах выступают существенные,характерные черты и взаимосвязи явления в целом. Т.е. совокупное действиебольшого числа случайных факторов приводит к результату, почти не зависящему отслучая.
Местостатистики среди других экономических дисциплин: с одной стороны, являетсявспомогательной по отношению к экономической теории, экономике предприятия,менеджменту (приводит первичные данные в удобную для анализа и принятия решенийформу), с другой стороны, является базовой по отношению к частным разделамстатистики, например, отраслевым статистикам – макроэкономической, статистикипромышленности, населения и др.
Статистикаделится на две составные части: дескриптивную (описательную, descriptive,descriptive) и индуктивную (выводную или аналитическую,induktive, inferential)). Исторически развитиестатистики связано с потребностями государства (status– политическое состояние, stato –государство). Описание явлений, связанных с деятельностью государства –хозяйственного механизма, функционирования экономики, результатовсоциально-экономического развития – дало название одному из двух основныхразделов общей теории статистики – описательной статистике.
Индуктивнаяили выводная статистика отражает математическое направление в статистике. С еепомощью по части данных определяются показатели всей совокупности.
/>/> Статистика
Дескриптивная Индуктивная
(описательная) (выводная)
Статистикаизучает только совокупность явлений.
Совокупность(Statistische Masse,Statistical population)– это множество однокачественных варьирующих единиц.
Единица (Statistische Einheit,Statistical unit)–это предел дробления совокупности, при котором сохраняются все свойстварассматриваемого явления или процесса.
Единицысовокупности обладают свойствами или признаками.
Признак (Merkmal, Feature)– это то, с помощьючего статистика изучает явление или процесс.
Результатамиизмерения признаков являются статистические показатели (Kennzahlen,Indicators). Показатель – это количественная оценкасвойств изучаемого явления.
Пример.Студенты МИЭПМ ННГАСУ на потоковой лекции по статистике образуют статистическуюсовокупность. Единицами совокупности являются отдельные студенты, признаком –например, возраст, показателем – средний возраст студента на потоке.
Количественныеизменения значений признака при переходе от одной единицы совокупности к другойназывается вариацией (Streuung, Variation). Именно вариация обуславливает необходимостьстатистики.
Классификацияпризнаков:
1) По характеру выражения: количественные признаки (выражаются в числовомзначении)
— дискретные(количество автомобилей в семье, ед.)
— постоянные(непрерывные) (возраст)
качественныепризнаки (атрибутивные) выражают смысл понятиями (наличие театров в Нижнем Новгородепо видам)
2) По роли в статистическом исследовании: основные и второстепенные
3) По способу измерения: первичные и вторичные. Первичные признакихарактеризуют абсолютные размеры социально-экономических явлений (протяженностьзаасфальтированных дорог в муниципальном образовании или численностьсотрудников хозяйствующего субъекта). Вторичные (расчетные) признаки образуютсяв результате соотношения первичных признаков (например, отношение объемасобранного урожая к размеру посевной площади дает показатель урожайности).
4) По отношению ко времени: моментные (объем вкладов населения в СбербанкеРФ на 1.01.200 __ г.) и интервальные (объем инвестиций в регионе N за 200__ г.)
5) Поизмеримости признаки делятся на:
— номинальноизмеряемые, (можно ответить только на вопрос: есть ли данный признак или нет);
— ординальноизмеряемые, порядковая шкала (можно провести ранжирование);
— метрическиизмеряемые, интервальная шкала (можно не только ранжировать, но и определитьрасстояние между отдельными значениями признака, т.е. величину интервала).
Пример.
Таблица 1.1.
Сведение осотрудниках консалтинговой фирмы ООО «Зефиров и компания»
Табельный номер сотрудника Возраст Пол Стаж работы, мес. Почасовая оплата, $ Мотивация Подразделение 1 23 М 12 4,8 Высокая Бухгалтерия 2 34 М 3 4,7 Высокая Финансы 3 35 Ж 17 7,2 Очень высокая Управление 4 45 М 56 4,5 Низкая Консалтинг 5 21 Ж 23 5,0 Средняя РекламаВ приведенныхв табл. 1.1 сведениях статистической совокупностью являются все сотрудникифирмы, единицей совокупности – отдельные работники. Пол, подразделение — номинально измеряемые признаки, мотивация – ординально измеряемый, возраст,стаж и зарплата – метрически измеряемые признаки.
Процессизучения социально-экономических явлений посредством системы статистическихметодов и системы показателей называется статистическим исследованием (Statistische Untersuchung, Statistical investigation, inquiry).
Статистическоеисследование представляет собой определение потребностей заказчикаисследования, целей и задач; проведение наблюдения; обработку и анализ данных;интерпретацию и презентацию результатов исследования. В случае необходимостистатистическое исследование может содержать дополнительный этап –статистический прогноз.
1.2 Методы статистики
На стадиисбора информации используются различные методы наблюдения.
На стадииобработки информации — методы сводки, группировки, построения таблиц играфиков.
На стадиианализа и интерпретации данных – методы абсолютных и относительных величин, корреляционныйи регрессионный анализ, анализ рядов динамики, индексный метод и т. д.
Индуктивная(выводная) статистика широко использует методы теории вероятностей, теориювыборки, статистическую проверку гипотез.
В последнеевремя используются также методы высшей математики: методы оптимального программирования,теория распознавания образов и др.
1.3 Задачи статистики
Главной цельюстатистики является подготовка обозримой, надежной и достоверной информации дляпринятия управленческих решений.
К основнымзадачам статистики относятся:
1) обеспечение хозяйствующих субъектов надежной информацией;
2) выявление ресурсов развития и резервов повышения эффективности;
3) обобщение и прогнозирование тенденций развития экономики;
4) всестороннее исследование происходящих в обществе процессов;
5) обеспечение достоверности, качества и доступности информации.
Областямиприменения статистических методов служат:
— национальнаяэкономика (макроэкономические показатели, например, ВВП и ВНП, индексы цен,показатели занятости, экспорта-импорта и т.д.),
— экономикапредприятия (микроэкономические показатели, например, по производству, сбыту,управлению персоналом, контролю качества и т.д.),
— общественные науки (методы эмпирического исследования, например, в социологии –поведение в группе, в психологии – тесты на проверку гипотез, в педагогике –измерение результата обучения),
— естественные науки (химия, физика – экспериментальные исследования, биология,медицина — классификации, экспериментальные исследования),
— инженерныенауки (экспериментальные исследования, контроль качества).
1.4 Организация статистики
Выделяютследующие организационные составляющие статистики:
1) государственная и муниципальная статистика;
2) ведомственная статистика;
3) частная и неофициальная статистика.
Первые двесоставляющие образуют официальную статистику. Нижний уровень официальнойстатистики – это районные отделы и управления статистики. Далее следуют статистическиекомитеты субъектов федерации (в Нижегородской области, например, Нижегородскийобластной комитет государственной статистики), Госкомстат РФ, Статкомитет СНГ,Евростат, Статистическая комиссия ООН.
Ведомственнаястатистика ведется на предприятиях, в организациях, ведомствах, министерствах,например, в Центральном банке (банковская статистика) или в Таможенном комитете(таможенная статистика).
Основнымистатистическими продуктами являются:
ü макроэкономические показатели,
ü отраслевые данные,
ü социальные статистика и статистика уровня жизни,
ü межрегиональные международные сравнения.
Они выходят ввиде докладов, сборников, бюллетеней, аналитических записок,экспресс-информации.
В процессе сбора ипредоставления статистических данных роль официальной статистики можноинтерпретировать как посредническую. Она собирает данные на микроуровне,агрегирует их и предоставляет на макроуровне в распоряжение конечныхпотребителей для анализа и расчетов (см. рис. 1.1.)
Статорганы
Респонденты
Потребители статданных
/> /> /> /> /> /> <td/> />микроданные макроданные
Рис.1.1. Посредническаяроль официальной статистики
Источник: П. фон дер Липпе(1995), с.16
Важная особенностьофициальной статистики состоит в том, что обследования проводятся на основезаконодательных и нормативных актов, что дает возможность требовать отреспондентов предоставления необходимых сведений при одновременной обязанностиконфиденциальности индивидуальных данных.
Неофициальнаястатистика, напротив, занимается статистическим анализом данных официальнойстатистики для специальных целей. К организациям, занимающимся неофициальнойстатистикой относятся научно-исследовательские организации, консалтинговыеагентства по изучению общественного мнения и проведению опросов, союзы иобъединении предприятий. Примеры: Рейнско-Вестфальский институт экономическихисследований RWI (Эссен), Российский союзпредпринимателей и промышленников (Москва), НФ ВЦИОМ (Нижний Новгород) являютсяпредставителями неофициальной статистики.
ТЕМА 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ
2.1 Формы, виды и способы статистическогонаблюдения
Наблюдениеявляется первой важной стадией статистического исследования и одновременно –одним из главных методов статистики.
Наблюдение (Erhebung, Observation)– этопланомерно организованный сбор массовых данных о явлениях и процессахобщественной жизни.
Наблюдениеосуществляется в трех организационных формах:
1) Отчетность;
2) Обследование;
3) Регистр.
Отчетность –основная форма. Представляет собой изучение документов с различнымистатистическими сведениями. Пример: формы статистической отчетностипредприятий, организаций, учреждений № П-1, № 5-з и др.
Обследование– специально организованное наблюдение. Пример: перепись населения.
Регистр –форма непрерывного наблюдения за статистическими совокупностями с фиксированнымначалом и концом. Пример: Единый государственный регистр предприятий,организаций, учреждений и объединений, созданный с целью обеспечения единогогосударственного учета хозяйствующих субъектов. (ЕГРПО).
Видыстатистического наблюдения:
I. По времени регистрации фактов
1) текущее наблюдение (непрерывное) – ведется постоянно, по мере возникновения,наступления явления. Пример: ЗАГС;
2) периодическое – через одинаковые промежутки времени. Пример: определениеуровня цен в розничной торговле;
3) единовременное (разовое) — служит для решения каких-либо отдельных задач,повторяется через неопределенный промежуток времени по мере надобности. Пример:единовременный учет студенческих эстрадных театров.
II. По охвату единиц совокупности
1) сплошное – обследуются все единицы совокупности. Пример: переписьнаселения;
2) несплошное – обследуется определенная часть единиц совокупности,возможно распространение результатов на всю совокупность. К несплошным видамнаблюдения относятся:
üвыборка – отбор изучаемой части совокупности с помощьюспециальных методов (см. тему 11). Пример: опрос общественного мнения;
üосновной массив – обследуется та часть единиц совокупности,которая вносит наибольший вклад в изучаемое явление. Пример: изучение особенностейурбанизации по городам-миллионникам.
üмонографическое обследование – обследуется одна единица совокупностиради самой этой единицы, очень подробно. Пример: одна семья при предварительномбюджетном обследовании.
3) частичное (изучение части совокупности ради самой этой части). Пример: обследованиекрупных городов.
Преимуществаи недостатки сплошного и несплошного наблюдений:
— Сплошноенаблюдение:
охватываетвсе единицы совокупности. Собранный материал точно соответствует целиобследования;
оно болеедорогостоящее и занимает больше времени;
оно невсегда может охватить все элементы совокупности.
сравнительнопродолжительное время обработки результатов сплошного наблюдения может понизитьактуальность выводов.
— Несплошноенаблюдение:
опасностьплохой репрезентативности (часть неточно представляет всю совокупность);
могут быть упущенынекоторые существенные признаки и таким образом искажены результаты.
Первичная ивторичная статистика. С первичной статистикой (Primärforschung, Field research) мы имеем дело, когда материал для статистическогообследования собирается специально. Вторичная статистика (Sekundärforschung, Desk research) использует уже собранный материал, даже если он собрандля других целей.
Пример:Предприятие розничной торговли хочет открыть филиал в новом микрорайоне.Информацию о структуре населения микрорайона оно может получить по результатамсобственного опроса (первичная статистика), или по документам паспортного стола(вторичная статистика).
Данныепервичной статистики точно совпадают с целью исследования, но требуют высокихвременных и финансовых затрат в отличие от данных вторичной статистики.
Способыстатистического наблюдения (регистрации данных): непосредственное,документальное, опрос и эксперимент.
Непосредственноенаблюдение (unmittelbare Beobachtung, direct observation) осуществляется путем регистрации фактов личноисследователем. Пример: изучение счетчиками интенсивности пассажиропотока.
Придокументальном наблюдении (dokumentale Beobachtung, documentary observation) источниками являютсядокументы первичного учета (например, инвентарные карточки).
Опрос (Befragung, Census) – это получениесведений со слов респондента. Выделяют
— анкетный –вопросники письменно заполняют сами респонденты, как правило, анонимно идобровольно.,
— корреспондентский – сведения сообщают добровольные корреспонденты,
— экспедиционныйили устный опрос – счетчики получают устные ответы и сами фиксируют их вформуляре,
— явочныйопрос – предоставление сведений в явочном порядке, например, при регистрациибрака.
В последнеевремя все шире применяются интерактивные формы опроса – по телефону,электронной почте, в сети Internet.
Эксперимент (Experiment) – получил распространение в естественных науках.
2.2 Программа статистического наблюдения
Она включаетв себя две основные части:
1) методическую (что мы хотим изучить?)
2) организационную (кто, когда, где и как будет проводить наблюдение?)
Вметодической части определяются:
Цель — получение достоверной информации о развитии явлений и процессов;
задачи – путидостижения цели;
объект иединица наблюдения. Объект – это исследуемая статистическая совокупность.Единица наблюдения – первичный элемент объекта или элемент совокупности, покоторому собираются необходимые данные. Необходимо отличать единицу наблюденияот отчетной единицы. Отчетная единица – единица, предоставляющая статистическиеданные, может состоять из нескольких единиц совокупности, а может и совпадать сединицей совокупности. Например, при обследовании населения единицей может бытьчлен домашнего хозяйства, а отчетной единицей – само домохозяйство.
переченьпризнаков (вопросов), подлежащих регистрации в процессе наблюдения, т.е. такназываемая программа наблюдения.
Примерпрограммы наблюдения: переписные листы при проведении переписи населения осенью2002 г.
Важноезначение имеет формулировка вопросов наблюдения. Обычно соблюдают следующиеправила:
— не задаютвопросов «на всякий случай»;
— не задаютвопросов, на которые заведомо нельзя получить ответ;
— не задаютвопросы, вызывающие настороженность и подозрение.
Пример:прямой вопрос о Вашей заработной плате за месяц лучше заменить на косвенныйвопрос о размере расходов за месяц.
Далее,рекомендуется формулировать вопросы как можно более проще и понятнее. Вопросовдолжно быть ровно столько, чтобы достичь цели наблюдения. По возможностивопросы формулируются коротко и точно. Контрольные вопросы дополняют обычныевопросы так, чтобы из ответов на них можно было сделать вывод о правдивостивсех ответов. Вопросы располагаются в порядке, облегчающем оценку ответов. Виданкеты (бумага, шрифт, оформление и т.д.) должны соответствовать целевымгруппам наблюдения.
Ворганизационной части (организационном плане):
— указываютсяорганы, выполняющие наблюдение, четко определяются и разграничиваются их праваи обязанности,
— формируетсякадровый состав,
— устанавливается время и срок проведения наблюдения (время, в течение которогозаполняются статистически формуляры). Пример: 9 -16 октября 2002 года – Всероссийская переписьнаселения,
— критическаядата, критический момент – для величин состояния, запаса. Это момент времени,на который регистрируют явление. Пример: 0 часов9 октября 2002 года во время переписи населения;
— интервалвремени – для потоковых величин;
— определяется список объектов и их местонахождение;
— подготавливаются бланки, инструкции, формы, переписные листы и т.п.;
— расписывается бюджет наблюдения.
2.3 Ошибки и контроль статистическогонаблюдения
Ошибки (Fehler, Errors) – это расхождение междурасчетным и действительным значениями изучаемой величины.
Существуютошибки:
1) регистрации – ошибки наблюдения, которые всегда могут произойти. Они вмассе случаев погашаются. Пример: описка регистратора ЗАГСа.
2) репрезентативности – ошибки, которые встречаются при несплошномобследовании, когда часть плохо представляет целое.
3) случайные – ошибки под влиянием случайных факторов. Пример: ошибкасчетчика вследствие усталости;
4) систематические – ошибки, ведущие по тенденции к завышению или занижениюзначений показателей. Пример: округление возраста на цифрах, оканчивающихся на5 и 0.
Систематическиеошибки бывают преднамеренными и непреднамеренными.
И ошибкирегистрации, и ошибки репрезентативности бывают случайными и систематическими
Существуютдва способа контроля над ошибками: логический и арифметический.
Логическийпредусматривает использование логических, качественных взаимосвязей. Пример: у8-летнего ребенка не может быть собственных детей. Логический контрольприменяется, когда невозможен арифметический.
Арифметическийиспользует количественные зависимости между значениями показателей. Пример:гр.3 = гр.1 + гр. 2.
2.4 Источники информации
Источникамиинформации для проведения и первичных, и вторичных статистических исследованийслужат данные
а)внутрипроизводственной и
б)внепроизводственной статистики
В качествепервичных источников информации в первую очередь рассматриваются опросы,интервью.
Вторичнымиисточниками данных являются:
— длявнутрипроизводственной статистики: калькуляции, прайс-листы, ведомости выдачизарплаты, больничные листы, балансы, отчеты о производственно-хозяйственнойдеятельности, планы предприятий и организаций;
— длявнепроизводственной статистики:
материалыгосударственной и муниципальной статистики (справочники, бюллетени, доклады ит.д.),
журналы,
материалыведомственной статистики (ЦБ РФ, ГТК, Федеральной службы занятости и т.д.),
частнаястатистика (союзы и объединения предприятий, ТПП),
материалынаучно-исследовательских институтов.
Некоторыенациональные и международные источники информации приведены в таблице 2.1.
Таблица 2.1.
Национальныеи международные источники информации
Национальные источники Международные источники Журнал «Вопросы статистики» Zeitschrift “Wirtschaft und Statistik" Российский статистический ежегодник Statistisches Jahrbuch für die Bundesrepublik Deutschland Россия в цифрах Monatsberichte der Deutschen BundesbankГоскомстат РФ
www.gks.ru
Statistisches Bundesamt (BRD)
www.statistik-bund.de
Журнал «Статистическое обозрение»Deutsche Bundesbank
www.bundesbank.de
Межгосударственный статистический комитет СНГ
www.cisstat.com
Bundesministerium für Wirtschft und Technologie (BRD)
www.bmwi.de
Russian Economic Trends cep.lse.ac.uk/datalib/ret/Organisation for Economic Co-operation and Development
www.oecd.org
Summaries of GOSCOMSTAT's monthly reports prepared in English by IC RATING and put on INTERNET feast.fe.msk.ru/koi/informarket/emn/rating/gstat.htmlUSA. Bureau of Labor Stats
stats.bls.gov
stats.bls.gov/cpihome.htm
Всероссийская перепись населения 2002 г.
www.perepis2002.ru
USA. Department of Commerce, Bureau of Economic Analysis
www.stat-usa.gov
USA. Census Bureau
www.census.gov
World Trade Organisation (WTO)
www.wto.org
Eurostat
europa.eu.int/en/comm/eurostat/eurostat.html
United Kingdom. Office for National Stats
www.emap.co.uk/ons
www.ons.gov.uk
United Nations, Statistics Division (UNSD)
www.un.org/depts/unsd
ТЕМА3. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ
Statistische Aufbereitung von Daten Statisticaldata processing
3.1 Статистическая сводка
Сводка – этовторой этап статистического исследования после наблюдения. Он заключается впревращении индивидуальных значений признаков, полученных в ходе наблюдения, всистему статистических показателей, т.е. обобщающих характеристикстатистической совокупности по определенному признаку.
Этапы сводки:
1) формулировка задачи;
2) группировка:
— определениеколичества групп;
— определениевеличины интервала;
— определениегруппировочного признака.
3) техническое осуществление сводки;
4) проверка полноты и качества сводки.
Существуютследующие способы сводки:
по формеобработки материала: — централизованный (информация идет снизу вверх поиерархической лестнице, обрабатывается в одном месте);
— децентрализованный (информация собирается на нижнем уровне и там же полностьюобрабатывается),
по техникевыполнения: — механизированный (с помощью компьютеров);
— ручной.
3.2 Группировка
Это важнаячасть сводки и один из самых распространенных методов статистики.
Группировка (Gruppierung, Grouping)– эторазделение статистической совокупности на части (группы) по определеннымсущественным признакам.
В отличие от группировки,классификация – это распределение явлений и объектов на определенные группы,классы на основе заранее установленных стандартизированных качественныхпризнаков.
Примеры классификации:международные правила заключения сделок Incoterms, товарная номенклатуравнешнеэкономической деятельности ТН ВЭД и др.
Виды группировки:
1) Типологическая группировка
Означаетразделение качественно разнородной совокупности на однородные группы. При этомкаждая группа будет представлять собой отражение какого-либо одного типа,аспекта исследуемого явления. Выделяется столько групп, сколько существуеттипов данного явления. Границы интервалов проходят там, где один тип сменяетсядругим.
Типологическаягруппировка дает хорошие результаты, если удалось идентифицировать типы явленияи найти точки перехода одного типа в другой.
Пример (см.табл.3.1).
Таблица 3.1.
Структура объема платных услуг населению НижнегоНовгорода по их видам в 2000 г.
Вид услуг Доля в % Пассажирского транспорта 28,6 Бытовые 4,7 Системы образования 10,7 Медицинские 3,0 Связи 15,7 Жилищные 10,6 Коммунальные 18,6 Санаторно-оздоровительные 3,2 Прочие 4,9Источник: Нижний Новгород. Краткий статистическийсборник. – Нижний Новгород:
Нижегородский областной комитет государственнойстатистики, 2001.
2) Аналитическая группировка
Применяетсядля выявления взаимосвязи между явлениями, т. е. отвечает на вопрос: есть илинет связь?
Признак, покоторому все единицы совокупности делятся на группы в аналитическойгруппировке, называется группировочным или факторным, а по которому судят оналичии или отсутствии связи – результативным.
Саналитической группировкой мы встретимся еще в теме корреляционно-регрессионныйанализ.
Как правило,при аналитической группировке применяют неравные, все время увеличивающиеся илиуменьшающиеся интервалы.
Пример (см.табл.3.2) Установить наличие или отсутствие связи между стажем ипроизводительностью труда. В данном случае факторным признаком х будет стаж,результативным y – производительность труда.
Один изсложных вопросов аналитической группировки – определить количество групп играницы интервалов между группами. Применяют различные методы, например, методкоординатной сетки.
В системе координатнаносят по оси OX стаж, по оси OY производительность труда (рис.3.1). Всего на рисункеполучается 710 точек. Затем ищут так называемые сгущения. Между ними и проводятграницы интервалов. Недостаток метода: рисунок сгущений меняется с изменениеммасштаба.
Таблица 3.2.
Распределение работников по средней производительноститруда
Группы работников по
стажу в годах
Число работников в группе, чел. Средняя производи-тельность труда в группе (изделий/час) Плотность распределения 0-1 200 2 200 1-3 300 4 150 3-10 150 5 21 10-20 50 3 5 20 и более 10 1 (1) N = 7103) Структурная(вариационная) группировка
Широко применяется для простого сжатия информации покакому-либо признаку. Принципиально отличается от типологической тем, чтосодержит группы, отличающиеся друг от друга количественно, а не качественно.Пример структурной группировки (табл. 3.3):
Интервалы при структурнойгруппировке, как правило, равные.
Величина равногоинтервала определяется по формуле:
/>
Xmax и Xmin –максимальное и минимальное значения признака.
Таблица 3.3
Данные о денежных доходахнаселения Нижегородской области в 1996 г.
Группы населения
(по 10% каждая)
Доля оплаты труда и дохода от предпринимательской деятельности ко всем доходам, % 1 (группа с низшим доходом) 68,4 2 75,8 3 76,1 4 75,6 5 76,4 6 77,8 7 79,8 8 79,9 9 81,7 10 (группа с высшим доходом) 78,0Источник: данные НОКГС
Число же групп можноопределить разными способами:
ü по формулеСтерджесса
/>
k – число групп;
N – объем ряда (число единицсовокупности).
Применение формулы Стерджесса дает хорошие результаты прибольшом объеме ряда и распределении, близком к нормальному.
ü на основе применения среднегоквадратического отклонения – например, при величине интервала i = 0,5 σ совокупностьразбивается на 12 групп, при i =σ – на 6 групп со следующими интервалами:
от /> — 3σ до /> — 2σ
от /> — 2σ до /> — σ
от /> — σ до />
от /> до />+ σ
от />+ σ до />+2 σ
от />+ 2σ до />+3σ
ü с помощью заранее установленных норм.Пример: согласно нормам DINориентировочное минимальное число групп составляет (табл.3.4):
Таблица 3.4
Число групп по нормам DIN
Число наблюдений Число групп до 100 min 10 до 1000 min 13 до 10000 min 16При этом величинаинтервала выбирается таким образом, чтобы в каждой группе было хотя бы однозначение признака, т.е. не было «пустых» групп. Кроме того, величинаинтервала по возможности должна выражаться нечетным числом, чтобы середина интервалаявлялась бы целым числом.
Количество групп зависиттакже от того, на какую потерю информации согласен исследователь (заказчик).Обычно приемлемым считается уровень 1-5 % величины показателя.
Точное установлениеграниц интервалов
Если признак дискретный,то следующий интервал будет на одну единицу больше предыдущего:
0-2 (+1)
3-5 (+1)
6-8 (+1) и.т.д.,
где, например, 6 – нижняяграница; 8 – верхняя граница интервала.
Если же имеем непрерывныйпризнак, то интервалы выглядят так:
0-2 (-)
2-5
5-8,
и возникает вопрос: вкакую группу включать единицу наблюдения, значение признака у которой совпадаетс границами интервалов. Существует 2 способа: «включительно» и«исключительно». По способу «включительно» единицанаблюдения со значением 2 попадает в первую группу, по способу «исключительно»– во вторую.
Далее, интервалы бываютоткрытые и закрытые. У закрытых интервалов обозначены обе границы, у открытых –только одна граница, верхняя или нижняя, например,
«менее 2» или
«5 и более»
Ширина открытого интервалапринимается равной ширине смежного с ним интервала (последующего илипредыдущего).
4) Сложнаягруппировка
Если в основу группировки положено несколько признаков, то мыимеем дело со сложной группировкой. Она может выполняться как комбинационная(группы, выделенные по одному признаку, затем подразделяются на подгруппы подругому признаку) или как многомерная (группы или кластеры выделяются одновременнопо нескольким признакам). В последнем случае единица совокупностирассматривается как точка в m-мерномпространстве, а задачей группировки является выделение точек, составляющих однородныегруппы (кластеры) единиц. Изучение многомерных группировок (кластерный анализ)проводится с помощью средств вычислительной техники.
После проведениягруппировки строится ряд распределения, а затем обработанный статистическийматериал представляется в виде таблиц, графиков, диаграмм и т.д..
3.3Статистические ряды
Статистический ряд – этоупорядоченное распределение единиц совокупности по группам. Его нужно отличатьот ряда динамики. Ряд распределения характеризует структуру явления. Ряддинамики – развитие явления во времени.
Ряд распределенияназывают ранжированным, если признак стоит в порядке возрастания или убывания.
Ряд распределения всегдаимеет 2 элемента:
х – варианта или значениепризнака,
f – частота или числовое значениеварианты.
Если значение признакавыражается числом, то ряд распределения является количественным иливариационным, если словом – атрибутивным или качественным.
Количественные рядыделятся, в свою очередь, на дискретные (варьирующий признак дискретен) инепрерывные (варьирующий признак непрерывен, значения признака задаются в видеинтервала).
Пример (табл.5) .
Таблица 3.5
Дискретный рядраспределения
X f F 10 10 1 20 30 2 15 45 3 5 50 4 3 53 5 2 55где X – число забитых в чемпионате мячей;
f – число игр с таким числом голов;
F – накопленная частота.
На плоскости дискретныйряд распределения изображается графиком, называемым полигоном распределения – das Häufigkeitspolygon, the frequency polygon (рис.3.2.).
/>f
/>/> 20 —
/> 15 -
10 -
/>5 -
/>
/> │ │ │ │ │
0 1 2 3 4 5 x
Рис. 3.2 Пример полигонараспределения
Примером интервальногоряда распределения может служить таблица распределения семей по размеру жилойплощади на одного человека.
Таблица 3.6
Интервальный рядраспределения
Группы семей по размеру жилой площади на человека (кв. м.) Число семей с данным размером жилой площади Накопленное число семей 3-5 10 10 5-7 20 30 7-9 30 60 9-11 40 100 11-13 15 115 N=115Для графического изображения интервального ряда распределения(непрерывный признак) применяется гистограмма – das Histogramm, the histogram.
Если в ряду распределения интервалы не равны, то гистограммастроится с использованием еще одной величины – плотности распределения.Плотность распределения – это частота, падающая на единицу интервала.
Построим гистограмму дляряда с неравными интервалами (см. табл.3.2. и рис.3.4.)
/> плотность
/>/> 200-
/>/> 150-
/>/> 20-
/>/>/> 10-
|/>/> | | | |
0 1 3 10 20 30 стаж
Рис. 3.4. Гистограммаряда распределения с неравными интервалами
В целом выделяютследующие основные типы распределения:
/>/> f
/>/>/>/>/> ТИП1 ТИП2
/>/>/> в
/> а в
а
/>/>/>/>/> x
/>
ТИП 3 ТИП4
/>
Рис. 3.5. Основные типы распределения
ТИП 1 – симметричноераспределение (а – плосковершинное, в — островершинное);
ТИП 2 – асимметричноераспределение (а – правосторонняя асимметрия, в – левосторонняя асимметрия);
ТИП 3 – многовершинноераспределение (статистическая совокупность неоднородна);
ТИП 4 – симметричнаякривая распределения с двумя экстремальными значениями.
Часто возникает вопрос нео том, какова частота отдельной варианты, а о том, сколько значений признакавыше (или ниже) определенной величины.
В таких случаях применяютдва особых вида кривых для изображения ряда распределения: кумуляту и огиву.Кумулята отвечает на вопрос “менее чем”, огива – “более, чем”.
Пример (табл. 3.7,рис.3.5).
Таблица3.7.
Договорыпредприятия N в 200_ г.
Группы договоров Количество договоров Количество договоров в процентах Абсолютное значение Накопленная величина по возрастанию Накопленная величииа по убыванию Доля Накоплен-ная вели-чина по воз-растанию 0-150 50 50 1000 5 5 150-300 150 200 950 15 20 300-450 180 380 800 18 38 450-600 260 640 620 26 64 600-750 220 860 360 22 86 750-900 90 950 140 9 95 900-1050 50 1000 50 5 100 1000 100Построим по этим даннымогиву и кумуляту (рис. 3.6)
В таблице 200 договоровимеют сумму менее 300 у. е., 950 – менее 900 у. е., 800 – от 300 у. е. и более,50 – от 900 у. е. и более и т.д.
Кроме полигонараспределения, гистограмм, огивы и кумуляты существуют другие статистическиеграфики:
столбиковые,
круговые (радиус круга = /> ,
ленточные,
квадратные (сторонаквадрата = />,
радиальные
cекторные (все явление = 100 % = 360°,значит 1% явления = 3,6° )
и фигурные диаграммы.
Таким образом, величинаявления всякий раз равна площади фигуры. Для построения диаграмм и графиковудобно использовать стандартные программные пакеты, например, MS Office/Excel.
/> накопленнаячастота
/>/> 1000 кумулята
/>/> 950
900
/> 850
/> 800
750
700
/>/> 650
600
550
500
450
/>/> 400
350
300
250
/> 200
/> 150
100 огива
/> 50
/> 0
50 100 150 200 250300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000 1050 вариантаряда
Рис. 5. Кумулята и огива
3.4Статистические таблицы
Каждая таблица должна соответствовать макету.
(Таблица №)
(наименование таблицы)
/> С
П
А 1 2 3 4Источник:
Примечания:
Каждая таблица имеетподлежащее и сказуемое.
Подлежащее – это группы иподгруппы, на которые разбиваются статистические совокупности для изучения.
Если единицы совокупностипросто перечисляются в подлежащем, то таблица называется перечневой илипростой. Если совокупность делится на определенные группы, то таблица будетгрупповая. Если совокупность делится по группам по двум или более признакам,таблица будет называться комбинационной.
Сказуемое – этопоказатель, с помощью которого мы изучаем подлежащее.
Сказуемое бывает простыми сложным. Если показатель разбивается на две или более части, то это будетсложное сказуемое.
Правила заполнения таблиц:
1) все данные втаблице должны измеряться с одной точностью (0; 0.0; 0.00; 0.000 и т. д.);
2) если значениепризнака мало по сравнению с выбранной нами точностью измерения, то вместо негопишут 0 (0.0; 0.00 и т. д.);
3) если явлениеотсутствует, ставят прочерк (-);
4) если явление неимеет смысла, ставят крест (x);
5) если нетсведений, то пишут либо ”нет сведений”, либо ставят многоточие (…);
После таблицы пишется:
Источник:
Примечания:
ТЕМА4. СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ И СРЕДНИЕ
Statistische Kennzahlen und Mittelwerte Statistical indices andMeans
4.1Статистические показатели
Таблицы и графики даюттолько первый обзор характера распределения. Чтобы кратко охарактеризоватьэмпирические данные, используют количественные величины, которые представляютвсе данные так, что можно отказаться от отдельных, попавших под наблюдениезначений признака. Эти количественные величины называются статистическимипоказателями(Kennzahlen, Indices). Кним относятся абсолютные показатели, относительные показатели и средние.
Отличие статистическогопоказателя от признака заключается в том, что он получается расчетным путем.
Абсолютные показатели (Absolute Kennzahlen, Absolute indices).
Абсолютные показателивыражают абсолютные размеры явлений и процессов и получаются в результатесводки статистической информации. Это масса, площадь, объем, протяженность и т.д.
Все абсолютные показателиимеют определенную размерность. Единица измерения может быть выражена:
1) натуральнымиизмерителями (кг);
2) условно-натуральными измерителями (условная консервная банка);
3) составныминатуральными показателями (т/км, чел/дн, кВт/ч);
4) стоимостнымипоказателями (руб., $);
5) трудовымипоказателями (трудодень).
/>
Проблема может выражатьсяв сопоставлении показателей, особенно это касается стоимостных единиц измерения(индекс-дефлятор, в котором применяются цены базисного года, а физический объем– текущего года).
Относительные показатели (Verhältniszahlen, Relative indices).
Относительные показателипредставляют собой частное от деления двух статистических величин ихарактеризует количественное соотношение между ними.
Относительный показатель= />
Если база сравнения равна единице, то относительныйпоказатель является коэффициентом. Если она равна ста, то относительныйпоказатель выражается в процентах (%), если она равна тысяче, то — в промилле(‰).
Виды относительных показателей:
1) выполнение договорных обязательств
Макет показателя = />
2) относительный показатель структуры (Gliederungszahl, Relativ index of structure)
Макет показателя = />
3) относительный показатель сравнения (Beziehungszahl) показывает соотношение одних и техже данных, но относящихся к разным объектам наблюдения (например, отношение ВВПдвух стран)
Макет показателя = />
/>
4) относительная величинакоординации показывает во сколько раз сравниваемая часть совокупности большеили меньше другой части совокупности, выбранной в качестве базы сравнения(например, отношение мужской части населения к женской или наоборот)
Макет показателя
=/>
5)/>
относительный показательинтенсивности характеризует распределение изучаемого явления в присущей емусреде (например, плотность населения)
Макет показателя =
/>
6) цепные и базисныепоказатели динамики (Messzahlen)
Цепные показатели рассматривают по сравнению с предыдущими, абазисные – по сравнению с периодом, выбранным за базу.
Макет показателя = />
Пример.
Таблица 4.1.
Вычисление цепных и базисных показателей динамики (1993 г. — базисный)
Годы Величина показателя Базисная относительная величина Цепная относительная величина 1993 200 100 % - 1994 250 125 % 125 % 1995 300 150 % 120 %С показателем динамики связаны показатели темпов роста итемпов прироста.
Темп роста – это отношение текущего показателя к показателю,выбранному за базу сравнения.
Темп прироста – это темп роста минус единица (или минус 100%).
В нашем примере темп роста производства в 1994 г. посравнению с 1993 г. равен (250 / 200)*100 % = 125 %, а темп прироста – 125 % — 100 % = 25 %.
При анализе показателей динамики нужно всегда смотреть набазу сравнения. Если она разная, то эти показатели вообще нельзя сравнивать.Если она одинаковая, то сравнивать можно, но не в процентах, а в процентныхпунктах.
Пример (см. табл.4.1.). На сколько выросло производствопродукции в 1995 г. по сравнению с 1994 г.? Неправильный ответ: на 25%.Правильный ответ: на 25 процентных пунктов или на (300-250)/250=(150-125)/125=20 %
4.2Средние
Средняя (Mittelwert, Mean)– это обобщающий показатель,отражающий наиболее типичный уровень варьирующего признака качественнооднородных единиц совокупности.
Данный показатель может вычисляться только у качественнооднородных величин.
Общий макет = />
Виды средних:
1) степенные
2) структурные(мода, медиана);
4.2.1 Степенные средние
Степенными средними являются средние, исчисляемые по формуле:
/>
где Хi –индивидуальное значение признака каждой единицы совокупности;
n — число единиц совокупности
/>
Для взвешенной имеем:
где fi –частота повторения индивидуальных значений признака (вес).
/>/>
При k = 1получаются формулы средней арифметической (Arithmetisches Mittel, Arithmetic mean) простой ивзвешенной:
Средняя арифметическая простая используется тогда, когдазначение признака относится к отдельным единицам наблюдения или к равновеликимгруппам единиц.
Пример (см. таблицы 4.2, 4.3).
Таблица 4.2.
Заработная плата работников бригады
Работник Заработная плата (в у. е.) Иванов 150 Петров 200 Сидоров 250или
Таблица 4.3.
Заработная плата по цехам предприятия
Цеха (в каждом цехе по 100 работников)Заработная плата по цеху
(в у. е.)
Цех 1 150 Цех 2 200 Цех 3 250Тогда
/>
Средняя арифметическая взвешенная применяется тогда, когдаотдельные значения признака встречаются с разной частотой или когда группы неявляются равновеликими.
Пример (см. табл.4.4).
Таблица 4.4.
Заработная плата по цехам предприятия
Цех Заработная плата по цеху (в у. е.) Количество работающих в цехе (чел.) 1 150 50 2 200 100 3 250 150/>
/>
При k = — 1 степенная средняя называется средней гармонической (Harmonisches Mittel, Harmonic mean):
/>
/>
Средняя гармоническая взвешенная тогда будет равна:
где Wi – вес среднейгармонической, равный произведению индивидуального значения признака на егочастоту (обычную).
Пример (см. таблицы 4.5, 4.6).
Таблица 4.5.
Данные о заработной плате по отделам организации
Отдел Заработная плата по отделу в у. е. Численность, чел. 1 100 50 2 200 150/>
Тогда среднюю зарплату по организации можно найти по формулесредней арифметической взвешенной:
Однако часто данные имеются в другом виде (табл. 4.6).Тогдадля расчета средней зарплаты по организации применяется средняя гармоническаявзвешенная:
Таблица 4.6.
Данные о заплате по отделам организации
Отдел Заработная плата по отделу в у. е. Фонд заработной платы в у.е. 1 100 5000 2 200 30000/>
Всегда, когда в качестве веса уже имеем произведение значенияпризнака на частоту, средняя арифметическая не работает – применяют формулусредней гармонической. Чтобы не ошибиться в расчетах, нужно постоянно следитьза смыслом числителя и знаменателя.
/>
При k = 0получаем формулу средней геометрической (Geometrisches Mittel, Geometric mean) простой ивзвешенной:
/>
Средняя геометрическая применяется тогда, когда используютсяоперации, связанные умножением/ делением, а не сложением/ вычитанием.
Пример (см. табл.4.7).Найти среднегодовой темп роста иприроста по следующим данным.
Таблица 4.7.
Темпы роста объема сбыта по фирме N
Годы Темпы роста, % 1996 103 1997 105 1998 104 1999 106 /> <td/> />Среднегодовой темп роста (Wachstumstempo, Rate of Growth):
Среднегодовой темп прироста (Zuwachsrate, Rate of increment):
/> = Среднегодовой темп роста – 1.
В нашем примере: />= 1,045 – 1= 0,045 или 4,5 %
Примечание: среднегодовой темп роста и среднегодовой темпприроста можно получить исходя и из абсолютных значений. Видоизменим предыдущийпример (табл. 4.8).
Таблица 4.8.
Объем оказанных услуг по фирме N
Года Произведено услуг, тыс. евро 1995 1800 1996 1854 (1854/1800=1,03) 1997 1947 1998 2025 1999 2147/>
Тогда получим:
/>= 1,045 – 1= 0,045 или 4,5 %.
/>/>
При k = 2получаем формулу средней квадратической (Quadratisches Mittel, Quadratic mean) простой ивзвешенной:
/>/>
При k = 3получаем формулу средней кубической (Kubisches Mittel,Cubic mean) простой и взвешенной и т.д:.
Средняя квадратическая и средняя кубическая применяются, еслинужно сохранить неизменной сумму квадратов или сумму кубов исходных величин.
Правило мажорантности средних
/>
Если на одном и том же фактическом материале рассчитатьразные средние, то все они будут иметь разные значения, причем эти значениябудут тем меньше, чем меньше k.Получаем следующее неравенство:
Свойства средней арифметической
Средняя арифметическая обладает некоторыми свойствами, облегчающимиее применение на практике и упрощающими ее расчеты.
1) сумма отклоненийиндивидуальных значений признаков от средней арифметической равна нулю:
/>
2) если все значенияпризнака увеличить или уменьшить на какое-либо число, то средняя арифметическаяувеличится (уменьшится) на это же число:
/>
3) если все значенияпризнака умножить (поделить) на какое-либо число, то средняя арифметическаяизменится во столько же раз:
/>
4) сумма квадратовотклонений индивидуальных значений признака от средней арифметической естьвеличина минимальная:
/>
5) если вес каждогозначения признака разделить (умножить) на какое-либо постоянное число А, тосредняя арифметическая от этого не изменится:
/>
6) средняя суммы(разности) двух величин равна сумме (разности) средних этих величин
/>
Условияприменения средних величин в анализе
— однородность статистической совокупности. Действительно, допустим, чтоотдельные элементы совокупности, вследствие подверженности влиянию некоторогослучайного фактора, имеют слишком большие (или слишком малые) величиныизучаемого признака, существенно отличающиеся от остальных. Такие элементыповлияют на размер средней для данной совокупности, поэтому средняя не будетвыражать наиболее характерную для совокупности величину признака.
Еслиисследуемое явление не является однородным, то его разбивают на группы,содержащие только однородные элементы. Для такого явления рассчитываютсясначала средние по группам, которые называются групповые средние, – они будутвыражать наиболее типичную величину явления в каждой группе. Затемрассчитывается для всех элементов общая средняя величина, характеризующаяявление в целом, – она рассчитывается как средняя из групповых средних,взвешенных по числу элементов совокупности, включенных в каждую группу.
На практике,однако, выполнение данного условия не является безусловным. Пример: расчетвеличины средней заработной платы по всем секторам экономики, включаявысокооплачиваемые (банки, финансы) и низкооплачиваемые (народное образование,сельское хозяйство).
— достаточноеколичество единиц в совокупности, по которой рассчитывается среднее значениепризнака. Достаточность анализируемых единиц обеспечивается корректнымопределением границ исследуемой совокупности, т.е. закладывается еще наначальном этапе статистического исследования. Данное условие становитсярешающим при применении выборочного наблюдения, когда необходимо обеспечитьрепрезентативность выборки.
— нежелательность большого расхождения максимального и минимального значенияпризнака в изучаемой совокупности также является условием применения среднейвеличины в анализе. В случае больших отклонений между крайними значениями исредней, необходимо проверить принадлежность экстремумов к исследуемойсовокупности. Если сильная изменчивость признака вызвана случайными,кратковременными факторами, то, возможно, крайние значения не характерны длясовокупности. Следовательно, их следует исключить из анализа, т.к. ониоказывают влияние на размер средней величины.
4.2.2 Структурные средние
Мода (Modus,Mode)– это наиболее часто встречающеесязначение признака.
Медиана (Median)– это значение признака у серединной единицы ранжированного ряда.
При нормальном распределении средняя арифметическая, мода имедиана совпадают (рис.4.1а). Условия нормального распределения довольношироки, оно часто встречается, следовательно, можно и не считать среднююарифметическую, а брать моду или медиану.
/>/>/>/>/>/>/>/>а) б)
/> /> /> /> /> /> /> <td/> /> /> /> /> /> /> /> /> <td/> /> />/>/>
/>
Рис. 4.1. Средняя арифметическая, мода и медиана принормальном и деформированном распределении
При деформированном распределении показатели«разбегаются»: мода остается почти на месте, медиана сдвигается всторону асимметрии, туда же, но еще дальше убегает средняя арифметическая (рис.4.1б). Медиана ближе к средней арифметической, расстояние от моды до медианыпри умеренно деформированном распределении в 2 раза больше, чем от медианы досредней арифметической, поэтому в этом случае среднюю арифметическую лучшезаменять медианой.
Расчет моды и медианы в дискретном ряду
(по несгруппированным данным)
Пусть дан ранжированный ряд распределения:
Ряд: 10, 20, 20, 25, 30 (35)
Порядковый номер значения признака: 1 2 3 4 5 (6)
Чаще всего повторяется значение признака 20, оно и будетмодой: Мо=20
Медианой будет центральное значение ряда 20: Ме=20
Если ряд содержит четное число единиц, то медианаопределяется как средняя из двух центральных значений. Предположим, что в нашемряду 6 значений, добавлено значение 35. Тогда Ме = (20+25) /2= 22,5.
Расчет средней арифметической, моды и медианы по данныминтервального ряда (сгруппированные данные).
Расчет средней арифметической, моды и медианы по данныминтервального ряда (сгруппированным данным) проведем на основе сведений табл.4.9.
Для того, чтобы рассчитать среднюю арифметическую, беремсередины интервалов в качестве значений признаков, что несколько искажаетрезультат, так как мы априори исходим из того, что внутри групп распределениеравномерное.
Допущение: в случае открытых интервалов расчет, строгоговоря, не возможен, но чаще всего берут величины предыдущих (последующих)интервалов либо используют в качестве средней арифметической моду или медиану.
Таблица 4.9.
Производительность труда на предприятии N
Производительность труда, изделий в час — XЧисло работников –
f
Накопленная частота — F 0-10 10 10 10-20 30 40 20-30 25 65 30-40 20 85 40-50 15 100/>
Расчет моды. По таблице видим, что она находится во второминтервале, т.е. имеет значение между 10 и 20. Для точного расчета применяетсяформула:
/>
А0 – нижняя граница модального интервала;
i – величина модального интервала;
fМ0 — частота модального интервала;
f М0-1–частота интервала, предшествующего модальному;
f Mo+1-частота интервала, следующего за модальным.
/> В нашем примере:
/>
Расчет медианы. По таблице видим, что накопленная частотапревышает половину суммы накопленных частот (в нашем случае – 50) в третьеминтервале, т.е. имеет значение между 20 и 30. Для точного расчета применяетсяформула:
А0 – нижняя граница медианного интервала;
i — величина медианного интервала;
N – объем ряда;
FМе-1 –накопленная частота интервала, предшествующего медианному;
f Ме – частота медианного интервала.
/> В нашем примере:
Квартили (Quartile, Quartile)– значения признаков, разбивающиеряд на 4 равные части.
Децили (Dezentile, Deciles) – значения признаков, разбивающиеряд на 10 равных частей.
Перцентили (Perzentile, Percentiles)- значения признаков, делящие ряд на100 равных частей.
4.3 Математическое ожидание
Математическое ожидание (Erwartungswert, Expected value)
ТЕМА5. ПОКАЗАТЕЛИ ВАРИАЦИИ
Streuungsmaße Variation
5.1Понятие вариации
Вариация (Variation)– это колеблемость или изменчивость изучаемого признака.
При исследовании социально-экономических явлений и процессовмы почти всегда имеем дело с вариацией. Причина вариации – множественностьдействующих факторов, не поддающихся устранению (элиминированию).
Показатели вариации нужныдля определения степени диффузии (рассеивания) признака. Ряды распределениямогут иметь одинаковые средние значения, один и тот же центр группирования,симметричное расположение частот вокруг него, но разные степени рассеивания.Пример (см. также рис. 5.1.): дано два ряда:
1) />/>–3; -3; -1; 0; 0; 0; 0; 1; 3; 3; X = 0
2) -9; -8; -6; 0;1; 1; 2; 2; 3; 14; X = 0
Вывод: необходимоиспользовать показатели вариации, т.е. мы должны изучать и оценивать вариацию иоперировать колеблющимися величинами.
/> <td/> />σ1< σ2
σ2
σ1
/>/>/>Рис. 5.1. Рядыраспределения с разной степенью диффузии
5.2Показателивариации
1) Размах вариации (Spannweite, Variation range) – это разница между максимальным и минимальнымзначениями признака.
/>
Показатель легко исчисляется, но недостаточно информативен,зависит только от крайних значений признака.
2) Среднее линейноеотклонение (Durchschnittliche absolute Abweichung, Mean absolute deviation)– арифметическая сумма отклоненийзначений признака от средней. В качестве средней чаще всего берут среднююарифметическую, но можно брать также другие средние, например, медиану.
/>/>
Недостаток показателя – мы вынуждены брать модуль отклонений,т.к. алгебраическая сумма отклонений значений признака от среднейарифметической всегда равна 0.
3) Дисперсия (Varianz, Variance)– средняя из квадратов отклоненийзначений признаков от средней арифметической
/> />
4) Среднееквадратическое отклонение (или стандартное) отклонение (Mittlere quadratische (Standard-) Abweichung, Standard deviation)– корень квадратный из дисперсии:
/>
Преимущество среднегоквадратического отклонения перед дисперсией состоит в том, что оно являетсяименованной величиной, т.е. имеет ту же единицу измерения, что и значенияпризнака.
И среднее квадратическоеотклонение, и дисперсия – показатели, широко применяемые в статистике,математической статистике и теории вероятностей.
Пример расчетапоказателей вариации. Дан ряд:
/>
/> /> /> /> /> /> /> /> <td/> /> <td/> /> /> />1; 2; 3; 4; 5 Тогда: X = 3, R = 5-1 = 4
Пример расчета дисперсиии среднего квадратического отклонения по сгруппированным данным:
Таблица 5.1.
Расчет σ2 и σ посгруппированным данным
Тарифный разряд, xi Число работников, чел., fi/>xi — x
/> (xi – x)2
/> (xi — x)2fi
12 1 -3 9 9 13 5 -2 4 20 14 30 -1 1 30 15 60 16 30 1 1 30 17 5 2 4 20 18 1 3 9 9 Итого: 132 - - 118X = 15 разрядов; σ2 = 118/132 = 0,89; и σ = />= 0,94 разряда.
Для оценки характерараспределения используют следующие взаимосвязи:
1) среднееквадратическое отклонение при нормальном или умеренно деформированном распределениипримерно в 1,25 раза больше линейного отклонения
/>
2) коэффициентвариации (Variationskoeffizient, Coefficient of variation) – это отношение среднегоквадратического отклонения к средней
/>
Здесь критическимзначением выступает V = 35 %. Если V ≤ 35 %, то считаем, что наша совокупность однородна.Если V > 35 %, то совокупность разнороднаи это автоматически накладывает ограничения на расчет средней (расчет просто неимеет смысла).
В нашем первом примереотношение σ/l =1,18, т.е.распределение близко к нормальному, а V = 47 %, т.е. совокупность разнородна.
Свойства дисперсии.Правило сложения дисперсии
1) дисперсияпостоянной величины равна 0
2) уменьшение всехзначений признака на одну и ту же величину А не меняет дисперсии:
σ2(х — А) = σ2х
3) уменьшение всехзначений признака в k раз уменьшает дисперсиюв k2 раз, а среднее квадратическоеотклонение – в k раз.
σ2(х / k) = σ2х: k2
σ(х / k) = σх: k
4) дисперсия равнасредней из квадратов значений признака минус квадрат средней значений признака:
/>
5) />дисперсия по средней есть величинаминимальная, т.е. она всегда меньше дисперсии по любой из величин А на ( Х – А)2 :
/> — А)2
6) дисперсию, вотличие от среднего квадратического отклонения, можно собирать по частям иделить на части.
/>
Существует так называемоеправило сложения дисперсии, которое заключается в следующем:
δ² — межгрупповая дисперсия;
/> α² — средняя из внутригрупповых.
/>
Межгрупповая дисперсия –это дисперсия, характеризующая влияние фактора, положенного в основугруппировки. Ее расчет производится по следующей формуле:
/> Xi –средняя по каждой группе;
/> Xобщ –общая средняя;
m – количество групп.
/>/>
Средняя извнутригрупповых дисперсий отражает влияние прочих факторов и определяется, как:
k – объем k-ой группы.
Исчислениесреднеарифметической и показателей вариации для качественных (атрибутивных илиноминально измеряемых) признаков
Наряду с вариациейколичественных признаков может ставиться задача оценки вариации качественныхпризнаков, например, при изучении качества продукции вся она делится на годнуюи бракованную.
В таком случае заэквивалент наличия признака (ответ «да») принимается 1, отсутствиепризнака обозначается 0 (ответ “нет”).
Общее число единиц совокупностипримем за n, тогда число единиц совокупности,обладающих данным признаком, будет f, а число единиц, не обладающих данным признаком, будет (n — f).
Ряд распределения покачественному признаку представлен в табл. 5.2. таблице:
Таблица 5.2.
Пример ряда распределенияпо качественному признаку
Значение переменной Частота 1 f n-f Итого nТогда средняяарифметическая равна:
/>
/>
Фактически, это доляединиц, обладающих данным признаком. Соответственно, доля единиц, не обладающихданным признаком равна:
/>
Так как p + q = 1, то для дисперсии альтернативного признака имеем:
/>
На практике это означает,что дисперсия по альтернативным или качественно изменяющимся признакамподчиняется следующему правилу
/>
Среднее квадратическоеотклонение по альтернативному признаку:
/>
Коэффициент вариации:
/>/>/>
Пример. В результатеконтроля качества из 1000 готовых изделий 20 оказались бракованными. Нужновычислить дисперсию и среднеквадратическое отклонение по данному номинальноизмеряемому признаку.
5.3Свойства нормального распределения
Нормальное распределениевозможно в том случае, когда на величину признака влияет большое числослучайных причин, которые не зависят друг от друга и ни одна из которых неимеет преобладающего влияние над другими.
/>
1) Кривая распределениясимметрична относительно максимальной ординаты:
2) кривая нормальногораспределения имеет две точки перегиба х ±σ
/>
/>
3) В промежутках между:
/>
/>
/> <td/> />
/>Рис.5.2. Кривая нормального распределения
5.4Моменты
Показатели вариациихарактеризуют ряд с точки зрения рассеивания, колеблемости значений признака.Ряд распределения, помимо рассеивания, может быть симметричным (асимметричным),остро- и плосковершинным. Универсальными характеристиками ряда распределенияявляются моменты (Momente, Moments) – средняя арифметическая тех илииных степеней отклонений значений признака от определенной исходной величины А.
Их общая формула:
/>
Если А = 0, то моментназывается начальным.
/>Если А = х, то момент называется центральным;
Если А = условнойвеличине, то момент называется условным.
В таблице 5.3.представлены формулы моментов первых четырех порядков.
Таблица 5.3.
Начальные, центральные иусловные моменты первых четырех порядков
Моменты распределения, порядка Начальные Центральные Условные Первого/>
/>
/>
Второго/>
/>
/>
Третьего/>
/>
/>
Четвертого/>
/>
/>
Большое значение имеютцентральные моменты, обозначаемые μi.
Центральный момент 2-гопорядка – это дисперсия:
/>
С помощью центральныхмоментов 3-го порядка
/>
исчисляются показателисимметричности (асимметричности) ряда. Так, если μ3 = 0, то рядраспределения симметричен, μ3 < 0, то ряд имеет левостороннююасимметрию, μ3 >0, то у ряда правосторонняя асимметрия (см. рис.5.3).
/>/>/>/> а)
/> /> /> /> /> /> <td/> /> />
/> /> /> /> /> /> /> /> /> /> />
Левосторонняя асимметрия
/>Правосторонняя асимметрия
/>/>/>/>/>/>/>/>б) в)
/> /> /> /> /> /> /> /> /> /> /> /> /> <td/> /> /> /> <td/> <td/> /> /> /> /> /> />/>
/> /> /> /> /> /> <td/> /> />
/>/>Рис.5.3. Асимметричные ряды распределения
Кроме того, степеньасимметрии можно определить с помощью коэффициента асимметрии Аs (Schiefemaß nach 3. zentralen Moment):
/>
Асимметрия выше 0,5(независимо от знака) считается значительной, меньше 0,25 – незначительной.
Существенностькоэффициента асимметрии оценивается на основе средней квадратической ошибкиσAs:
/>
Если />, то асимметриясущественна, если />, то асимметрия несущественна и ееналичие объясняется случайными обстоятельствами.
Для симметричных рядов помоментам 4-го порядка рассчитывается показатель остро- или плосковерщинности — эксцесса Ex (Wölbungskoeffizient):
/>
Ecли Ex = 0, то распределение признается нормальным, при Ex > 0 распределение островершинное,при Ex < 0 распределение плосковершинное(см. рис.5.4). При Ex = -2 и менеераспределение «рассыпается», статистическая совокупность разнородна.
плосковершинное распределение
нормальное распределение
/>островершинное распределение
/>/>/>/>/> <td/> />σ2
/>/>/>Рис. 5.4. Ряды с нормальным,остро- и плосковершинным распределением
Среднеквадратическаяошибка эксцесса σExрассчитывается по формуле:
/>
ТЕМА6. ИНДЕКСЫ
Indizes Indices
6.1Понятие об индексах
Индексы (Index)– это относительные величины (динамики,структуры или сравнения), полученные в результате сопоставления сложныхпоказателей во времени и в пространстве.
Сложными являются такиепоказатели, отдельные элементы которых не подлежат непосредственномусуммированию.
Пример.
Таблица 6.1.
Год Хлеб j=1 Пиво j=2 Кол-во, кг Цена, руб./кг Кол-во, л Цена, руб./л 3,5 2 20 1,0 1 4,0 3 25 1,2Для получения итогового изменения стоимости продуктов питаниянужно перейти к общей мере. Следовательно, вводят особый соизмеритель. Выборсоизмерителя зависит от цели исследования. Это может быть цена, себестоимость,трудоемкость и т.д.
Большинство экономических показателей являются сложными илинесоизмеримыми, поэтому индексы широко применяются на практике.
При построении индексаотвечают на следующие три вопроса:
1) какаявеличина будет индексируемой?
2) что будет весомпри расчете индекса?
3) по какому составуразнородных элементов необходимо исчислить индекс?
С помощью индексов решаются следующие задачи:
1) характеризуетсяобщее изменение уровня сложного экономического показателя (так называемаясинтетическая функция);
2) выделяют влияниеодного из факторов на изменение изучаемого показателя (аналитическая функция).
В теме индексы принятыследующие обозначения:
q – количество (физический объемпродаж);
p – цена;
z – себестоимость;
t – трудоемкость и т. д.
Индексы бывают:
I. По степени охвата явления:
— индивидуальные;
— сводные.
II. По базе сравнения:
— динамические
а) базисные – текущий(отчетный) уровень показателя сопоставляется
с уровнем периода,принятого за базу сравнения;
б) цепные – текущий(отчетный) уровень показателя сопоставляется с
предшествующим уровнем;
— территориальные –сравниваются показатели территорий.
III. По виду весов:
1) постояннымсостава;
2) переменногосостава.
IV. По характеруобъекта исследования:
1) Качественные –индексы цен, себестоимости, зарплаты, производительности труда и др.;
2) количественные –индекс физического объема;
6.2Индивидуальные индексы
Индивидуальные индексыотражают изменение только одного элемента сложного показателя.
/>
Так, индивидуальныйиндекс физического объема:
отражает изменение толькофизического объема, индивидуальный индекс цен – изменение цен на конкретныепродукты..
/>/>
Пример (на основе таблицы6.1.):
Вывод: цена на хлебвозросла на 50%, цена на пиво – на 20%.
6.3Сводные индексы
Сводные индексыопределяют изменение всех элементов сложного показателя. Макет сводного индексавыглядит следующим образом:
/>
/>
Пример сводного индекса –индекс стоимости (Wertindex, Value index):
/>
По таблице 6.1.:
Вывод: расходы возрослина 55,6%.
Если индекс охватывает невсе элементы, а только их часть, то он называется групповым или субиндексом.
Если в индексесравниваемая величина (ставится в числитель) берется за текущий период, а базасравнения (в знаменателе) за базисный, то такой индекс называется базисным.Если же в индексе сравниваемая величина берется за текущий период, а базасравнения за предыдущий, то индекс называется цепным.
В экономике широко применяются индексы цен и физическогообъема.
Индекс цен и физическогообъема по Э. Ласпейресу и Г.Пааше:
Индекс цен поЭ.Ласпейресу (Preisindex nach Laspeyres, Laspeyres price index):
/>
/>
Индекс физического объемапо Э. Ласпейресу (Mengenindex nach Laspeyres, Laspeyres quantity index):
/>
Индекс физического объемапо Г. Пааше (Mengenindex nach Paasche, Paasche quatityindex):
Индекс цен по Г. Паше (Preisindex nach Paasche, Paascheprice index):
/>
/>
Следующее уравнениеотражает взаимосвязь между индексами цен, физического объема и стоимости:
В целом отметим, что:
— индекс по формулеЛаспейреса (например, цен) дает ответ на вопрос: как изменились бы цены, еслибы структура производства (потребления) осталась прежней?
Преимущество этогоиндекса: веса определяются один раз на длительный период времени.
Недостаток: чем большевремени прошло с базисного года, тем больше вероятность изменения структурыпроизводства (потребления) товаров и тем больше вероятность неточности индекса.
Пример применения: индексстоимости жизни (Lebenshaltungskostenindex, cost of living index)
— индекс Пааше (например,цен) дает ответ на вопрос: как изменились бы цены при данной (текущей)структуре производства (потребления) товаров и услуг?
Преимущество: отражаетреальную сложившуюся на сегодня ситуацию.
Недостаток: требует болеевысоких затрат на исчисление весов.
Пример применения:проверка и корректировка индекса стоимости жизни, а также расчетмакроэкономических показателей (индекса – дефлятора и др.). Индекс-дефляторслужит для приведения важнейших стоимостных макроэкономических показателей(ВВП, ВНП, национального дохода, выпуска по регионам, по отдельным отраслямэкономики и др.) в сопоставимый вид путем их измерения по стоимости базисногопериода. Т.е. индекс-дефлятор рассчитывается как отношение фактическойстоимости выпуска к стоимости выпуска в ценах базисного года при сохраненииструктуры выпуска отчетного года. Для индекса-дефлятора ВВП имеем:
/>
Средний арифметическийиндекс
Бывает, что имеется информация по одним элементам сложныхпоказателей и не имеется по другим. Например, при расчете индекса физическогообъема продаж есть данные по индивидуальным индексам, тогда сводный индексприменяется в виде среднего арифметического .
/> /> /> /> /> /> /> />/>
/> В нашем примере:
Гармонический индекс
Аналогично при наличииданных, например, о динамике физического выпуска продукции ijq и стоимости каждого вида продукции втекущем (отчетном) периоде pj1 qj1, удобно применять сводный индексфизического объема Паше в виде гармонического индекса:
/> /> /> /> /> /> /> /> <td/> /> /> /> /> /> /> /> <td/> /> />/>
В нашем примере:
Другие индексы (по Лоу иФишеру)
/>/>/>
Предпринималисьнеоднократные попытки избавиться от недостатков индексов по Пааше и Ласпейресус помощью изобретения «идеального» индекса. Американский экономистИ.Фишер вывел среднюю геометрическую из этих индексов – изящный расчетныйпример, лишенный, однако, экономического содержания. Индекс Лоу привязан кусловной структуре выпуска продукции, что обуславливает трудности егоисчисления на практике.
Некоторые правилаисчисления индексов
1) Произведениерядом стоящих цепных индексов дает базисный индекс.
/>
/>
/>
2) Частное отделения двух рядом стоящих базисных индексов дает цепной.
/>
Эти правила работают дляиндивидуальных индексов, для сводных они будут верным только в случаепостоянных весов.
Пример индекса спостоянными весами:
Пример индекса спеременными весами:
3) Установление иной базы сравнения (Umbasierung, determining of another base for index).
Таблица 6.2.
Показатели 1986 1989 1990 Индекс цен 100 110,9 117,0 Индекс цен 100 x/>/>
Потребительскаякорзина неизменна (в случае исчисления индексaстоимости жизни).
4) Построение цепных индексов(Verkettung, Chaining).
Таблица 6.3.
Показатели 1961 1986 1990 Индекс цен 100 122,5 x Индекс цен 100 150,1/>/>
Надежностьрезультата изменяется с ростом числа временных периодов и потребительскихкорзин.
6.4 Практика применения индексов в экономике
Пример1. Расчет паритетапокупательной способности ППС (Kaufkraft-parität KKP, Parity of purchasing powerPPP) .
ППС показывает, сколько иностраннойвалюты должно быть израсходовано для покупки потребительской корзины, которуювнутри страны приобретают на отечественную валюту (в расчете на единицу).
Таблица 6.4.
Страна Потребление товаров в кг. Цены за кг. (в соотв. валюте) А В С А В С Страна 1 10 7 14 5 3 4 Страна 2 5 11 13 2 2,5 2 Сточки зрения страны 2:ППС = (Стоимостьпотребительской корзины страны 2 в стране 1)//>
(Стоимость потребительской корзиныстраны 2 в стране 2)
Потребительская корзина по стране 2 стоит в стране 1 на 76%больше, чем в стране 2.
Пример 2. Расчет индексаDAX (Der Deutsche Aktienindex)
DAX строится на основе индекса Ласпейресав форме среднего арифметического индекса. Расчет проходит ежеминутно постоимости 30 акций ведущих фирм и компаний Германии. Критериями для включения всписок являются:
— биржевой оборот запоследние 12 месяцев,
— объем рыночнойкапитализации (рыночная стоимость акций),
— раннее появление данныхо курсе,
— свободное размещение,
— доступность на рынке,
— переплетенностькапитала с АО, акции которых участвуют в расчете DAX.
Например, в 1995 г. всостав DAX входили:
Фактор веса, % Allianz Holding 12,43 ВASF 4,19 BAYER 5,66 Bayerische Hypotekbank 2,00 BMW 3,51 Bayerische Vereinsbank 1,54 Commerzbank 2,84 Deutsche Bank 7,35 Karstadt 1,13 Kaufhof 1,05Формула индекса:
/>
Fti — фактор веса,
pti — действительный курс акции i,
А = const = 29356.73
Фактор веса Fti = /> eit – корректирующий коэффициент акций i,
Kit – cвязывающий коэффициент, устраняет скачки индекса приизменении списка акций в его составе,
git – количество акций i
Справочно: значенияиндекса DAX в разные годы
1987 г. 1990 г. 1991 г. 1992 г. 1993 г. 1994 г. 2002 1000 1398.2 1578.0 1545.1 2966.1 2108.8 5180Пример 3. Анализизменения стоимости акций.
Акции, обращающиеся нарынке, анализируются по таким направлениям, как:
1) сравнениеизменения индекса акций и индекса рынка или его отдельного сегмента, т.е. оценкаспроса на данный вид акций;
2) изменение цен наакции в разных сегментах рынка, т.е. какой сегмент является наиболеепривлекательным для инвесторов в данный момент;
3) изменение цен наакции в разных странах (регионах), т.е. опредение инвестиционнойпривлекательности страны (региона);
4) изменение цен наакции отдельных компаний, групп компаний относительно друг друга.
Таблица 6.5.
Некоторые данные обакциях компаний A,B,C
Ком-па-ния Курс акций (у.е.) Количество выпущенных акций (млн. у.е. ) q Прирост курса акций (%) Рыночная стоимость всех акций (млн. у.е.) /> Базовый период — p° Текущий период — p´ /> Базовый период — p° Текущий период — p´ /> А 20 22 20 +10 400 440В 40 38 10 -5 400 380
С 100 120 1 +20 100 120
Всего 900 940 />
/>
1) Темп роста (снижения)средней цены акций по простой арифметической:
Средняя цена в базовомпериоде:
Средняя цена в текущемпериоде:
/>/>
Темп роста равен:
Это означает, что средняяцена акции возросла на 12,57%.
/>
2) Рассчитаем темп ростасредневзвешенной цены акции (за вес возьмем количество обращающихся акций).
Т.е. средневзвешеннаяцена акции возросла на 4,44%.
/>
3) Средний темп приростацены акции:
или 7,84% среднего темпаприроста.
Вывод: общая тенденцияхарактеризуется однонаправлено (курс растет), но есть расхождения в величинахпоказателей.
ТЕМА7. ОСНОВЫ СТАСТИКИ НАСЕЛЕНИЯ
Bevölkerungsstatistik Demographic statistics
7.1Предмет и задачи статистики населения
Предметданного раздела статистики – население, рассматриваемый фактор – труд.Население(Bevölkerung, Population) – это совокупность людей, проживающих наопределенной территории, непрерывно возобновляющаяся за счет рождения исмертей.
Объектом наблюдениястатистики населения могут быть различные совокупности: и население в целом, иотдельные группы.
Источники статистики населения:
1) перепись(единовременное наблюдение в сплошной или выборочной форме);
2) микроперепись(охватывает 5% постоянного населения);
3) текущий учет(ЗАГС, паспортные столы, паспортно-визовая служба МВД);
Задачи статистикинаселения:
1) учет и анализ численностии размещения населения;
2) учет и анализсостава и структуры населения;
3) учет движениянаселения и его воспроизводства;
4) изучениесоциальных характеристик населения;
5) разработка исовершенствование методологии переписи и текущего учета населения.
7.2 Статистика численности и состава населения
1) Показателичисленности
Численность населения (Bevölkerungszahl, Size of population) – это количество лиц, проживающихна определенной территории страны или в отдельных ее регионах.
Учет осуществляется наопределенную дату и время (критический момент наблюдения).
Различают следующие категории населения: постоянное (ПН),наличное (НН), временно проживающее (ВП) и временно отсутствующее (ВО)население.
Постоянное население (Wohnbevölkerung, Stable population) – этолица, постоянно проживающие на данной территории, независимо от их фактическогоместонахождения на момент учета.
Наличное население (Ortsanwesende Bevölkerung,Available population) — это лица, которые на момент учетафактически находятся в данном населенном пункте, независимо от их постоянногоместа жительства.
Временно проживающеенаселение (Vorübergehend anwesende Bevölkerung,Temporary staying population)- это лица, которые на момент учетанаходятся на территории данного населенного пункта, но постоянно проживают вдругом.
Временно отсутствующеенаселение (Vorübergehend abwesende Bevölkerung,Temporary absentee population) – это лица, находящиеся в моментучета за пределами места жительства.
Пример. На начало 2001 г.наличное население г. Нижнего Новгорода составляло 1356,5 тыс. чел, постоянноенаселение – 1351,7 тыс. чел.
При проведении переписиобычно учитывают наличное население с пометкой о временном проживании иливременном отсутствии.
Все категории связанымежду собой следующим образом:
ПН = НН – ВП + ВО
НН = ПН – ВО + ВП
Определение категорииимеет большое значение для планирования экономики и социального развития(например, количество мест в школах определяют по постоянному населению, аобъем товарооборота – по наличному населению).
/>
В основе анализачисленности населения лежит показатель среднегодовой численности, которыйрассчитывается по формуле средней арифметической:
где S1 и S2 – численность населения на начало периода 1,2
Пример. Среднегодоваячисленность наличного населения г. Нижнего Новгорода в 2000 г. составила 1361,7тыс. чел.
Если имеются данные поряду периодов, равноотстоящих друг от друга, то используется более точная формуласредней хронологической.
Если интервалы не равны,имеем среднюю хронологическую взвешенную (пример см. в теме ряды динамики).
/>
Наиболее часто применяютсяпоказатели абсолютного прироста (уменьшения) численности населения Sn – S1; коэффициента (темпа) роста Sn/S1; коэффициента(темпа) прироста населения Sn/S1 – 1; среднегодового темпа роста /> ; плотности населения, численности городского исельского населения; численности населения по отдельным регионам.
Пример: Плотность – этоколичество жителей на квадратный километр. В настоящее время плотностьнаселения составляет в РФ 8,7 чел/км2 и в Нижегородской области 48 чел/км2. Длясравнения: плотность населения в ЕС равна 115 чел/км2, в США — 28,2 чел/км2, вЯпонии 331, 7 чел/км2.
2) Показателиструктуры населения
Показатели структуры(состава) населения – это возрастная структура населения, численность мужскогои женского населения, национальный состав, группы населения по составу семьи,источникам средств к существованию и т.д..
Так, для анализа и оценки возрастно-половой структурынаселения существуют так называемые возрастные пирамиды:
возраст (год рождения,) />
/>
/> М Ж
численность, тыс. чел.
/> /> /> /> /> /> /> /> /> /> /> <td/> /> /> /> /> />Рис. 7.1. Схемавозрастной пирамиды
В данном случае пирамидаотображает прогрессивную структуру населения. Стационарная и регрессивнаяструктура имеет место тогда, когда пирамида принимает соответственнопрямоугольную форму или форму перевернутого треугольника, т.е. когда населениесоответственно распределяется по возрастным группам равномерно или стареет.
Население склонно кокруглению возраста на 0 и на 5. В результате в возрастных группах,оканчивающихся на 0 и на 5, образуются наросты – так называемая аккумуляциявозрастов. Для избежания этого кроме возраста спрашивают еще и год рождения.
Показателидемографической нагрузки отражают нагрузку на общество непроизводительногонаселения. Рассчитываются такие показатели, как отношение общего числа детей,лиц пенсионного возраста и их общей совокупности к численности населениятрудоспособного возраста.
Пример. В РФ на 1000 лицтрудоспособного возраста в 1995 г. приходилось 430 детей и подростков 0-15 лети 325 лиц старше трудоспособного возраста, всего – 755 чел.
Практическое применениеэти показатели имеют при расчете затрат на пенсионное обеспечение, насодержание детей, на социальные мероприятия.
7.2 Статистика естественногодвижения и статистика миграции населения
Воспроизводство населения– это процесс постепенной смены населения через смену уходящих поколений.
Уровень воспроизводства характеризуется показателямиестественного движения населения. При их изучении используют абсолютные (числородившихся, умерших) и относительные показатели (исчисление в расчете на 100,1000, 10000… человек).
/>
/>
Коэффициенты рождаемости:
N – число родившихся.
/>
/>
Коэффициенты смертности:
M – число умерших.
/>
Коэффициент естественногоприроста населения:
/>
Используют такжеспециальные коэффициенты такие, как специальный коэффициент рождаемости:
SF — среднегодовая численность женщин,способных к деторождению (в фертильном возрасте – 15-49 лет).
/>
Повозрастной коэффициентрождаемости:
N15-19 – число родившихся от матерей ввозрасте 15-19 лет.
/>
Повозрастной коэффициент смертности:
Отдельно вычисляюткоэффициенты смертности детей до одного года:
/>
N1 – число родившихся в этом году;
/>
N0 – число родившихся в предыдущемгоду;
М0 – число умерших.
m0 – число умерших в текущем году изродившихся в предыдущем;
m1 — число умерших в текущем году из родившихсяв этом же году.
/>
Коэффициент жизненности:
На базе этих показателей применяют стандартизированные(нормированные) показатели. Они нормируются, например, по удельному весуотдельных групп в структуре населения I.
/>
Коэффициент смертности:
Обобщающие показателивоспроизводства населения – это показатели суммарной плодовитости,брутто-коэффициент воспроизводства и нетто-коэффициент воспроизводства.
/>
Суммарная плодовитость –это количество детей, рожденных одной женщиной за весь фертильный период.
Fx – вероятность родить ребенка ввозрасте x лет (15≤x≤49);
Кp – повозрастной коэффициент рождаемости.
/>
Брутто-коэффициентвоспроизводства показывает, сколько девочек в качестве смены оставляет каждаяженщина.
δ – доля девочексреди родившихся.
/>
Нетто-коэффициентвоспроизводства (исчисляется только для женщин) показывает, сколько девочекдоживает до возраста своей матери.
Lx – среднее число женщин в возрасте отx до x+1 года.
Маятниковая миграция –это перемещения с места жительства на работу и обратно.
/>
Существует три показателямиграции:
1) Коэффициентприбытия:
2) Коэффициентубытия:
/>
3) коэффициентмеханического прироста
/>
Общий коэффициентприроста населения – это сумма коэффициентов естественного прироста имеханического прироста.
K = Kест.пр. + Kмех.пр.
Для более глубокого анализа и изучения особенностейдемографических показателей в отдельных возрастных группах применяют табличныйсчет населения (например, таблицы смертности, плодовитости и т.д.).
Таблицы строят в полном и кратком варианте (полная таблица –с одногодичным интервалом, краткая – с интервалом в 5-10 лет).
Экономические таблицы могут содержать следующие данные:
1) Возраст – X;
2) Число доживших довозраста X – lx;
3) Число умерших ввозрасте от X до X+1 – dx;
4) Вероятностьумереть в течение следующего года – qx;
5) Вероятностьостаться в живых в следующем году – px;
6) Средняяпродолжительность предстоящей жизни населения — exº.
/>
/>
Рассмотрим некоторые взаимосвязи между этими величинами:
/>
/>
/>
/>
Тx – числопредстоящих человеко-лет жизни.
W – предельный возраст;
Lx – число доживших до возраста Х лет.
7.4 Перспективные расчетычисленности населения
Существуют следующие методы перспективного расчета:
1) глобальный метод(на основе данных о численности населения в начальном периоде и коэффициентовмеханического и естественного прироста):
/>
К – общий коэффициент прироста населения.
2) метод передвижкивозрастов:
/>
Глобальный метод хорошо применяется для определения общейчисленности населения, но не применяется для определения численности отдельныхвозрастных групп. Для этого можно использовать метод передвижки возрастов(табличный счет).
ТЕМА8. ИЗМЕРЕНИЕ УРОВНЯ КОНЦЕНТРАЦИИ
Konzentrationsmessung Measurement of concentration
8.1Постановка проблемы
Измерение уровняконцентрации – это одна из задач статистического анализа. Она заключается вопределении степени концентрации изучаемого признака по единицам совокупности,а также в оценке неравномерности его распределения.
Подобные цели частоставятся на практике. Например:
1) в сфересоциальной политики, при анализе уровня жизни населения (например, проблеманеравномерного распределения доходов);
2) в антимонопольнойполитике и политике развития конкуренции (выявление доминирующего положения нарынке и рыночной силы хозяйствующих субъектов);
3) длястратегического планирования и анализа рынка отдельных фирм (например, оценкадоли рынка по имущественному обороту, прибыли, числу занятых и т. д.).
Как можно заметить дажеиз приведенного выше списка, концентрация в экономическом смысле может касатьсядвух аспектов: во-первых, сосредоточения экономических признаков (рыночнойвласти, доли рынка и др.) у немногих единиц совокупности; во-вторых,существования значительных различий, неравенства в размере отдельных единицсовокупности. Соответственно различают абсолютную концентрацию и относительнуюконцентрацию (Absolute und relative Konzentration, Absolute and relative Concentration).
Пример:
— 1,7 % населенияобладают более чем 70 % имущества – относительная концентрация;
— на рынке определенноготовара 3 наиболее крупных предприятия имеют совокупную долю 90 % — абсолютнаяконцентрация.
Различие абсолютной иотносительной концентрации особенно заметно в случае строго равномерногораспределения объема признака по единицам совокупности: относительнаяконцентрация будет равна 0, а абсолютная концентрация будет тем больше, чемменьше число единиц совокупности.
8.2Показатели концентрации
Для измерения относительной концентрации наиболее частоприменяется кривая концентрации -кривая Лоренца (Lorenzkurve, Lorenz curve) и рассчитываемые на ее основе показатели.
Пример. Рынок снабжаетсяпятью предприятиями. Три предприятия имеют по10 % рынка каждое, четвертое – 20%, пятое – 50 %.
Для построения кривойЛоренца представим данные в виде накопленной частоты объема совокупности (числопредприятий в %) и накопленной частоты объема признака (доля рынка в %). Данныепредставляются в ранжированном виде (или по возрастанию, или по убыванию).
Таблица 8.1.
Данные о снабжении рынкапредприятиями
Предприятие Накопленная частота объема совокупности, %Доля рынка,
%
Накопленная частота объема признака, % 1 20 % 10 % 10 % 2 40 % 10 % 20 % 3 60 % 10 % 30 % 4 80 % 20 % 50 % 5 100 % 50 % 100 %Прохождение кривой L сравнивают с прямой D, проходящей под углом 45%. Прямая D соответствует идеальному случаюравномерного распределения и называется прямой равномерного распределения.
/> Накопленная доля рынка в %
/>/>/>100 A
80
60 D
/>40 L
/>/>20
/> B
/> 0 20 40 60 80 100
Накопленная доля предприятийв %
Площадь, заключеннаямежду прямой D и кривой L показывает степень концентрации. Чем больше площадь, тембольше концентрация.
Треугольник AOB соответствует случаю абсолютноймонополизации.
В нашем примере визуальноможно сделать вывод о существенной концентрации доли рынка у ведущихпредприятий.
Если мы будем сравниватьплощадь, заключенную между прямой D и кривой L и площадьтреугольника АОВ, то получим коэффициент Джини (Gini-Koeffizient, Gini coefficient). Он используется для количественнойоценки уровня концентрации:
/>
dxi – доля i-ой группы в общем объеме совокупности;
dyi — доля i-ой группы в общем объеме признака;
dyiⁿ — накопленная доля i-ой группы в общем объеме признака.
Или в немецком варианте:
/>
n – число единиц совокупности;
i – порядковый номер единицысовокупности.
Коэффициент Джиниизменяется от 0 до 1:
0 ≤G≤1
При G=0, то признак распределенравномерно, кривая L совпадает спрямой D. При G=1 площадь, заключенную между прямой D и кривой L иплощадь треугольника АОВ совпадают, т.е. имеется одна единица совокупности-абсолютная монополия – с долей рынка 100 %.
Пример расчета коэффициента Джини.
1) По немецкому вариантуформулы и данным табл. 8.1.:
/>= 0,36
Значение коэффициентаДжини подтверждает вывод о существенной концентрации признака «долярынка».
2) По российскомуварианту формулы и данным таблицы 8.2.:
Таблица 8.2.
Распределение доходовнаселения в _ месяце 199_ г.
Группы населения (ранжированные по уровню сред-недушевого дохода, по 10 % численности населения) Месяц _ Удельный вес в совокупном доходе Накопленная частота 1 4,3 4,3 2 6,1 10,4 3 7,1 17,5 4 8,1 25,6 5 9,1 34,7 6 10,1 44,8 7 11,2 56,0 8 12,6 68,6 9 14,3 82,9 10 17,1 100,0Источник данных:(Шмойлова Р.А., 1996, с.365)
Рассчитаем коэффициентДжини:
/>
При разделениисовокупности на десять равных групп формула коэффициента Джини упрощается:
/>
/>
Таким образом,концентрация доходов населения (или дифференциация населения по уровню доходов)в нашем примере составила 21 %, что не является критической величиной.
Для измерения абсолютнойконцентрации применяют другие показатели концентрации: коэффициентконцентрации, индекс Герфиндаля, индекс Розенблюта, экспоненциальный индекс,коэффициент энтропии и др..
Коэффициент концентрации CRg (Konzentrationsrate, Concentration ratio)- самый простой показатель концентрации:
/>
pi – доля i-го значения признака;
g – число единиц совокупности снаибольшими значениями признака (g = 3,4, 5, …).
По данным табл.8.1.:
/>
т.е. рынок сильно монополизирован
/>/>
Индекс Герфиндаля (Herfindahl-Index, Herfindahl index) имеет воснове формулу средней арифметической взвешенной, где весами выступают сами долиpi:
/>
По данным таблицы 8.1.:
Подтверждается вывод осильной монополизации рынка.
В разных странахкритические значения коэффициента концентрации и индекса Герфиндаля разные.Так, в РФ они приняты следующими:
— если CR3 < 45 %,
HHI < 1000, то
рынок неконцентрированный (нормальная концентрация)— если 45 ≤ CR3 ≤ 70 %,
1000 ≤ HHI ≤ 2000, то
рынок умеренно концентрированный (средняя степень концентрации)— если CR3 > 70 %,
HHI > 2000, то
слабая конкурентная среда (высокая степень концентрации)В ФРГ доминирующееположение предприятия или группы предприятий на рынке возникает, если
— на 1 предприятиеприходится свыше 1/3 всего оборота на рынке, либо
— на 3 и менеепредприятий – свыше ½ оборота, либо
— на 5 и менеепредприятий – свыше 2/3 оборота.
В США безопасным с точкизрения монополизации считается рынок с HHI < 1000, при HHI > 1800 рынок считается слабоконкурентным, при 1000≤ HHI ≤ 1800 требуются дополнительныеисследования. Максимально возможная концентрация долей крупнейших предприятийна рынке составляет:
при HHI = 1000 при HHI = 1800 CR1 ≤ 31 % CR1 ≤ 42 % CR2 ≤ 44 % CR2 ≤ 60 % CR3 ≤ 54 % CR3 ≤ 72 % CR4 ≤ 63 % CR4 ≤ 85 %/>
/>
Экспоненциальный индекс (Exponentialindex, Exponential index) основывается на средней геометрической взвешенной:
К особой группепоказателей рыночной силы можно отнести индекс Линда (Linda-Index,Linda index) который связан с поиском границы олигополии:
/>
Аi – общая доля i единицсовокупности с наибольшими значениями признака в объеме признака;
Аk – доля kизучаемых единиц совокупности в объеме признака. (примеры расчета индекса Линдаи экспоненциального индекса)
8.3Применение методов измерения уровня концентрации в экономике
Рассмотрим применениеметодов измерения уровня концентрации в экономике на примере анализа и оценкисостояния конкурентной среды на нижегородском рынке наружной рекламы.[1]
Под продуктовыми границами рынкапонимается часть товарной группы «Услуги в области рекламы» –«Услуги по распространению рекламы» (конкретно речь идет ораспространении наружной рекламы).
Покупателями на рынкеуслуг в области рекламы всегда выступают рекламодатели. Продавцами услуг пораспространению рекламы выступают рекламораспространители Нижегородской областии других крупных российских городов и регионов, а также других стран.
Географическими границамирынка услуг по распространению наружной рекламы является территория г. НижнегоНовгорода.
В 1997 г. 40 рекламныхфирм предлагали услуги по распространению наружной рекламы, в 1998 г. — 52фирмы. Ограничимся, однако, 8 фирмами, так как эти фирмы являлись наиболеекрупными и объем предоставляемых ими услуг составил 90% от общего объема рынка.
Доли хозяйствующихсубъектов на рынке услуг по распространению наружной рекламы в 1996-1997 гг.отражены в таблице 8.3.
Таблица 8.3.
Доли хозяйствующих субъектовна рынке услуг по распространению наружной рекламы
Продавцы Доля на товарном рынке, % 1996 г. 1997 г. ООО «Курсив» 32 32 ЧП Арабаджи 18 5,6 ООО «Ректайм» 12 24,4 ООО «Фирма АНЖ» 11,5 10,4 ООО «Россерв» 9,5 11,2 АОЗТ «АПР-НН» 3 3,6 ТОО «Арт-студия Клим» 2 1,5 ООО «Росреклама» 2 1,3 Прочие хозяйств. субъекты 10 10 Всего: 100 100Подсчитаем уровеньконцентрации трех (CR3), четырех (CR4), шести (CR6) и восьми (CR8)крупнейших продавцов на рынке.
CR3 CR4 CR6 CR8— Коэффициент концентрации по итогам
1996 г.
62 % 73 % 86 % 90 %— Коэффициент концентрации по итогам
1997 г.
68 % 79 % 88 % 90 %Индекс Герфиндаля за 1996г. составил:
3х3 + 12х12 + 9,5х9,5 +2х2 + 18х18 + 11,5х11,5 + 32х32 + 2х2 + 10х10 = 1831,5
За 1997 г.:
3,6х3,6 + 24,4х24,4 +11,2х11,2 + 1,3х1,3 + 5,6х5,6 + 10,4х10,4 + 32х32 + 1,5х1,5 + 10х10 = 1988,26
В соответствии созначениями коэффициента концентрации и индекса Герфиндаля определяем тип рынка:
— в 1996 г. — умеренноконцентрированный рынок, так как коэффициент концентрации трех крупнейшихпродавцов равен 62 %, т.е. 45 < CR3< 70. Индекс Герфиндаля равен 1831,5, т.е. 1000 < HHI < 2000;
— в 1997 г. тип рынкаопределен аналогично — умеренно концентрированный, так как коэффициентконцентрации равен 68 %, т.е. 45< CR3< 70. Индекс Герфиндаля равен 1988,26, т.е. 1000 < HHI < 2000.
Итоговая оценка состоянияконкурентной среды на товарном рынке «Услуги по распространению наружнойрекламы» в г. Нижнем Новгороде представлена в таблице 8.4.
Таблица 8.4.
Сводная таблица оценкисостояния конкурентной среды на рынке «Услуги по распространению наружнойрекламы»
Наименование
Показателя
Ед. изм. Критерии оценки значений показателей Характеристика типа рыночной структуры Оценки состояния конкурентной среды высоко конц. рынок умеренно кон-. рынокнизко кон-
центр. рынок
неразвитая конкуренция развитая конкуренция 1. Численность хозяйствующ. субъектов на данном товарном рынке — 40 шт 2. Доли каждого продавцам в общем объеме товарного ресурса рынка (Di): 32 %, % Распределение Di -равномерное + +24,4 %, 11,2 %,10,4 %, 5,6 %,
3,6 %, 1,5 %, 1,3 %, для остальных 32 хоз. субъектов — 10 %
3. Коэффициент рыночной концентрации CR % 45%<68%<70% + + 4. Индекс Герфиндаля HHI 1000<1988,2<2000 + + 5. Барьеры «входа» на рынок степень преодоли-мости –преодоли-мый 6. Открытость рынка рынок открыт Итоговая оценка + +ТЕМА9. Корреляционный и регрессионный анализ
Korrelations- und Regressionsrechnung Correlationand regression analysis
9.1Понятие корреляции и регрессии
Корреляция (Korrelation, Correlation)– это изучение взаимосвязей двух илиболее величин.
Регрессия (Regression) – это нахождение аналитическоговыражения взаимосвязи, т.е. определение конкретной формулы.
При изучении взаимосвязейодни признаки – факторные обусловливают изменение других – результативных.Факторные признаки обычно обозначаются Х, результативные Y.
Методы корреляциипредназначены для изучения корреляционной зависимости, которую нужно отличатьот функциональной зависимости. Функциональная зависимость означает полноесоответствие между изменениями факторного и результативного признака, т.е. знаяфакторный признак, можно точно определить результативный. Корреляционная связьозначает, что одному значению факторного признака соответствует неопределенноечисло результативных признаков, т.е. мы можем с помощью корреляционного анализаустановить лишь тенденцию изменения результативного признака при изменениифакторного.
Задачи, которые решаюткорреляционный и регрессионный анализы:
1) предварительныйанализ статистической совокупности;
2) установлениефакта наличия связи, ее направления и формы;
3) установлениестепени тесноты связи;
4) построениерегрессионной модели;
5) интерпретация ипрактическое использование выводов и результатов.
9.2Показатели корреляции
Показатели корреляции отражают тесноту корреляционной связи.
Корреляционную связьразличают:
I. По числу переменных:
1)
/> <td/> />простая (парная):
2) сложная (множественная):
/> <td/> />3) частичная:
II.
/> <td/> />По виду связи:
1) позитивная;
2) негативная.
III. По форме связи:
1) линейная;
2) нелинейная.
/>/> Yi экстремально позитивнаясвязь сильная позитивная связь
/> /> /> /> /> /> <td/> />/>/> Xi
/> /> /> /> /> /> <td/> />слабая позитивная связь сильная негативнаясвязь
/> /> /> /> /> /> /> /> /> <td/> /> /> /> /> /> /> /> /> />/> нет связи экстремальнонегативная связь
/> /> /> /> /> /> /> /> /> <td/> /> /> /> /> /> /> /> /> /> />/>/>/>/>/> нелинейная позитивная связь нелинейная связь
/>/>
/> /> /> /> /> /> <td/> />Рис. 9.1. Виды связей между двумя переменными
Основными показателями корреляции являются:
1) коэффициентФехнера;
2) коэффициентассоциации;
3) коэффициентконтингенции;
4) критерий согласия- χ²;
5) коэффициенткорреляции рангов;
6) коэффициенткорреляции;
7) коэффициентдетерминации;
8) корреляционноеотношение.
Рассмотрим все эти показатели подробнее.
Коэффициент Фехнера (Fechner-Koeffizient, Fechner coefficient):
/>
nс – число совпадений знаковотклонений индивидуальных величин от средней;
nн — число несовпадений знаковотклонений индивидуальных величин от средней.
/>
/>
/>
Пример (см. табл.9.1.):.
Вывод: существует слабовыраженная негативная связь между X и Y.
Коэффициент Фехнераизменяется от -1 до +1.
В общем случае, еслипоказатели корреляции:
0 ≤ П ≤ 0,3, то существует слабая связь;
0,3 ≤ П ≤0,7 – умеренная связь;
0,7 ≤ П ≤ 1– сильная связь.
Таблица 9.1.
Данные для расчетакоэффициента Фехнера
Носитель признакаФакторный признак
X
Результативный признак
Y
1 5 (+) 5 (+) 2 4 (-) 5 (+) 3 4 (-) 4 (-) 4 5 (+) 4 (-) 5 5 (+) 3 (-)По номинально измеряемымпризнакам можно рассчитать лишь коэффициенты ассоциации (Assoziationskoeffizient, Association coefficient) и контингенции (Kontingenzkoeffizient, Contingent coefficient) .
Таблица 9.2
Данные для расчетакоэффициентов ассоциации и контингенции
Участники мероприятия Спортсмены Не спортсмены Мужчины 20 (а) 60 (в) Женщины 15 (с) 80 (d)Существует ли зависимость между двумя качественнымипризнаками – полом и отношением к спорту?
1) по коэффициентуассоциации
/>
Вывод: вряд ли существует такая зависимость, т.е. степеньзависимости невелика.
2) по коэффициентуконтингенции:
/>
Вывод: связь еще слабее.
/>
Более точным по сравнениюс рассматриваемыми коэффициентами является критерий согласия — χ²Пирсона (χ² Anpassungstest nach Pearson, Pearson χ²-test of goodness of fit), отражающий связь между двумя и более признаками.
О – реальные значенияпризнаков;
Е – теоретическивыровненные значения признаков.
Пример.По данным таблицы9.3. нужно ответить на вопрос: зависит ли частота несчастных случаев от смены?Предварительная гипотеза: связь отсутствует.
Таблица 9.3
Данные о несчастныхслучаях по предприятию N
Номер смены Число несчастных случаев Реальное Теоретически выровненное 1 1 5 2 7 5 3 7 5 Итого: 15 15Вычислим критерийсогласия — χ²:
/>
Чем больше χ²,тем больше вероятность того, что между О и Е есть существенные различия, т.е.наша гипотеза (связь отсутствует) неверна. Напротив, чем меньше χ²,тем несущественнее, случайнее различия между О и Е, т.е. тем больше вероятностьверности гипотезы.
По специальным таблицамнаходим критериальное значение χ² с вероятностью 95 % и числомстепеней свободы 2 (равно числу строк таблицы-1, т.е. 3-1=2):
χ² = 5,99
Таким образом, в нашемпримере χ² небольшой (4,8 < 5,99), различия между О и Е случайны, фактическоераспределение несчастных случаев по сменам не отличается существенно оттеоретически выровненного. Вывод: с 95 % вероятностью можно утверждать, чтонаша гипотеза верна.[2]
Для ординально измеряемыхпризнаков применяется коэффициент корреляции рангов по Спирмену r (Spearmanscher Rangkorrelations-koeffizient, Spearman's rank correlation coefficient).
/>
d – разность порядковых номеров(рангов) факторного и результативного признаков;
n – число наблюдений.
Пример: (см. табл. 9.4):
/>
Вывод: существует сильнаяположительная зависимость между стажем и производительностью
Таблица 9.4
Стаж и производительностьтруда по 5 работникам предприятия N
№ работника Стаж Производительность X*Y X² Y² d d² X Ранг Y Ранг 1 1 1 2 1 2 1 4 2 2 2 4 2 8 4 16 3 3 3 8 4 24 9 64 -1 1 4 4 4 6 3 24 16 36 1 1 5 5 5 10 5 50 25 100 Итого 15 30 108 55 220 2Наиболее точнымпоказателем корреляции является коэффициент корреляции (Korrelationskoeffizient, Coefficient of correlation ). Он позволяет учесть не толькознаки отклонений значений признака от их средних, но и саму величинуотклонений. Его можно рассчитать в два шага:
1) расчет показателяковариации (kovarianz, covariance)
/>
Однако полученныеабсолютные величины нельзя сравнивать между собой, т.к. сами признаки X и Y могут бытьвыражены в разных единицах измерения или средние `Х и`Yмогут быть различны по величине. Поэтому отклонения значений признаков отсредних нормируют по среднему квадратическому отклонению, т.е. выражают в доляхот sx и sy .
2) расчеткоэффициент корреляции
/>
На практике применяют другую формулу:
/>
По данным табл. 9.4рассчитаем коэффициент корреляции:
/>
Вывод: между стажем ипроизводительностью труда существует сильная положительная связь.
Коэффициент детерминации (Bestimmtheitskoeffizient, coefficient of determination):
/>
Он имеет очень простойсмысл: какая часть колебаний результативного признака вызвана факторнымпризнаком. В нашем примере 72.25% изменений в производительности труда вызванвлиянием стажа работника.
/>
Все эти коэффициентыприменяются без ограничений при прямолинейной зависимости. При криволинейнойзависимости (параболической) они не годятся. Здесь применяются показатель,называемый корреляционным отношением h (Korrelationsverhältnis, Correlation ratio).
δ² — межгрупповая дисперсия;
σобщ² — общаядисперсия совокупности.
/>
Учитывая правило сложения дисперсии, можно написатьвидоизмененную формулу корреляционного отношения
/>/> - средняя из групповых дисперсий.
Различают эмпирическое(фактическое) корреляционное отношение и теоретическое корреляционноеотношение. В последнем для расчета δ² берут выровненные (т.е.рассчитанные по уравнению регрессии) значения результативного признака y. Теоретическое корреляционноеотношение еще называют индексом корреляции.
В целом корреляционноеотношение является универсальным показателем корреляции и используется припрямо- и криволинейной зависимости. При строго прямолинейной зависимости коэффициенткорреляции и корреляционное отношение совпадают, но чем больше кривизна, темсильнее они отличаются друг от друга.
Для этого коэффициентасуществует аналогичный предыдущему коэффициент детерминации — η².
/>
/>
Для проверки значимостипоказателей корреляции рассчитывают их ошибки. Средние квадратические ошибкипоказателей корреляции имеют вид:
/>
При количестве наблюденийменее 30 в знаменателе под корнем лучше брать n-1.
Показатель корреляциидолжен в 2-3 раза превосходить ошибку, чтобы с вероятностью 0,95 (0,997)говорить о связи между явлениями.
9.3Регрессия
Регрессия (Regression)– это определение формы взаимосвязи2-х или более признаков (определение тенденции развития явления).
Этапы регрессионногоанализа:
1) определениефункций, которыми характеризуется наша зависимость (прямая, парабола, гиперболаи т.д.);
2) определениепараметров (коэффициентов) выбранной функции
/> Y
/>/>/> aX+b
/>/>/> Yi (Xi;Yi)
Yi=(aXi+b)
/>
Коэффициенты
/> aXi+b
b
/>
Xi X
Рис. 9.2. Графическоеизображение метода наименьших квадратов
/>
/>
Используют метод наименьших квадратов:
Его сущность заключается в нахождении таких параметров(коэффициентов) уравнения регрессии, при которых минимизируется сумма квадратовотклонений эмпирических (фактических) значений результативного признака оттеоретических (выровненных) значений.
Формулы для расчета коэффициентов в случае линейнойзависимости:
/>
/>
/>
В нашем примере (см. данныетабл. 9.4):
/>
b = 6 – 1,7*3 = 0,9
3) определениефункции регрессии: />
4) />
5) Y
6)
7)
8) 10
9) />9
10) 8 Ŷ=1.7X+0.9
11) 7
12) 6
13) 5
14) />4
15) 3 a=tg α
16)2
17) />/>1
18) 0 1 2 3 4 5 X
19)
20) найдя уравнениерегрессии можно продолжить зависимость за известные пределы или найти дополнительныепоказатели внутри их, т.е. экстраполировать или интерполировать значения />.
/>
При этом нужно учитывать среднюю квадратическую ошибкууравнения регрессии.
/>
Последняя формула более точнаи удобна.
.ТЕМА10. РЯДЫ ДИНАМИКИ
Zeitreiheanalyse The analysis of time series
10.1Понятие рядов динамики
Ряд динамики (иливременной, или хронологический ряд) – это ряд чисел, характеризующих развитиеявления во времени. Ряд динамики следует отличать от ряда распределения.
В общем виде ряд динамикиобозначается, как
/>
У каждого ряда динамикиимеются два элемента: уровень ряда y и момент (период) времени t.Уровень ряда – это показатель, характеризующие объект исследования.
Различают два вида рядовдинамики:
1) моментный ряддает сведения о развитии явления на какие-то последовательные моменты времени(например, численность населения на 1.01.2000);
2) интервальный ряддает сведения о развитии явления за определенные периоды времени (например,выпуск продукции предприятия за квартал).
В уровнях моментного рядасодержится повторный счет, следовательно, их не имеет смысла суммировать (можнонайти только изменение — разность). По интервальным рядам можно определятьсуммы и нарастающим итогом – конечный показатель.
Компоненты ряда динамики:
1) тренд (Trend,trend) – это основная тенденция развития явления (в долгосрочном плане) – T(t);
2) циклическая (конъюнктурная)компонента (zyklischeKomponente, cyclical component) показывает влияние конъюнктурныхколебаний (периодически повторяющихся в среднесрочном плане) – Z(t);
3) сезоннаякомпонента (dieSaisonkomponente, season component )отражает влияние сезонных иликраткосрочных колебаний – S(t);
4) остаточнаякомпонента (die Restkomponente, rest component)отражает влияние прочих факторов,объяснимых и нет – R(t).
/>
/>/> Z(t) S(t)
/>
/> T(t)
/> <td/> />/>
Рис. 10.1.Компоненты ряда динамики
Между компонентами ряда динамики существует связь.Она бывает двух видов: 1) аддитивная (Additive Verbundenheit, a additive relationship)
/>
/>
d2
/>
/>
d1
/> /> /> /> /> /> <td/> /> />/>
2) мультипликативная (Multiplikative Verbundenheit, a multiplicative relationship)
/>
/> d3
/>
d2
/>
/> d1
/>
/>
или
/>
/>
На практике совмещаюттрендо трендовые и конъюнктурные колебания, обозначая их как Т, а остаточнуюкомпоненту прибавляют к сезонной. Тогда получается
/>
/>
для аддитивной имультипликативной связи соответственно.
Анализ рядов динамики предполагает решение следующих задач:
1) определениесреднего уровня ряда;
2) определениетемпов роста и прироста;
3) определениетренда;
4) определениесезонной компоненты;
5) преобразованиерядов: сглаживание, выравнивание, интерполяция, экстраполяция, приведение рядовк одному основанию, смыкание рядов.
10.2Показатели ряда динамики
Каждыйряд характеризуется начальным уровнем, конечным уровнем и промежуточнымиуровнями. Важным показателем является средний уровень ряда./>/>
Для интервального ряда средний уровень рассчитывается посреднеарифметической простой и взвешенной (если интервалы в рядах,соответственно, равноотстоящие и неравноотстоящие):
где n – число уровней
ti – длительность интервала временимежду уровнями
Примеры.
1) Предприятие выпускаетпродукцию по кварталам года
I кв. – 300 тыс.,
II кв.– 250 тыс.,
III кв.– 100 тыс.,
IV кв.– 500 тыс.
Т.к. ряд интервальный сравноотстоящими интервалами, применим среднюю арифметическую простую:
/>
2) Предприятие выпустило продукции за первые 3 месяца года на300 тыс., за последующие 2 месяца – на 250 тыс., за 1 месяц – на 100 тыс. и заоставшиеся 6 месяцев – на 500 тыс. Т.к. это интервальный ряд снеравноотстоящими интервалами, применяем среднюю арифметическую взвешенную:
/>
Для моментного ряда c равноотстоящими интервалами средний уровень исчисляется по формулесредней хронологической простой, которая имеет следующий вид:
/>
Пример. Остатки оборотных средств предприятия составили
на 1.01 – 110 тыс.,
на 1.02 – 120 тыс.,
на 1.03 – 130 тыс.,
на 1.04 – 140 тыс.,
на 1.07 – 170 тыс.
Определим средние остатки оборотных средств за I квартал:
/>
В случае если интервалы неравноотстоящие, применяют формулусредней хронологической взвешенной:
/>
В нашем примере средние остатки оборотных средств заполугодие:
/>
Эту задачу можно решить и другим способом (в несколькодействий) – используя среднеарифметическую простую:
/>
/>/>
10.3Темпы роста и прироста
Темп роста (Wachstumsfaktor, Growth factor) отвечает на вопрос, во сколько раз изменилосьявление и получается делением последующего уровня ряда на предыдущий.
Темп прироста (Wachstumsrate, Growth rate) отвечает на вопрос, на сколько увеличилось явление иполучается делением абсолютного прироста на преды/>дущий уровень.
/>
/>
Среднегодовойтемп роста находится по средней геометрической:
/>
Пример. Фирмапроизвела услуг в 1 году – на 100 у.е., во 2 году – на 120 у.е.,
/>
/>
/>
в 3 году – на132 у.е. и в 4 году – на 200 у.е.
/>
/>
/>
Среднегодовойтемп прироста нельзя находить как среднее из годовых темпов прироста. Для этогосуществует формула:
/>
Т.е.среднегодовой темп прироста составил 0,26 или 26 %.
10.4 Правила составления рядов динамики
Анализ рядовдинамики дает правильные результаты при условии правильного составления ряда.Для этого существуют следующие правила:
1) Все уровни динамического ряда должны быть сопоставимыми во времени.Например, численность населения обычно указывается на начало года.
2) Все уровни динамического ряда должны быть сопоставимыми в пространстве,т.е. относиться к одной и той же территории.
Исключениедопускается только в случае, когда территориальные изменения рассматриваютсякак самостоятельный показатель динамики (например, в 1993 г. в составНижегородской области вошел Сокольский район
Ивановскойобласти).
3) Все уровни динамического ряда должны быть сопоставимыми по методологиирасчета.
Если способырасчета меняются с течением времени, то нужно сделать пересчет. Например, длясоставления динамического ряда произведенного в Нижегородской области ВВП данныепо производству совокупного общественного продукта (СОП), рассчитывавшегося до начала90-х годов, пересчитываются в ВВП.
10.5 Преобразование рядов динамики
При анализерядов динамики приходится делать некоторые преобразования, которые улучшаютусловия анализа.
I. Сглаживаниеи выравнивание ряда (die Glättung, smoothing)
Это делаетсядля погашения случайной колеблемости уровней ряда. Иными словами сглаживание ивыравнивание выявляют основное направление развития явления (тренд).
Существуютследующие методы сглаживания и выравнивания:
1) выявление тренда визуальным методом (на графике)
Этот методнаиболее прост и наименее точен.
2) механическое выравнивание
Онозаключается в укрупнении интервалов путем расчета средних уровней не за одинпериод, а за несколько. Например, этот прием часто используют при обработкединамических рядов урожайности сельскохозяйственных культур, рассчитываясреднюю урожайность не за 1 год, а за 5 лет.
3) метод скользящей средней
Этот методприменяется следующим образом (см. данные табл. 10.1).
/>
Скользящаясредняя заменяет несколько уровней одним значением. В первую очередь выбираетсяинтервал сглаживания (в нашем примере – 3 мес.). Чем он больше, тем сглаживаниесильнее
Далееподсчитывают значения средней:
/>
и т.д.
Таблица 10.1
Сведения о продажах продукции по месяцам напредприятии N
t -3 -2 -1 1 2 3 -2 -1 1 2 - Месяц январь февраль март апрель май июнь Yi 10 8 15 14 19 9 Т - 11 12,3 16 14 - Ŷ 8,4 10,8 13,2 15,6 18 - S 1,6 -2,8 1,8 -1,6 1 /> /> /> /> /> /> /> /> />Недостатокэтого метода в том, что теряются уровни в начале и в конце ряда, а при криволинейномразвитии явления скользящая средняя смещает уровни ряда. Для избежания этогоприменяют более сложный расчет скользящей средней взвешенной.
4) аналитическое выравнивание. В этом случае фактические уровни заменяютсяуровнями, вычисленными на основе определенной функции (кривой).
/>
/>
/>
В нашемслучае это линейная зависимость (уравнение прямой), хотя выравнивание можетосуществляться и с помощью гиперболы, параболы, показательной, экспоненциальнойи др. функций:
Коэффициенты a и b находятся по методу наименьшихквадратов. Расчет можно значительно упростить, если изменить нумерацию уровнейряда (так, чтобы Σ ti = 0 и при четном, и принечетном числе уровней) – см. верхние строки табл. 10.1.
/> <td/> />Тогда получим следующие формулы коэффициентов:
/>
/>
Пример (см.табл. 10.1).
/> <td/> />/>
/>
/>
Теперьподсчитываем выровненные значения y:
/>
и т.д.
/>
/>
Далее можновычислить разницу между трендовыми значениями и первоначальными уровнями ряда.Это даст нам возможность оценить и, если нужно, устранить влияние сезоннойкомпоненты.
II. Приведениеряда динамики к одному основанию
Используетсяв случае, если необходимо сравнение или сопоставление тенденций в несколькихрядах.
Примеры.
1) Начальные уровни рядов динамики находятся в различных периодах (табл.10.2). По какому предприятию темп роста выпуска продукции выше?
Таблица 10.2
Выпуск продукции по двум предприятиям (в %)
Ряд 1985 1986 1987 1988 1989 1990 1 100 110 125 130 135 140 1΄ - - 100 104 108 112 2 - - 100 108 114 1201΄ — это 1-й ряд, приведенный к другому основанию(к 1987 г.) по пропорции:
Тр1987 = 100 % Тр1988 = /> = 104 % и т.д.
Таким образом, всопоставимом виде у предприятия 2 темп роста выпуска продукции выше, чем упредприятия 1.
2) уровни рядадинамики выражены абсолютными величинами и начальные уровни имеют различныеразмеры (табл. 10.3). По какому предприятию темп роста выпуска продукции выше?
Таблица 10.3
Выпуск продукции по двумпредприятиям (в тыс. руб.).
Предприятие 1995 1996 1997 Абсолютные величины (тыс. руб.) 1 2 3 4 2 5 7 8 Относительные величины (%) 1 100 150 200 2 100 140 160При сравнении динамикивыпуска продукции двух предприятий после перевода абсолютных значений вотносительные можно сделать вывод о более высоких темпах роста на первомпредприятии.
3) Ряды динамики можноприводить к одному основанию не по одному показателю, а по несколькимпоказателям.
Так, например, напредприятии имеются данные о средней производительности труда и заработнойплате (табл. 10.4.). Как соотносятся между собой темпы роста этих двухпоказателей?
Таблица 10.4.
Средняяпроизводительность труда и заработная плата по предприятию
Годы Произ. труда (выработка), изд./месяц Заработная плата, у.е.Произв. труда,
%
Заработная плата,
%
1995 650 120 100 100 1996 695 123 106,9 102,5 1997 725 125 111,5 104,2 1998 747 129 115,0 107,5 1999 764 131 117,5 109,2 2000 779 133,5 119,9 111,3После переводапоказателей в относительный вид можно сказать, что темп ростапроизводительности труда за рассматриваемый период опережал темп ростазаработной платы. Следовательно, предприятие развивалось устойчиво, егоконкурентоспособность возрастала.
III. Смыкание рядовдинамики
Метод применяется, если необходимо совместить двадинамических ряда, характеризующих одно явление.
Пример.
Таблица 10.5
Данные о продажахпредприятия
Годы Объем продаж до реорганизации Объем продаж после реорганизации Сомкнутый ряд в относительных величинах Сомкнутый ряд в абсолютных величинах 1996 1995 - 95 1895 1997 2058 - 98 1955 1998 2100 2000 100 2000 1999 - 2040 102 2040 2000 - 2100 105 2100 /> /> /> /> /> /> /> /> /> /> <td/> /> <td/> /> <td/> />Принимаем 1998 г. за 100 %, а остальные уровни пересчитываем.
Иногда рассчитываюткоэффициент до и после реорганизации:
/> /> /> /> /> /> /> /> <td/> /> <td/> /> />Теперь можно составитьсомкнутый ряд по абсолютным значениям:
IV. Интерполяция иэкстраполяция
Интерполяция – это нахождениеуровней внутри динамического ряда.
Экстраполяция — этонахождение уровней за пределами динамического ряда.
Неизвестные уровни находятся с помощью всех перечисленныхвыше методов.
10.6Определение и устранение влияния сезонных колебаний
Для определения сезонных колебаний существует два способа:
I. Если мы исходим из того, что тренд неопределен или неизвестен.
В таком случае цель состоит в нахождении ряда динамики,очищенного от сезонных колебаний, прохождение которого похоже на тренд(показывает такую же, как тренд, тенденцию развития).
Пример.
Таблица 10.5
Оборот предприятия за тригода
Месяц Оборот в тыс. у.е. (Yij) Относительные показатели (Sij) ΣSij Сезонный индекс si Si Yi — Si 1 2 3 1 2 3 1 2 3 1 2 3 1 20 21 21 95.2 91.3 87,5 274.0 91.3 -1.9 -2.0 -2.0 21.9 23.0 23.0 2 22 24 25 104.8 104.3 104.2 313.3 104.5 0.9 1.0 1.1 21.1 23.0 23.9 3 24 25 28 114.3 108.7 116.7 339.7 113.2 2.8 2.9 3.3 21.2 22.1 24.7 4 21 23 23 100.0 100.0 95.8 295.8 98.6 -0.3 -0.3 -0.3 21.3 23.3 23.3 5 18 21 21 85.7 91.3 87.5 264.5 88.2 -2.4 -2.8 -2.8 20.4 23.8 23.8 6 20 19 20 95.2 82.6 83.3 261.1 87.0 -3.0 -2.8 -3.0 23.0 21.8 23.0 7 20 22 22 95.2 95.7 91.7 282.6 94.2 -1.2 -1.4 -1.4 21.2 23.4 23.4 8 24 27 28 114.3 117.4 116.7 348.4 116.1 3.3 3.7 3.9 20.7 23.3 24.1 9 26 28 30 123.8 121.7 125.0 370.5 123.5 4.9 5.3 5.7 21.1 22.7 24.3 10 21 23 25 100.0 100.0 104.2 304.2 101.4 0.3 0.3 0.3 20.7 22.7 24.7 11 19 22 23 90.5 95.7 95.8 282.0 94.0 -1.2 -1.4 -1.5 20.2 23.4 24.5 12 17 21 22 81.0 91.3 91.7 264.0 88.0 -2.3 -2.9 -3.0 19.3 23.9 25.0 252 276 288 1200.0Руководство предприятия хотело бы знать, насколько великовлияние сезонных условий на оборот (такая постановка вопроса типична длянекоторых отраслей, например, для сельского хозяйства).
1) Определим среднемесячныйоборот по годам
1 год – 252/12=21
2 год – 276/12=23
3 год – 288/12=24
2) Рассчитаемотносительные показатели (sij)
Относительный показатель= (Реальный месячный оборот)/
(Средний оборот за месяц)
/> <td/> />Январь 1-го года:
Результат (95,2%)показывает, что оборот в этот период был на 4,8% ниже среднемесячного уровня.
Январь 2-го года:
/> <td/> />и т.д.
3) Рассчитанные величины для одноименных месяцевскладываются, и вычисляется их средняя, которая называется сезонным индексомили индексом сезонности (si)
/>
Это означает, что за три года оборот предприятия вянваре-месяце подвержен влиянию сезонных колебаний на 8,7% ниже нормальногогодового значения.
Все двенадцать индексовсезонности образуют так называемую сезонную волну (1200,0), которая темсильнее, чем больше отклонения в каждом месяце от нормального значения (100%).
/>
4) Исключаем влияниесезонной компоненты (Si)
Чтобы получить значенияряда, очищенные от сезонных колебаний (выровненные значения), нужно от каждогоуровня ряда отнять сезонную компоненту.
/>
Январь 1-го года:
Это означает, что если быв этот период не было бы сезонных колебаний, то оборот составил бы 21,9 тыс.у.е.
II. Если нам известен тренд ряда
1-й шаг. Расчет трендалюбым способом
2-й шаг. Определение видасвязи компонент ряда и расчет сезонных значений в виде разницы или частного.
3-й шаг. Определениесезонной компоненты, как среднеарифметическую из сезонных значений.
4-й шаг. Исключениевлияния сезонной компоненты.
ТЕМА11. Выборка
Stichprobenverfahren Sampling
11.1Понятие выборки
Выборка (Stichprobe, sample) – это один из видов несплошного наблюдения, когда оцелом судят по части. В качестве теоретических основ выборочного наблюдения используетсятеория вероятностей и математическая статистика, в особенности теоремыБернулли, Пуассона, Чебышева, Ляпунова, закон больших чисел.
Для того, чтобы выборкадавала хорошие результаты, необходим случайный отбора, т.е. избежание преднамеренности(в прикладных науках, например, в маркетинговых исследованиях, бывают исключения).
Условия проведениявыборки:
1) требуемаяточность устанавливается самостоятельно;
2) выборка должнадавать значительное сокращение расходов по сравнению со сплошным наблюдением.
Причины проведениявыборки:
1) невозможностьсплошного наблюдения;
2) повышеннаятрудоемкость сплошного наблюдения;
3) необходимостьпроверки результатов сплошного наблюдения.
Условные обозначения, используемые в этой теме:
N – объем генеральной совокупности;
n – объем выборки;
/> - генеральная средняя;
/> - средняя выборки;
w – выборочная доля;
p – генеральная доля;
σ² — генеральная дисперсия;
s² — выборочная дисперсия.
11.2Способы отбора
Существует несколько способов, обеспечивающих случайность иисключающих преднамеренность отбора:
1) собственнослучайный отбор (Zufallsstichprobe, random sample) — это отбор по жребию, по таблице случайных чисел.
Случайный отбор бывает повторным (отобранная единицасовокупности может снова попасть в выборку) и бесповторным (отобранная единицасовокупности вновь в выборку не возвращается). Пример повторного отбора –измерение плотности пассажиропотока на определенном городском маршруте. Примербесповторного отбора – лотерея «Спортлото».
Бесповторный отбор более точен, но и более сложен.
2) механический отбор (Mechanische Auswahl, mechanical sample) — отбор изсписков.
На всю генеральнуюсовокупность составляется общий список и далее из него через равный интервалотбирают нужное количество единиц.
Размер интервала равен1/долю выборки. Так, при 2 %-ной выборке интервал будет равен 1/0,02 = 50 ед.
Общий список составляется двумя способами: единицысовокупности располагаются в случайном порядке или в определенном порядке,имеющем прямое или косвенное отношение к цели исследования. При первом вариантеотбор можно начинать с любой единицы, при втором – с середины первогоинтервала. Примеры: табельные номера работников предприятия (первый вариант),алфавитный список студентов потока (второй вариант)
3) типический отбор (geschichtete Auswahl, stratified sample)
При этом способе генеральная совокупность разбивается натипические группы, которые должны как можно сильнее отличаться друг от друга ибыть однородными внутри. Тогда типический отбор дает хорошие результаты. Затемиз каждой типической группы первыми двумя способами отбирают единицы ввыборочную совокупность.
Пример. Обследуются предприятия различных форм собственности.Формы собственности представляют различные типические группы.
4) серийный отбор (Klumpenauswahl, cluster sample)
Генеральная совокупность разбивается на серии. В отличие оттипических групп, серии должны как можно менее отличаться друг от друга и бытьразнородными внутри. Обследуется часть серий, зато внутри серии – как правило,все единицы. Отбор из серий в выборку также осуществляется первыми двумяспособами.
Пример. Обследование одного ящика пива из партии.
11.3 Ошибки выборки
/>
При проведении любого наблюдения случаются ошибки. Выборкахарактеризуется прежде всего ошибками представительства или репрезентативности,суть которых заключается в отклонениях выборочных значений от генеральных:
/>
где Δ – предельная ошибка выборки (absolute Stichprobenfehler, absolute sampling error)
Для каждого способа отбора существуют свои формулы ошибок.
1) Случайный отбор
/>
/>
— повторный случайный отбор:
где μ средняя (стандартная) ошибка выборки;
t – кратность средней ошибки выборки;
n – объем выборки.
Кратность средней ошибки выборки связывает наши расчеты сопределенной вероятностью p, чторасчет ошибки правильный:
при p=0,997 t=3,
при p=0,954 t=2,
при p=0,683 t=1 и т.д. (см. таблицу нормальногораспределения).
Данная формула верна лишьдля случая нормального распределения. В случаях отклонений от нормальногораспределения пользуются таблицей распределения Стьюдента. Например, при n<30 — случай малой выборки – взнаменателе будет n-1, а t будет определяться по таблицераспределения Стьюдента, у которой 2 входа: вероятность p и число степеней свободы k:
При p=0,95 t=12,71 (k=1),
При p=0,95 t= 4,3 (k=2),
При p=0,95 t= 3,18 (k=3),
При p=0,95 t= 2,79 (k=4),
При p=0,95 t= 1,96 (k = ¥) и т.д. (см. таблицу распределенияСтьюдента)
Пример. Из стада в 10тыс. коров обследовано 100 коров. Половина из обследованных признанапородистой. Определить долю породистых коров во все стаде.
Доля породистых коров вовсем стаде p = w ± D.= 0,5 ± 0,098 />
w = 0,5
При t = 1,96 (вероятность 95 %) D = 1,96 /> = 0,098.
Т.е. с вероятностью 0,95можно утверждать, что во всем стаде породистых коров 50 ± 9,8 %.
/>
/>
— бесповторный случайныйотбор:
2) Механическийотбор
Используются те же формулы, хотя фактически ошибки при данномвиде отбора составляют меньшую величину. Следствие отрицательное – ошибкизавышаются, следствие положительное – повышается уверенность в надежностирезультата.
3) Типический отбор
/>
Вместо общей дисперсии(σ²) используется средняя из внутригрупповых дисперсий />:
— повторный типическийотбор:
/>
/>
/>
— бесповторный типическийотбор:
4) Серийный отбор
Здесь вместо общейдисперсии используется межгрупповая дисперсия δ²:
— повторный серийныйотбор
/>
/>
— бесповторный серийныйотбор
/>
/>
где s – число отобранных серий,
S – общее число серий в генеральнойсовокупности.
В случае, если внутрисерий обследуются не все единицы, формулы усложняются:
— повторный серийныйотбор
/>
— бесповторный серийныйотбор
/>
где m – число отобранных в сериях единиц
/>
После нахождения величиныошибки определяются доверительные интервалы:
/>
11.4Необходимая численность выборки
1) Случайный отбор
/>
/>
— повторный отбор
На практике при определении численности выборки встает вопросо нахождении генеральной дисперсии. Существуют следующие способы:
а) если ранее ужепроводилось обследование данной совокупности, то дисперсия берется из архива;
б) проводится пробноеобследование, чтобы по его результатам ориентировочно определить выборочнуюдисперсию;
/>
в) самый дешевый ираспространенный способ – взять максимально возможную дисперсию — σ²= max из предполагаемых. Для этого используют размах вариации R. По правилу шести s он приблизительно равен 6s: R » 6s. Тогда s » R/6, а
Если речь идет о доле, тоw(1-w) = 0,5 (1-0,5) = 0,25.
/>
/>
— бесповторный отбор
Пример. Определитьчисленность выборки, если
D2 = 0,01
N = 100
s2 = 1
t = 2
Тогда n = /> Þ лучше провести сплошноеобследование, а не выборочное.
2) Механическийотбор
Используются те жеформулы.
3) Типический отбор
В формулах вместовыборочной дисперсии (σ²) используется средняя из внутригрупповыхдисперсий />:
статистическийнаблюдение индекс население
/>
/>
— повторный отбор:
— бесповторный отбор:
/>
/>
4) Серийный отбор
В формулах вместовыборочной дисперсии σ² используется межгрупповая δ²:
/>
/>
— повторный отбор:
/>
/>
— бесповторный отбор:
11.5Практика применения выборки
Основные направления применения выборочного метода напрактике:
1) маркетинговыеисследования;
2) изучениеобщественного мнения;
3) обследованиеуровня цен и объемов продаж в регионах;
4) оценка качествапродукции;
5) статистическийконтроль производства;
6) обработкаматериалов переписи населения и переписей вообще.