Реферат: Средние величины и показатели вариации
Содержание
1. Средняя величина в статистике, еесущность и условия применения. Виды и формы средних величин
2. Средняя арифметическая и условия ееприменения
3. Средняя гармоническая и условия ееприменения
4. Понятие, виды и показатели вариации
5. Виды дисперсий. Правило сложениядисперсий. Коэффициент детерминации и эмпирическое корреляционное отношение
6. Дисперсия альтернативного признака
7. Изучение формы распределенияпризнака. Основные характеристики закономерностей распределения
Список использованной литературы
1. Средняявеличина в статистике, ее сущность и условия применения. Виды и формы среднихвеличин
Средние являютсяобобщенной характеристикой большого количества индивидуальных значенийварьирующего признака. В экономическом анализе их можно считать наиболее употребительнымиобобщающими показателями. Понимается в статистике под средней величинойобобщающий показатель, характеризующий типичный уровень варьирующего признака врасчете на единицу однородной совокупности в конкретных условиях места ивремени. Величины количественного признака у отдельных единиц складываются поддействием разнообразных условий (факторов). Одни из этих условий являютсяобщими основными для всех единиц изучаемой совокупности, другие же различны дляотдельных единиц и являются поэтому индивидуальными (случайными).
Под влиянием случайных,второстепенных обстоятельств индивидуальные значения признака внутри изучаемойстатистической совокупности различаются между собой (варьируют). Например,отдельные работники банка имеют стаж работы различной продолжительности,различный уровень квалификации, различный уровень доходов и т.п.
Сущность среднейзаключается в том, что в ней взаимопогашаются случайные различия и отражаетсялишь результат влияния основных факторов и выявляется то общее, типичное, чтохарактерно для всех единиц изучаемой совокупности, т.е. характерный уровеньпризнака.
Способность среднейотражать типичный уровень признака и раскрывать общие закономерности называютзаконом средних чисел. Этот закон действует при определенных условиях.
Остановимся на некоторыхобщих условиях применения средних величин.
1. При определениисредней величины в каждом конкретном случае нужно исходить из качественногосодержания осредняемого признака и имеющихся для расчета исходных данных.
2. Средние должнывычисляться на основе массового обобщения факторов. По закону больших чисел примассовом обобщении факторов случайные отклонения индивидуальных величинпогашаются в средней величине. Поэтому средняя и выявляет типичный, характерныйразмер варьирующего признака.
3. Средние должнырассчитываться по качественно однородным совокупностям.
Например, рассчитываютсреднюю урожайность конкретного вида культур (среднюю урожайность ржи,картофеля, пшеницы и пр.), среднюю заработную плату работников определеннойспециальности на конкретном предприятии, средний доход студентов вГосударственных вузах и т.п. Средние, полученные для неоднородных совокупностейне характеризуют типичного размера признака. Пример нетипичной средней хорошопоказан в рассказе Глеба Успенского «Живые цифры». Там средний доходопределялся сложением 1 млн. миллионера Колотушкина и 1 гроша просвирниКукушкиной и получилось, что он составил 0,5 млн. руб. Такая средняя фиктивна,так как рассчитана по неоднородной совокупности и не дает представления овеличине типичного дохода.
А поскольку качественнооднородные совокупности позволяет получить метод группировок, то метод среднихвеличин используется в сочетании с методом группировок.
Например, если рассчитаемсредний уровень доходов служащих, то получим фиктивную среднюю. Это объясняетсятем, что используемая для расчета средней совокупность, включающая служащихгосударственных, совместных арендных, акционерных предприятий, а также органовгосударственного управления, сферы науки, культуры, образования и т.п.,является крайне неоднородной. В этом и подобных случаях метод средних нужноиспользовать в сочетании с методом группировок: если совокупность неоднородна –общие средние должны быть заменены или дополнены групповыми средними, т.е.средними рассчитанными по качественно однородным группам. Только при соблюденииэтих условий средняя действительно будет отражать типичный уровень варьирующегопризнака в расчете на единицу совокупности. Однако неправильно сводить рольсредних величин только к характеристике типичных значений признаков воднородных по данному признаку совокупностях. На практике современнаястатистика помимо средних, характеризующих типичные значения признаков воднородных совокупностях довольно часто использует еще так называемые системныесредние, обобщающие явно неоднородные явления. Например, характеристикигосударства, как единой народнохозяйственной системы: средняя величинанационального дохода на душу населения, средняя урожайность зерновых по всейстране, среднее потребление разных продуктов питания на душу населения, среднийреальный доход на душу населения, производительность общественного труда и др. Системныесредние могут характеризовать как пространственные или объектные системы,существующие одномоментно (государство, отрасль, регион, планета Земля и т.п.).Так и динамические системы протяженные во времени (год, десятилетие, сезон ит.п.). Типическая средняя может обобщать системные средние для однороднойсовокупности, или системная средняя может обобщать типические средние дляединой, хотя и не однородной системы. При этом даже типическая средняя неявляется раз и навсегда данной, неизменной характеристикой. Поэтому«типичность» любой средней величины – понятие относительное, ограниченное как впространстве, так и во времени.
Виды средних величин
В статистике отказалисьот поиска универсальной средней в каждом конкретном случае используется тот видсредней величины, который правильно отражает экономическое содержаниепоказателя.
Средние величины делятсяна два больших класса: 1) структурные средние и 2) степенные средние.
В качестве структурных(описательных, непараметрических) средних рассматриваются мода, медиана,квартили, квинтили и децили. Они применяются для изучения внутреннего строенияпоследовательностей значений признака.
Мода /> - это наиболее частоповторяющееся значение признака. Однако определение величины моды в точномсоответствии с таким определением возможно только при достаточно большомколичестве наблюдений и при условии, что одна из вариант повторяетсязначительно чаще, чем все другие варианты, что бывает только при прерывном(дискретном) изменении изучаемого признака. Например, тарифный разряд рабочегои др.
Если признак /> варьируетнепрерывно, то для расчета моды прежде всего необходимо представить первичныеданные в форме интервального ряда распределения. Интервалы значений признака вэтом ряду распределения могут быть либо равными, либо неравными. Дляопределения моды интервального ряда выбирается модальный интервал.
Если интервалы равные,то модальным называется тот интервал значений признака, в котором наблюдаетсянаибольшая абсолютная или относительная частота повторяемости признака. Изначит, для интервального ряда с равными интервалами величина моды определяетсяпо формуле:
/> (1)
где /> — нижняя границамодального интервала;
/> - величина интервала в данномряду;
/> - соответственно частоты(частости) в интервалах предшествующем модальному, модальном и следующим замодальным.
Если интервалы неравные,то модальным называется интервал, имеющий наибольшую абсолютную (относительную)плотность распределения. Под абсолютной (или относительной) плотностьюраспределения понимается отношение частоты (или частости) к величине интервала.Тогда формула расчета моды получит вид:
/> (2)
где /> — нижняя границамодального интервала;
/> - величина модального интервала;
/> - соответственно абсолютная (илиотносительная) плотность распределения признака в интервалах предшествующеммодальному, модальном и следующим за модальным.
Пример 4.1. Дляинтервального ряда с равными интервалами построенного в примере 2.1. определиммоду.
Стаж, г.Число работников />
2-5
5-8
8-11
4
5
2
Итого 11Решение.
1. Находим модальный интервал, это – [5-8].
2. По формуле (1) определим моду.
/> г.
Наиболее часто в бригадевстречаются работники со стажем 5,75 г.
Графически />можно определить погистограмме ряда (см. Рис. 1)
/>/>/>/>/>/>(число />
/>/>/>/>/>/>/>/>/>/>/>работников)
/>/>/>/>/> 5
/>
/>/> 4
/>/> 2
/>
/>
2 5 8 11 /> (стаж)
Рис. 1. Гистограмма рядараспределения работников по стажу работы
Мода используется для решения многихпрактических задач, прежде всего в тех случаях, когда вычисление средней неимеет реального смысла. Например, не реально было бы исчислять средний размер(номер) проданной обуви, однако здесь интересна модальная величина, как размер,пользующийся наибольшим спросом. При принятии менеджерами швейной либо обувнойфирмы решения об ассортименте изготовляемой (или реализуемой) одежды или обуви,прежде всего, устанавливается размер продукции, который пользуется наибольшимспросом (модальный размер). В процессе проведения статистического наблюдения зарыночными ценами в расчет берется модальная цена, т.е. цена, по которойпродается максимальное количество товаров того или иного вида. При определениирезультатов соревнования первые места иногда присуждаются тем из егоучастников, которые чаще побеждали в течение последних лет.
Так как по своимматематическим свойствам мода имеет минимальное число отклонений (ошибок) вряду распределения, то ею широко пользуются при изучении покупательскогоспроса, режима работы предприятий, обслуживающих население и т.д.
Медиана /> - это численное значение признакатой единицы изучаемой совокупности, которая расположена в серединеранжированного ряда.
В коллективе работниковиз 11 человек, ранжированных по целому числу лет стажа работы; стаж работы 6-гоработника будет медианой.
В интервальномвариационном ряду медиана определяется по следующей формуле:
/> (3)
где /> — нижняя границамедианного интервала;
/> - величина медианного интервала;
/> - номер медианной единицы;
/> - накопленная частота интервалапредшествующего медианному;
/> — частота медианного интервала.
Пример 4.3. Определим /> для рядараспределения работников по стажу работы в примере 2.1.
Стаж, г.Число работников />
Накопленные частоты />
2-5
5-8
8-11
4
5
2
4
9
11
Итого 11Решение
1. Определим номер медианного работника
/>
2. Рассчитаем накопленные частоты />.
3. Найдем медианный интервал – 5-8.
4. Определим медиану по формуле (3) играфически.
/> года
Графически медиану можноопределить по кумуляте ряда распределения.
/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>(накопленные />
частоты)
/> 11
/> 9
/>/> 6
/> 4
/>
2 5 8 11 /> (стаж,годы)
Рис. 2. Кумулята рядараспределения работников по стажу работы
Медиана также важна встатистической работе. В некоторых случаях (скажем, при контроле качествапродукции) медиану используют вместо средней арифметической. При исчислениипоследней учитываются все значения осредняемого признака, в том числе иисключительные, а величина медианы не зависит от того, какие варианты имеются вначале и в конце вариационного ряда. Получение средней арифметической всегдасвязано с проведением расчетов; нахождение медианы в первичных рядах не требуетникаких расчетов.
Медиана обладает важнымисвойствами: сумма отклонений вариант от медианы по модулю всегда меньше, чемсумма отклонений вариант от любой другой величины, т.е.
/>
Это свойство медианышироко используется при проектировании расположения пунктов массовогообслуживания – бензоколонок, ссыпных пунктов, школ, водозаборных колонок и т.д.Например, если в определенном квартале населения предполагается соорудитьводозаборную колонку, то расположить ее целесообразнее в такой точке, котораяделит пополам не длину квартала, а число жителей.
Подобно медиане определяютсяквартили (варианты, делящие ряд на четыре равные части), квинтили(варианты, делящие ряд на пять равных частей) и децили (варианты,делящие ряд на десять равных частей).
Эти характеристики широкоиспользуются в социальной статистике. Например, при изучении дифференциациинаселения по размеру среднедушевого дохода.
Виды и формы степенныхсредних
Степенные средние взависимости от представления исходных данных могут быть простыми и взвешенными.Простая средняя считается по первичным (не сгруппированным) данным иимеет следующую общую формулу:
/>,
где /> - индивидуальныезначения признака (варианты);
/> - число вариант;
/> - показатель степени.
Взвешенная средняя считается по вторичным(сгруппированным) данным и имеет общую формулу:
/>
где /> - веса средней, т.е.значения признака, участвующего в определении экономического содержания рассчитываемогопоказателя.
В зависимости от того,какое значение принимает показатель степени />, различают следующие видыстепенных средних (см. табл. 1).
Таблица 1
Вид степенной среднейПоказатель степени />
Формула расчета Простая Взвешенная Арифметическая 1/>
/>
Квадратическая 2/>
/>
Гармоническая -1/>
/>
Геометрическая/>
/>
где />
Если рассчитать все видысредних для одних и тех же исходных данных, то значения окажутся неодинаковыми.Здесь действует правило мажорантности средних: чем выше показательстепени, тем больше по величине и сама средняя:
/>
И значит, если мыподберем неправильно вид средней, то рискуем или завысить, или занизитьистинную среднюю величину данного признака.
Каждый показатель имеетсвое, только ему присущее экономическое содержание. В общем виде количественноеисходное соотношение, для исчисления средней величины (ИСС) будет следующим:
Объемварьирующего признака
Средняя величина (ИСС)=--------------------------------------------
Объем совокупности
При выборе вида и формысредней величины надо исходить из экономического содержания показателя, среднюювеличину которого вычисляем и его взаимосвязи с общим объемом варьирующегопризнака. Общий объем варьирующего признака не должен изменяться при заменеиндивидуальных значений признака средней величиной – это определяющее свойствосредней. Оно является в статистике критерием для подбора вида средней.
2. Средняяарифметическая и условия ее применения
Средняя арифметическаяприменяется в тех случаях, когда объем варьирующего признака всей совокупностиобразуется как сумма значений этого признака у ее отдельных единиц.
Средняя арифметическаяпредставляет собой ту величину признака, которую имела бы каждая единица совокупности,если бы общий итог признака был равномерно распределен между всеми единицамисовокупности. Используется две формы средней арифметической. Для первичныхданных – простая средняя арифметическая /> (4), для вторичных данных –средняя арифметическая взвешенная
/> (5).
Среднюю арифметическуюцелесообразно использовать в тех случаях, когда разрыв между минимальным имаксимальным значениями признака достаточно невелик (они не отличаются друг отдруга в несколько десятков или сотен раз.
Свойства среднейарифметической.
1. Произведение среднейварианты на сумму частот всегда равно сумме произведения вариант на их частоты
/>.
2. Если к каждомузначению признака вариационного ряда добавить (или отнять) одно и то же число А,то это все равно, что прибавить (или отнять) это число к средней арифметическойвеличине этого ряда
/>.
3. Если каждый признакряда умножить (или разделить) на постоянное число А, то это все равно, чтоумножить (или разделить) на это число среднюю арифметическую величину ряда.
4. Если пропорциональноизменить частоты, то средняя от этого не изменится (можно частоты умножить (илиделить) на одно и то же число средняя арифметическая от этого не изменится).Это свойство дает возможность частоты заменить удельными весами, называемымичастостями, а также, когда частоты всех вариант одинаковы, вычислять средние поформуле простой средней арифметической. Это свойство важно тогда, когдаабсолютные числа – частоты не известны, а известны лишь удельные веса, то естьотносительные величины структуры совокупности. Тогда средняя вычисляется так />, если /> - в процентахили />, если/> - в доляхединицы.
5. Средняя сумма(разности) двух или нескольких величин равна сумме (разности) их средних.
6. Нулевое свойствосредней арифметической. Сумма положительных отклонений от среднейарифметической равна сумме отрицательных отклонений от средней арифметической.Сумма всех отклонений индивидуальных значений признака от среднейарифметической всегда равна нулю. Именно благодаря этому свойству средняяарифметическая широко применяется в статистике как средство для погашения«сглаживания» случайных отклонений изучаемого признака у отдельных единицнаблюдаемой статистической совокупности.
Пример 4.4
По исходным даннымпримера 2.1. расчет средней сменной выработки осуществляется по среднейарифметической простой:
/> г.
Применение простойсредней арифметической объясняется тем, что объем варьирующего признака длявсей совокупности – общее число проработанных лет работниками (61 год)образуется как сумма стажей каждого работника.
Пример 4.5. Расчетсреднего производственного стажа работников на основе ряда распределения
Стаж, г.Число работников />
Середина интервала />
/>
2-5
5-8
8-11
4
5
2
3,5
6,5
9,5
14,0
32,5
19,0
Итого 11 65,5В данном случае следуетвоспользоваться формулой средней арифметической взвешенной, поскольку данныевторичные. Интервальные значения признака встречаются не один раз (т.е.повторяются) и эти числа повторений (частоты) не одинаковы.
Конкретными значениямипризнака, которые должны непосредственно участвовать в расчетах служат середины(центры) интервалов, весами – частоты.
/>
Данный результатотличается от результата, полученного на основе средней арифметической простой.Это объясняется тем, что на основе ряда распределения мы уже не располагаемисходными индивидуальными данными, а вынуждены ограничиться лишь сведениями овеличине середины (центра) интервала.
Пример 4.6. Просроченнаязадолженность по кредитам предприятиями фирмы за отчетный год характеризуетсяследующими данными:
№ предприятия фирмыЗадолженность по кредитам, тыс. руб. />
Удельный вес просроченной задолженности, % />
/>
1
2
3
3500
4000
2000
15
30
20
52500
120000
40000
Итого 9500 212500Определить среднийпроцент просроченной задолженности фирмы.
Решение: Основой расчетаявляется экономическое содержание показателя.
Удельный вес Объемпросроченной задолженности />
просроченной =-------------------------------------------------------- ∙ 100
задолженности, />, % Объемобщей задолженности />
Для расчета среднегопроцента просроченной задолженности фирмы в этом случае воспользуемся формулойсредней арифметической взвешенной:
/> %.
3. Средняягармоническая и условия ее применения
Среднюю гармоническуювзвешенную следует использовать в тех случаях, когда, кроме вариантосредняемого признака />, известны показатели,представляющие собой произведения вариант на их частоты />. Величиной /> может быть,например, товарооборот по видам товаров при расчете средней их цены, фондызаработной платы у отдельных категорий работников при расчете среднейзаработной платы; стоимостные объемы сделок при покупке валют, ценных бумаг,биржевых продаж и т.д. Как видим, ситуаций, когда нам известны не частоты, а произведениячастот на соответствующие им варианты при расчете средней величины, более чемдостаточно.
Формула среднейгармонической взвешенной имеет вид:
/> (6)
где /> - значения произведенийварианты на соответствующую ей частоту;
/> - значения вариант.
Пример 4.7. По данным оцене акций и общей стоимости продажи акций рассчитать среднюю цену одной акции.
Вид акцииЦена за одну акцию, тыс. руб. />
Общая стоимость продажи акций, тыс. руб. />
А
Б
В
2
3,3
2,8
1000
2838
3360
Итого 7298Решение: Основой расчетаявляется экономическое содержание показателя
Общаястоимость продажи акций />
Средняя цена =----------------------------------------------------
акций /> Число проданныхакций />
При этих исходных данныхследует воспользоваться формулой (6) для расчета средней цены одной акции
/> тыс. руб.
При этом следуетзаметить, что
7298 тыс. руб. – общаястоимость продажи акций;
2560 – общее числопроданных акций (500, 860 и 1200 – число проданных акций каждого вида вотдельности).
Если при использованиисредней гармонической веса всех вариант равны, то вместо взвешенной можноиспользовать простую среднюю гармоническую:
/> (7)
где /> - число вариантосредняемого признак.
Пример 4.8. Предприятиембыли выделены одинаковые денежные суммы на приобретение акций 3-х видов. Приэтом, цена акции вида А составила 500 руб., вида В – 1000 руб. и Г – 2200 руб.
Рассчитать среднюю ценуприобретения акций:
Решение
Воспользуемся дляопределения средней цены формулой (7):
/> руб.
В практике реальныхрасчетов взвешенные средние гармонические используются чаще.
4.Понятие, виды и показатели вариации
Рассматриваязарегистрированные при статистическом наблюдении величины того или иногопризнака у отдельных единиц совокупности, обнаруживаем, что они различаютсямежду собой, колеблются, так как у каждой из единиц они складываются поддействием многих причин и условий. Эти различия индивидуальных значенийпризнака внутри изучаемой совокупности в статистике называют вариациейпризнака.
Вариация делится наслучайную и систематическую. Вариация признака, которая не зависит от факторов,положенных в основу группировки, называется случайной вариацией.Например, в условиях налаженного и поддерживаемого в устойчивом состояниитехнологического процесса наблюдаются случайные различия в качестве выпускаемойпродукции, возникают эти различия под влиянием не поддающихся контролю и учетуфакторов, то есть случайных факторов. Вариация признака, которая зависит отфакторов, положенных в основу выделения группы, называется систематическойвариацией. При систематической вариации значения признака в пределахсовокупности варьируют при переходе от одной группы к другой в связи сизменением группировочных признаков. Например, качество одного и того же видапродукции будет различно в различных условиях организации технологическогопроцесса.
Показатели вариацииявляются числовой мерой уровня колеблемости признака, они измеряют отклоненияот средних и дают возможность установить насколько однороден состав даннойсовокупности по изучаемому признаку, насколько надежна, типична средняявеличина. Чем однороднее состав совокупности, тем более близки между собойотдельные значения признака, тем меньше разбросанность этих значений вокругсредней величины.
Наиболеераспространенными (основными) характеристиками вариации являются размахвариации />,среднее линейное отклонение />, среднее квадратическоеотклонение />,дисперсия /> икоэффициент вариации />.
Самой простойхарактеристикой служит размах вариации /> - разность между наибольшим инаименьшим признаками. Размах вариации – довольно грубая характеристикаразбросанности ряда, так как и минимальное и максимальное значения сами могутбыть весьма нетипичными для данной совокупности.
Среднее линейноеотклонение опирается на учет индивидуальных отклонений вариант от среднейарифметической величины данного ряда и определяется как средняя арифметическаяиз абсолютных величин этих отклонений.
Для первичных данных — /> (8)
Для вторичных данных — /> (9)
Этот показатель даетнеобъективную оценку вариации, как правило, занижает ее.
Дисперсия – это средняяарифметическая из квадратов отклонений индивидуальных значений признака отсредней арифметической величины ряда. Для первичных данных дисперсияопределяется по формуле:
/>, (10)
где />
Для вторичных данных — />, (11)
где />.
Среднее квадратическоеотклонение определяется по формуле />. Среднее квадратическоеотклонение является наиболее распространенным показателем степени вариации.
Размах вариации, среднеелинейное отклонение и среднее квадратическое отклонение – это абсолютные мерывариации. Они выражаются в единицах измерения варьирующего признака. С ихпомощью можно сравнивать вариацию только одного и того же признака в разныхраспределениях, например, вариацию заработной платы рабочих на разныхпредприятиях какой — то отрасли, стаж работы рабочих различных отраслей. Причемсравнивать, например, средние квадратические отклонения вариационных рядов сразными средними уровнями непосредственно нельзя, так как по своему абсолютномузначению квадратическое отклонение зависит не только от степени вариациипризнака, но и от абсолютных уровней вариант и средней.
Коэффициент вариацииявляется относительной мерой вариации, определяется по формуле /> (12), позволяетсравнивать степень варьирования признаков в вариационных рядах с разным уровнемсредних, а также служит для сравнения вариации разных явлений.
Величина коэффициентавариации оценивает интенсивность колебаний признаков относительно их среднейвеличины. Принята следующая оценочная шкала колеблемости признака:
/>% — колеблемость незначительная(невысокая)
/>% — колеблемость средняя(умеренная)
/>% — колеблемость значительная
Если его величина непревышает 33%, это говорит о типичности, надежности средней величины, ободнородности совокупности.
Если он более 33%, то всеуказанные выводы следует изменить на противоположные.
Проиллюстрируем расчетпоказателей вариации на основе исходных расчетных данных примера 2.1.
Пример 4.9. Имеетсяследующий ряд распределения работников по стажу
Стаж, г. Число работников, чел.2-5
5-8
8-11
4
5
2
Итого 11Определить:
— размах вариации
— дисперсию
— среднее квадратическоеотклонение
— коэффициент вариации
Решение:
1. Размах вариации
/> лет
Размах вариации лучшеопределять по первичным данным, что мы уже делали при расчете величиныинтервала группировки /> (см. пример 2.1). Для расчетаостальных показателей оформим рабочую таблицу
Стаж, лет Число работников, чел/>
/>
/>
2-5
5-8
8-11
4
5
2
3,5
6,5
9,5
14,0
32,5
19,0
(3,5-5,955)2∙4=24,108
(6,5-5,955)2∙5=1,485
25,134
Итого 11 65,5 50,727/> лет
Дисперсия равна:
/>
Среднее квадратическоеотклонение равно
/>
Коэффициент вариацииравен
/>%
Анализ полученных данныхговорит о том, что стаж работников предприятия отличается от среднего стажа /> в среднем на2,147 года или на 43,3%. Коэффициент вариации превышает 33%, и 40%,следовательно, вариация производственного стажа умеренная, найденный среднийстаж плохо представляет всю совокупность работников, не является ее типичной,надежной характеристикой, а саму совокупность нет оснований считать однороднойпо производственному стажу.
5. Видыдисперсий
Правило сложениядисперсий. Коэффициент детерминации и эмпирическое корреляционное отношение
В статистике важнорассчитывать дисперсии для результативного признака />, опираясь на данные аналитическойгруппировки.
В этом случае дисперсиипримут вид:
— общая дисперсия
/> (13)
— внутригрупповыедисперсии
/> (14)
— средняя извнутригрупповых дисперсий
/> (15)
— межгрупповая дисперсия
/> (16)
где /> - общая средняя
/> — средняя />-ой группы
Правило сложениядисперсий
/> (17)
На основе этого правиларассчитывают эмпирические показатели тесноты корреляционной связи междуфакторным и результативным признаками.
Если учесть, что величинамежгрупповой дисперсии характеризует влияние только факторного признака, авеличина общей дисперсии помимо факторного признака характеризует влияние ивсех остальных признаков, то отношение межгрупповой дисперсии к общей покажетсилу влияния факторного признака на результативный.
Это отношение называюткоэффициентом детерминации />
/> (18)
Корень квадратный изкоэффициента детерминации называют эмпирическим корреляционным отношением.
/> (19)
Оно показывает степеньтесноты связи между факторным и результативным признаком и изменяется впределах от 0 до 1. Нулевое значение говорит о том, что связи нет (тогдамежгрупповая дисперсия равна 0). Значение 1 указывает на наличие функциональнойзависимости между признаками, при которой значения исследуемого показателяполностью определяются значениями факторного (группировочного) признака(средняя из внутригрупповых дисперсий в этом случае принимает нулевоезначение). И естественно, чем ближе /> к 1, тем связь теснее. Дляаналитической характеристики степени связи используют шкалу Чэддока
/>
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,999 1сила
связи
отсутствует слабая умеренная заметная тесная весьма тесная функциональнаяПроиллюстрируем расчетыпо данным и результатам расчета примера 2.2.
Пример 4.10. Имеютсяследующие данные о зависимости выработки работников от их производственногостажа.
Стаж, г.Число работников, чел./>
Выработка изделий в среднем на работника, шт. />
2-5
5-8
8-11
4
5
2
7,0
8,4
11,0
Итого 11/>
Опираясь на данныепредставленной таблицы и на исходные данные примера 2.2. определить коэффициентдетерминации и эмпирическое корреляционное отношение.
Решение
Вычислим межгрупповуюдисперсию по формуле (16)
/>.
Расчеты произведем втаблице
Стаж, летЧисло работников, чел. />
Средняя выработка />
/>
2-5
5-8
8-11
4
5
2
7,0
8,4
11,0
(7-8,364)2∙4=7,442
(8,4-8,364)2∙5=0,006
(11-8,364)2∙2=13,897
Итого 11/>
21,345/>
Теперь вычислим общуюдисперсию выработки изделий на основе индивидуальных данных примера 2.2 поформуле (13)
/>
Для этого вначалевозведем данные выработки в квадрат.
Выработка изделий, шт. />/>
/>
1 210
7
100
49
7
6
9
8
12
9
8
7
9
49
36
81
64
144
81
64
49
81
Итого 798/>
Тогда /> или 74,9%
/>=0,865
Величина коэффициентадетерминации говорит о том, что вариация выработки изделий на 74,9% зависит отвариации производственного стажа работников и на 25,1% от прочих признаков.
Величина эмпирическогокорреляционного отношения (0,865) свидетельствует о тесной взаимосвязи междустажем работников и их выработкой.
6.Дисперсия альтернативного признака
Частный случайатрибутивного (неколичественного) признака – признак альтернативный. Когдаединицы совокупности либо имеют данный изучаемый признак, либо не имеют его.Примером таких признаков является: наличие бракованной продукции, ученаястепень у преподавателей вуза, работа по полученной специальности, превышениесреднедушевых денежных доходов их общероссийского уровня, наличие детей в семьеи т.д.
В случае наличияальтернативного признака единице совокупности присваивается значение «1». Вслучае отсутствия – «0».
Весами в расчетах служат:
/> - доля единиц обладающих даннымпризнаком;
/> - доля единиц, не обладающихданным признаком
/>
Тогда средняя величинаальтернативного признака равна:
/>
дисперсия примет вид:
/>
Дисперсия альтернативногопризнака изменяется в пределах от 0 до 0,25. Максимального значения 0,25достигает при />0,5
Пример 4.11. Привыборочном опросе 300 жителей Курска 60 из них высказались положительно поповоду хранения личных денежных сбережений в коммерческих банках города
Определить среднийуровень, дисперсию и среднее квадратическое отклонение признака
Решение
/>
/>
/>
Практическое применениевариации альтернативного признака в основном состоит в построении доверительныхинтервалов при проведении выборочного наблюдения.
7. Изучение формы распределенияпризнака. Основные характеристики закономерностей распределения
Непременным условиемуспешности построений, исчислений и выводов на основе вариационных рядовявляется однородность обобщаемых в них совокупностей, устанавливаемая на базеглубокого теоретического анализа.
Четко выраженный порядокизменения частот в соответствии с изменением величины признака называютзакономерностью распределения.
Знание типазакономерности распределения, (а следовательно, и формы кривой) необходимопрежде всего:
1. Для выяснениятипичности условий получения первичного статистического материала. Так,появление многовершинной или существенно асимметричной кривой говорит оразнотипном составе совокупности и о необходимости перегруппировки данных сцелью выявления более однородных групп.
2. Для обеспеченияправильности выполнения практических расчетов и прогнозов. Так, применениеформулы Г. Стерджесса для расчета оптимального числа групп интервального ряда,правила «трех сигм», коэффициента вариации Vσ в качестве индикатора однородностисовокупности, метода наименьших квадратов при моделировании корреляционнойсвязи явлений, методов дисперсионного анализа и других правомочно лишь вусловиях нормального и близких к нему распределений.
Закономерности вариационныхрядов, выражающие в типе распределения их частот, наглядно выступают награфиках – гистограмме и полигоне распределения частот. Их рассмотрениепоказывает, что в гистограмме наблюдается большая скачкообразностьраспределения, а в полигоне обнаруживается постепенность перехода от однойгруппы к другой. Ломаная линия полигона частично сглаживает скачкообразностьгистограммы, является более обобщенным приемом анализа распределения.
При увеличении строкинтервального вариационного ряда и соответственном уменьшении величины егоинтервалов число сторон полигона распределения будет расти и ломаной линиибудет присуща тенденция превратиться в пределе в некую кривую. Такая криваяназывается кривой распределения. В ней происходит наибольшееосвобождение данных от влияния случайных факторов. Она выявляет и показывает вмаксимально обобщенном виде характер вариации, закономерность распределениячастот внутри однокачественной совокупности явлений.
Кривые распределениямогут быть разных типов. В практике социально-экономических исследований широкоприменяется кривая нормального распределения. Она представляет собойодновершинную симметричную колоколообразную фигуру, правая и левая ветвикоторой равномерно и симметрично убывают, асимптотически приближаясь к оси абсцисс.
Отличительнойособенностью этой кривой является совпадение в ней средней арифметической, модыи медианы. Если всю площадь между кривой и осью абсцисс принять за 100%, то впределах /> заключено68,3% частот, в пределах /> - 95,4%, в пределах /> 99,7%(«правило трех сигм»).
Хотя нормальное, илисимметричное, распределение соответствует природе ряда явлений, однако дляобщественных явлений оно нехарактерно, так как в нем отражаются различия,вызванные внешними воздействиями, присущие не развивающейся, а лишьколеблющейся совокупности единиц. Для социальных явлений характерно развитие,динамизм. Поэтому ряды и кривые распределения частот общественных явлений, какправило, асимметричны, в них частоты возрастают до максимума и убывают от негонеравномерно. Именно наличие асимметрии, или скошенности, в рядах однородных совокупностейслужит косвенным указанием на то, что исследуемый процесс проходит активнуюстадию развития.
Асимметричные ряды исоответствующие кривые имеют различные формы распределений, исследованныематематической статистикой. Такими формами являются распределение Пуассона,распределение Максвелла, распределение Пирсона и др. Здесь асимметричностьрассматривается в целом как единый тип распределения. При этом различаютправостороннюю и левостороннюю асимметрии (скошенность).
Если длинная ветвь кривойрасположена правее вершины, то асимметрия называется правосторонней, если этаветвь расположена левее вершины – левосторонней. При правосторонней асимметрии /> прилевосторонней />. Поэтому разность между ними,отнесенную к />, называют коэффициентом К.Пирсона и используют в качестве коэффициента асимметрии:
/>. (20)
При правостороннейасимметрии этот коэффициент положителен, при левосторонней – отрицателен. Если />= 0,вариационный ряд симметричен. Чем больше абсолютная величина коэффициента, тембольше степень скошенности.
Наиболее точнымпоказателем асимметрии распределения является коэффициент асимметрии />, вычисляемыйпо формуле
/> (21)
где n – число единиц совокупности. Как и вслучае коэффициента Пирсона, при />> 0 имеет место правосторонняяасимметрия, при />< 0 левосторонняя. Всимметричных распределениях /> = 0.
Чем больше величина |/>|, тем болееасимметрично распределение. Установлена следующая оценочная шкалаасимметричности:
|/>| /> - асимметрия незначительная;
0,25 < |/>| /> - асимметрия заметная(умеренная);
|/>| > 0,5 — асимметриясущественная.
Поскольку коэффициенты />и />являютсяотносительными безразмерными величинами, они часто применяются длясравнительного анализа асимметричности различных рядов распределения.
Характер асимметриииногда указывает на направление развития. При исследовании вариации признаков,в отношении которых имеется заинтересованность в их увеличении (выполнениенорм, выпуск продукции и т.д.), правосторонняя асимметрия свидетельствует опрогрессивности развития, о том, что оно идет в сторону увеличения показателя,а левосторонняя асимметрия указывает на наличие большого числа отстающихучастков.
При исследовании вариациипризнаков, в отношении которых имеется заинтересованность в их уменьшении(себестоимость, трудоемкость, расход сырья на единицу продукции и т.п.),правосторонняя асимметрия свидетельствует о недостатках в развитии изучаемогопроцесса, левосторонняя – о прогрессивности его развития, о том, что последнееидет в сторону уменьшения показателя. В распределении работников по стажу (см. пример4.9 /> />= 5,75 />) наблюдаетсяправосторонняя асимметрия, так как коэффициент асимметрии положителен:(5,955-5,75):2,47=0,095. Такая асимметрия для данного ряда прогрессивна, онасвидетельствует о развитии ряда в сторону увеличения исследуемого показателя.
Форму распределения можноориентировочно определить непосредственно рассмотрением эмпирических данныхряда, особенно если они изображены гистограммой и полигоном. Чтобы убедиться вправильности ориентировочного определения формы распределения, эмпирическиеданные ряда исследуются на их близость к теоретическому распределению,устанавливаемому с помощью построения соответствующей кривой распределения.Однако во многих случаях ни теория, ни непосредственное рассмотрение эмпирическихданных не дают ответов на вопрос о форме распределения. Тогда обычно ведетсяисследование на близость эмпирических данных к нормальному распределению, таккак распределения с небольшой или умеренной асимметричностью в большинствеслучаев по своему типу относятся к нормальным.
Для объективного сужденияо степени соответствия эмпирического распределения нормальному в статистикеиспользуется ряд критериев, называемых критериями согласия или соответствия.
К ним относятся критерииПирсона, Романовского, Ястремского, Колмогорова, основанные на использованииразличных теоретических представлений.
Например, наиболееиспользуемый критерий согласия Пирсона /> («хи-квадрат») определяется поформуле:
/>, (22)
где /> — эмпирические частоты(частости)
/> - теоретические частоты(частости)
Для оценки близостиэмпирического распределения к теоретическому определяется вероятность /> достиженияэтим критерием данной величины. Если эта вероятность превышает 0,05, тоотклонения фактических частот от теоретических считаются случайными,несущественными. Если же />, то отклонения считаютсясущественными, а эмпирическое распределение – принципиально отличным оттеоретического.
Для характеристикистепени отклонения симметричного распределения от нормального рассчитываетсяпоказатель эксцесса. Он приближенно может быть определен с помощью коэффициентаЛиндберга.
/>, (23)
где /> - доля (в%) количествавариант, лежащих в интервале равном половине среднего квадратическогоотклонения (в ту и другую сторону от величины средней) в общем количествевариант данного ряда;
38,29 – доля (в %)количества вариант, лежащих в интервале, равном половине среднегоквадратического отклонения (в ту и другую сторону от величины средней) в общемколичестве вариант ряда нормального распределения
Эксцесс может бытьположительным, отрицательным и равным нулю.
У высоковершинных кривыхпоказатель эксцесса имеет положительный знак, у низковершинных кривых –отрицательный знак. Для кривой нормального распределения его величина равнанулю.
Для более точнойхарактеристики степени отклонения симметричного распределения от нормальногорассчитывается показатель островершинности (показатель эксцесса) (Ek ) по формуле:
/> (24)
Он, как и коэффициентЛиндберга, может быть положительным, отрицательным и равным нулю. Показательэксцесса, как и показатель асимметрии, — число отвлеченное. Предельнымзначением отрицательного эксцесса является значение Ek= -2; величина же положительного эксцесса является величинойбесконечной.
Определение показателейасимметрии и эксцесса имеет не только описательное значение, часто их величиныдают определенные указания для дальнейшего исследования изучаемых явлений. Так,например, появление значительного отрицательного эксцесса может указывать накачественную неоднородность исследуемой совокупности.
Современные компьютерныетехнологии открывают широкие возможности для выполнения громоздких вычислительныхопераций по анализу вариационных рядов. Если материал теоретически осмыслен ивыдвинута разумная гипотеза о форме распределения (последнее, кстати, ЭВМ тожев состоянии проверить), вычислительные устройства могут быстро исчислитьразличные обобщающие показатели и критерии, построить графики и т.д. Это темболее возможно, так как показатели вариации сравнительно несложны и хорошоформализованы.
Списокиспользованной литературы
1. Виноградова Н.М.,Евдокимова В.Т., Хитарова Е.М. и др. Общая теория статистики: Учебное пособие /Подред. И.Г. Венецкого/ – М.: Статистика, 1968г- 380с
2. Гусаров ВикторМаксимович. Статистика: Учеб. пособие для студентов вузов обучающихся поэкономическим специальностям/ В.М. Гусаров, Е.И. Кузнецова.- 2-е изд., перераб.и доп. – М.: ЮНИТИ-ДАНА, 2007.- 479с
3. Гусаров, ВикторМаксимович. Обшая теория статистики: Учеб. пособие для студентов вузовобучающихся по экономическим специальностям/ В.М. Гусаров, С.М. Проява.- 2-еизд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2008.- 207с
4. Ильишев АнатолийМихайлович. Общая теория статистики: учебник для студентов вузов, обучающихсяпо специальностям экономики и управления / А.М. Ильишев, — М.: ЮНИТИ- ДАНА,2008. – 535с
5. Ряузов Н.Н. Общаятеория статистики: Учебник для студ. экон. спец. вузов – 4-е изд. перераб. идоп. – М.: Финансы и статистика, 1984.- 343с
6. Салин В.Н.,Чурилова Э.Ю. Курс теории статистики для подготовки специалистовфинансово-экономического профиля: Учебник. – М.: Финансы и статистика, 2006-480с
7. Статистические методыанализа факторов повышения эффективности общественного производства. Учебноепособие. Под ред. Ряузова Н.Н. Акиншиной М.К.- М. ВЗФЭИ. 1980-88с
8. Статистика: Учеб.пособие / А.В. Багат, М.М. Конкина, В.М. Симчера и др.; Под ред. В.М. Симчеры.– М.: Финансы и статистика, 2005.- 368с
9. Статистика.Компьютерные лабораторные работы: Методические указания к лабораторной работе№1 « Автоматизированный априорный анализ статистической совокупности в среде MS Excel». / Г.П. Кожевникова, А.В. Голикова, А.М. Каманина,А.М. Бобров. Под ред. проф. Г.П. Кожевниковой- М.: Вузовский учебник,2005.-72с.
10. Теориястатистики: Учебник / Под ред. проф. Р.А. Шмойловой – 3-е изд., перераб. – М.:Финансы и статистика, 1999.- 560с.