Реферат: Выборочный метод

--PAGE_BREAK--Пример 1.9.1Произведена случайная выборка объемом.n=200 деталей. Из них поврежденных оказалось 40. Определить с вероятностью 0,95 доверительный интервал для доли поврежденных деталей генеральной совокупности.

Рассчитываем выборочную долю:

р* =
m
/
n
= 40 / 200 = 0.20

По заданной доверительной вероятности

Р = 1 –
α
= 2Ф(zα) = 0.95

находим по таблице интегральной функции Лапласа соответствующее значение   zα
=1,96. Применяем формулу (1.9.9):

<img width=«331» height=«47» src=«ref-1_1663213725-750.coolpic» v:shapes="_x0000_i1050">

Таким образом, доверительный интервал для генеральном доли р:

0,20-0,06<p<0,20+0,06,     или     0,14<p<0,26

Пример 1.9.2. По результатам той же выборки определить вероятность того, что ошибка выборки не превысит 0,03.

Имеем:

<img width=«195» height=«47» src=«ref-1_1663214475-452.coolpic» v:shapes="_x0000_i1051">

Отсюда:

<img width=«275» height=«68» src=«ref-1_1663214927-780.coolpic» v:shapes="_x0000_i1052">

По таблице интегральной функции Лапласа находим соответствующую доверительную вероятность Р = 2Ф(z
а
)=0,71.
Пример 1.9.3.До проведения выборки необходимо ответить на вопрос: какой объем выборки обеспечит с вероятностью0,95 ошибку выборзки не более, чем 0,02?

Применяем формулу (1.9.11):

<img width=«207» height=«48» src=«ref-1_1663215707-496.coolpic» v:shapes="_x0000_i1053">

Следует заметить, что требуемые надежность и точность может обеспечить в нашей задаче и выборка меньшего объема.Если до проведения выборкиу нас есть приближенная оценка хотя бы максимальной величины р*,то мыможем применить формулу (1.9.10) и получить меньшее значение необходимого объема выборки п.

В случае безвозвратной выборки случайная величина р*, как доказываетсяв теории вероятностей, имеет так называемое гипергеометрическое распределение. Ее математическое ожидание,как и в случае возвратнойвыборки, равно генеральной доле: М(р*)=р, а среднее квадратическоеотклонение вычисляется но формуле:
<img width=«333» height=«47» src=«ref-1_1663216203-817.coolpic» v:shapes="_x0000_i1054">                             (1.9.12)

где N — объем генеральной совокупности

Придостаточно большом объеме выборки гипергеометрическоераспределение также хорошо аппроксимируетсянормальным распределением с указанными параметрами M(p*)   и σ(p*), поэтому дальнейший ход решения задач аналогичен рассмотренному выше случаю возвратной выборки.

Формула для предельной выборки принимает вид
<img width=«192» height=«47» src=«ref-1_1663217020-478.coolpic» v:shapes="_x0000_i1055">                                              (1.9.13)
При решении задач IIIтипа из (1.9.13) получаем:
<img width=«183» height=«48» src=«ref-1_1663217498-504.coolpic» v:shapes="_x0000_i1056">                                       (1.9.14)
Соответственно изменится и формула для nmax:
<img width=«121» height=«44» src=«ref-1_1663218002-312.coolpic» v:shapes="_x0000_i1057">                                                            (1.9.15)
Если объем выборочной совокупности nсоставляет незначительную долю по отношению к объему генеральной совокупности N, то величина <img width=«53» height=«47» src=«ref-1_1663218314-217.coolpic» v:shapes="_x0000_i1058"> в формуле (1.9.12) ближе к 1, можно пренебречь различием формул (1.9.9) и (1.9.13) и пользоваться более простыми соотношениями для возвратной выборки, даже если фактически выборка производится как безвозвратная.

В заключение раздела необходимо отметить что в статистике используется понятие средней ошибки выборки, которая определяется как среднее квадратическое отклонение соответствующей выборочной характеристики. Нетрудно видеть, что формула для средней ошибки выборки является частным случаем формулы предельной ошибки выборки при z=1.
3.4 Точечные оценки для средней и дисперсии генеральной совокупности
Обозначим через <img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1059"> и σ2 среднюю и дисперсию генеральной совокупности.

Возвратная выборка объема
nможет рассматриваться как совокупность nнезависимых случайных величин Xj, имеющих одно и то же распределение, совпадающее с генеральным, для которых, следовательно:

M(Xj)= <img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1060">;       D(Xj)= σ2

Для точечной оценки генеральной средней <img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1061">естественно использовать статистику <img width=«121» height=«47» src=«ref-1_1663218831-415.coolpic» v:shapes="_x0000_i1062"> ¾среднюю. Используя свойства математического ожидания и дисперсии, получим:
<img width=«319» height=«47» src=«ref-1_1663219246-846.coolpic» v:shapes="_x0000_i1063">           (1.9.16)

<img width=«339» height=«48» src=«ref-1_1663220092-878.coolpic» v:shapes="_x0000_i1064">                 (1.9.17)
Нетрудно видеть, что статистика θ ¾X
* является состоятельной, несмещенной и эффективной оценкой параметра <img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1065"> .

Для точечной оценки генеральной дисперсии воспользуемся статистикой <img width=«292» height=«45» src=«ref-1_1663221070-720.coolpic» v:shapes="_x0000_i1066"> — выборочной дисперсией. Однако при ближайшем рассмотрении оказывается, что
<img width=«119» height=«41» src=«ref-1_1663221790-294.coolpic» v:shapes="_x0000_i1067">                                                             (1.9.18)

Таким образом, статистика θ= D
* является смещеннойоценкой для генеральной дисперсии σ2. Однако смещенность легко устраняется путем введения корректирующего множителя <img width=«36» height=«41» src=«ref-1_1663200426-144.coolpic» v:shapes="_x0000_i1068">.Статистика
<img width=«233» height=«41» src=«ref-1_1663222228-555.coolpic» v:shapes="_x0000_i1069">                             (1.9.19)
(так называемая «исправленная» выборочная дисперсия) является несмещенной оценкой генеральной дисперсии σ2 и используется для ее точечной оценки.

Заметим, что при большом п отношение <img width=«57» height=«41» src=«ref-1_1663222783-178.coolpic» v:shapes="_x0000_i1070"> и потому значение s2≈D
*

В случае безвозвратной выборки можно показать, что точечная оценка средней будет той же (т. е. <img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1071">*), а точечная оценка дисперсии должна быть заменена на:
<img width=«211» height=«41» src=«ref-1_1663223061-450.coolpic» v:shapes="_x0000_i1072">                                          (1.9.20)
где N— объем генеральной совокупности

В случае безвозвратной выборки изменится и выражение для D(<img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1073">*), которое потребуется для построения доверительного интервала при оценке средней:
<img width=«140» height=«44» src=«ref-1_1663223611-363.coolpic» v:shapes="_x0000_i1074">                                                         (1.9.21)
При относительно небольшом объеме выборки <img width=«67» height=«41» src=«ref-1_1663223974-224.coolpic» v:shapes="_x0000_i1075"> и <img width=«153» height=«44» src=«ref-1_1663224198-371.coolpic» v:shapes="_x0000_i1076">

3.5 Интервальные оценки средней

При изложении данного вопроса будем различать случаи больших и малых выборок. При этом оба случая сначала рассмотрим в более простой, с теоретической точки зрения, ситуации возвратной (повторной) выборки.
3.5.1 Большая выборка

Если объем выборки достаточно большой (практически, начиная с п > 20—30), то распределение выборочной средней <img width=«28» height=«20» src=«ref-1_1663224569-113.coolpic» v:shapes="_x0000_i1077">, согласно центральной предельной теореме, независимо от характера генерального распределения приближается к нормальному распределению с параметрами

М(<img width=«28» height=«20» src=«ref-1_1663224569-113.coolpic» v:shapes="_x0000_i1078">)=<img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1079">      и      <img width=«88» height=«44» src=«ref-1_1663224895-256.coolpic» v:shapes="_x0000_i1080">)
где <img width=«19» height=«20» src=«ref-1_1663174351-100.coolpic» v:shapes="_x0000_i1081"> — генеральная средняя,

σ— генеральное среднее квадратическое отклонение,

п — объем выборки.

Таким образом, величина
<img width=«84» height=«68» src=«ref-1_1663225251-286.coolpic» v:shapes="_x0000_i1082">
распределена по стандартному нормальному закону (с математическим ожиданием M(z)= 0и средним квадратическим отклонением σ(z
) = 1).

Задавшись доверительной вероятностью Р = 1 — α, определяем из равенства 2Ф(z) = 1 — α   соответствующее значение za
(используем при этом таблицу интегральной функции Лапласа). Тогда с вероятностью Р = 1 — α выполняется неравенство:

<img width=«145» height=«68» src=«ref-1_1663225537-387.coolpic» v:shapes="_x0000_i1083">                                                        (1.9.22)
которое эквивалентно неравенству:
<img width=«120» height=«44» src=«ref-1_1663225924-319.coolpic» v:shapes="_x0000_i1084">                                                             (1.9.23)
Величина <img width=«85» height=«44» src=«ref-1_1663226243-222.coolpic» v:shapes="_x0000_i1085">  называется предельной ошибкой выборки.

Таким образом, мы имеем доверительный интервал для генеральной средней:
(<img width=«57» height=«27» src=«ref-1_1663226465-154.coolpic» v:shapes="_x0000_i1086">; <img width=«59» height=«27» src=«ref-1_1663226619-160.coolpic» v:shapes="_x0000_i1087">)
Наоборот, если задана предельная ошибка ε, а требуется определить вероятность Р, то схема решения задачи следующая:
ε→z=<img width=«39» height=«45» src=«ref-1_1663226779-174.coolpic» v:shapes="_x0000_i1088">→Ф(z)→P=2Ф(z)                                        (1.9.24)
Наконец, определение объема выборки п по данным Р и ε производится по следующей схеме:

P=2Ф(z) →z→n=<img width=«41» height=«44» src=«ref-1_1663226953-171.coolpic» v:shapes="_x0000_i1089">                                                 (1.9.25)
Пример 1.9.4. Взвешивание 50 случайно отобранных коробок печенья дало <img width=«28» height=«21» src=«ref-1_1663227124-114.coolpic» v:shapes="_x0000_i1090">=1200г. Определить с вероятностью Р = 0,95 доверительные границы для среднего веса коробки печенья <img width=«19» height=«21» src=«ref-1_1663227238-100.coolpic» v:shapes="_x0000_i1091"> в генеральной совокупности, если есть основания полагать, что генеральная дисперсия σ2 = 11664.

Решение:

Дано:    n=50; <img width=«28» height=«21» src=«ref-1_1663227124-114.coolpic» v:shapes="_x0000_i1092">=1200; σ2=11664 (<img width=«84» height=«24» src=«ref-1_1663227452-205.coolpic» v:shapes="_x0000_i1093">= 108); Р = 0,95.

Из равенства Р = 2Ф(z)=0,95 по таблице значений интегральной функции Лапласа находим z=1,96, откуда:
ε=<img width=«247» height=«53» src=«ref-1_1663227657-1173.coolpic» v:shapes="_x0000_i1094">(г)
Таким образом, получаем доверительный интервал:

1200 — 30 < <img width=«19» height=«21» src=«ref-1_1663227238-100.coolpic» v:shapes="_x0000_i1095">< 1200 + 30.
Пример 1.9.5Определить, с какой доверительной вероятностью можно утверждать, что при данном объеме выборки (50 коробок) ошибка выборки не превысит <metricconverter productid=«20 г» w:st=«on»>20 г.

Решение:

По величине ε=20 вычисляем <img width=«184» height=«45» src=«ref-1_1663228930-432.coolpic» v:shapes="_x0000_i1096">, откуда по таблице Ф(z): Р = 2Ф(1,31)≈0,81
Пример 1.9.6.Определить необходимый объем выборки n, который с вероятностью 0,99 гарантировал бы ошибку выборки не более чем ε= <metricconverter productid=«20 г» w:st=«on»>20г.

Решение:

Из Р = 2Ф(z
) =0,99 находим z= 2,58, откуда:

<img width=«200» height=«44» src=«ref-1_1663229362-474.coolpic» v:shapes="_x0000_i1097"> коробок

Предположение о том, что генеральная дисперсия σ2известна при неизвестной генеральной средней, на практике выполняется весьма редко. Чаще всего мы имеем лишь выборочные данные и можем дать лишь выборочную оценку   s
2   неизвестной дисперсии σ2.

Статистика
<img width=«81» height=«68» src=«ref-1_1663229836-282.coolpic» v:shapes="_x0000_i1098">                                                           (1.9.26)
подчиняется закону распределения Стьюдента с v
=
n—1 степенями свободы. Однако при больших значениях параметра v(v≥ 30) распределение Стьюдента практически совпадает с нормальным. Поэтому в случае больших выборок схема решения задач остается прежней, даже если вместо 'Неизве стного генерального среднего квадратического отклонения а используется его выборочная оценка s
.
3.5.2. Малая выборка

Если генеральная совокупность подчинена нормальному закону распределения (что на практике имеет место очень часто), то выборочная средняя <img width=«97» height=«45» src=«ref-1_1663230118-363.coolpic» v:shapes="_x0000_i1099"> как средняя арифметическая п нормально распределенных случайных величин также имеет нормальный закон распределения. Таким образом, величина <img width=«84» height=«68» src=«ref-1_1663225251-286.coolpic» v:shapes="_x0000_i1100">распределена по стандартному нормальному закону, и схема решения задач при известном генеральном среднем квадратическом отклонении σ остается прежней.

Если же генеральное среднее квадратическое отклонение σ неизвестно и приходится пользоваться его выборочной оценкой s
, то используется статистика t
(1.9.26), которая, как мы уже отмечали, подчинена закону распределения Стьюдента с v
=
n—1 степенями свободы. При v< 30 имеются значительные различия между распределением Стьюдента и нормальным распределением (тем более значительные, чем меньше v). Используя функцию распределения Стьюдента, мы можем записать равенство, аналогичное формуле Лапласа:
<img width=«171» height=«75» src=«ref-1_1663230767-512.coolpic» v:shapes="_x0000_i1101">                                         (1.9.27)
где S
(
t
,
v) — функция Стьюдента, значения которой для различных значений tи vподробно рассчитаны и представлены в специальных таблицах.

Выражение (1.9.27) эквивалентно выражению:
<img width=«233» height=«25» src=«ref-1_1663231279-388.coolpic» v:shapes="_x0000_i1102">                             (1.9.28)
где <img width=«53» height=«44» src=«ref-1_1663231667-182.coolpic» v:shapes="_x0000_i1103">

Решение задач с помощью этого равенства аналогично решению задач с использованием формулы Лапласа. Лишь определение п несколько усложняется из-за того, что оно входит также в параметр v
=
n—1.

Поэтому можно воспользоваться схемой последовательных приближений. Вначале производят оценку (s2) генеральной дисперсии. Затем находят п1по схеме (1.9.25), используя таблицу функции Лапласа и принимая σ2 = s
2
— По найденному n
1
и, соответственно, v
1
=
n
1— 1 и заданному значению

Р=1—α определяют t
1
(по таблице распределения Стьюдента) и вычисляют <img width=«67» height=«44» src=«ref-1_1663231849-222.coolpic» v:shapes="_x0000_i1104">
  и так далее.

Теперь можно снова повторить расчет по   v
2
=
n
2— 1 и т.д.

Итерация заканчивается, если окажется   ni
≈ ni
-1.
Пример 1.9.7. Для определения среднего заработка работника за день при соблюдении необходимых условий было отобрано 10 работников, заработок которых оказался равным (в руб.): 325; 337; 319; 330; 327; 328; 332; 320; 318; 334. Требуется определить с вероятностью 0,95 доверительный интервал для среднего заработка работников в генеральной совокупности, если есть основания полагать, что заработная плата в генеральной совокупности подчиняется нормальному закону определения.

продолжение
--PAGE_BREAK--

еще рефераты

Еще работы по социологии

Реферат по социологии

Социологическая диагностика первичных социальных групп

1 Сентября 2013

Реферат по социологии

Изучение способностей и их влияние на выбор профессии

1 Сентября 2013

Реферат по социологии

Управление социальной защиты населения на уровне муниципального образования

25 Июня 2015

Реферат по социологии

Региональная модель системы социальной защиты населения на примере

1 Сентября 2013