Реферат: Обработка результатов экспериментов и наблюдений

--PAGE_BREAK--                 Sa2= <img width=«208» height=«63» src=«ref-1_294824998-593.coolpic» v:shapes="_x0000_i1045">.<img width=«96» height=«38» src=«ref-1_294825591-182.coolpic» v:shapes="_x0000_i1046">

          При большом числеNS2a ®s2a

                             <img width=«332» height=«63» src=«ref-1_294825773-778.coolpic» v:shapes="_x0000_i1047">.
          Усредняя выражениеS2nпо числу серийN, получаем

                   <img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1048"><img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1049">              Sa2 = (Dx)2 = Sn2-<img width=«81» height=«57» src=«ref-1_294826889-293.coolpic» v:shapes="_x0000_i1050">.
          Учитывая что при большом n S2n®s2 и S2®s2получаем искомую

связь между дисперсиями всего опыта s2aи отдельного эксперимента [i1] s2

                   <img width=«268» height=«63» src=«ref-1_294827182-486.coolpic» v:shapes="_x0000_i1051">,

т.е. дисперсияs2aрезультата серии изnизмерений вnраз меньше дисперсии отдельного измерения. При ограниченном числеnизмерений приближенным выражениемs2aбудет S2a

                                                <img width=«202» height=«91» src=«ref-1_294827668-574.coolpic» v:shapes="_x0000_i1052">.
          Выраженияs2aи S2aотражают фундаментальный закон возрастания точности при росте числа наблюдений. Из него следует, что желая повысить точность измерений в 2 раза мы должны сделать вместо одного -четыре измерения; чтобы повысить точность в 3 раза, нужно увеличить число измерений в 9 раз и т.д.
1.7. Понятие доверительного интервала и доверительной вероятности

          Как установлено ранее, истинное значение измеряемой величины Х отличается от среднеарифметическогоaна некоторую величину Dx. На рис. 2 представлено расположение истинного значения Х иа, полученного из некоторых измерений а1, а2, а3.

          Ясно, что случайные величины а1, а2, а3 обусловят случайный характер абсолютной погрешности Dxрезультата серии измерений, которая будет распределена по закону Гаусса:

                   <img width=«183» height=«86» src=«ref-1_294828242-530.coolpic» v:shapes="_x0000_i1053">.
Рис. 2. Взаимное расположение Х и а, полученных

                          из трех измерений а1, а2, а3
Тогда вместо выражения Х = а ±Dх можно записать а -Dх £Х £а + D.

          Интервал (а -Dх; а + Dх), в который по определению попадает истинное значение Xназывают доверительным интервалом. Надежностью (уровнем значимости)результата серии измерений называется вероятность aтого, что истинное значение Xизмеряемой величины попадет в доверительный интервал. Вероятность aвыражается в долях единицы или процентах. Графически надежность отражается площадью под кривой нормального распределения в пределах доверительного интервала, отнесенной к общей площади. Выбор надежности определяется характером производимых измерений. Например, к деталям самолета предъявляются более жесткие требования, чем к лодочному мотору, а к последнему значительно больше, чем к ручной тачке. При обычных измерениях ограничиваются доверительной вероятностью 0,90 или 0,95. Для любой величины доверительного интервала (выраженного в долях s)по формуле Гаусса может быть просчитана соответствующая доверительная вероятность. Эти вычисления проделаны и сведены в таблицу, имеющуюся практически во всей литературе по теории вероятности. На рис. 3 представлены значения надежности aпри величине доверительного интервала ±s, ±2s, ±3s. Эти значения доверительной вероятности рекомендуется запомнить.

          По рис. 3 видно, что величина абсолютной погрешности Dx может быть представлена в виде К×sа, где К некоторый численный коэффициент, зависящий от надежности a. Однако это справедливо лишь для большого (бесконечного)числа n. При малых nэтим коэффициентом пользоваться нельзя, т.к. величина sанеизвестна. Для того, чтобы получить оценки границ доверительного интервала при малом nвводится новый коэффициент ta. Этот коэффициент предложен английским математиком и химиком В.С. Госсетом, публиковавшим свои работы под псевдонимом ²Стьюдент ².
Рис. 3. Значения надежности aпри различных значениях Dx/s



И коэффициент taназвали коэффициентом Стьюдента. Коэффициент Стьюдента отражает распределение случайной величины t =<img width=«33» height=«59» src=«ref-1_294828772-289.coolpic» v:shapes="_x0000_i1054"><img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1055">при различном n. При n®¥(практически при n ³20 )распределение Стьюдента переходит в нормальное распределение. Значения коэффициента Стьюдента также приводятся практически во всей литературе по теории вероятности.

          Зная величину taможно определить величину абсолютной погрешности Dх = t×Sa. Следует отметить, что величина абсолютной погрешности еще не определяет точность измерений. Точность измерений характеризует относительная погрешность, равная отношению абсолютной погрешности Dxрезультата измерений к результату измерений а: ε= ±Dх /а.               .

1.8. Обнаружение промахов
          Если в ряду измерений встречаются результаты, резко отличающиеся от большей части ряда, то возникает вопрос принадлежности ²выскакивающих ²значений этому ряду измерений. Большие ошибки имеют малую вероятность возникновения. Поэтому следует объективно оценить, является ли данное измерение промахом (тогда его исключают из ряда )или же это результат случайного, но совершенно закономерного отклонения. Можно считать каждое измерение промахом, если вероятность случайного появления такого значения является достаточно малой.

          Если известно точное значение s, то вероятность появления значения, отличающегося от среднеарифметического а более чем на 3s£0,003 и все измерения, отличающиеся от а на 3s(и больше )могут быть отброшены, как маловероятные.

          Следует иметь в виду, что для совокупности измерений вероятность появления измерения ³3sот а всегда больше 0,003. Действительно, вероятность того, что результат каждого измерения не будет отличаться от истинного более чем 3sсоставляет 1-0,003 =0,997. Вероятность того, что все nизмерений не будут отличаться от среднего более чем на 3sпо правилу умножения вероятностей составит (1 -0,003 )n. Для не слишком большого n

                   (1 -0,003)n»1 -0,003×n.
          Это значит, что вероятность того, что из 10 измерений хотя бы одно будет случайно отличаться от среднего более чем на 3sбудет уже не 0,003, а 0,03 или 3%. А при 100 измерениях вероятность такого события составит уже около 30%.

          Обычно число измерений не очень велико. При этом точное значение sне известно, следовательно, отбрасывать измерения, отличающиеся от среднего более чем на 3s, нельзя.

          Для оценки вероятности bслучайного появления ²выскакивающих²значений в ряду n измерений составлены соответствующие таблицы.

          Для применения таблицы вычисляется среднее арифметическое а и средняя квадратичная погрешность Snиз всех измерений, включая и подозреваемое значение аk. Затем вычисляется уклонение подозреваемого значения аk от среднего арифметического в долях среднеквадратичной ошибки

                                                Vмакс= <img width=«76» height=«69» src=«ref-1_294829230-316.coolpic» v:shapes="_x0000_i1056">.<img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1057">
          По таблице определяется какой вероятности bсоответствует полученное значение Vмакс.

          Если вероятность появления данного измерения в ряду лежит в диапазоне 0,1 >b>0,01, то представляется одинаково правильным -оставить это измерение или отбросить. В случае же, когда bвыходит за указанные пределы, вопрос об отбрасывании решается практически однозначно. Решая вопрос об отбрасывании полезно посмотреть, как сильно оно меняет окончательный результат по а и Sn.
          1.9. Ошибки косвенных измерений
          Часто измеряется не непосредственно интересующая нас величина, а другая, зависящая от нее некоторым образом. Например, при резании металлов часто непосредственно измеряются деформации, ЭДС, по которым судят о возникающих силах и температурах. При этом также необходимо оценить ошибку измерения.

          При косвенных измерениях значение yизмеряемой величины находят по некоторой формуле
                   y = ¦(х1, х2,…, хm),
где x1, x2,… xm-средние арифметические измеряемые (непосредственно)величины. Рассмотрим функцию общего вида

                   y = ¦(х1, х2,…, хm)
где x1, x2,…, xm-независимые переменные, для определения которых производятся n прямых независимых измерений по каждой xi.

          Обозначим значения переменных через среднее значение и отклонения
          y ±Dy = ¦(x1±Dx1, x2±Dx2,…, xm±Dxm).
Эту функцию представим рядом Тейлора, ограничив его первыми членами ряда ( принимая Dxi<<xi)
   y ±Dy = ¦(х1, х2,…, хn)±<img width=«332» height=«61» src=«ref-1_294829715-704.coolpic» v:shapes="_x0000_i1058">,<img width=«13» height=«22» src=«ref-1_294830419-169.coolpic» v:shapes="_x0000_i1059">
где

      <img width=«40» height=«60» src=«ref-1_294830588-287.coolpic» v:shapes="_x0000_i1060">  -производная функции по xi, взятая в точке xi.

          Учитывая, что y = ¦(x1, x2,…, xm) получаем
                   Dy =<img width=«328» height=«61» src=«ref-1_294830875-700.coolpic» v:shapes="_x0000_i1061">.
          Чтобы учесть погрешности Dxiвсех nопытов целесообразно использовать средние квадратические оценки ( Dxi)2, так как Dxi=0.

          Возведем в квадрат левую и правую части уравнения и разделим на n
<img width=«660» height=«89» src=«ref-1_294831575-1525.coolpic» v:shapes="_x0000_i1062">.

Здесь суммы удвоенных произведений типа
                                                 <img width=«200» height=«84» src=«ref-1_294833100-542.coolpic» v:shapes="_x0000_i1063"><img width=«15» height=«28» src=«ref-1_294833642-170.coolpic» v:shapes="_x0000_i1064">

согласно четвертому свойству случайных ошибок ( Dxi=0 ).

          Тогда в левой и правой частях имеем среднеквадратические погрешности функции и аргументов
          S<img width=«475» height=«73» src=«ref-1_294833812-1093.coolpic» v:shapes="_x0000_i1065">.
          Пример. При тарировке динамометра было получено уравнение зависимости силы от отклонения lлуча осциллографа вида P =25 l. Точность измерения отклонения Dl =1 мм. Тогда
                                       DP = <img width=«175» height=«48» src=«ref-1_294834905-439.coolpic» v:shapes="_x0000_i1066">.
          В качестве меры точности лучше выступает не абсолютная, а относительная погрешность.

          ε<img width=«124» height=«61» src=«ref-1_294835344-396.coolpic» v:shapes="_x0000_i1067">.



Рассмотрим ее определение на примере. Пусть



y = cx1a×x2b×x3g.
Тогда

<img width=«209» height=«63» src=«ref-1_294835740-558.coolpic» v:shapes="_x0000_i1068">; <img width=«208» height=«63» src=«ref-1_294836298-574.coolpic» v:shapes="_x0000_i1069">;

<img width=«208» height=«63» src=«ref-1_294836872-570.coolpic» v:shapes="_x0000_i1070">.

       <img width=«574» height=«77» src=«ref-1_294837442-1284.coolpic» v:shapes="_x0000_i1071">

<img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1072">

<img width=«577» height=«76» src=«ref-1_294838895-1196.coolpic» v:shapes="_x0000_i1073">
= <img width=«268» height=«44» src=«ref-1_294840091-537.coolpic» v:shapes="_x0000_i1074">.
Аналогично можно определить относительную погрешность и при других зависимостях. Зная относительную погрешность, можно определить и абсолютное ее значение:

          Dy = y×εy.
1.10. Правила округления чисел
          Величина погрешности результата измерений физической величины дает представление о том, какие цифры в числовом значении измеряемой величины сомнительны. Поэтому результаты измерений следует округлять перед тем, как производить с ними дальнейшие вычисления.

          Округлять числовое значение результата измерений следует в соответствии с числовым разрядом значащей цифры погрешности. При этом выполняют общие правила округления.

          Лишние цифры в целых числах заменяются нулями, а в десятичных дробях отбрасываются ( как и лишние нули ). Например, если погрешность измерения ±0,001 мм, то результат 1,07005 округляется до 1,070.

          Если первая из изменяемых нулями и отбрасываемых цифр меньше 5, остающиеся цифры не изменяются. Например, число 148935, точность измерения ±50, округление:148900.

          Если первая из заменяемых нулями или отбрасываемых цифр равна 5, а за ней не следует никаких цифр или идут нули, то округление производится до ближайшего четного числа. Например, число 123,50 округляется до 124.

          Если первая из заменяемых нулями или отбрасываемых цифр больше 5 или равна 5, но за ней следует значащая цифра, то последняя остающаяся цифра увеличивается на единицу. Например, число 6783,6 округляется до 6784.
1.11. Порядок обработки результатов измерений
          При практической обработке результатов измерений можно последовательно выполнить следующие операции:

1. Записать результаты измерений;

2. Вычислить среднее значение из nизмерений

          а= <img width=«71» height=«61» src=«ref-1_294817759-337.coolpic» v:shapes="_x0000_i1075"> продолжение
--PAGE_BREAK--

3. Определить погрешности отдельных измерений Vi=а -аi;

4. Вычислить квадраты погрешностей отдельных измерений Vi2;

5. Если несколько измерений резко отличаются по своим значениям от остальных измерений, то следует проверить не являются ли они промахом. При исключении одного или нескольких измерений п.п.1...4 повторить;

6. Определяется средняя квадратичная погрешность результата серии измерений

                                      <img width=«152» height=«95» src=«ref-1_294840965-541.coolpic» v:shapes="_x0000_i1076">

7. Задается значение надежности a;

8. Определяется коэффициент Стьюдента ta(n) для выбранной надежности aи числа проведенных измерений n;

9. Находятся границы доверительного интервала
          Dх = ta(n)×Sa
10. Если величина погрешности результата измерений (п.9) окажется сравнимой с величиной dпогрешности прибора, то в качестве границы доверительного интервала следует взять величину



<img width=«309» height=«76» src=«ref-1_294841506-688.coolpic» v:shapes="_x0000_i1077">.

11. Записать окончательный результат
                                      X =a ±Dx ;

12. Оценить относительную погрешность результата серии измерений
ε= <img width=«94» height=«57» src=«ref-1_294842194-344.coolpic» v:shapes="_x0000_i1078">.<img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1079">
1.12. Обработка результатов измерений диаметра цилиндра
          Микрометром было сделано десять замеров диаметра цилиндра. Цена деления микрометра 0,01 мм. Определить диаметр цилиндра с надежностью a=0,95 и a=0,99. Оценить влияние числа замеров на точность получаемого результата.
                             аi:14,85; 14,80; 14,84; 14,81; 14,79;
                                 14,81; 14,80; 14,85; 14,84; 14,80.
1. Для первых пяти измерений определим среднеарифметическое значение и границы доверительного интервала. Для удобства расчетов выберем произвольное число ао удобное для расчетов (ао =14,80 мм) и определим разности (аi-ао) и квадраты этих разностей. Результаты сведены в таблицу.

i

      аi, мм

   аi-ао, мм

(аi-ао)2, мм2

1

      14, 85

      0, 05

    0, 0025

2

      14, 80

      0, 00

    0, 0000

3

      14, 84

      0, 04

    0, 0016

4

      14, 81

      0, 01

    0, 0001

5

      14, 79

     -0, 01

    0, 0001

           <img width=«36» height=«53» src=«ref-1_294842707-256.coolpic» v:shapes="_x0000_i1080">



       0, 09



    0, 0043

Найдем среднее значение а и среднеквадратичное отклонение Sа:

<img width=«507» height=«61» src=«ref-1_294842963-859.coolpic» v:shapes="_x0000_i1081">

а -ао = 0, 018 мм;

<img width=«561» height=«66» src=«ref-1_294843822-1025.coolpic» v:shapes="_x0000_i1082">

<img width=«384» height=«57» src=«ref-1_294844847-660.coolpic» v:shapes="_x0000_i1083"><img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1084">(мм2 );

<img width=«284» height=«37» src=«ref-1_294845676-528.coolpic» v:shapes="_x0000_i1085"> ( мм ).
Для надежности a=0,95 и n =5 ta=2,78. Абсолютная погрешность измерения Dх:
Dх =ta×Sа=2,78 ×0,0116 =0,0322 мм.
Результат измерения можно представить в виде
(14,818 -0,032)мм £а £(14,818 +0,032)мм
или сохраняя в величине погрешности одну значащую цифру

          (14,82 -0,03)мм £а £(14,82 +0,03)мм,

т.е. 14,79 мм £а £14,85 мм или а =(14,82 ±0,03)мм.

Относительная погрешность

          εа= <img width=«226» height=«61» src=«ref-1_294846204-545.coolpic» v:shapes="_x0000_i1086">.
          Теперь найдем абсолютную и относительную погрешность этих измерений при a=0,99.

          В этом случае ta=4,60. Тогда
                             Dх = ta×Sa= 4,60×1,16×10-2 = 5,34×10-2 ( мм ).
          Следовательно а =(14,82 ±0,05)мм

          εа= <img width=«228» height=«58» src=«ref-1_294846749-551.coolpic» v:shapes="_x0000_i1087">.
          Видно, что с увеличением надежности границы доверительного интервала возросли, а точность результата уменьшилась.

2. Проведем расчет погрешностей для этих же пяти измерений, незаконно полагая, что s2=S2n(что при n = 5 ошибочно). Для этого используем распределение Гаусса (а не Стюарта). При a=0,95 ka= <img width=«83» height=«52» src=«ref-1_294847300-345.coolpic» v:shapes="_x0000_i1088">.

Это дает возможность определить
                             Dх = ka×Sa = 1,96×1,16×10-2»2×10-2 ( мм ),
т.е. погрешность получилась меньше примерно на 30%. Если по этой величине погрешности определить величину надежности при ta=ka, то из таблицы коэффициентов Стьюдента получим a<0,90 вместо заданной a=0,95. Следовательно при малом числе измерений nприменение закона нормального распределения с s2=S2nвместо распределения Стьюдента приводит к уменьшению надежности результата измерений.

3. Найдем средние значения и погрешности следующих пяти измерений

i

     аi, мм

    аi-ао, мм

(аi-ао)2, мм2

1

     14, 81

       0, 01

     0, 0001

2

     14, 80

       0, 00

         0

3

     14, 85

       0, 05

     0, 0025

4

     14, 84

       0, 04

     0, 0016

5

     14, 80

       0, 00

         0

         <img width=«38» height=«55» src=«ref-1_294847645-263.coolpic» v:shapes="_x0000_i1089">

       0, 10

     0, 0042

ао = 14, 80 мм;

          а = ао +<img width=«357» height=«61» src=«ref-1_294847908-709.coolpic» v:shapes="_x0000_i1090"> ( мм );

          а -ао = 0, 02 мм;
          <img width=«426» height=«63» src=«ref-1_294848617-746.coolpic» v:shapes="_x0000_i1091">

          <img width=«364» height=«57» src=«ref-1_294849363-601.coolpic» v:shapes="_x0000_i1092"> ( мм2 );
          Sa= 1, 05×10-2 мм.
При a=0,95:
                       Dх = ta×Sa = ±2,78×1,05×10-2 = 2,92×10-2 ( мм );



   εа= <img width=«289» height=«49» src=«ref-1_294849964-634.coolpic» v:shapes="_x0000_i1093">;



    Х = 14, 82 ±0, 03 мм.
При a=0,99:
                             Dх = ±4,60×1,05×10-2»5×10-2 ( мм );
          εа= ±<img width=«181» height=«49» src=«ref-1_294850598-501.coolpic» v:shapes="_x0000_i1094">



Х = 14, 82 ±0,05 мм.

          Результаты практически не отличаются, от результатов полученных из первой серии.

4. Найдем теперь погрешность результата всей серии из десяти измерений. В этом случае <img width=«151» height=«28» src=«ref-1_294851099-395.coolpic» v:shapes="_x0000_i1095"> (мм); <img width=«184» height=«31» src=«ref-1_294851494-442.coolpic» v:shapes="_x0000_i1096"> (мм2).

Эти величины получаются суммированием последних строк из таблиц частных серий.
                                                ао = 14, 80 мм;
          а = ао+ <img width=«393» height=«61» src=«ref-1_294851936-752.coolpic» v:shapes="_x0000_i1097"> ( мм );
а -ао = 0, 019 мм.
          Sa2= <img width=«360» height=«63» src=«ref-1_294852688-660.coolpic» v:shapes="_x0000_i1098">
          =<img width=«497» height=«56» src=«ref-1_294853348-822.coolpic» v:shapes="_x0000_i1099"> ( мм2 );
          Sa= 7, 35×10-3 мм.
При a=0,95 имеем
                             Dх = ta×Sa= ±2,26×7,35×10-3 = ±1,7×10-2 ( мм );



εа= <img width=«227» height=«53» src=«ref-1_294854170-521.coolpic» v:shapes="_x0000_i1100">;



а = 14, 819 ±0, 017 мм.
При a=0,99 получаем
                             Dх = ta×Sa = ±3,25×7,35×10-2 = ±2,4×10-2 ( мм );



εа = <img width=«232» height=«53» src=«ref-1_294854691-549.coolpic» v:shapes="_x0000_i1101">;



а = 14, 819 ±0, 024 мм.
          Видно, что абсолютная и относительная погрешность результата десяти измерений стали почти в два раза меньше погрешностей пяти измерений.

          Применение нормального распределения с s2=S2nдает в случае a=0,95 ka=1,96 и Dх =1,4 ×10-2мм, а величина надежности понижается до 0,91; в случае a=0,99 получаем ka=2,58 и Dх =1,9 ×10-2мм, а величина надежности понижается до a=0,97.

          Как видно, с ростом числа измерений различие между результатами, вычислениями по распределению Стьюдента и по нормальному распределению уменьшается.
          Контрольные вопросы
1. Цель математической обработки результатов эксперимента;

2. Виды измерений;

3. Типы ошибок измерения;

4. Свойства случайных ошибок;

5. Почему среднеарифметическое значение случайной величины при нормальном законе ее распределения является вероятнейшим значением?

6. Что такое истинная абсолютная и вероятнейшая ошибки отдельного измерения?

7. Что такое доверительный интервал случайной величины?

8. Что такое уровень значимости (надежности) серии измерений?

9. Геометрический смысл уровня значимости;

10. Почему при малом числе опытов нельзя погрешность измерений представить в виде Dх =±Ksа?

11. Что является критерием “случайности” большого отклонения измеряемой величины?

12. Чем определяется величина случайной ошибки косвенных измерений?

13. Чем определяется точность числовой записи случайной величины?
2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
          При характеристике случайных величин недостаточно указать их возможные значения. Необходимо еще знать насколько часто возникают различные значения этой величины. Это характеризуется вероятностью pотдельных ее значений.

          Соотношение, устанавливающее связь между значениями случайной величины и вероятностями этих значений, называют законом распределения случайной величины. Различают интегральный и дифференциальный законы распределения.



2.1. Виды случайных величин и законы их распределения



          Под случайной величиной понимается величина, принимающая в результате опыта какое либо числовое или качественное значение.

          Случайная величина, принимающая конечное число или последовательность различных значений, называется дискретной случайной величиной. Случайная величина, принимающая все значения из некоторого интервала, называется непрерывной случайной величиной.

          Под интегральным законом распределения (или функцией распределения) F(х) случайной величины Х понимают вероятность p того, что случайная величина Х не превысит некоторого ее значения х
                   F(х) =p (Х <х).
Основным свойством интегрального распределения является монотонное не убывание в ограниченном диапазоне [;1 ].

          Действительно, если х1 и х2 некоторые значения случайной величины Х. Причем х2>х1, то очевидно, что событие p (Х <х2) ³p (Х <х1), т.к. между значениями х1 и х2 могут быть и промежуточные. Из определения интегрального закона следует, что F (х2) ³F(х1), что говорит о монотонном не убывании функции. Очевидно также, что
          F (-¥) =p (Х <-¥) =0;
                                              ÞF(¥) -F(-¥) =1,

       F (+¥) =p (Х <¥) =1;
т.е. F(х) изменяется в диапазоне от 0 до 1.

          Закон распределения дискретной случайной величины может быть задан таблицей или ступенчатой функцией (рис. 4)


Рис. 4. Интегральный закон распределения

                                дискретной случайной величины
                Для дискретной случайной величины
          F (x) = P (X <x) = P (-¥<X <x) = <img width=«56» height=«51» src=«ref-1_294855240-302.coolpic» v:shapes="_x0000_i1102"> продолжение
--PAGE_BREAK--,

<img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1103">где суммирование распространяется на хi<х. В промежутке между двумя последовательными значениями Х функция F(х) постоянна. При переходе аргумента х через значение хiF (х) скачком возрастает на величину p (Х =хi).

          Рассмотрим p (х1£Х <х2). Если х2>х1, то очевидно, что

p (Х <х2) =p (Х <х1) +p (х1£Х <х2).

          Тогда
          p (х1£Х <х2) =p (Х <х2) -p (Х <х1) =F (х2) -F(х1),
т.е. вероятность попадания случайной величины в интервал [х1;х2) равен разности значений интегральной функции граничных точек.

          Последнее условие можно использовать для нахождения вероятности p (Х =х1) для непрерывной случайной величины. Для этого рассмотрим предел
          p (X = x1) = <img width=«443» height=«46» src=«ref-1_294855711-779.coolpic» v:shapes="_x0000_i1104">,
т.е. если закон распределения случайной величины есть функция непрерывная, то вероятность того, что случайная величина примет заранее заданное значение, равна нулю.

          Здесь видно различие между дискретными и непрерывными случайными величинами. Для дискретных случайных величин, для каждого значения случайной величины существует своя вероятность. И для него справедливо утверждение: событие, вероятность которого равна нулю, невозможно. Для непрерывной случайной величины это утверждение неверно. Как показано, вероятность того, что Х =х1 ( где х1-заранее выбранное число) равна нулю, это событие не является невозможным.

Рассмотрим непрерывную случайную величину Х, интегральный закон которой предполагается непрерывным и дифференцируемым. Функцию
                   ¦(х) =F¢(х)
называют дифференциальным законом распределения или плотностью вероятности случайной величины Х. Из определения производной можно записать

¦(x) = F¢(x)= <img width=«468» height=«59» src=«ref-1_294856490-875.coolpic» v:shapes="_x0000_i1105">,
т.е. плотность вероятности случайной величины Х в точке х равна пределу отношения вероятности попадания величины Х в интервал (х; х +Dх) к Dх, когда Dх стремится к нулю.
          Используя понятия интегральной функции распределения и определенного интеграла можно записать

                    ¦(x) = F¢(x) или F (x) = p (x1 < X < x2) = <img width=«80» height=«71» src=«ref-1_294857365-366.coolpic» v:shapes="_x0000_i1106">.

Это соотношение имеет простое геометрическое толкование (рис. 5).

          Если <img width=«80» height=«71» src=«ref-1_294857365-366.coolpic» v:shapes="_x0000_i1107">  определяет заштрихованную область в соответствующих пределах, то

          p (х <Х <х +Dх) »¦(х) Dх.
Рис. 5. Геометрический смысл дифференциальной функции распределения
          Из свойств интегрального распределения следует
          <img width=«303» height=«66» src=«ref-1_294858097-625.coolpic» v:shapes="_x0000_i1108">.
          Зная дифференциальный закон распределения можно определить интегральный закон распределения
          F (x) = <img width=«73» height=«66» src=«ref-1_294858722-334.coolpic» v:shapes="_x0000_i1109">.
2.2. Числовые характеристики случайных величин, заданных своими распределениями
          Основными характеристиками случайной величины, заданной своими распределениями, является математическое ожидание ( или среднее значение ) и дисперсия.

          Математическое ожидание случайной величины является центром ее распределения. Дисперсия характеризует отклонение случайной величины от ее среднего значения.

          Если Х дискретная случайная величина, значения хiкоторой принимают с вероятностью pi, так, что <img width=«83» height=«59» src=«ref-1_294859056-322.coolpic» v:shapes="_x0000_i1110">, то математическое ожидание М (Х) случайной величины Х определяется равенством
                                      M (X)= <img width=«113» height=«61» src=«ref-1_294859378-359.coolpic» v:shapes="_x0000_i1111">,
т.е. суммой произведений всех ее возможных значений на соответствующие вероятности.

          Математическим ожиданием непрерывной случайной величины является аналог его дискретного выражения

                   M (X)= <img width=«138» height=«66» src=«ref-1_294859737-435.coolpic» v:shapes="_x0000_i1112">.

          Действительно, все значения в интервале (х; х +Dх) можно считать примерно равными х, а вероятность таких значений равна ¦(х) dx(см. ранее). Поэтому значения хiдискретного распределения заменяются х, а вероятности pi-на ¦(х) dx, а сумма заменяется интегралом.

          Дисперсией или рассеянием случайной величины Х называется математическое ожидание квадрата разности случайной величины и ее математического ожидания.
                             D(Х) =М [Х -М (Х)]2=М (Х -х)2=s2(х)
          Если случайная величина Х дискретна и принимает значения хiс вероятностями pi, то случайная величина (Х -х)2 принимает значения (хi-х)2 с вероятностями Рi. Поэтому для дискретной случайной величины имеем

                                       D (X)= <img width=«227» height=«63» src=«ref-1_294860172-528.coolpic» v:shapes="_x0000_i1113">.
          Аналогично для непрерывной случайной величины получаем
    D (X)= <img width=«162» height=«66» src=«ref-1_294860700-493.coolpic» v:shapes="_x0000_i1114">.

          Чем меньше величина дисперсии, тем лучше значения случайной величины характеризуются ее математическим ожиданием.
2.3. Основные дискретные и непрерывные законы распределения
          Как отмечалось ранее, очень часто случайная величина распределена по нормальному закону. Но существуют и другие распределения, имеющие практическое значение. Рассмотрим некоторые из них по условиям возникновения и основным параметрам их характеризующим.
1. Равномерное распределение вероятностей.
Пусть плотность вероятности А равна нулю всюду, кроме интервала (a; b), на котором она постоянна (рис. 6). Тогда можно записать

p (a < X < b)= <img width=«112» height=«66» src=«ref-1_294861193-344.coolpic» v:shapes="_x0000_i1115">  <img width=«27» height=«20» src=«ref-1_294861537-197.coolpic» v:shapes="_x0000_i1116">  A= <img width=«56» height=«57» src=«ref-1_294861734-248.coolpic» v:shapes="_x0000_i1117">.
Рис. 6. Дифференциальный и интегральный законы

равномерного распределения
Тогда дифференциальный закон равномерного распределения определяется

¦(x) = <img width=«265» height=«108» src=«ref-1_294861982-682.coolpic» v:shapes="_x0000_i1118"><img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1119">

Интегральный закон распределения

F (x)= <img width=«498» height=«66» src=«ref-1_294862833-954.coolpic» v:shapes="_x0000_i1120">.
При х ³bимеем
F (x)= <img width=«569» height=«64» src=«ref-1_294863787-892.coolpic» v:shapes="_x0000_i1121">
Таким образом интегральный закон равномерного распределения задается (рис. 6)

F (x) = <img width=«259» height=«108» src=«ref-1_294864679-697.coolpic» v:shapes="_x0000_i1122">
Основные характеристики распределения
М (X)= <img width=«417» height=«67» src=«ref-1_294865376-878.coolpic» v:shapes="_x0000_i1123">;
D(X)= <img width=«567» height=«68» src=«ref-1_294866254-1037.coolpic» v:shapes="_x0000_i1124">

= <img width=«505» height=«69» src=«ref-1_294867291-855.coolpic» v:shapes="_x0000_i1125">

= <img width=«600» height=«68» src=«ref-1_294868146-1009.coolpic» v:shapes="_x0000_i1126">

<img width=«267» height=«68» src=«ref-1_294869155-589.coolpic» v:shapes="_x0000_i1127">.<img width=«13» height=«25» src=«ref-1_294815485-169.coolpic» v:shapes="_x0000_i1128">
2. Биноминальное распределение
          Пусть при некотором испытании событие А может наступить или не произойти (А). Обозначим вероятность А через р, а А через q=1 -р (других итогов испытания нет). Тогда исходами двух последовательных независимых испытаний и их вероятностью будут:
                             АА -р2; АА -рq; АА -qр; АА -q2.
          Отсюда видно, что двукратное появление события А равно р2, вероятность однократного появления -2 рq, а вероятность того, что А не наступит ни разу -q2. Эти результаты единственно возможные и поэтому
                             <img width=«335» height=«60» src=«ref-1_294869913-580.coolpic» v:shapes="_x0000_i1129">.

Это рассуждение можно перенести на любое число испытаний.
Например, при трех испытаниях получим

                    <img width=«412» height=«60» src=«ref-1_294870493-688.coolpic» v:shapes="_x0000_i1130">.

Подсчитаем вероятность того, что при nиспытаниях событие А появится mраз. Это может произойти, например, в последовательности
                                       <img width=«132» height=«49» src=«ref-1_294871181-344.coolpic» v:shapes="_x0000_i1131">
Ясно, что вероятность равна рmqn-m. Но mсобытий А может быть и в другом сочетании. Число всех возможных сочетаний из nэлементов по m(количество событий А) равно числу сочетаний <img width=«35» height=«35» src=«ref-1_294871525-245.coolpic» v:shapes="_x0000_i1132">. Используя теорему сложения вероятностей получаем общую вероятность Рm,nнаступления mсобытий А из nиспытаний

                    Pm,n= <img width=«350» height=«58» src=«ref-1_294871770-563.coolpic» v:shapes="_x0000_i1133">

                   = <img width=«304» height=«64» src=«ref-1_294872333-549.coolpic» v:shapes="_x0000_i1134">.
          Из этой формулы видно, что вероятности Рm,nдля различного исхода испытаний (появление или не появление определенного результата А) определяется
pn + npn-1q + <img width=«509» height=«55» src=«ref-1_294872882-738.coolpic» v:shapes="_x0000_i1135">.
          Коэффициенты перед вероятностями р, qявляются биноминальными коэффициентами, а общая вероятность представляет слагаемые в разложении бинома ( р +q)n. Поэтому закон распределения случайной величины Х, в котором вероятность наступления событий А определяется коэффициентами бинома, называется биноминальным распределением дискретной случайной величины. Этот закон может быть задан в виде таблицы 1.
                                                                                   Таблица 1

Биноминальный закон распределения

хi







   1



       2

...

m

...

n

pi



qn

npqn-1

<img width=«128» height=«49» src=«ref-1_294873620-408.coolpic» v:shapes="_x0000_i1136">

...

<img width=«94» height=«32» src=«ref-1_294874028-308.coolpic» v:shapes="_x0000_i1137">

...

pn

          Биномиальные коэффициенты удобно получать с помощью треугольника Паскаля.
                              1                                     n =

                            1   1                                  n =1

                         1   2   1                                 n = 2

                       1   3   3   1                               n = 3

                     1   4   6   4   1                            n = 4

                   1   5 10 10 5   1                          n = 5
          Все строки треугольника ( начинающегося с единицы ) начинаются и заканчиваются единицей. Промежуточные числа получаются сложением соседних чисел вышестоящей строки. Числа, стоящие в одной строке, являются биноминальными коэффициентами соответствующей степени.

          Из описания биномиального распределения становится ясно, что область его действия там, где возможно многократное проведение испытаний с известной вероятностью.

          На рис. 7 представлен биномиальный закон распределения.
Рис. 7. Биномиальный закон распределения
          Определим основные характеристики этого распределения.

          Математическое ожидание
          М (Х) = <img width=«507» height=«63» src=«ref-1_294874336-855.coolpic» v:shapes="_x0000_i1138">

          + <img width=«534» height=«66» src=«ref-1_294875191-824.coolpic» v:shapes="_x0000_i1139">

          + <img width=«572» height=«78» src=«ref-1_294876015-921.coolpic» v:shapes="_x0000_i1140">

          = np (q + p)n-1 = np.
          Дисперсия распределения может быть определена из общего выражения

                                       <img width=«218» height=«63» src=«ref-1_294876936-540.coolpic» v:shapes="_x0000_i1141">,
но это приводит к громоздким вычислениям. В то же время случайная величина Х принимает в каждом опыте только два значения: 1, если событие А произошло и 0, если оно не произошло с вероятностями, соответственно, р илиq. Тогда математическое ожидание одного опыта определится
                                      М (Х1) =×q+1×р =р =х
и соответственно дисперсия одного опыта
          D(Х1) =(0 -р)2×q +(1 -р)2×р =р2q+q2р =рq(р +q) =рq.
          Тогда дисперсия всех nопытов составит
                                                D (X) =n×p×q.

3. Закон Пуассона
          В случае малых р ( или, наоборот, близких к 1 ) биноминальный закон распределения можно преобразовать следующим образом
<img width=«633» height=«66» src=«ref-1_294877476-907.coolpic» v:shapes="_x0000_i1142"> продолжение
--PAGE_BREAK--

<img width=«173» height=«68» src=«ref-1_294878383-476.coolpic» v:shapes="_x0000_i1143">,

где <img width=«62» height=«56» src=«ref-1_294878859-257.coolpic» v:shapes="_x0000_i1144">.

<img width=«542» height=«69» src=«ref-1_294879116-882.coolpic» v:shapes="_x0000_i1145">.
          Определим предел Рm,nпри n®¥и постоянном m. Тогда пределы
<img width=«310» height=«64» src=«ref-1_294879998-625.coolpic» v:shapes="_x0000_i1146"> равны единице, а <img width=«165» height=«64» src=«ref-1_294880623-433.coolpic» v:shapes="_x0000_i1147">.
          Окончательно имеем

          <img width=«198» height=«63» src=«ref-1_294881056-414.coolpic» v:shapes="_x0000_i1148">.
Это распределение называется законом Пуассона, где l-интенсивность распределения. Используется в задачах с редкими событиями. На рис. 8 представлена схема вероятностей, распределенных по закону Пуассона.
Рис. 8. Закон распределения Пуассона
Определим его основные характеристики и смысл величины l.

          Запишем закон распределения в виде таблицы.

хi

0

    1



    2



...



m

...

pi



   e-l

    <img width=«54» height=«57» src=«ref-1_294881470-280.coolpic» v:shapes="_x0000_i1149">

   <img width=«67» height=«61» src=«ref-1_294881750-334.coolpic» v:shapes="_x0000_i1150">

  ...

<img width=«65» height=«60» src=«ref-1_294882084-311.coolpic» v:shapes="_x0000_i1151">

...

          M (X) = <img width=«412» height=«66» src=«ref-1_294882395-755.coolpic» v:shapes="_x0000_i1152">
          + <img width=«492» height=«75» src=«ref-1_294883150-847.coolpic» v:shapes="_x0000_i1153">.
Выражение в скобках есть разложение функции еlв ряд Маклорена.

Поэтому
          М (Х) =lе-lеl=l.
Не рассматривая вывод отметим, что
                                                D(Х) =l,
т.е. дисперсия равна математическому ожиданию.

          Рассмотренные виды распределений случайной величины, конечно, не исчерпывают всех существующих распределений. Можно назвать еще несколько: распределение Бернулли, экспоненциальное распределение, гамма -распределение, распределение Вейбула, гипергеометрические распределения и др. При определенных условиях и параметрах один вид распределения может переходить в другой. Поэтому при решении практических задач по законам распределения случайных величин следует обращаться к специальной литературе.
2.4. Понятие статистической гипотезы и статистического критерия
          Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Такие утверждения можно делать на основе теоретических соображений или статистических исследований других наблюдений. Например, при многократном измерении некоторой физической величины, точное значение Х которой не известно, но в процессе измерений оно меняется. На результат измерений влияют многие случайные факторы, поэтому результат i-го измерения можно записать в виде аi=Х + εi, где εi-случайная погрешность измерения. Если εiскладывается из большого числа ошибок, каждая из которых не велика, то на основании центральной предельной теоремы можно предположить, что случайные величины аiимеют нормальное распределение. Такое предположение является статистической гипотезой о виде распределения наблюдаемой случайной величины.

          Если для исследуемого явления сформулирована та или иная гипотеза ( обычно ее называют основной или нулевой гипотезой и обозначают символом Но ), то задача состоит в том, чтобы сформулировать правило, которое позволяло бы по результатам наблюдений принять или отклонить эту гипотезу. Правило, согласно которому проверяемая гипотеза Но принимается или отвергается, называется статистическим критерием проверки гипотезы Но .

          Наиболее распространены такие статистические гипотезы, как:

          а) вида распределения;

        б) однородности нескольких серий независимых результатов;

        в) случайности результатов эксперимента и т.п.

          Статистический критерий проверки гипотезы Но служит для определения возможного отклонения от основной гипотезы. Характер отклонений может быть различным. Если критерий ²улавливает²любые отклонения от Но, то такой критерий называют универсальным или критерием согласия. Существуют критерии, которые выявляют отклонения от заданного вида, это узко направленные критерии.

          Выбор правила проверки гипотезы Но эквивалентен заданию критической области х1, при попадании в которую переменной х гипотеза Но отвергается. Критерий, определяемый критической областью х1 называют критерием х1.

          В процессе проверки гипотезы Но можно прийти к правильному решению или совершить ошибку первого рода -отклонить Но когда она верна, или ошибку второго рода -принять Но, когда она ложна. Иными словами, ошибка первого рода имеет место, если точка х попадает в критическую область х1, в то время как верна нулевая гипотеза Но, а ошибка второго рода -когда х Îхо, но гипотеза Но ложна.

          Желательно провести проверку гипотезы так, чтобы свести к минимуму вероятности обоих ошибок. Однако при данном числе испытаний nв общем случае невозможно одновременно обе эти вероятности сделать как угодно малыми. Поэтому наиболее рационально выбирать критическую область следующим образом: при заданном числе испытаний nустанавливается граница для вероятности ошибки первого рода и при этом выбирается та критическая область х1, для которой вероятность ошибки второго рода минимальна.
          2.5. Вероятности ошибок первого и второго рода
          Рассмотрим станок, который может работать только в одном из двух состояний. Если он работает в налаженном режиме, то для интересующего нас признака качества, например, длины или диаметра заготовки, имеет место нормальное распределение при работе как в налаженном так и в разлаженном режиме. Оба режима отличаются только уровнем настройки процесса по математическому ожиданию ( М(х) =10 и 11, соответственно в налаженном и разлаженном режиме ), в то время как дисперсии в обоих случаях составляют s2=4.

          Проверить нужно нулевую гипотезу, в соответствии с которой М(х) =10, против альтернативы ( в данном случае единственной ) М(х) =11. Конкурирующую гипотезу обозначим Н1. Тогда Но: М(х) =10; Н1: М(х) =11.

          Необходимо по результатам выборки определить в каком из состояний работает станок. Примем объем выборки nиз потенциально бесконечной генеральной совокупности. В качестве контрольной величины возьмем выборочное среднее Хn. На рис. 9 изображены плотности распределения Хnдля n = 25 иn = 4.

          Для формулировки критерия необходимо разделить область изменения контрольной величины (х) на критическую область отклонения гипотезы Но ( принятия Н1 ) и область принятия гипотезы Но. Для этого необходимо выбрать число К, такое, что 10 <К <11, и интервал (-¥; К ]рассматривать как область принятия гипотезы Но, а интервал [К; ¥) -как область отклонения гипотезы Но. По рис. 9 видно, что каждая реализация Х25 или Х4 возможна при верности любой из двух гипотез, но с различной вероятностью. На рис. 9 указаны вероятности совершения ошибки первого
Рис. 9. Плотности распределения двух гипотез при различном

                   объеме выборки и одинаковой дисперсии
рода a( отклонения верной гипотезы Но ) и второго рода b( принятие гипотезы Но, когда она не верна ). По рис. 9 также видно, что увеличение nведет к уменьшению дисперсии распределения х и тем самым -к одновременному уменьшению вероятностей aи b. В соответствии с рис. 9 можно записать:
                    <img width=«424» height=«68» src=«ref-1_294883997-835.coolpic» v:shapes="_x0000_i1154">;
                   <img width=«385» height=«68» src=«ref-1_294884832-787.coolpic» v:shapes="_x0000_i1155">.
          Эти два уравнения содержат четыре величины a, b, К, n. Задав две из четырех величин, можно определить две другие.
Например, при n =25 и К =10,4 определим:
                             <img width=«339» height=«57» src=«ref-1_294885619-697.coolpic» v:shapes="_x0000_i1156">;

                             <img width=«408» height=«55» src=«ref-1_294886316-830.coolpic» v:shapes="_x0000_i1157">.

Если задаться величинами aи b, то можно определить величины К, n.
          2.6. Проверка гипотезы вида закона распределения вероятностей
          При проверке эксперимента закон распределения вероятностей случайных величин неизвестен и можно лишь предположительно судить о его виде. Выборочные оценки параметров распределения несут в себе случайные ошибки, искажающие истинный характер распределения. Поэтому после получения эмпирического распределения производится подбор теоретического закона распределения, пригодного для описания вероятностных свойств изучаемой случайной величины. Критерии подбора ( проверки гипотезы соответствия ) называют в статистике критериями согласия. Все они основаны на выборе допустимой меры расхождения между теоретическим распределением и выборочными данными.

          Общую процедуру проверки гипотезы закона распределения можно представить в следующей последовательности:

1. По опытным данным строится эмпирическая кривая распределения вероятностей;

2. Определяются параметры эмпирического распределения ( в соответствии с его видом );

3. Выдвигается одна или несколько гипотез о функции плотности исследуемой случайной величины, исходя из внешнего вида эмпирической кривой, значений ее параметров, технических факторов, влияющих на ее вид;

4. Эмпирическая кривая выравнивается по одной или нескольким теоретическим кривым;

5. Проводится сравнение по одному или нескольким критериям согласия;

6. Выбирается теоретическая функция, дающая наилучшее согласование.

          Поясним п. 4; 5. Определив по эмпирическим данным параметры распределения, подставляют их в теоретическую кривую закона распределения и рассчитывают вероятность середин интервалов эмпирического распределения. Умножив значение полученной вероятности на общее число опытов, получают теоретическое значение частот случайной величины, которые и определяют ²выровненную²кривую. Теперь можно найти вероятность того, что эмпирическая кривая соответствует выбранной теоретической, выбрав вероятность согласия ( уровень значимости ). Если результат расхождения не выйдет за принятый уровень значимости, то считают, что эмпирическое распределение согласуется с теоретическим. Если сравнение осуществляется с несколькими теоретическими законами, то окончательно принимать тот, который дает лучшее соответствие.

          Чаще всего в качестве критериев согласия принимают критерий Пирсона ( c2) и критерий Колмогорова -Смирнова ( К -С -критерий ).

          Критерий c2является наиболее состоятельным при большом числе наблюдений. Он почти всегда опровергает неверную гипотезу, обеспечивает минимальную ошибку в принятии неверной гипотезы по сравнению

с другими критериями.

                                      c2= <img width=«149» height=«91» src=«ref-1_294887146-488.coolpic» v:shapes="_x0000_i1158">,
где mj -наблюдаемая частота случайного события;

     m*j-ожидаемая по принятому теоретическому закону распределения;

     К -число интервалов случайной величины.

Затем определяется число степеней свободы l:
                                                l = К-r -1;
где К -число интервалов случайной величины;

     r-число параметров теоретической функции распределения.

          К -С -критерий лучше всего использовать в случае, если теоретические значения параметров распределения известны. При неизвестных параметрах его можно использовать, но он дает несколько завышенные результаты. При использовании этого критерия определяется величина
                                      <img width=«208» height=«73» src=«ref-1_294887634-403.coolpic» v:shapes="_x0000_i1159">,
где

     mнj, m*нj-соответственно, накопленные наблюдаемые и ожидаемые

          (теоретические) частоты;

     n-число проведенных опытов.

          То есть, в данном случае оценивается только максимальное отклонение накопленной частоты случайного события, возникающее в одном из диапазонов изменения случайной величины. Полученное значение коэффициента сравнивается с табличным для числа степеней свободы опыта и принятого уровня значимости результата. Если табличное значение коэффициента больше, то гипотеза о принятом законе распределения не отвергается.
          Контрольные вопросы
1. Сущность непрерывной и дискретной случайной величины;

2. Сущность интегрального закона распределения случайной величины;

3. Сущность дифференциального закона распределения случайной величины;

4. Связь интегрального и дифференциального законов распределения;

5. Основные характеристики случайной величины, заданной своим распределением;

6. Назовите примеры законов распределения непрерывной и дискретной случайной величины;

7. Понятие статистической гипотезы и статистического критерия;

8. Назовите примеры статистических гипотез;

9. Сущность ошибок первого и второго рода;

10. Сущность проверки гипотезы вида закона распределения;

11. Принципиальное различие в критериях Пирсона и Колмогорова -Смирнова.



3. НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ
          В первой части пособия рассматривались измерения той или иной физической величины, находящейся при проведении серии измерений в неизменном состоянии. Очень часто исследуемая величина меняется в соответствии с изменением условий опыта или времени. Цель эксперимента в этом случае состоит в нахождении функциональной зависимости, которая наилучшим образом описывает изменение интересующего нас параметра.

          Следует понимать, что однозначно восстановить ( большей частью неизвестную ) функциональную зависимость между переменными невозможно даже в том случае, если бы переменные величины, полученные из опыта, не имели бы ошибки измерения. Тем более не следует ожидать, что это удастся сделать, имея экспериментальные данные, содержащие, по крайней мере, случайные ошибки измерений.

          Поэтому математическая обработка результатов наблюдений не может ставить перед собой задачу разгадать истинный характер зависимости между переменными. Она позволяет лишь представить результаты опыта в виде наиболее простой формулы.

          В зависимости от назначения этих формул существуют различные методы их получения, отличающиеся сложностью расчетных процедур и точностью получаемых решений.
3.1. Графический метод обработки результатов
          Графический метод заключается в построении графика зависимости между исследуемыми величинами с последующим определением уравнения зависимости между ними.

          Графики строят прежде всего в равномерных шкалах. Если характер связи между исследуемыми величинами неизвестен, то сначала проверяют совпадение экспериментальных точек с заданной кривой. Если предварительные сведения о характере уравнения отсутствуют, то первым этапом обработки данных является нахождение кривой, совпадающей с опытными точками. Эта задача решается методом подбора. Можно использовать эталон -кальку с предварительно вычерченным на ней семейством кривых с различными параметрами. Естественно, что масштаб кальки и эмпирической кривой должен быть одинаков.

          Построенный по опытным данным отрезок кривой может совпадать с большим количеством различных кривых, проходящих достаточно близко к опытным точкам. В этом случае выбирают кривую с наиболее простым и удобным в использовании уравнением. Иногда эмпирическая кривая может иметь перегибы или состоять из отдельных ярко выраженных участков. Однако при этом необходимо определить координаты точек перехода от одной кривой к другой.

          Уравнение зависимости между исследуемыми величинами при графическом методе просто определяется тогда, когда эмпирические точки достаточно хорошо совпадают с прямой линией, т.е. описываются уравнением y = ax + b, где a, b-коэффициенты, подлежащие определению.

          Определение коэффициентов при графическом методе основано на ²способе натянутой нити². Нанеся результаты эксперимента на график (лучше, если он выполнен на миллиметровке), подбираем графическую прямую, ближе всего подходящую к нанесенным точкам. Выбрав положение прямой, определяем две произвольные точки на этой прямой (не обязательно являющиеся точками эксперимента), определяем их координаты (x1; y1), (х2; y2). И для определения коэффициентов а и bполучаем два простых уравнения
                                                ах1 + b= y1;
                                      ах2 + b = y2.
          На рис. 10 приведена иллюстрация этого метода. Точки -результаты, полученные в эксперименте. Прямая проведена на глаз как можно ближе к экспериментальным точкам. На прямой выбраны точки М (2; 4) и N(13; 10). Коэффициент а характеризует угол наклона прямой.

Поэтому

                   <img width=«405» height=«62» src=«ref-1_294888037-806.coolpic» v:shapes="_x0000_i1160"> продолжение
--PAGE_BREAK--
                    <img width=«451» height=«29» src=«ref-1_294888843-619.coolpic» v:shapes="_x0000_i1161">.
          Таким образом y = 0,55х + 2,9.
Рис. 10. Графический метод интерполяции
          В случае, если экспериментальная зависимость имеет нелинейный характер, то графическим способом в системе координат с равномерными шкалами определить коэффициенты кривой затруднительно. Но достаточно большой класс нелинейных зависимостей путем замены переменных и графического изображения в функциональных шкалах можно привести к линейным и далее использовать способ натянутой нити.
3.2. Функциональные шкалы и их применение
          Пусть функция y = ¦(х) непрерывна и монотонна на некотором промежутке [a; b]. Возьмем ось ОМ, на которой будет строиться шкала, выберем на ней точку начала отсчета О и установим масштаб m. Функциональная шкала строится следующим образом.

          Разбив интервал [а; b]на равные части, вычисляем значение функции ¦(х) в каждой из точек деления и отложим на оси ОМ для каждой точки отрезок m¦(х). Получающаяся при этом точка снабжается отметкой х, т.е. откладывается в выбранном масштабе значение функции, а надписывается значение аргумента.

          Иногда начало шкалы помещают в первую точку отсчета, т.е. точку с надписью а совмещают с 0. Тогда точка х будет находиться в конце отрезка m[¦(х) -¦(а) ]. Полученная шкала позволяет судить о поведении функции на рассматриваемом участке: большие промежутки между отметками укажут, что функция изменяется быстрее, чем там, где эти промежутки малы.

          Выбор масштаба mопределяет длину шкалы. Чаще поступают наоборот: задаются длиной шкалы lи определяют масштаб.

                    <img width=«154» height=«37» src=«ref-1_294889462-377.coolpic» v:shapes="_x0000_i1162">       Þ      m= <img width=«97» height=«66» src=«ref-1_294889839-355.coolpic» v:shapes="_x0000_i1163">.

          Пример. Построим функциональную шкалу для функции y = x2на участке [1; 2 ]. Зададимся длиной шкалы l = 12 см. Тогда                      m=<img width=«101» height=«49» src=«ref-1_294890194-338.coolpic» v:shapes="_x0000_i1164"> см. Разобьем отрезок [1; 2 ]на десять равных частей и вычислим значения функции во всех точках деления. Совместим начало шкалы с точкой отсчета х =1. Результаты расчета сведены в табл. 2, а функциональная шкала приведена на рис. 11.
Таблица 2

Расчет функциональной шкалы y = x2

х

1,0

1,1

1,2

1,3

1,4

1,5

1,6

1,7

1,8

1,9

2,0

х2

1,0

1,21

1,44

1,69

1,96

2,25

2,56

2,89

3,24

3,61

4,00

х2-1

0

0,21

0,44

0,69

0,96

1,25

1,56

1,89

2,24

2,26

3,00

4(х2-1)

0,84

1,76

2,76

3,84

5,00

6,24

7,56

8,94

10,44

12,0

<img width=«3» height=«11» src=«ref-1_294890532-161.coolpic» v:shapes="_x0000_s1039 _x0000_s1040"> <img width=«3» height=«11» src=«ref-1_294890693-153.coolpic» v:shapes="_x0000_s1037"> <img width=«3» height=«12» src=«ref-1_294890846-155.coolpic» v:shapes="_x0000_s1028"> <img width=«2» height=«12» src=«ref-1_294891001-158.coolpic» v:shapes="_x0000_s1029"> <img width=«2» height=«12» src=«ref-1_294891159-158.coolpic» v:shapes="_x0000_s1030"> <img width=«2» height=«12» src=«ref-1_294891317-158.coolpic» v:shapes="_x0000_s1031"> <img width=«3» height=«12» src=«ref-1_294891475-160.coolpic» v:shapes="_x0000_s1032"> <img width=«2» height=«12» src=«ref-1_294891001-158.coolpic» v:shapes="_x0000_s1033"> <img width=«2» height=«12» src=«ref-1_294891159-158.coolpic» v:shapes="_x0000_s1034"> <img width=«2» height=«12» src=«ref-1_294891317-158.coolpic» v:shapes="_x0000_s1035"> <img width=«3» height=«12» src=«ref-1_294891475-160.coolpic» v:shapes="_x0000_s1036">

<img width=«192» height=«3» src=«ref-1_294892269-178.coolpic» v:shapes="_x0000_s1038"><img width=«2» height=«3» src=«ref-1_294892447-150.coolpic» v:shapes="_x0000_s1027"><img width=«381» height=«4» src=«ref-1_294892597-248.coolpic» v:shapes="_x0000_s1026">

             1,0   1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0
Рис. 11. Функциональная шкала y = x2

          С помощью функциональных шкал графики многих функций могут быть преобразованы к прямолинейному виду.

          Например, уравнение параболы y = x2. Если на оси OYнанести равномерную шкалу, а на оси OX1шкалу квадратов х1=х2, то получится сетка, где уравнение параболы имеет изображение прямой линии ( y = x1),

проходящей через начало координат.

          Особенно часто используются различные логарифмические функции, с помощью которых можно ²выпрямлять²графики степенных и показательных функций. Например, y = aebx; lg y = (b lg е) х + lg a. Полагая lg y = y1, lg a = A, b lg e = Bзапишем исходное уравнение в виде y1= А + Вх, откуда видно, что оставив равномерной шкалу х и построив логарифмическую шкалу y1, можно изобразить исходное уравнение прямой линией. Полученная координатная сетка называется полулогарифмической.

          Очевидно, что такого рода преобразования возможны и в более общем случае. Всякая неявная функция, заданная соотношением вида
                   аj(х) + by(y) + с =0,
где a, b, с -постоянные, будет изображаться прямой линией на функциональной сетке, где на оси ОХ построена шкала j(х), а на оси OY-шкала функции y(y). Естественно, что функции j(х) и y(y) должны удовлетворять условиям непрерывности и монотонности. В табл. 3 приведены преобразования для некоторых функций.

                                                                                                    Таблица 3

Линеаризация некоторых функций

Исходная

формула

Преобразованная

формула

Замена

переменных

Линеаризованная формула

y=axb

lg y=b×lgx+lga

lg y=y1

lg x=x1

lg a=a1

y1=bx1+a1

y=a×lgx+b

¾

lg x=x1

y=ax1+b

y=ebx+k

lg y=b×lge×x+k×lge

lg y=y1

b×lg e=a

k×lg e=k1

y1=ax+k1

y=aebx

lg y=bx×lge+lga

lg y=y1

b×lg e=b1

lg a=a1

y1=b1x+a1

y=<img width=«50» height=«49» src=«ref-1_294892845-252.coolpic» v:shapes="_x0000_i1165">

¾

<img width=«68» height=«56» src=«ref-1_294893097-260.coolpic» v:shapes="_x0000_i1166">

y=ax1+b

y=<img width=«60» height=«51» src=«ref-1_294893357-256.coolpic» v:shapes="_x0000_i1167">

<img width=«107» height=«60» src=«ref-1_294893613-320.coolpic» v:shapes="_x0000_i1168">

<img width=«59» height=«52» src=«ref-1_294893933-264.coolpic» v:shapes="_x0000_i1169">

y1=ax+b

y=<img width=«58» height=«49» src=«ref-1_294894197-259.coolpic» v:shapes="_x0000_i1170">

<img width=«85» height=«52» src=«ref-1_294894456-306.coolpic» v:shapes="_x0000_i1171">

<img width=«59» height=«103» src=«ref-1_294894762-321.coolpic» v:shapes="_x0000_i1172">

y1=bx1+a

          Из сказанного ясна роль функциональных сеток при обработке результатов эксперимента. Если результаты эксперимента располагаются вблизи кривой, то по имеющемуся ограниченному участку кривой трудно судить, какого типа функцией ее лучше всего приближать. Переведя полученные экспериментальные данные на функциональные сетки можно оценить на какой из них эти данные ближе всего подходят к прямой и, следовательно, какой функцией лучше всего описываются.
3.3. Аналитические методы обработки результатов
          Графический метод обработки результатов обладает наглядностью, относительной простотой, однако его результаты содержат определенную субъективность и относительно низкую точность.

          Аналитические методы лишены в какой -то степени указанных недостатков и позволяют получить результат для более широкого класса функций с большей точностью, чем графический метод.

          Существуют различные аналитические методы получения параметров эмпирических кривых в зависимости от критерия, принятого при их получении. Рассмотрим некоторые из существующих способов.

3.3.1. Способ средней
          Допустим, что имеется nсочетаний xi, yi, полученных при эксперименте. Даже в том случае, если между х и yтеоретически установлена функциональная связь ( в данном случае предположим, что линейная ), то наблюдаемые значения yiбудут отличаться от ахi+ bвследствие наличия экспериментальных ошибок. Обозначим через Diсоответствующую ошибку
                             Di= yi-axi-b     (i = 1, 2, ..., n)
Если выбирать параметры а и bтак, чтобы для всех n наблюдений ошибки уравновешивались, т.е. <img width=«94» height=«60» src=«ref-1_294895083-332.coolpic» v:shapes="_x0000_i1173">, то это привело бы нас к одному уравнению, тогда как для нахождения двух коэффициентов (а, b) их требуется два. Поэтому предположим, что уравновешивание происходит не только для всех произведенных наблюдений в целом, но и для каждой группы, содержащей половину ( или почти половину ) всех наблюдений в отдельности.

          В этом случае можно прийти к системе уравнений

                             <img width=«214» height=«127» src=«ref-1_294895415-648.coolpic» v:shapes="_x0000_i1174"> ,

где m-число наблюдений в первой группе.

          Данную систему уравнений запишем теперь в виде

                             <img width=«284» height=«131» src=«ref-1_294896063-972.coolpic» v:shapes="_x0000_i1175">.

          Изложенное показывает, что метод средних ²уравновешивает²положительные и отрицательные отклонения теоретической кривой от экспериментальных значений.

          Пример.Используя данные рис. 10 определим коэффициенты а, bметодом средней. Для этого семь измерений разделим на две группы m = 3 первых значений, n -m = 4последующих

<img width=«284» height=«61» src=«ref-1_294897035-542.coolpic» v:shapes="_x0000_i1176">; <img width=«322» height=«58» src=«ref-1_294897577-616.coolpic» v:shapes="_x0000_i1177">;

<img width=«272» height=«60» src=«ref-1_294898193-560.coolpic» v:shapes="_x0000_i1178"> ; <img width=«325» height=«57» src=«ref-1_294898753-633.coolpic» v:shapes="_x0000_i1179">.

          Получаем систему
                                      <img width=«188» height=«67» src=«ref-1_294899386-624.coolpic» v:shapes="_x0000_i1180">
          Решая систему находим
<img width=«434» height=«106» src=«ref-1_294900010-1180.coolpic» v:shapes="_x0000_i1181">;

b= <img width=«402» height=«106» src=«ref-1_294901190-1082.coolpic» v:shapes="_x0000_i1182">
          Таким образом способ средней дает прямую
     y = 0,55х + 3,11.
          В сравнении с графическим способом коэффициенты а совпадают и имеется различие в коэффициенте b.
          3.3.2. Метод наименьших квадратов
          В методе средних при определении коэффициентов уравнения использовалось условие равенства нулю алгебраической суммы отклонений результатов эксперимента от теоретической кривой ( в частном случае прямой ). Очевидно, что при этом Diмогут быть значительной величины. Имеет значение только ²уравновешивание²положительных и отрицательных отклонений.

          Поставим теперь задачу нахождения по результатам наблюдений наиболее вероятные значения неизвестных коэффициентов.

          Предположим, что искомая зависимость y = ¦(х) существует. Тогда параметры этой линии необходимо выбрать таким образом, чтобы точки yiрасполагались по обе стороны кривой y = ¦(х) как можно ближе к последней. Предположим, что разброс точек yiотносительно y = ¦(х) подчиняется закону нормального распределения. Тогда мерой разброса является дисперсия s2или ее приближенное выражение -средний квадрат отклонений.
                         <img width=«377» height=«63» src=«ref-1_294902272-816.coolpic» v:shapes="_x0000_i1183"> продолжение
--PAGE_BREAK--

еще рефераты

Еще работы по математике

Реферат по математике

Разработка схемы маршрута

20 Июня 2015

Реферат по математике

Сетевые модели

3 Сентября 2013

Реферат по математике

Оптимальное планирование работы флота судоходной компании

20 Июня 2015

Реферат по математике

Основные физические формулы

3 Сентября 2013