Лекция: Логарифмически нормальное распределение.
Случайная переменная Y имеет логарифмически нормальное распределение с параметрами μ и σ, если случайная переменная X = lnY имеет нормальное распределение с теми же параметрами μ и σ. Зная характер связи между переменными X и Y, можем легко построить график плотности вероятности случайной переменной с логарифмически нормальным распределением
Рисунок 4.2 – Кривые плотности логарифмически нормального распределения при различных значениях параметров μ и σ
Если случайная переменная X имеет функцию плотности вероятности, определяемую формулой (4.6), и если X = lnY, то:
, откуда имеем для у > 0:
(4.14)
Из определения следует, что случайная переменная, подчиняющаяся логарифмически нормальному распределению, может принимать только положительные значения. Как показано на рисунке 4.2, кривые функции f(y) имеют левостороннюю асимметрию, которая тем сильнее, чем больше значения параметров μ и σ. Каждая кривая имеет один максимум и является определенной для всех положительных значений у. Вычисление математического ожидания и дисперсии случайной переменной с логарифмически нормальным распределением не составляет особых трудностей:
(4.15)
(4.16)
(4.17)
Путем подстановок и ввода новых переменных в интегралах 4.15 и 4.16 получим:
(4.18)
(4.19)
Пример
Вычислим вероятность того, что случайная переменная с логарифмически распределением μ = 1, σ = 0,5, примет значение в интервале (2, 5). Имеем:
Из таблиц логарифмов находим ln2 = 0,6932 и ln5 = 1,6094.
Обозначив lnY = X, можем написать:
Причем случайная переменная X подчинена нормальному распределению со средним значением μ = 1 и стандартным отклонением σ = 0,5. Теперь искомую вероятность нетрудно вычислить по таблицам интегральной функции нормального распределения:
2. Ошибка коэффициента корреляции.
Как и всякая выборочная величина, коэффициент корреляции имеет свою ошибку репрезентативности, вычисляемую для больших выборок по формуле:
, (11.7)
где – коэффициент корреляции в генеральной совокупности, из которой взята выборка;
n – численность выборки, т. е. число пар значений, по которым вычислялся выборочный коэффициент корреляции.
Поскольку в числителе формулы ошибки выборочного коэффициента корреляции стоит квадрат генерального коэффициента корреляции, то эта формула может применяться лишь в исключительных случаях, когда заранее известна или предполагается степень корреляции в генеральной совокупности.
БИЛЕТ14
1. t-распределение Стьюдента. F-распределение Фишера-Снедекора, χ2-распределение
Закон нормального распределения проявляется при числе признаков n > 20–30. Однако экспериментатор часто проводит ограниченное число измерений, основывает свои выводы на малых выборках. При небольшом числе наблюдений результаты обычно близки и редко появляются большие отклонения. Это легко объяснить законом нормального распределения, согласно которому вероятность появления малых отклонений больше, чем отклонений значительных. Так, вероятность отклонений, превышающих по абсолютной величине ±2σ, равна 0,05, или один случай на 20 измерений, а отклонений ± 3σ – 0,01, или один случай на 100. С начала XX века в математической статистике стало разрабатываться новое направление, которое можно назвать статистикой малых выборок. Наибольшее практическое значение для экспериментальной работы имело открытое в 1908 г. английским статистиком и химиком В. Распределение t Стьюдента для выборочных средних определяется равенством:
(5.1)
Числитель формулы означает отклонение выборочной средней от средней всей совокупности, а знаменатель:
– является показателем, оценивающим величину стандартной ошибки средней выборочной совокупности.
Таким образом, величина t измеряется отклонением выборочной средней от средней совокупности, выраженным в долях ошибки выборки, принятой за единицу. Максимумы частоты нормального и t-распределения совпадают, но форма кривой t-распределения всецело зависит от числа степеней свободы. При очень малых значениях степеней свободы она принимает вид плосковершинной кривой, причем площадь, отграниченная кривой, больше, чем при нормальном распределении, а при увеличении числа наблюдений (n > 30) распределение t приближается к нормальному и переходит в него при n = ∞.
Фишер -Если из нормально распределенной совокупности взять две независимые выборки объемом n1 и n2 и подсчитать дисперсии и со степенями свободы ν1 = n –1 и ν2 = n2–1, то можно определить отношение дисперсий:
(5.2)
Отношение дисперсий берут таким, чтобы в числителе была большая дисперсия, и поэтому F ≥ 1. Распределение F зависит только от числа степеней свободы ν1 и ν2 (закон F-распределения открыл Р.А. Фи шер). Когда две сравниваемые выборки являются случайными независимыми из общей совокупности с генеральной средней, то фактическое значение F не выйдет за определенные пределы и не превысит критическое для данных ν1 и ν2 теоретическое значение критерия F (Fфакт < Fтеор). Если генеральные параметры сравниваемых групп различны, то Fфакт > Fтеор. Теоретические значения F для 5%-ного и 1%-ного уровня значимости даны в таблице, где табулированы только правые критические точки для F ≥ 1, так как всегда принято находить отношение большей дисперсии к меньшей.
X2 -Многие фактические распределения соответствуют моделям теоретических распределений (нормальное, биномиальное, Пуассона) Однако, на практике существуют распределения, сильно отличающиеся от нормального. Для оценки степени расхождения или степени согласия между численностями фактического и теоретического распределений вводятся статистические критерии согласия, например критерий χ2. Этот критерий применяется для решения задач статистического анализа, например для проверки гипотез: о независимости двух принципов, положенных в основу группировки результатов наблюдений из одной совокупности; об однородности групп в отношении некоторых определяемых характеристик; о согласии теоретической и экспериментальной кривых численностей. Критерий χ2 может называться как критерием согласия, так и критерием независимости, критерием однородности. Закон распределения χ2 (хи–квадрат) открыл К. Пирсон. Кривая распределения, полученная из функции хи–квадрат:
(5.4)
где f – фактические и F – теоретические частоты численности объектов выборки. Ее вид в сильной степени зависит от числа степеней свободы. Для малого числа степеней свободы ν кривая асимметрична, но с увеличением ν асимметрия уменьшается и при ν = ∞ кривая становится нормальной гауссовой.