Реферат: Планирование эксперимента

1.История возникновенияпланирования эксперимента

Планированиеэксперимента – продукт нашего времени, однако истоки его теряются в глубиневеков.

Истокипланирования эксперимента уходят в глубокую древность и связаны с числовоймистикой, пророчествами и суевериями.

Этособственно не планирование физического эксперимента, а планирование числовогоэксперимента, т.е. расположение чисел так, чтобы выполнялись некоторые строгиеусловия, например, на равенство сумм по строкам, столбцам и диагоналямквадратной таблицы, клеточки которой заполнены числами натурального ряда.

Такие условиявыполняются в магических квадратах, которым, по-видимому, принадлежит первенствов планировании эксперимента.

Согласноодной легенде примерно в 2200 г. до н.э. китайский император Ю выполнялмистические вычисления с помощью магического квадрата, который был изображен напанцире божественной черепахи.

Квадратимператора Ю

4 9 2

3 5 7

8 1 6

Клетки этогоквадрата заполнены числами от 1 до 9, и суммы чисел по строкам, столбцам иглавным диагоналям равны 15.

В 1514 г.немецкий художник Альбрехт Дюрер изобразил магический квадрат в правом углусвоей знаменитой гравюры-аллегории «Меланхолия». Два числа в нижнемгоризонтальном ряду A5 и 14) составляют год создания гравюры. В этом состоялосвоеобразное «приложение» магического квадрата.

КвадратДюрера

16 3 2 13

5 10 11 8

9 6 7 12

4 15 14 1

В течениенескольких веков построение магических квадратов занимало умы индийских,арабских, немецких, французских математиков.

В настоящеевремя магические квадраты используются при планировании эксперимента в условияхлинейного дрейфа, при планировании экономических расчетов и составлениирационов питания, в теории кодирования и т.д.

Построениемагических квадратов является задачей комбинаторного анализа, основы которого вего современном понимании заложены Г. Лейбницем. Он не только рассмотрел ирешил основные комбинаторные задачи, но и указал на большое практическоеприменение комбинаторного анализа: к кодированию и декодированию, к играм истатистике, к логике изобретений и логике геометрии, к военному искусству,грамматике, медицине, юриспруденции, технологии и к комбинации наблюдений.Последняя область применения наиболее близка к планированию эксперимента.

Одной изкомбинаторных задач, имеющей прямое отношение к планированию эксперимента,занимался известный петербургский математик Л. Эйлер. В 1779 г. онпредложил задачу о 36 офицерах как некоторый математический курьез.

Он поставилвопрос, можно ли выбрать 36 офицеров 6 рангов из 6 полков по одному офицерукаждого ранга от каждого полка и расположить их в каре так, чтобы в каждом рядуи в каждой шеренге было бы по одному офицеру каждого ранга и по одному откаждого полка. Задача эквивалентна построению парных ортогональных 6x6квадратов. Оказалось, что эту задачу решить невозможно. Эйлер высказалпредположение, что не существует пары ортогональных квадратов порядка п=1 (mod4).

ЗадачейЭйлера, в частности, и латинскими квадратами вообще занимались впоследствиимногие математики, однако почти никто из них не задумывался над практическимприменением латинских квадратов.

В настоящеевремя латинские квадраты являются одним из наиболее популярных способов ограниченияна рандомизацию при наличии источников неоднородностей дискретного типа впланировании эксперимента. Группировка элементов латинского квадрата, благодарясвоим свойствам (каждый элемент появляется один и только один раз в каждойстроке и в каждом столбце квадрата), позволяет защитить главные эффекты отвлияния источника неоднородностей. Широко используются латинские квадраты и каксредство сокращения перебора в комбинаторных задачах.

Возникновениесовременных статистических методов планирования эксперимента связано с именем Р. Фишера.

С 1918 г.он начал свою известную серию работ на Рочемстедской агробиологической станциив Англии. В 1935 г. появилась его монография «Design of Experiments»,давшая название всему направлению.

Среди методовпланирования первым был дисперсионный анализ (кстати, Фишеру принадлежит итермин «дисперсия»). Фишер создал основы этого метода, описав полныеклассификации дисперсионного анализа (однофакторный и многофакторныйэксперименты) и неполные классификации дисперсионного анализа без ограничения ис ограничением на рандомизацию. При этом он широко использовал латинскиеквадраты и блок-схемы. Вместе с Ф. Йетсом он описал их статистическиесвойства. В 1942 г. А. Кишен рассмотрел планирование по латинскимкубам, которое явилось дальнейшим развитием теории латинских квадратов.

Затем Р.Фишер независимо опубликовал сведения об ортогональных гипер-греко-латинскихкубах и гипер-кубах. Вскоре после этого 1946–1947 гг.) Р. Раорассмотрел их комбинаторные свойства. Дальнейшему развитию теории латинскихквадратов посвящены работы X. Манна A947–1950 гг.).

ИсследованияР. Фишера, проводившиеся в связи с работами по агробиологии, знаменуют началопервого этапа развития методов планирования эксперимента. Фишер разработалметод факторного планирования. Йегс предложил для этого метода простуювычислительную схему. Факторное планирование получило широкое распространение.Особенностью полного факторного эксперимента является необходимость ставитьсразу большое число опытов.

В 1945 г.Д. Финни ввел дробные реплики от факторного эксперимента. Это позволилорезко сократить число опытов и открыло дорогу техническим приложениямпланирования. Другая возможность сокращения необходимого числа опытов былапоказана в 1946 г. Р. Плакеттом и Д. Берманом, которые ввелинасыщенные факторные планы.

В 1951 г.работой американских ученых Дж. Бокса и К. Уилсона начался новый этапразвития планирования эксперимента.

Эта работаподытожила предыдущие. В ней ясно сформулирована и доведена до практическихрекомендаций идея последовательного экспериментального определения оптимальныхусловий проведения процессов с использованием оценки коэффициентов степенныхразложений методом наименьших квадратов, движения по градиенту и отысканияинтерполяционного полинома (степенного ряда) в области экстремума функцииотклика («почти стационарной» области).

В 1954–1955 гг.Дж. Бокс, а затем Дж. Бокс и П. Юл показали, что планированиеэксперимента можно использовать при исследовании физико-химических механизмовпроцессов, если априори высказаны одна или несколько возможных гипотез. Здесьпланирование эксперимента пересекалось с исследованиями по химической кинетике.Интересно отметить, что кинетику можно рассматривать как метод описанияпроцесса с помощью дифференциальных уравнений, традиции которого восходят к И. Ньютону.Описание процесса дифференциальными уравнениями, называемое детерминистическим,нередко противопоставляется статистическим моделям.

Бокс и Дж. Хантерсформулировали принцип ротатабельности для описания «почти стационарной»области, развивающейся в настоящее время в важную ветвь теории планированияэксперимента. В той же работе показана возможность планирования с разбиением наортогональные блоки, указанная ранее независимо де Бауном.

Дальнейшимразвитием этой идеи было планирование, ортогональное к неконтролируемомувременному дрейфу, которое следует рассматривать как важное открытие вэкспериментальной технике – значительное увеличение возможностейэкспериментатора.


2. Математическоепланирование эксперимента в научных исследованиях

 

2.1Основные понятия и определения

Подэкспериментом будем понимать совокупность операций совершаемых над объектомисследования с целью получения информации о его свойствах. Эксперимент, вкотором исследователь по своему усмотрению может изменять условия егопроведения, называется активным экспериментом. Если исследователь не можетсамостоятельно изменять условия его проведения, а лишь регистрирует их, то этопассивный эксперимент.

Важнейшейзадачей методов обработки полученной в ходе эксперимента информации являетсязадача построения математической модели изучаемого явления, процесса, объекта.Ее можно использовать и при анализе процессов и при проектировании объектов.Можно получить хорошо аппроксимирующую математическую модель, если целенаправленноприменяется активный эксперимент. Другой задачей обработки полученной в ходеэксперимента информации является задача оптимизации, т.е. нахождения такойкомбинации влияющих независимых переменных, при которой выбранный показательоптимальности принимает экстремальное значение.

Опыт – этоотдельная экспериментальная часть.

Планэксперимента – совокупность данных определяющих число, условия и порядокпроведения опытов.

Планированиеэксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям,совокупность действий направленных на разработку стратегии экспериментирования(от получения априорной информации до получения работоспособной математическоймодели или определения оптимальных условий). Это целенаправленное управлениеэкспериментом, реализуемое в условиях неполного знания механизма изучаемогоявления.

В процессеизмерений, последующей обработки данных, а также формализации результатов ввиде математической модели, возникают погрешности и теряется часть информации,содержащейся в исходных данных. Применение методов планирования экспериментапозволяет определить погрешность математической модели и судить о ееадекватности. Если точность модели оказывается недостаточной, то применениеметодов планирования эксперимента позволяет модернизировать математическуюмодель с проведением дополнительных опытов без потери предыдущей информации и сминимальными затратами.

Цельпланирования эксперимента – нахождение таких условий и правил проведения опытовпри которых удается получить надежную и достоверную информацию об объекте снаименьшей затратой труда, а также представить эту информацию в компактной иудобной форме с количественной оценкой точности.

Пустьинтересующее нас свойство (Y) объекта зависит от нескольких (n)независимых переменных (Х1, Х2, …, Хn)и мы хотим выяснить характер этой зависимости – Y=F(Х1, Х2,…, Хn), о которой мы имеем лишь общее представление. Величина Y– называется «отклик», а сама зависимость Y=F(Х1, Х2,…, Хn) – «функция отклика».

Отклик долженбыть определен количественно. Однако могут встречаться и качественные признаки Y.В этом случае возможно применение рангового подхода. Пример рангового подхода –оценка на экзамене, когда одним числом оценивается сложный комплекс полученныхсведений о знаниях студента.

Независимыепеременные Х1, Х2, …, Хn – иначефакторы, также должны иметь количественную оценку. Если используютсякачественные факторы, то каждому их уровню должно быть присвоено какое-либочисло. Важно выбирать в качестве факторов лишь независимые переменные, т.е.только те которые можно изменять, не затрагивая другие факторы. Факторы должныбыть однозначными. Для построения эффективной математической моделицелесообразно провести предварительный анализ значимости факторов (степенивлияния на функцию), их ранжирование и исключить малозначащие факторы.

Диапазоныизменения факторов задают область определения Y. Если принять, чтокаждому фактору соответствует координатная ось, то полученное пространствоназывается факторным пространством. При n=2 область определения Yпредставляется собой прямоугольник, при n=3 – куб, при n >3 – гиперкуб.

При выборедиапазонов изменения факторов нужно учитывать их совместимость, т.е.контролировать, чтобы в этих диапазонах любые сочетания факторов были быреализуемы в опытах и не приводили бы к абсурду. Для каждого из факторовуказывают граничные значения

/>, i=1,… n.

Регрессионныйанализ функции отклика предназначен для получения ее математической модели ввиде уравнения регрессии

/>,

где В1,…, Вm – некоторые коэффициенты; е – погрешность.

Средиосновных методов планирования, применяемых на разных этапах исследования,используют:

·          планированиеотсеивающего эксперимента, основное значение которого выделение из всейсовокупности факторов группы существенных факторов, подлежащих дальнейшемудетальному изучению;

·          планированиеэксперимента для дисперсионного анализа, т.е. составление планов для объектов скачественными факторами;

·          планированиерегрессионного эксперимента, позволяющего получать регрессионные модели(полиномиальные и иные);

·          планированиеэкстремального эксперимента, в котором главная задача – экспериментальнаяоптимизация объекта исследования;

·          планированиепри изучении динамических процессов и т.д.

Инициаторомприменения планирования эксперимента является Рональд А. Фишер, другой авторизвестных первых работ – Френк Йетс. Далее идеи планирования экспериментаформировались в трудах Дж. Бокса, Дж. Кифера. В нашей стране – втрудах Г.К. Круга, Е.В. Маркова и др.

В настоящеевремя методы планирования эксперимента заложены в специализированных пакетах,широко представленных на рынке программных продуктов, например: StatGrapfics,Statistica, SPSS, SYSTAT и др.

2.2Представление результатов экспериментов

Прииспользовании методов планирования эксперимента необходимо найти ответы на 4вопроса:

·          Какиесочетания факторов и сколько таких сочетаний необходимо взять для определенияфункции отклика?

·          Какнайти коэффициенты В0, В1, …, Bm?

·          Какоценить точность представления функции отклика?

·          Какиспользовать полученное представление для поиска оптимальных значений Y?

Геометрическоепредставление функции отклика в факторном пространстве Х1, Х2,…, Хn называется поверхностью отклика (рис. 1).


/>

Рис. 1.Поверхность отклика

Еслиисследуется влияние на Y лишь одного фактора Х1, тонахождение функции отклика – достаточно простая задача. Задавшись несколькимизначениями этого фактора, в результате опытов получаем соответствующие значенияY и график Y =F(X) (рис. 2).

/>

Рис. 2.Построение функции отклика одной переменной по опытным данным

По его видуможно подобрать математическое выражение функции отклика. Если мы не уверены,что опыты хорошо воспроизводятся, то обычно опыты повторяют несколько раз иполучают зависимость с учетом разброса опытных данных.

Если факторовдва, то необходимо провести опыты при разных соотношениях этих факторов.Полученную функцию отклика в 3х-мерном пространстве (рис. 1)можно анализировать, проводя ряд сечений с фиксированными значениями одного изфакторов (рис. 3). Вычлененные графики сечений можно аппроксимироватьсовокупностью математических выражений.

/>

Рис. 3.Сечения поверхности отклика при фиксированных откликах (а) и переменных (б, в)

При трех иболее факторах задача становится практически неразрешимой. Если и будут найденырешения, то использовать совокупность выражений достаточно трудно, а часто и нереально.

2.3Применение математического планирования эксперимента в научных исследованиях

В современнойматематической теории оптимального планирования эксперимента существует 2основных раздела:

1.        планированиеэксперимента для изучения механизмов сложных процессов и свойств многокомпонентныхсистем.

2.        планированиеэксперимента для оптимизации технологических процессов и свойствмногокомпонентных систем.

Планированиеэксперимента – это выбор числа опытов и условий их проведения необходимых идостаточных для решения поставленной задачи с требуемой точностью.

Эксперимент,который ставится для решений задач оптимизации, называется экстремальным.Примерами задач оптимизации являются выбор оптимального составамногокомпонентных смесей, повышение производительности действующей установки,повышение качества продукции и снижение затрат на её получение. Прежде чемпланировать эксперимент необходимо сформулировать цель исследования. От точнойформулировки цели зависит успех исследования. Необходимо также удостовериться,что объект исследования соответствует предъявляемым ему требованиям. Втехнологическом исследовании целью исследования при оптимизации процесса чащевсего является повышение выхода продукта, улучшение качества, снижениесебестоимости.

Экспериментможет проводиться непосредственно на объекте или на его модели. Модельотличается от объекта не только масштабом, а иногда природой. Если модельдостаточно точно описывает объект, то эксперимент на объекте может бытьперенесён на модель. Для описания понятия «объект исследования» можно использоватьпредставление о кибернетической системе, которая носит название чёрный ящик.

/>

/>


Стрелкисправа изображают численные характеристики целей исследования и называются выходнымипараметрами (y) или параметрами оптимизации.

Дляпроведения эксперимента необходимо воздействовать на поведение чёрного ящика.Все способы воздействия обозначаются через «x» и называются входнымипараметрами или факторами. Каждый фактор может принимать в опытеодно из нескольких значений, и такие значения называются уровнями.Фиксированный набор уровней и факторов определяет одно из возможных состоянийчёрного ящика, одновременно они являются условиями проведения одного извозможных опытов. Результаты эксперимента используются для полученияматематической модели объекта исследования. Использование для объекта всехвозможных опытов приводит к абсурдно большим экспериментам. В связи с этимэксперименты необходимо планировать.

Задачейпланирования является выбор необходимых для эксперимента опытов, методовматематической обработки их результатов и принятия решений. Частный случай этойзадачи – планирование экстремального эксперимента. То есть экспериментапоставленного с целью поиска оптимальных условий функционирования объекта.Таким образом, планирование экстремального эксперимента – это выбор количестваи условий проведения опытов, минимально необходимых для отыскания оптимальныхусловий. При планировании эксперимента объект исследования должен обладатьобязательными свойствами:

1. управляемым

2. результаты экспериментадолжны быть воспроизводимыми.

Экспериментназывается воспроизводимым, если при фиксированныхусловиях опыта получается один и тот же выход в пределах заданной относительнонебольшой ошибки эксперимента (2%-5%). Эксперимент проводят при выборенекоторых уровней для всех факторов, затем он повторяется через неравныепромежутки времени. И значения параметров оптимизации сравниваются. Разбросэтих параметров характеризует воспроизводимость результатов. Если он непревышает заранее заданной величины, то объект удовлетворяет требованиювоспроизводимости результатов.

Припланировании эксперимента активное вмешательство предполагает процесс ивозможность выбора в каждом опыте тех факторов, которые представляют интерес.Экспериментальное исследование влияния входных параметров (факторов) навыходные может производиться методом пассивного или активного эксперимента.Если эксперимент сводится к получению результатов наблюдения за поведениесистемы при случайных изменениях входных параметров, то он называется пассивным.Если же при проведении эксперимента входные параметры изменяются по заранеезаданному плану, то такой эксперимент называется активным.Объект, на котором возможен активный эксперимент, называется управляемым.На практике не существует абсолютно управляемых объектов. На реальный объектобычно действуют как управляемый, так и неуправляемый факторы. Неуправляемыефакторы действуют на воспроизводимость эксперимента. Если все факторынеуправляемы, возникает задача установления связи между параметром оптимизациии факторами по результатам наблюдений или по результатам пассивногоэксперимента. Возможна также плохая воспроизводимость изменения факторов вовремени.


3.Параметры оптимизации

 

3.1 Видыпараметров оптимизации

Параметроптимизации – это признак, по которому мы хотим оптимизировать процесс. Ондолжен быть количественным, задаваться числом. Множество значений, которыеможет принимать параметр оптимизации, называется областью его определения.Области определения могут быть непрерывными и дискретными, ограниченными инеограниченными. Например, выход реакции – это параметр оптимизации снепрерывной ограниченной областью определения. Он может изменяться в интервалеот 0 до 100%. Число бракованных изделий, число кровяных телец в пробе крови – вотпримеры параметров с дискретной областью определения, ограниченной снизу.

В зависимостиот объекта и цели исследования параметры оптимизации могут быть весьмаразнообразными (рис. 1).

Прокомментируемнекоторые элементы схемы. Экономические параметры оптимизации, такие, какприбыль, себестоимость и рентабельность, обычно используются при исследованиидействующих промышленных объектов, тогда как затраты на эксперимент имеет смыслоценивать в любых исследованиях, в том числе и лабораторных. Если цена опытоводинакова, затраты на эксперимент» пропорциональны числу опытов, которыенеобходимо поставить для решения данной задачи. Это в значительной мереопределяет выбор плана эксперимента.

Средитехнико-экономических параметров наибольшее распространение имеетпроизводительность. Такие параметры, как долговечность, надежность истабильность, связаны с длительными наблюдениями. Имеется некоторый опыт ихиспользования при изучении дорогостоящих ответственных объектов, напримеррадиоэлектронной аппаратуры.

Почти во всехисследованиях приходится учитывать количество и качество получаемого продукта.Как меру количества продукта используют выход, например, процент выхода готовойпродукции.

Показателикачества чрезвычайно разнообразны. В нашей схеме они сгруппированы по видамсвойств. Характеристики количества и качества продукта образуют группутехнико-технологических параметров.

В группе«прочие» сгруппированы различные параметры, которые реже встречаются, но неявляются менее важными. Сюда попали статистические параметры, используемые дляулучшения характеристик случайных величин или случайных функций.

3.2Требования к параметру оптимизации

 

Параметроптимизации – это признак, по которому мы хотим оптимизировать процесс. Ондолжен быть количественным, задаваться числом. Мы должны уметь его измерять прилюбой возможной комбинации выбранных уровней факторов. Множество значений,которые может принимать параметр оптимизации, будем называть областью егоопределения. Области определения могут быть непрерывными и дискретными,ограниченными и неограниченными. Например, выход реакции – это параметроптимизации с непрерывной ограниченной областью определения. Он можетизменяться в интервале от 0 до 100%. Число бракованных изделий, число зерен нашлифе сплава, число кровяных телец в пробе крови – вот примеры параметров сдискретной областью определения, ограниченной снизу.

Уметьизмерять параметр оптимизации – это значит располагать подходящим прибором. Вряде случаев такого прибора может не существовать или он слишком дорог. Еслинет способа количественного измерения результата, то приходится воспользоватьсяприемом, называемым ранжированием (ранговым подходом). При этом параметрамоптимизации присваиваются оценки – ранги по заранее выбранной шкале:двухбалльной, пятибалльной и т.д. Ранговый параметр имеет дискретнуюограниченную область определения. В простейшем случае область содержит двазначения (да, нет; хорошо, плохо). Это может соответствовать, например, годнойпродукции и браку.

Ранг – этоколичественная оценка параметра оптимизации, но она носит условный(субъективный) характер. Мы ставим в соответствие качественному признакунекоторое число – ранг. Для каждого физически измеряемого параметра оптимизацииможно построить ранговый аналог. Потребность в построении такого аналогавозникает, если имеющиеся в распоряжении исследователя численные характеристикинеточны или неизвестен способ построения удовлетворительных численных оценок.При прочих равных условиях всегда нужно отдавать предпочтение физическомуизмерению, так как ранговый подход менее чувствителен и с его помощью трудноизучать тонкие эффекты.

Пример:Технолог разработал новый вид продукта. Вам необходимо оптимизировать этотпроцесс.

Цель процесса– получение вкусного продукта, но такая формулировка цели еще не даетвозможности приступить к оптимизации: необходимо выбрать количественныйкритерий, характеризующий степень достижения цели. Можно принять следующеерешение: очень вкусный продукт получает отметку 5, просто вкусный продукт – отметку4 и т.д.

Можно липосле такого решения переходить к оптимизации процесса? Нам важно количественнооценить результат оптимизации. Решает ли отметка эту задачу? Конечно, потомучто, как мы договорились, отметка 5 соответствует очень вкусному продукту ит.д. Другое дело, что этот подход, называемый ранговым, часто оказываетсягрубым, нечувствительным. Но возможности такой количественной оценкирезультатов не должна вызывать сомнений.

Следующеетребование: параметр оптимизации должен выражаться одним числом. Например:регистрация показания прибора.

Еще однотребование, связанное с количественной природой параметра оптимизации, – однозначностьв статистическом смысле. Заданному набору значений факторов должносоответствовать одно с точностью до ошибки эксперимента значение параметраоптимизации. (Однако обратное неверно: одному и тому же значению параметрамогут соответствовать разные наборы значений факторов.)

Для успешногодостижения цели исследования необходимо, чтобы параметр оптимизациидействительно оценивал эффективность функционирования системы в заранеевыбранном смысле. Это требование является главным, определяющим корректностьпостановки задачи.

Представлениеоб эффективности не остается постоянным в ходе исследования. Оно меняется помере накопления информации и в зависимости от достигнутых результатов. Этоприводит к последовательному подходу при выборе параметра оптимизации. Так,например, на первых стадиях исследования технологических процессов в качествепараметра оптимизации часто используется выход продукта. Однако в дальнейшем,когда возможность повышения выхода исчерпана, нас начинают интересовать такиепараметры, как себестоимость, чистота продукта и т.д.

Говоря обоценке эффективности функционирования системы, важно помнить, что речь идет осистеме в целом. Часто система состоит из ряда подсистем, каждая из которыхможет оцениваться своим локальным параметром оптимизации.

Следующеетребование к параметру оптимизации – требование универсальности или полноты.Под универсальностью параметра оптимизации понимается его способностьвсесторонне характеризовать объект. В частности, технологические параметрыоптимизации недостаточно универсальны: они не учитывают экономику.Универсальностью обладают, например, обобщенные параметры оптимизации, которыестроятся как функции от нескольких частных параметров.

Желательно,чтобы параметр оптимизации имел физический смысл, был простым и легковычисляемым.

Требованиефизического смысла связано с последующей интерпретацией результатовэксперимента.

Такимобразом, параметр оптимизации должен быть:

– эффективнымс точки зрения достижения цели;

– универсальным;

– количественными выражаться одним числом;

– статистическиэффективным;

– имеющимфизический смысл, простым и легко вычисляемым.

В техслучаях, когда возникают трудности с количественной оценкой параметровоптимизации, приходится обращаться к ранговому подходу. В ходе исследованиямогут меняться априорные представления об объекте исследования, что приводит кпоследовательному подходу при выборе параметра оптимизации.

Из многихпараметров, характеризующих объект исследования, только один, часто обобщенный,может служить параметром оптимизации. Остальные рассматриваются какограничения.


4. Факторыоптимизации

 

4.1Определение фактора

Фактором называется измеряемаяпеременная величина, принимающая в некоторый момент времени определенноезначение. Факторы соответствуют способам воздействия на объект исследования.

Так же, как ипараметр оптимизации, каждый фактор имеет область определения. Фактор считаютзаданным, если вместе с его названием указана область его определения.

Под областьюопределения понимается совокупность всех значений, которые в принципе можетпринимать данный фактор.

Совокупностьзначений фактора, которая используется в эксперименте, является подмножествомиз множества значений, образующих область определения. Область определенияможет быть непрерывной и дискретной. Однако в основном, в задачах планированияэксперимента, используются дискретные области определения. Так, для факторов снепрерывной областью определения, таких, как температура, время, количествовещества и т.п., всегда выбираются дискретные множества уровней.

Впрактических задачах области определения факторов, как правило, ограничены.Ограничения могут носить принципиальный либо технический характер.

Факторыклассифицируют в зависимости от того, является ли фактор переменной величиной,которую можно оценивать количественно: измерять, взвешивать, титровать и т.п.,или же он – некоторая переменная, характеризующаяся качественными свойствами.

Факторыразделяются на количественные и качественные.

Качественныефакторы –это разные вещества, разные технологические способы, аппараты, исполнители и т.д.

Хотякачественным факторам не соответствует числовая шкала в том смысле, как этопонимается для количественных факторов, однако можно построить условнуюпорядковую шкалу, которая ставит в соответствие уровням качественного факторачисла натурального ряда, т.е. производит кодирование. Порядок уровней можетбыть произволен, но после кодирования он фиксируется.

Качественнымфакторам не соответствует числовая шкала, и порядок уровней факторов не играетроли.

Времяреакции, температура, концентрация реагирующих веществ, скорость подачивеществ, величина рН – это примеры наиболее часто встречающихся количественныхфакторов. Различные реагенты, адсорбенты, вулканизующие агенты, кислоты,металлы являются примером уровней качественных факторов.

 

4.2Требования, предъявляемые к факторам при планировании эксперимента

Припланировании эксперимента факторы должны быть управляемыми. Это значит, чтоэкспериментатор, выбрав нужное значение фактора, может его поддерживатьпостоянным в течение всего опыта, т.е. может управлять фактором. Планироватьэксперимент можно только в том случае, если уровни факторов подчиняются волеэкспериментатора.

Пример: Выизучаете процесс синтеза аммиака. Колонна синтеза установлена на открытойплощадке. Является ли температура воздуха фактором, который можно включить впланирование эксперимента?

Температуравоздуха – фактор неуправляемый. Мы еще не научились делать погоду по заказу. Ав планировании могут участвовать только те факторы, которыми можно управлять, –устанавливать и поддерживать на выбранном уровне в течение опыта или менять позаданной программе. Температурой окружающей среды в данном случае управлятьневозможно. Ее можно только контролировать.

Чтобы точноопределить фактор, нужно указать последовательность действий (операций), спомощью которых устанавливаются его конкретные значения (уровни). Такоеопределение фактора будем называть операциональным. Так, если фактором являетсядавление в некотором аппарате, то совершенно необходимо указать, в какой точкеи с помощью какого прибора оно измеряется и как оно устанавливается. Введениеоперационального определения обеспечивает однозначное понимание фактора.

Соперациональным определением связаны выбор размерности фактора и точность егофиксирования.

Точностьзамера факторов должна быть возможно более высокой. Степень точностиопределяется диапазоном изменения факторов. При изучении процесса, которыйдлится десятки часов, нет необходимости учитывать доли минуты, а в быстрыхпроцессах необходимо учитывать, быть может, доли секунды.

Факторыдолжны быть непосредственными воздействиями на объект. Факторы должны бытьоднозначны. Трудно управлять фактором, который, является функцией другихфакторов. Но в планировании могут участвовать сложные факторы, такие, каксоотношения между компонентами, их логарифмы и т.п.

Припланировании эксперимента обычно одновременно изменяется несколько факторов.Поэтому очень важно сформулировать требования, которые предъявляются ксовокупности факторов. Прежде всего выдвигается требование совместимости.Совместимость факторов означает, что все их комбинации осуществимы и безопасны.Это очень важное требование.

Припланировании эксперимента важна независимость факторов, т.е. возможностьустановления фактора на любом уровне вне зависимости от уровней других факторов.Если это условие невыполнимо, то невозможно планировать эксперимент.

Такимобразом, установили, что факторы – это переменные величины, соответствующиеспособам воздействия внешней среды на объект.

Ониопределяют как сам объект, так и его состояние. Требования к факторам:управляемость и однозначность.

Управлятьфактором – это значит установить нужное значение и поддерживать его постояннымв течение опыта или менять по заданной программе. В этом состоит особенность«активного» эксперимента. Планировать эксперимент можно только в том случае,если уровни факторов подчиняются воле экспериментатора.

Факторыдолжны непосредственно воздействовать на объект исследования.

Требования ксовокупности факторов: совместимость и отсутствие линейной корреляции.Выбранное множество факторов должно быть достаточно полным. Если какой-либосущественный фактор пропущен, это приведет к неправильному определениюоптимальных условий или к большой ошибке опыта. Факторы могут бытьколичественными и качественными.


5. Ошибкиопыта

Изучение всехвлияющих на исследуемый объект факторов одновременно провести невозможно,поэтому в эксперименте рассматривается их ограниченное число. Остальныеактивные факторы стабилизируются, т.е. устанавливаются на каких-то одинаковыхдля всех опытов уровнях.

Некоторыефакторы не могут быть обеспечены системами стабилизации (например, погодныеусловия, самочувствие оператора и т.д.), другие же стабилизируются с какой-топогрешностью (например, содержание какого-либо компонента в среде зависит отошибки при взятии навески и приготовления раствора). Учитывая также, чтоизмерение параметра у осуществляется прибором, обладающимкакой-то погрешностью, зависящей от класса точности прибора, можно прийти квыводу, что результаты повторностей одного и того же опыта укбудут приближенными и должны отличаться один от другого и от истинногозначения выхода процесса. Неконтролируемое, случайное изменение и множествадругих влияющих на процесс факторов вызывает случайные отклоненияизмеряемой величины укот ее истинного значения– ошибку опыта.

Каждыйэксперимент содержит элемент неопределенности вследствие ограниченностиэкспериментального материала. Постановка повторных (или параллельных) опытов недает полностью совпадающих результатов, потому что всегда существует ошибкаопыта (ошибка воспроизводимости). Эту ошибку и нужно оценить по параллельнымопытам. Для этого опыт воспроизводится по возможности в одинаковых условияхнесколько раз и затем берется среднее арифметическое всех результатов. Среднееарифметическое у равно сумме всех n отдельных результатов, деленной на количествопараллельных опытов n:


/>

Отклонениерезультата любого опыта от среднего арифметического можно представить какразность y2– />, где y2 – результат отдельногоопыта. Наличие отклонения свидетельствует об изменчивости, вариации значенийповторных опытов. Для измерения этой изменчивости чаще всего используютдисперсию.

Дисперсиейназывается среднее значение квадрата отклонений величины от ее среднегозначения. Дисперсия обозначается s2 и выражается формулой:

/>

где (n-1) – число степенейсвободы, равное количеству опытов минус единица. Одна степень свободыиспользована для вычисления среднего.

Корень квадратныйиз дисперсии, взятый с положительным знаком, называется средним квадратическимотклонением, стандартом или квадратичной ошибкой:

/>

Ошибка опытаявляется суммарной величиной, результатом многих ошибок: ошибок измеренийфакторов, ошибок измерений параметра оптимизации и др. Каждую из этих ошибокможно, в свою очередь, разделить на составляющие.

Все ошибкипринято разделять на два класса: систематические и случайные (рисунок 1).

Систематическиеошибки порождаются причинами, действующими регулярно, в определенномнаправлении. Чаще всего эти ошибки можно изучить и определить количественно. Систематическаяошибка – это ошибка, которая остаётся постоянно или закономерноизменяется при повторных измерениях одной и той же величины. Эти ошибкипоявляются вследствие неисправности приборов, неточности метода измерения,какого либо упущения экспериментатора, либо использования для вычислениянеточных данных. Обнаружить систематические ошибки, а также устранить их вомногих случаях нелегко. Требуется тщательный разбор методов анализа, строгаяпроверка всех измерительных приборов и безусловное выполнение выработанныхпрактикой правил экспериментальных работ. Если систематические ошибки вызваныизвестными причинами, то их можно определить. Подобные погрешности можноустранить введением поправок.

Систематическиеошибки находят, калибруя измерительные приборы и сопоставляя опытные данные сизменяющимися внешними условиями (например, при градуировке термопары пореперным точкам, при сравнении с эталонным прибором). Если систематическиеошибки вызываются внешними условиями (переменной температуры, сырья и т.д.),следует компенсировать их влияние.

Случайными ошибками называются те,которые появляются нерегулярно, причины, возникновения которых неизвестны икоторые невозможно учесть заранее. Случайные ошибки вызываются и объективнымипричинами и субъективными. Например, несовершенством приборов, их освещением,расположением, изменением температуры в процессе измерений, загрязнениемреактивов, изменением электрического тока в цепи. Когда случайная ошибка большевеличины погрешности прибора, необходимо многократно повторить одно и тожеизмерение. Это позволяет сделать случайную ошибку сравнимой с погрешностьювносимой прибором. Если же она меньше погрешности прибора, то уменьшать её нетсмысла. Такие ошибки имеют значение, которое отличается в отдельных измерениях.Т.е. их значения могут быть неодинаковыми для измерений сделанных даже водинаковых условиях. Поскольку причины, приводящие к случайным ошибкамнеодинаковы в каждом эксперименте, и не могут быть учтены, поэтому исключитьслучайные ошибки нельзя, можно лишь оценить их значения. При многократномопределении какого-либо показателя могут встречаться результаты, которыезначительно отличаются от других результатов той же серии. Они могут бытьследствием грубой ошибки, которая вызвана невнимательностью экспериментатора.

Систематическиеи случайные ошибки состоят из множества элементарных ошибок. Для того чтобыисключать инструментальные ошибки, следует проверять приборы перед опытом,иногда в течение опыта и обязательно после опыта. Ошибки при проведении самогоопыта возникают вследствие неравномерного нагрева реакционной среды, разногоспособа перемешивания и т.п.

Приповторении опытов такие ошибки могут вызвать большой разброс экспериментальныхрезультатов.

Очень важноисключить из экспериментальных данных грубые ошибки, так называемый брак приповторных опытах. Грубые ошибки легко обнаружить. Для выявленияошибок необходимо произвести измерения в других условиях или повторитьизмерения через некоторое время. Для предотвращения грубых ошибок нужнособлюдать аккуратность в записях, тщательность в работе и записи результатовэксперимента. Грубая ошибка должна быть исключена из экспериментальных данных.Для отброса ошибочных данных существуют определённые правила.

Например,используют критерий Стьюдента t (Р; f): Опыт считается бракованным, если экспериментальноезначение критерия t по модулю больше табличного значения t (Р; f).

Если враспоряжении исследователя имеется экспериментальная оценка дисперсии S2(yk) с небольшим конечным числомстепеней свободы, то доверительные ошибки рассчитываются с помощью критерийСтьюдента t (Р;f):

ε(/>) = t (Р; f)* S(yk)//>= t (Р; f)* S(/>)

ε(yk) = t (Р; f)* S(yk)


6.Результат прямого измерения – случайная величина, подчиняющаяся нормальномузакону распределения

Результаты,которые получаются при экспериментальном исследовании какого-либотехнологического процесса, зависят от целого ряда факторов. Поэтому результатисследования является случайной величиной, распределённой по нормальному законураспределения. Оно названо нормальным, т. к. именно это распределение дляслучайной величины является обычным и называется гаусовским или лапласским.Под распределением случайной величины понимают совокупностьвсех возможных значений случайной величины и соответствующих им вероятностей.

Закономраспределения случайной величины называется всякое соотношение, устанавливающеесвязь между возможными значениями случайной величины и соответствующим имвероятностям.

Приэкспериментальном исследовании какого-либо технологического процесса измеряемыйрезультат последнего является случайной величиной, на которую оказывает влияниеогромное число факторов (изменение погодных условий, самочувствие оператора,неоднородность сырья, влияние износа измерительной и стабилизирующей аппаратурыи т.д. и т.п.). Именно поэтому результат исследования является случайнойвеличиной, распределенной по нормальному закону. Однако если исследователькакой-либо активный фактор не заметил или отнес его к неактивным, анеконтролируемое изменение этого фактора может вызвать несоразмерно большоеизменение эффективности процесса и параметра, характеризующего этуэффективность, то распределение вероятности последнего может нормальному законуне подчиниться.

Точно так жеприведет к нарушению нормальности закона распределения наличие в массивеэкспериментальных данных грубых ошибок. Именно поэтому в первую очередьпроводят анализ на наличие в экспериментальных данных грубых ошибок с принятойдоверительной вероятностью.

Случайнаявеличина будет распределена по нормальному закону, если она представляет собойсумму очень большого числа взаимно зависимых случайных величин, влияния каждойиз которых ничтожно мало. Если измерения искомой величины y проведены много раз, торезультат можно наглядно представить, построив диаграмму, которая показывалабы, как часто получались те или иные значения. Такая диаграмма называется гистограммой.Что бы построить гистограмму нужно разбить весь диапазон измеренныхзначений на равные интервалы. И посчитать сколько раз каждая величина попадаетв каждый интервал.

/>

Еслиизмерения продолжать до тех пор, пока число измеренных значений n не станет очень большим,то ширину интервала можно сделать очень малой. Гистограмма перейдёт внепрерывную прямую, которая называется кривой распределения.

В основетеории случайных ошибок лежат два предположения:

1. при большом числеизмерений случайные погрешности одинаково велики, но с разными знакамивстречаются одинаково часто;

2. большие (по абсолютнойвеличине) погрешности встречаются реже, чем малые. Т. е. вероятность появленияпогрешности уменьшается с ростом её величины.

Согласнозакону больших чисел при бесконечно большом числе измерений n, истинное значениеизмеряемой величины y равно среднеарифметическому значению всех результатов измерений ỹ

Для всех m-повторностей можнозаписать:

/>

Разделив этоуравнение на число повторностей m, получим после подстановки:

/>

Заэкспериментальную оценку истинного значения (математического ожидания) критерияоптимальности у принимается среднеарифметическая оценка результатоввсех т повторностей:

/>

Если число m велико (m→∞), то будетсправедливо равенство:

/>/>

Такимобразом, при бесконечно большом числе измерений истинное значение измеряемойвеличины yравно среднеарифметическому значению ỹ всех результатов произведённыхизмерений: y═ỹ, при m→∞.

Приограниченном числе измерений (m≠∞) среднеарифметическое значение y будет отличаться отистинного значения, т.е. равенство y═ỹ будет неточным, априближённым: y≈ỹ и величину этого расхождения необходимо оценить.

Если враспоряжении исследователя имеется только единичный результат измерения yk, то оценка истинногозначения измеряемой величины будет менее точной. чем среднеарифметическаяоценка при любом числе повторностей: |y─ỹ|<|y-yk|.

Появлениетого или иного значения yk в процессе измерения является случайным событием. Функцияплотности нормального распределения случайной величины характеризуется двумяпараметрами:

·          истиннымзначением y;

·          среднеквадратичнымотклонением σ.

/>

а) б)

Рисунок – 1а– кривая плотности нормального распределения; 1б – кривая плотностивероятности нормально распределенной случайной величины при различныхдисперсиях

Плотностьнормального распределения (рис. 1а) симметрична относительно y и достигаетмаксимального значения при yk= y, стремится к 0 при увеличении.

Квадратсреднеквадратичного отклонения называется дисперсией случайной величины иявляется количественной характеристикой разброса результатов вокруг истинногозначения y.Мера рассеяния результатов отдельных измерений yk от среднего значения ỹдолжна выражаться в тех же единицах, то и значения измеряемой величины. В связис этим в качестве показателя разброса гораздо чаще используют величину σ:

/>

Значения этойвеличины определяют форму кривой распределения py. Площади под тремякривыми одинаковы, но при малых значения σ кривые идут более круто и имеютбольшее значение py. С увеличением σ значение py уменьшается и криваяраспределения растягивается вдоль оси y. Т.о. кривая 1 характеризует плотностьраспределения случайной величины, воспроизводимость которой в повторныхизмерениях лучше, чем воспроизводимость случайных величин имеющих плотностьраспределения 2, 4. На практике не возможно произвести слишком много замеров.Поэтому нельзя построить нормальное распределение, чтобы точно определитьистинное значение y. В этом случае хорошим приближением к истинному значению можносчитать ỹ, а достаточно точной оценкой ошибки выборочную дисперсию ρ²n,вытекающую из закона распределения, но относящуюся к конечному числу измерения.Такое название величины ρ²n объясняется тем, что из всего множествавозможных значений yk, т.е. из генеральной совокупности выбирают лишь конечное числозначений равное m, называемых выборкой, которая характеризуется выборочным среднимзначением и выборочной дисперсией.


7.Экспериментальные оценки истинных значений измеряемой случайной величины и еёсреднеквадратичного отклонения

Если враспоряжении исследователя находится конечное число независимых результатовповторности одного и того же опыта, то он может получить лишь экспериментальныеоценки истинного значения и дисперсии результата опыта.

Оценки должныобладать следующими свойствами:

1. Несмещённости,проявляющейся в том, что теоретическое среднее совпадает с истинным значениемизмеряемого параметра.

2. Состоятельности, когдаоценки при неограниченном увеличении числа измерений могут иметь сколь угодномалый доверительный интервал при доверительной вероятности.

3. Эффективности,проявляющейся в том, что из всех несмешанных оценок данная оценка будет иметьнаименьшее рассеяние (дисперсию).

Экспериментальнаяоценка среднеквадратичного отклонения обозначается S с указанием в скобкахсимвола анализируемой величины, т.е.

S (yk) – среднеквадратичногоотклонение единичного результата.

S (y) – среднеквадратичноеотклонение среднего результата.

Квадратэкспериментальной оценки среднеквадратичного отклонения S² являетсяэкспериментальной оценкой дисперсии:

/>

Для обработкирезультатов наблюдения можно использовать следующую схему:

 Определение среднегозначения полученных результатов:


/>

 Определение отклонения отсреднего значения для каждого результата:

/>

Этиотклонения характеризуют абсолютную ошибку определения. Случайные ошибки имеютразные знаки, когда значение результата опыта превышает среднее значение,ошибка опыта считается положительной, когда значение результата опыта меньшесреднего значения, ошибка считается отрицательной.

Чем точнеепроизведены измерения, тем ближе значение отдельных результатов и среднеезначение.

Если по m результатам рассчитываютоценку истинного значения />, а затем, используя те жерезультаты, рассчитывают оценки абсолютных отклонений:

/>

то оценкудисперсии единичного результата находят по зависимости:

/>

Разностьмежду числом т независимых результатов уки числом уравнений, в которых эти результаты уже были использованы длярасчета неизвестных оценок, называют числом степеней свободы f:

f=m –1.

Для оценкидисперсии эталонного процесса f=m.

Посколькусредняя оценка /> является более точной, чемединичная ук, дисперсия средних будет меньше дисперсииединичныхрезультатов в mраз, если /> рассчитанопо всем mединичным результатам ук:

/>

Если враспоряжении исследователя имеется экспериментальная оценка дисперсии S2 (yк) с небольшим конечнымчислом степеней свободы, то доверительные ошибки рассчитывают с помощью критерияСтьюдента t (P; f):

/>,

где Р –доверительная вероятность (Р=1-q, q – уровень значимости).

Проверканадёжности полученных результатов по критерию Стьюдента для проведенного числаопытов mпри избранной доверительной вероятности (надёжности) Р=0,95; 0,99. Это значит,что 95% или 99% абсолютных отклонений результатов лежит в указанных пределах.Критерий t (P; f) с доверительнойвероятностью Р показывает во сколько раз модуль разности между истиннымзначением определённой величины y и средним значением ỹ больше стандартного отклонениясреднего результата.


8.Определение грубых ошибок среди результатов повторностей опыта

Пристатистическом анализе экспериментальных данных для процессов, негативныйрезультат которых не создает ситуаций, опасных для жизни людей или утратыбольших материальных ценностей, доверительная вероятность обычно принимаютравной Р=0,95

Средирезультатов yk повторностей опыта могут быть результаты, значительноотличающиеся от других. Это может быть связано либо с какой-то грубой ошибкой,либо с неизбежным случайным влиянием неучтенных факторов на результат даннойповторности опыта.

Признакомналичия «выделяющегося» результата среди других является большая величинаотклонения │▲yk│= yk – yˉ./>

Если ▲yk>yпред, то такие результатыотносятся к грубым ошибкам. Предельное абсолютное отклонение определяют взависимости от сложившейся ситуации различными методами. Если, например,проводиться статистический анализ экспериментальных данных опыта с эталоннымпроцессом (известно истинное значение результата опыта и ▲yk=yk-y) и если исследовательимеет в своем распоряжении оценку дисперсии S2(yk) с таким большим числомстепеней свободы, то может принять f→∞ и S2(yk)=σ2, тодля определения грубых ошибок можно применить правило «2-х сигм»: всерезультаты, абсолютные отклонения которых по модулю превышают величину двухсреднеквадратичных отклонений с надежностью 0,95 считаются грубыми ошибками иисключаются из массива экспериментальных данных (вероятность исключениядостоверных результатов равна уровню значимости q=0,05).

Еслидоверительная вероятность отличается от 0,95 то пользуются правилом «однойсигмы» (Р=0,68) или правилом «трех сигм» (Р=0,997), или по заданнойвероятности Р=2Ф(t) – 1 находят Ф(t) по справочным данным и параметр t, по которому ирассчитывают абсолютное отклонение:

/>

Если враспоряжении исследователя имеется лишь приближенная оценка дисперсии снебольшим (конечным) числом степеней свободы, то применение правила «сигм»может привести либо к необоснованному исключению достоверных результатов либо кнеобоснованному оставлению ошибочных результатов.

В этойситуации для определения грубых ошибок можно применить критериймаксимального отклонения rmax(P, m), взятый из соответствующих таблиц. Для этого rmax сравнивают с величиной r, равной

/>

/> (22)

Если r > rmax, то данный результатдолжен исключаться из дальнейшего анализа, оценка yˉ должна быть пересчитана,изменяются абсолютные отклонения ▲yk и соответственно оценкадисперсии S2(yk) и S2(yˉ). Анализ на грубые ошибки повторяют при новыхзначениях оценок yˉ и S2(yk), прекращают его при r <= rmax.

Припользовании формулой (22) следует применять оценку дисперсии, полученную порезультатам повторностей опыта, среди которых находится сомнительный результат.

Дляопределения грубых ошибок существуют и другие методы, среди которых наиболеебыстрым является метод «по размаху», основанный на оценке максимальныхразличий полученных результатов. Анализ по этому методу проводят в такойпоследовательности:

1) располагают результаты yk в упорядоченный ряд, вкотором максимальному результату присваивается номер первый (y1), а максимальному –наибольший (ym).

2) Если результатом,вызывающим сомнение, будет ym, рассчитывают отношение

/> (23)

еслисомнительным результатом будет y1 – отношение

/> (24)

3) при заданном уровнизначимости qи известном числе повторностей m по приложению 6 находят табличное значение критерия αТ.

4) если α > αТ, то подозреваемыйрезультат является ошибочным и его следует исключить.

Послеисключения грубой ошибки находят по таблице новую величину αТ и решают судьбуследующего «подозреваемого» результата, сравнивая αТ и рассчитанный для него α.

Если естьоснование предполагать, что 2 наибольших (2 наименьших) результата являются «промахами»,то их можно выявить в один прием, используя соответствующий столбец таблицыприложения 6 для определения αТ и рассчитывая α по формуле:

/> (25)


или

/> (26)

Средневзвешенныеоценки дисперсии. Анализ однородности исходных оценок дисперсии

Если враспоряжении экспериментатора имеются результаты многократных измерений величинкритерия оптимальности в опытах при различных условиях ведения процесса, топоявляется возможность расчета средневзвешенной оценки дисперсии единичногорезультата, единой для всех опытов эксперимента.

В каждом из Nопытов (номер опыта и = 1+N) оценка дисперсииединичного результата равна

/>

где ти– число повторностей и-го опыта.

Средневзвешеннаяоценка дисперсии единичного результата рассчитывается по всем оценкам дисперсииединичного результата опытов:

а) приразличных ти

/>


где /> — число степенейсвободы средневзвешенной оценки дисперсии; ти– 1 = fu– «вес» соответствующейи-ой оценки дисперсии, равный числу степеней свободы fu;

б) прити= т = const

/>

где N (m-1)=f – число степенейсвободы средневзвешенной оценки дисперсии.

Прежде чемпользоваться соотношениями (28) и (29) для расчета средневзвешенных уточненныхоценок дисперсии (чем больше число степеней свободы, тем более точной будетоценка дисперсии), надо доказать однородность исходных оценок дисперсии.

Определение«однородные» в статистике означает «являющиеся оценкой одного и того жепараметра» (в данном случае – дисперсии σ2).

Еслиизмеряемая случайная величина уикраспределена по нормальномузакону во всем исследуемом диапазоне, то независимо от значений />идисперсияσ не будет изменять своей величины и оценки этой дисперсии должны бытьоднородными. Однородность этих оценок проявляется в том, что они могутотличаться друг от друга лишь незначительно, в пределах, зависящих от принятойвероятности и объема экспериментальных данных.

Если ти= т и f= const, то однородность оценок дисперсий можно проанализировать припомощи критерия Кохрена Gkp. Вычисляют отношениемаксимальной дисперсии S2(yuk)maxк сумме всех дисперсий

/>


и сравниваютэто отношение с величиной критерия Кохрена Gkp(P; f; N). Если G< Gkp, то оценки однородны.

Таблицазначений критерия Кохрена в зависимости от числа степеней свободы числителя fu, числа сравниваемыхдисперсий N и принятого уровня значимости q= 1 – Р дана вприложении.

Если числоповторностей в опытах различно (fltconst), однородность оценокдисперсии можно проанализировать с помощью критерия Фишера FТ.Для этого из N оценокдисперсии выбирают 2: максимальную S2(yuk)max и минимальную S2(yuk)min. Если вычисленноезначение Fих отношения меньше Ft,

/>

то все N оценокдисперсии будут однородны.

Значениякритерия Фишера FTданы в приложении в зависимости от принятогоуровня значимости qи числа степеней свободы f1иf2 оценок S2(yuk)max и S2(yuk)min соответственно.

Если оценкидисперсии непосредственно измеряемого параметра у оказалисьнеоднородными, т.е. оценками различных дисперсий, то средневзвешенная оценка неможет быть рассчитана. И кроме того, величины укуже нельзясчитать подчиняющимися нормальному закону, при котором дисперсия может бытьлишь одной и неизменной при любом у.

Причинойнарушения нормального закона распределения может быть наличие оставшихся грубыхошибок (анализ на грубые ошибки либо не проводился, либо проведен недостаточнотщательно).

Другой причинойможет быть наличие активного фактора, ошибочно отнесенного исследователем кнеактивным и не снабженного системой стабилизации. Поскольку условияизменились, этот фактор стал значимо влиять на процесс.


9.Планирование и обработка результатов однофакторных экспериментов

 

9.1Формализация экспериментальных данных методом наименьших квадратов

Влияниекакого-либо фактора на выход процесса может быть выражено зависимостью у =f(C). Если конкретномузначению Сисоответствует единственное значение уи,то такая зависимость называется функциональной. Эту зависимостьполучают путем строгих логических доказательств, не нуждающихся в опытнойпроверке. Например, площадь квадрата ω может быть представленафункциональной зависимостью от размера стороны квадрата а: ω = а2.

Если уиостается неизменным в то время как Сиизменяется, то уне зависит от С. Например, угол при вершине квадрата равный π/2,не зависит от размера стороны аи.

Если дляоценки величин уии Сииспользуются данныенаблюдений, величины случайные, то функциональная зависимость между нимисуществовать не может.

Измеривотдельно сторону а и площадь ω квадрата, можно убедиться, чтополученные результаты не могут быть представлены с абсолютной точностьюзависимостью ω = а 2.

Кформализации экспериментальных данных, т.е. построению по ним описывающейпроцесс зависимости, исследователь прибегает, когда не может составить эвристическую(детерминированную) математическую модель из-за недостаточного пониманиямеханизма процесса или его чрезмерной сложности.

Полученная врезультате формализации экспериментальных данных эмпирическая математическаямодель имеет меньшую ценность, чем отражающая механизм процессаэвристическая математическая модель, которая может предсказать поведениеобъекта за пределами изученного диапазона изменения переменных.

Приступая кэксперименту с целью получения эмпирической математической модели,исследователь должен определить необходимый объем опытных данных с учетомколичества принятых к исследованию факторов, воспроизводимости процесса,предполагаемой структуры модели и обеспечения возможности проверки адекватностиуравнения.

Если порезультатам эксперимента, состоящего из двух опытов, получено линейноеоднофакторное уравнение у = b0+ b1С, то построенная по этомууравнению прямая обязательно пройдет через эти экспериментальные точки.Следовательно, для того чтобы проверить, насколько хорошо эта зависимостьописывает данный процесс, надо поставить опыт хотя бы еще в одной точке. Этотдополнительный опыт дает возможность осуществить корректную процедуру проверкипригодности уравнения. Однако проверку обычно проводят не по однойдополнительной точке, которая не участвовала в определении коэффициентовуравнения, а по всем экспериментальным точкам, число которых (N) должно превышать числокоэффициентов уравнения (N')

Так как N> N', решение такой системы требует специального подхода.

9.2Симметричный и равномерный план однофакторного эксперимента

Задача взначительной степени упростится, если при планировании эксперимента, можнобудет обеспечить условие:

ΣCu=0 (1)

При натуральнойразмерности факторов выполнить условие ΣCu=0 невозможно, т. к.в этом случае величина фактора должна иметь как положительные значения, так иотрицательные.

Если же точкуотсчета величины фактора перенести в середину диапазона изменения фактора(центр эксперимента)

/>

то появляетсявозможность удовлетворить условию/>в виде />, где С'u=Сu – С0.

Дляравномерного плана Сu – С(u-1) = λ = const,

где λ –интервал варьирования фактора.

Условие /> можетбыть выполнено, если для обозначения величины фактора использовать безразмерныевыражения:

xu = />,

отсюда легкоувидеть, что условие /> эквивалентно условию /> и такиепланы называют симметричными.

Присоставлении плана диапазон фактора ориентировочно ограничивают величинами Сmin и Сmax, назначенными послеизучения литературы по теме исследования. От опыта к опыту предусматриваюттакое изменение величины фактора, которое позволило бы достоверно уловитьимеющимися в распоряжении исследователя приборами изменение выхода процесса />.

С учетомвеличины λ и диапазона (Сmax – Cmin) определяют числоопытов, округляя его до нечетного N:


/>.

Затемопределяют величины факторов в каждом из N опытов и уточняютисследуемый диапазон фактора СN – С1:

/>=/>,

где хu – безразмерное выражениефактора, аналогичное полученному по соотношению />

Для расчетакоэффициентов уравнения используем формулу:

/>,

множители аju<sub/>и знаменатель lj берем из приложения.

Число опытовэксперимента может быть четным или нечетным, и, как правило, должно быть большечисла коэффициентов N' уравнения.

Чем большеразность (N– N'), тем с большейточностью можно получить оценки коэффициентов данного уравнения и тем в большейстепени эти оценки будут освобождены от влияния случайных неуточненныхфакторов.

еще рефераты
Еще работы по экономико-математическому моделированию