Реферат: Корреляционный анализ

КУРСОВАЯ РАБОТА

 

Тема: Корреляционный анализ

Задание: Рассчитать полным факторнымэкспериментом влияние давления, жирности и кислотности на качество продукции


СОДЕРЖАНИЕ

 

Введение

1.Корреляционный анализ

1.1Понятие корреляционной связи

1.2Общая классификация корреляционных связей

1.3Корреляционные поля и цель их построения

1.4Этапы корреляционного анализа

1.5Коэффициенты корреляции

1.6Нормированный коэффициент корреляции Браве-Пирсона

1.7Коэффициент ранговой корреляции Спирмена

1.8Основные свойства коэффициентов корреляции

1.9Проверка значимости коэффициентов корреляции

1.10Критические значения коэффициента парной корреляции

2.Планирование многофакторного эксперимента

2.1 Условие задачи

2.2Определение центр плана (основной уровень) и уровня варьирования факторов

2.3Построение матрицы планирования

2.4Проверка однородности дисперсии и равноточности измерения в разных сериях

2.5Коэффициенты уравнения регрессии

2.6Дисперсия воспроизводимости

2.7Проверка значимости коэффициентов уравнения регрессии

2.8Проверка адекватности уравнения регрессии

Заключение

Списоклитературы


ВВЕДЕНИЕ

 

Планирование эксперимента -математико-статистическая дисциплина, изучающая методырациональной организации экспериментальных исследований — от оптимальноговыбора исследуемых факторов и определения собственно плана эксперимента всоответствии с его целью до методов анализа результатов. Началопланирования экспериментаположили труды английского статистика Р.Фишера (1935), подчеркнувшего, чторациональное планирование экспериментадаёт не менее существенный выигрыш в точности оценок, чем оптимальнаяобработка результатов измерений. В 60-х годах 20 века сложилась современнаятеория планирования эксперимента. Её методы тесно связаны с теорией приближенияфункций и математическим программированием. Построены оптимальные планы иисследованы их свойства для широкого класса моделей.

Планирование эксперимента – выборплана эксперимента, удовлетворяющего заданным требованиям, совокупностьдействий направленных на разработку стратегии экспериментирования (от полученияаприорной информации до получения работоспособной математической модели или определенияоптимальных условий). Это целенаправленное управление экспериментом,реализуемое в условиях неполного знания механизма изучаемого явления.

В процессе измерений, последующейобработки данных, а также формализации результатов в виде математическоймодели, возникают погрешности и теряется часть информации, содержащейся висходных данных. Применение методов планирования эксперимента позволяетопределить погрешность математической модели и судить о ее адекватности. Еслиточность модели оказывается недостаточной, то применение методов планированияэксперимента позволяет модернизировать математическую модель с проведениемдополнительных опытов без потери предыдущей информации и с минимальнымизатратами.

Цель планирования эксперимента –нахождение таких условий и правил проведения опытов при которых удаетсяполучить надежную и достоверную информацию об объекте с наименьшей затратойтруда, а также представить эту информацию в компактной и удобной форме сколичественной оценкой точности.

Среди основных методов планирования,применяемых на разных этапах исследования, используют:

— планирование отсеивающегоэксперимента, основное значение которого выделение из всей совокупностифакторов группы существенных факторов, подлежащих дальнейшему детальномуизучению;

— планирование эксперимента длядисперсионного анализа, т.е. составление планов для объектов с качественнымифакторами;

— планирование регрессионногоэксперимента, позволяющего получать регрессионные модели (полиномиальные ииные);

— планирование экстремальногоэксперимента, в котором главная задача – экспериментальная оптимизация объектаисследования;

— планирование при изучениидинамических процессов и т.д.

Целью изучения дисциплины является подготовка студентов к производственно-техническойдеятельности по специальности с применением методов теории планирования исовременных информационных технологий.

Задачи дисциплины: изучение современных методов планирования, организации иоптимизации научного и промышленного эксперимента, проведения экспериментов иобработки полученных результатов.


1. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

 

1.1 Понятиекорреляционной связи

 

Исследователя нередкоинтересует, как связаны между собой две или большее количество переменных водной или нескольких изучаемых выборках. Например, может ли рост влиять на весчеловека или может ли давление влиять на качество продукции?

Такого рода зависимостьмежду переменными величинами называется корреляционной, или корреляцией. Корреляционнаясвязь — это согласованное изменение двух признаков, отражающее тот факт, чтоизменчивость одного признака находится в соответствии с изменчивостью другого.

Известно, например, что всреднем между ростом людей и их весом наблюдается положительная связь, и такая,что чем больше рост, тем больше вес человека. Однако из этого правила имеютсяисключения, когда относительно низкие люди имеют избыточный вес, и, наоборот,астеники, при высоком росте имеют малый вес. Причиной подобных исключенийявляется то, что каждый биологический, физиологический или психологическийпризнак определяется воздействием многих факторов: средовых, генетических, социальных,экологических и т.д.

Корреляционные связи — этовероятностные изменения, которые можно изучать только на представительныхвыборках методами математической статистики. Оба термина — корреляционная связьи корреляционная зависимость — часто используются как синонимы. Зависимостьподразумевает влияние, связь — любые согласованные изменения, которые могутобъясняться сотнями причин. Корреляционные связи не могут рассматриваться каксвидетельство причинно-следственной зависимости, они свидетельствуют лишь отом, что изменениям одного признака, как правило, сопутствуют определенныеизменения другого.

Корреляционная зависимостьэтоизменения, которые вносят значения одного признака в вероятность появленияразных значений другого признака.

Задача корреляционногоанализа сводится к установлению направления (положительное или отрицательное) иформы (линейная, нелинейная) связи между варьирующими признаками, измерению еетесноты, и, наконец, к проверке уровня значимости полученных коэффициентовкорреляции.

Корреляционные связиразличаютсяпо форме, направлению и степени (силе).

По форме корреляционная связь может быть прямолинейной или криволинейной.Прямолинейной может быть, например, связь между количеством тренировок натренажере и количеством правильно решаемых задач в контрольной сессии.Криволинейной может быть, например, связь между уровнем мотивации иэффективностью выполнения задачи (рисунок 1). При повышении мотивацииэффективность выполнения задачи сначала возрастает, затем достигаетсяоптимальный уровень мотивации, которому соответствует максимальнаяэффективность выполнения задачи; дальнейшему повышению мотивации сопутствуетуже снижение эффективности.

/>

Рисунок 1 — Связь междуэффективностью решения задачи и силой мотивационной тенденции

По направлению корреляционная связьможет быть положительной («прямой») и отрицательной(«обратной»). При положительной прямолинейной корреляции болеевысоким значениям одного признака соответствуют более высокие значения другого,а более низким значениям одного признака — низкие значения другого (рисунок 2).При отрицательной корреляции соотношения обратные (рисунок 3). Приположительной корреляции коэффициент корреляции имеет положительный знак, приотрицательной корреляции — отрицательный знак[1].

/>

Рисунок 2 – Прямая корреляция

 

/>

Рисунок 3 – Обратная корреляция


/>

Рисунок 4 – Отсутствие корреляции

Степень, сила или теснота корреляционной связи определяется по величине коэффициентакорреляции. Сила связи не зависит от ее направленности и определяется поабсолютному значению коэффициента корреляции.

1.2 Общая классификация корреляционных связей

 

В зависимости откоэффициента корреляции различают следующие корреляционные связи:

— сильная, или тесная при коэффициенте корреляции r>0,70;

— средняя (при 0,50<r<0,69);

— умеренная (при 0,30<r<0,49);

— слабая (при 0,20<r<0,29);

— очень слабая (при r<0,19).

 

1.3 Корреляционные поля и цель ихпостроения

Корреляция изучается на основании экспериментальных данных, представляющихсобой измеренные значения (xi, yi) двух признаков. Еслиэкспериментальных данных немного, то двумерное эмпирическое распределениепредставляется в виде двойного ряда значений xi и yi. Приэтом корреляционную зависимость между признаками можно описывать разными способами.Соответствие между аргументом и функцией может быть задано таблицей, формулой,графиком и т. д.

Корреляционный анализ, как и другие статистические методы, основанна использовании вероятностных моделей, описывающих поведение исследуемыхпризнаков в некоторой генеральной совокупности, из которой полученыэкспериментальные значения xi и yi. Когда исследуетсякорреляция между количественными признаками, значения которых можно точноизмерить в единицах метрических шкал (метры, секунды, килограммы и т.д.), тоочень часто принимается модель двумерной нормально распределенной генеральнойсовокупности. Такая модель отображает зависимость между переменными величинами xiи yi графически в виде геометрического места точек в системепрямоугольных координат. Эту графическую зависимость называются также диаграммойрассеивания или корреляционным полем.
Данная модель двумерного нормального распределения (корреляционное поле)позволяет дать наглядную графическую интерпретацию коэффициента корреляции,т.к. распределение в совокупности зависит от пяти параметров: μx,μy – средние значения (математические ожидания); σx,σy– стандартные отклонения случайных величин Х и Y и р – коэффициент корреляции,который является мерой связи между случайными величинами Х и Y.
Если р = 0, то значения, xi, yi, полученные из двумернойнормальной совокупности, располагаются на графике в координатах х, у в пределахобласти, ограниченной окружностью (рисунок 5, а). В этом случае между случайнымивеличинами Х и Y отсутствует корреляция и они называются некоррелированными.Для двумерного нормального распределения некоррелированность означаетодновременно и независимость случайных величин Х и Y.


/>

Рисунок 5 — Графическая интерпретациявзаимосвязи между показателями

Если р = 1 или р = -1, то между случайными величинами Х и Y существуетлинейная функциональная зависимость (Y = c + dX). В этом случае говорят ополной корреляции. При р = 1 значения xi, yi определяютточки, лежащие на прямой линии, имеющей положительный наклон (с увеличением xiзначения yi также увеличиваются), при р = -1 прямая имеет отрицательныйнаклон (рисунок 5, б). В промежуточных случаях (-1 < p < 1) точки, соответствующиезначениям xi, yi, попадают в область, ограниченнуюнекоторым эллипсом (рисунок 5, в, г), причем при p > 0 имеет место положительнаякорреляция (с увеличением xi значения yi имеют тенденциюк возрастанию), при p < 0 корреляция отрицательная. Чем ближе р к />, тем уже эллипси тем теснее экспериментальные значения группируются около прямой линии. Здесьже следует обратить внимание на то, что линия, вдоль которой группируютсяточки, может быть не только прямой, а иметь любую другую форму: парабола,гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную(или криволинейную) корреляцию (риунок 5, д).

Таким образом, визуальный анализ корреляционного поля помогаетвыявить не только наличия статистической зависимости (линейную или нелинейную)между исследуемыми признаками, но и ее тесноту и форму. Это имеет существенноезначение для следующего шага в анализе ѕ выбора и вычисления соответствующегокоэффициента корреляции.

Корреляционную зависимость между признаками можно описыватьразными способами. В частности, любая форма связи может быть выраженауравнением общего вида Y = f(X), где признак Y – зависимая переменная, или функцияот независимой переменной X, называемой аргументом. Соответствие междуаргументом и функцией может быть задано таблицей, формулой, графиком и т. д.[2]

1.4Этапыкорреляционного анализа

 

Практическая реализациякорреляционного анализа включает следующие этапы:

а) постановка задачи и выборпризнаков;

б) сбор информации и ее первичнаяобработка (группировки, исключение аномальных наблюдений, проверка нормальностиодномерного распределения);

в) предварительная характеристикавзаимосвязей (аналитические группировки, графики);

г) устранение мультиколлинеарности(взаимозависимости факторов) и уточнение набора показателей путем расчетапарных коэффициентов корреляции;

д) исследование факторнойзависимости и проверка ее значимости;

е) оценка результатов анализа иподготовка рекомендаций по их практическому использованию[3].


1.5Коэффициентыкорреляции

 

Коэффициентыкорреляции является общепринятой в математической статистике характеристикойсвязи между двумя случайными величинами. Коэффициент корреляции — показатель степени взаимозависимости, статистической связидвух переменных; изменяется в пределах от -1 до +1. Значение коэффициентакорреляции 0 указывает на возможное отсутствие зависимости, значение +1свидетельствует о согласованности переменных.

Различают следующие коэффициенты корреляции:

— дихотомический — показатель связипризнаков (переменных) измеряемых по дихотомическим шкалам наименований;

— Пирсона (Pearson product-moment correlation) — коэффициент корреляции, используемый для континуальных переменных;

— ранговой корреляции Спирмена (Spearmen's rank-order correlation)- коэффициент корреляции для переменных, измеренных в порядковых(ранговых) шкалах;

— точечно-бисериальной корреляции (point-biserial correlation) — коэффициент корреляции, применяемый в случае анализа отношенияпеременных, одна из которых измерена в континуальной шкале, а другая — в строгодихотомической шкале наименований;

— j — коэффициент корреляции,используемый в случае, если обе переменные измерены в дихотомической шкале наименований.

— тетрахорический (четырехпольный) (tetrachoric) — коэффициент корреляции, используемый в случае, если обепеременные измерены в континуальных шкалах[4].

Линейная связь между переменными Xi и Xj<sub/>оценивается коэффициентом корреляции:

/>,


где Xi и Xj – исследуемые переменные; mXi и mXj – математическиеожидания переменных; σX и σX<sub/>– дисперсии переменных.

Выборочный коэффициент корреляции определяют по формуле:

/>,

или по преобразованной формуле:

/>,

где i =1, 2, ..., n, j = 1, 2, ..., m, u = 1, 2, ..., N; N – число опытов(объем выборки); xi, xj – оценкиматематических ожиданий; SXi, SXj – оценки среднеквадратических отклонений.

Только при совместной нормальной распределенности исследуемыхслучайных величин Xi и Xj коэффициент корреляции имеетопределенный смысл связи между переменными. В противном случае коэффициент корреляцииможет только косвенно характеризовать эту связь[5].

1.6Нормированный коэффициент корреляции Браве-Пирсона

 

В качестве оценки генерального коэффициента корреляции р используетсякоэффициент корреляции r Браве-Пирсона. Для его определения принимаетсяпредположение о двумерном нормальном распределении генеральной совокупности, изкоторой получены экспериментальные данные. Это предположение может бытьпроверено с помощью соответствующих критериев значимости. Следует отметить, чтоесли по отдельности одномерные эмпирические распределения значений xiи yi согласуются с нормальным распределением, то из этого еще неследует, что двумерное распределение будет нормальным. Для такого заключениянеобходимо еще проверить предположение о линейности связи между случайнымивеличинами Х и Y. Строго говоря, для вычисления коэффициента корреляциидостаточно только принять предположение о линейности связи между случайнымивеличинами, и вычисленный коэффициент корреляции будет мерой этой линейной связи.
 Коэффициент корреляции Браве–Пирсона (/>) относится к параметрическимкоэффициентам и для практических расчетов вычисляется по формуле:

/>

Из формулы видно, что для вычисления /> необходимо найти средние значенияпризнаков Х и Y, а также отклонения каждого статистического данного от егосреднего />.Зная эти значения, находятся суммы />. Затем, вычислив значение />, необходимоопределить достоверность найденного коэффициента корреляции, сравнив егофактическое значение с табличным для f = n –2. Если />, то можно говорить отом, что между признаками наблюдается достоверная взаимосвязь. Если />, то междупризнаками наблюдается недостоверная корреляционная взаимосвязь[2].

Пример 1.10 студентам были даны тесты на наглядно-образное ивербальное мышление. Измерялось среднее время решения заданий теста в секундах.Исследователя интересует вопрос: существует ли взаимосвязь между временем решенияэтих задач? Переменная X — обозначает среднее время решения наглядно-образных,а переменная Y— среднее время решения вербальных заданий тестов.

Решение. Представим исходныеданные в виде таблицы 4, в которой введены дополнительные столбцы, необходимыедля расчета по формуле.

Таблица 1 – Условиязадачи

№ испытуемых x y

хi — />

(хi — />)2

yi — />

(yi — />)2

/>

1 19 17 -16,7 278,89 -7,2 51,84 120,24 2 32 7 -3,7 13,69 -17,2 295,84 63,64 3 33 17 -2,7 7,29 -7,2 51,84 19,44 4 44 28 8,3 68,89 3,8 14,44 31,54 5 28 27 -7,7 59,29 2,8 7,84 -21,56 6 35 31 -0,7 0,49 6,8 46,24 -4,76 7 39 20 3,3 10,89 -4,2 17,64 -13,86 8 39 17 3,3 10,89 -7,2 51,84 -23,76 9 44 35 8,3 68,89 10,8 116,64 89,64 10 44 43 8,3 68,89 18,8 353,44 156,04 Сумма 357 242   588,1   1007,6 416,6 Среднее 35,7 24,2          

Рассчитываем эмпирическуювеличину коэффициента корреляции по формуле расчета коэффициента корреляцииБраве–Пирсона:

/>

Определяем критическиезначения для полученного коэффициента корреляции по таблице. При нахождениикритических значений для вычисленного коэффициента линейной корреляции Пирсоначисло степеней свободы рассчитывается как f = n – 2 = 8. rкрит=0,72 > 0,54, следовательно, гипотеза Н1отвергается и принимается гипотеза H0, иными словами, связь междувременем решения наглядно-образных и вербальных заданий теста не доказана[1].


1.7Коэффициент ранговой корреляции Спирмена

 

Еслипотребуется установить связь между двумя признаками, значения которых вгенеральной совокупности распределены не по нормальному закону, т. е.предположение о том, что двумерная выборка (xi и yi) получена из двумернойнормальной генеральной совокупности, не принимается, то можно воспользоватьсякоэффициентом ранговой корреляции Спирмена (/>):

/>

гдеdx и dy – ранги показателей xi и yi; n – число коррелируемых пар.

Коэффициентранговой корреляции также имеет пределы 1 и –1. Если ранги одинаковы для всехзначений xi и yi, то все разности рангов (dx — dy) = 0 и = 1. Если ранги xi иyi расположены в обратном порядке, то />= -1. Таким образом, коэффициентранговой корреляции является мерой совпадения рангов значений xiи yi.

Когдаранги всех значений xi и yi строго совпадают илирасположены в обратном порядке, между случайными величинами Х и Y существуетфункциональная зависимость, причем эта зависимость не обязательно линейная, какв случае с коэффициентом линейной корреляции Браве-Пирсона, а может быть любоймонотонной зависимостью (т. е. постоянно возрастающей или постоянно убывающейзависимостью). Если зависимость монотонно возрастающая, то ранги значений xiи yi совпадают и />= 1; если зависимость монотонноубывающая, то ранги обратны и />= –1. Следовательно, коэффициентранговой корреляции является мерой любой монотонной зависимости междуслучайными величинами Х и Y.

Изформулы видно, что для вычисления /> необходимо сначала проставитьранги (dx и dy) показателей xi и yi, найти разности рангов (dx — dy) для каждойпары показателей и квадраты этих разностей (dx — dy)2. Зная эти значения,находятся суммы />, учитывая, что />всегда равна нулю.Затем, вычислив значение />, необходимо определитьдостоверность найденного коэффициента корреляции, сравнив его фактическое значениес табличным. Если />, то можно говорить о том, чтомежду признаками наблюдается достоверная взаимосвязь. Если />, то между признакаминаблюдается недостоверная корреляционная взаимосвязь.

Коэффициентранговой корреляции Спирмена вычисляется значительно проще, чем коэффициенткорреляции Браве-Пирсона при одних и тех же исходных данных, поскольку привычислении используются ранги, представляющие собой обычно целые числа.

Коэффициентранговой корреляции целесообразно использовать в следующих случаях:

— если экспериментальные данные представляют собой точно измеренные значенияпризнаков Х и Y и требуется быстро найти приближенную оценку коэффициентакорреляции. Тогда даже в случае двумерного нормального распределениягенеральной совокупности можно воспользоваться коэффициентом ранговойкорреляции вместо точного коэффициента корреляции Браве-Пирсона. Вычислениябудут существенно проще, а точность оценки генерального параметра р с помощьюкоэффициента /> при больших объемах выборкисоставляет 91,2% по отношению к точности оценки по коэффициенту корреляций;

— когда значения xiи (или) yi заданы впорядковой шкале (например, оценки судей в баллах, места на соревнованиях,количественные градации качественных признаков), т. е. когда признаки не могутбыть точно измерены, но их наблюдаемые значения могут быть расставлены вопределенном порядке.

Пример 2. Определить достоверность взаимосвязи между показателямивеса и максимального количества сгибания и разгибания рук в упоре лежа у 10исследуемых с помощью расчета рангового коэффициента корреляции, если данныевыборок таковы:

 

xi, кг~55; 45; 43; 47; 47;51; 48; 60; 53;50

yi, кол-во раз ~ 26; 20;25; 22; 27; 28; 16; 15; 18; 24

Решение

1. Расчет рангового коэффициента корреляции Спирмена произведем поформуле:

/>

где: dx и dy — рангипоказателей х и у;

n — число коррелируемых парили исследуемых.

2 Данные тестирования занести в рабочую таблицу и сделатьнеобходимые расчеты.

 

Таблица 2 – Данные тестирования

xi

dx

yi

dy

/>

/>

55 9 26 9 45 2 20 4 -2 4 43 1 25 7 -6 36 47 3.5 22 5 -1.5 2.25 47 3.5 7 8 -4.5 20.25 51 7 28 10 -3 9 48 5 16 2 3 9 60 10 15 1 9 81 53 8 18 3 5 25 50 6 24 6

/>

/>

/>

/>

/>= 0

/>= 186,5

Тогда />

3. Сравнить расчетное значение рангового коэффициента корреляции(rф=-0,13) с табличным значением для n = 10 при α = 5% и сделать вывод.

Вывод:

1) т.к. rф = -0,13 < 0, то между данными выборокнаблюдается прямая отрицательная взаимосвязь, т.е. увеличением показателей весавызывает снижение максимального количество сгибаний и разгибаний рук в упорележа в группе исследуемых;

2) т.к. rф = -0,13 < rst = 0,64 для n =10 при α = 5%, то с уверенностью Р = 95% можно говорить о том, чтовыявленная зависимость недостоверна.

1.8Основныесвойства коэффициентов корреляции

 

К основным свойствам коэффициента корреляции необходимо отнестиследующие:

— коэффициенты корреляции способны характеризовать только линейныесвязи, т.е. такие, которые выражаются уравнением линейной функции. При наличиинелинейной зависимости между варьирующими признаками следует использоватьдругие показатели связи;

— значения коэффициентов корреляции – это отвлеченные числа,лежащее в пределах от —1 до +1, т.е. -1 < r < 1;

— при независимом варьировании признаков, когда связь между нимиотсутствует, r= 0;

— при положительной, или прямой, связи, когда с увеличением значенийодного признака возрастают значения другого, коэффициент корреляции приобретаетположительный знак и находится в пределах от 0 до +1, т.е. 0 < r < 1;

— при отрицательной, или обратной, связи, когда с увеличением значенийодного признака соответственно уменьшаются значения другого, коэффициенткорреляции сопровождается отрицательным знаком и находится в пределах от 0 до–1, т.е. -1 < r <0;

— чем сильнее связь между признаками, тем ближе величина коэффициентакорреляции к 1. Если r = ±1, то корреляционная связь переходит в функциональную,т.е. каждому значению признака Х будет соответствовать одно или несколькострого определенных значений признака Y;

— только по величине коэффициентов корреляции нельзя судить одостоверности корреляционной связи между признаками. Этот параметр зависит отчисла степеней свободы f= n –2, где n – число коррелируемых пар показателей Х и Y. Чем больше n,тем выше достоверность связи при одном и том же значении коэффициентакорреляции. [2]

1.9Проверказначимости коэффициентов корреляции

 

Дляпроверки значимости коэффициентов корреляции чаще всего используютраспределение Стьюдента и условие:

/> , f= N – 2, α= 0,05.


Еслиусловие выполняется, то гипотеза об отсутствии корреляционной связи принимается[5].

1.10  Критическиезначения коэффициента парной корреляции

 

Таблица3 — Критические значения коэффициента парной корреляции при α=0,05

Число степеней свободы f Критиче-ское значение r Число степеней свободы f Критиче-ское значение r Число степеней свободы f

Критиче-

ское значение

r

1

2

3

4

5

6

7

8

0,997

0,950

0,878

0,811

0,754

0,707

0,666

0,632

9

10

11

12

13

14

15

16

0,602

0,576

0,553

0,532

0,514

0,497

0,482

0,468

17

18

19

20

30

50

80

100

0,456

0,444

0,433

0,423

0,349

0,273

0,217

0,195

 

/>Дляпроверки значимости коэффициента парной корреляции нужно сравнить его значениес табличным (критическим) значением r, которое приведено в таблице 3. Для пользования этой таблицейнужно знать число степеней свободы f = N – 2 и выбрать определенный уровень значимости, например равный0,05. Такое значение уровня значимости называют еще 5%-ным уровнем риска, чтосоответствует вероятности верного ответа при проверке нашей гипотезы Р = 1 –α = 0,95, или 95%. Это значит, что в среднем только в 5% случаев возможнаошибка при проверке гипотезы.

В практических исследованиях 5%-ный уровень риска применяетсянаиболее часто. Но экспериментатор всегда свободен в выборе уровня значимости,и возможны ситуации, в которых, например, требуется 1%-ный уровень риска. Приэтом возрастает надежность ответа. Проверка гипотезы сводится к сравнениюабсолютной величины коэффициента парной корреляции с критическим значением. Еслиэкспериментально найденное значение r меньше критического, то нет оснований считать, что имеется теснаялинейная связь между параметрами, а если больше или равно, то гипотеза о корреляционнойлинейной связи не отвергается[6].


2. РЕШЕНИЕ ЗАДАЧИ

 

2.1 Условие задачи

Рассчитатьполным факторным экспериментом влияние давления 5-20 МПа, жирности 4-2,5м.д. икислотности 14-20°Т на качество продукции.

 

Таблица1 – Условие задачи

Фактор Номер фактора Верхнее значение Нижнее значение Давление

/>

20 5 Жирность

/>

4 2,5 Кислотность

/>

20 14

 

Таблица 2 – Функцияотклика

У1 65 60 63 46 47 47 56 54 У2 55 47 46 47 58 56 49 61 УЗ 55 51 61 57 58 53 55 52

2.2 Определение центра плана (основной уровень) иуровня варьирования факторов

Находимцентр плана:

/>.

Находимполуразмах:

/>.


Рассчитываеми оформляем в виде таблицы.

/>, />

/>, /> 

/>, />

 

Таблица3 – Центр плана и полуразмах

Фактор

Центр плана />

Полуразмах/>

Давление 12,5 7,5 Жирность 3,25 0,75 Кислотность 17 3

Рассчитываемнижний уровень варьирования факторов:

/>

/>

/>

/>

Рассчитываемверхний уровень варьирования факторов:

/>

/>

/>

/>

2.3 Построение матрицы планирования

 

Таккак мы имеем 2 уровня варьирования факторов и 3 фактора, то получаем матрицу />. Число опытовравно 8.

 

Таблица3 – Матрица планирования типа />

№ опыта

/>

/>

/>

1 + + - 2 + + + 3 + - + 4 + - - 5 - + - 6 - + + 7 - - + 8 - - -

Составляемрасширенную матрицу планирования для того, чтобы учесть взаимодействиефакторов.

 

Таблица4 – Расширенная матрица планирования

№ опыта

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

1 + + + - + - - - 65 55 55 58,3 2 + + + + + + + + 60 47 51 52,7 3 + + - + - + - - 63 46 61 56,7 4 + + - - - - + + 46 47 57 50 5 + - + - - + - + 47 58 58 54,3 6 + - + + - - + - 47 56 53 52 7 + - - + + - - + 56 49 55 53,3 8 + - - - + + + - 54 61 52 55,7

2.4 Проверка однородности дисперсии и равноточностиизмерения в разных сериях

Дляпроверки однородности дисперсии был выбран критерий Кохрена. Для этогорассчитываем дисперсию в каждом опыте по формуле:

/>.

Находим:

/>

/>

/>

/>

/>

/>

/>

/>

Условияпроверки однородности дисперсий по критерию Кохрена:


/> 

/>

/> для уровнязначимости 0,05 равна 0,32.

/></>,следовательно, дисперсия однородна и измерения в разных сериях равноточны.

2.5 Коэффициенты уравнения регрессии

Находимкоэффициенты уравнения регрессии.

/>.

Находим:

/>

/>

/>

/>

/>

/>

/>

/>

Следовательно,уравнение регрессии примет вид:

 

/>

2.6 Дисперсия воспроизводимости

Вычисляемзначение дисперсии воспроизводимости по формуле:

/>

/>

2.7 Проверка значимости коэффициентов уравнениярегрессии

Проверяемзначимость коэффициентов уравнения регрессии по критерию Стьюдента:

/> где />

/>

/>

/>

/>

/>

/>

/>

/>

/>

Условиезначимости /> Дляуровня значимости α = 0,05 и числа степеней свободы f= N — 1 =8 — 1 = 7 находим табличноезначение критерия Стьюдента />

Сравниваемрасчетное значение с табличным и видим, что значение/>незначительные и их коэффициентыследует исключить из уравнения регрессии. Так как коэффициенты получилисьнезначимы и мы не имеем возможности заново поставить новый эксперимент ипродолжаем вычисления, выбрав наиболее близкие к значимым коэффициенты.

Уравнениерегрессии примет вид:

/>

2.8 Проверка адекватности уравнения регрессии

Дляпроверки используется критерий Фишера:

/> 

/> 

гдеd – количество коэффициентов уравнениярегрессии.

Находимзначения />:

/>

/>

/>

/>

/>

/>

/>

/>

Найдемзначение

/> 

/>

Находимтабличное значение критерия Фишера для степеней свободы /> />/>

Сравниваемусловие /></>, значит,модель адекватна.

Выводы:

- Уравнениерегрессии имеет вид: />

- Анализзначимости коэффициентов уравнении регрессии показал, что влияние всех факторовнезначимо.

- Модельадекватна, так как критерий адекватности меньше табличного.

- Измеренияв различных серий равноточны.


ЗАКЛЮЧЕНИЕ

 

Термин «корреляция» былвведен в науку выдающимся английским естествоиспытателем Френсисом Гальтоном в1886 году. Однако точную формулу для подсчета коэффициента корреляцииразработал его ученик Карл Пирсон.

Задачи с одним выходнымпараметром имеют очевидные преимущества. Но на практике чаще всего приходитсяучитывать несколько выходных параметров. Иногда их число довольно велико. Так,например, при производстве резиновых и пластмассовых изделий приходитсяучитывать физико-механические, технологические, экономические,художественно-эстетические и другие параметры (прочность, эластичность,относительное удлинение и т.д.). Математические модели можно построить длякаждого из параметров, но одновременно оптимизировать несколько функций невозможно.

Обычно оптимизируется однафункция, наиболее важная с точки зрения цели исследования, при ограничениях,налагаемых другими функциями. Поэтому из многих выходных параметров выбираетсяодин в качестве параметра оптимизации, а остальные служат ограничениями. Всегдаполезно исследовать возможность уменьшения числа выходных параметров. Для этогои используется корреляционный анализ.

С использованиемрезультатов корреляционного анализа исследователь может делать определённыевыводы о наличии и характере взаимозависимости, что уже само по себе можетпредставлять существенную информацию об исследуемом объекте. Результаты могутподсказать и направление дальнейших исследований, и совокупность требуемыхметодов, в том числе статистических, необходимых для более полного изученияобъекта[7].

Особенно реальнуюпользу применение аппарата корреляционного анализа может принести на стадииранних исследований в областях, где характеры причин определённых явлений ещёнедостаточно понятны. Это может касаться изучения очень сложных системразличного характера: как технических, так и социальных.


СПИСОК ЛИТЕРАТУРЫ

1 СидоренкоЕ.В. Методы математической обработки в психологии. Спб.: ООО «Речь», 2000. –350 с.

2 Лекция на тему: «Корреляционный анализ''// www.kgafk.ru,2006, 8 с.

3 Ковалев В.В, Волкова О.Н., Анализ хозяйственной деятельностипредприятия// polbu.ru, 2005, 2 с.

4 ПоляковЛ.Е., Коэффициент ранговой корреляции Спирмена//www.eduhmao.ru, 1971, 2 с.

5 БондарьА.Г., Статюха Г.А. Планирование эксперимента в химической технологии. Киев:Высшая школа, 1976 – 335 с.

6 АдлерЮ.П., Грановский Ю.В., Маркова Е.В. Планирование эксперимента при поискеоптимальных условий. М.: Наука, 1976.–278 с.

7 АндерсонТ., Введение в многомерный статистический анализ//www.ami.nstu.ru, 1963, 24 с.

еще рефераты
Еще работы по экономико-математическому моделированию