Реферат: Прогнозування моделями простої лінійної регресії
НЕПАРАМЕТРИЧНІ МЕТОДИ ОЦІНКИ ТІСНОТИ ЗВ`ЯЗКУ
План
1. Критерії Спірмена та Кендала
2. КритерійФехнера
3. Коефіцієнтиасоціації і контингенції
4. Коефіцієнт взаємної спряженості Пірсона і Чупрова
Література
1. Критерії Спірмена та Кендала
Середнепараметричних (емпіричних) методів оцінки тісноти зв’язку найбільше значеннямають розрахунки рангових коефіцієнтів Спірмена /> і Кендала />.
Ці коефіцієнтиможуть бути використанні для визначення тісноти зв’язку як між кількісними, такі між якісними ознаками при умові, якщо значення цих показників можуть бутивпорядковані або проранговані по спаданню або зростанню ознаки.
Для визначеннярангового коефіцієнта кореляції рангують (тобто записують у зростаючому абоспадаючому порядку) всі значення факторної ознаки /> іразом з тим записують відповідні значення результативної ознаки />. Другими словами,визначають ранг по обох ознаках, тобто номер кожної ознаки в рангових рядах.
Ступінь тіснотизв’язку між ознаками визначається ранговим коефіцієнтом кореляції Спірмена поформулі:
/>
де /> - квадрати різниць рангівзв’язаних величин /> і />; п — числоспостережень (число пар рангів).
У випадкувідсутності зв’язку />; при прямомузв’язку коефіцієнт /> додатній, а приоберненому зв’язку — від’ємний.
Приклад 1. Визначити, чи існує залежність між стажем роботи та виробіткомробітника для слідуючих даних:
Таблиця 1
№ п/пСтаж роботи робітників, х, роки
Виробіток на 1 робітника, у
1 2,5 222 2 2,5 223 3 1 200 4 1 202 5 1 205 6 5 244 7 5 250 8 3 234 9 4,5 241 10 4,4 244 11 2,7 230
Рішення.
Фактори /> і /> ранжуємо (впорядкуємо)в порядку зростання (спадання) їх значень ізаповнюємо табл. 2.
Таблиця 2
/>
/>
Ранг ознаки х
Ранг ознаки у
Рангова різниця/>
1 200 4 3 1 1 1 202 4 4 1 205 4 5 -1 1 2,5 222 1,5 1 0,5 0,25 2,5 223 1,5 2 -0,5 0,25 2,7 230 11 11 3 234 8 8 4,4 241 10 9 1 1 4,5 244 9 8 1 1 5 244 6,5 8 -1,5 2,25 5 250 6,5 7 -0,5 0,25 Всього 3,5-3,5=0 7Визначаємо рангипо обох ознаках, тобто номер кожної ознаки в рангованих рядах. Для рівних значень факторів х та у ранг знаходять шляхомділення суми рангів, що приходяться на неї, на число рівних значень.
3. Знаходимо рангову різницю /> та />.
4. Розрахуємо коефіцієнт кореляції рангів Спірмена:
/>
Розрахунокрангового коефіцієнта Кендала відбувається за формулою:
/>
де п — число спостережень; S — сумадодатних та від’ємних балів по одній із зв’язаних величин, ранги котроїрозміщені у відповідності з впорядкованими рангами другої.
2. КритерійФехнераОдним ізнайпростіших показників кореляційної залежності, пов’язаний з іменем відомогонімецького вченого психофізика Фехнера.
Коефіцієнт Фехнерабазується на застосуванні перших ступенів відхилень всіх значеньвзаємозв’язаних ознак від середньої величини по кожній ознаці.
Коефіцієнт Фехнеравимірює тісноту зв’язку за наступною формулою:
/>
де /> - число збігів танезбігів знаків відхилень значень фактичної і результативної ознак від своїхсередніх, тобто /> При цьому фіксуються збіги танезбіги знаків в відхиленнях від середньої у різних пар значень ознак.
Коефіцієнт ФехнераК змінюється в межах від — 1 до +1. Якщо зв’язок між ознаками обернений, то К від’ємний; у випадку прямого зв’язку — додатній. Чим ближче К до />, тим зв’язок більш тісний.
Приклад 2.Розрахувати коефіцієнт Фехнера для наступних даних:
Таблиця 3
Стаж роботи, х
/>
Виробіток на 1 робітника, у
/>
Збіг чи незбіг знаків 2,5 - 222 - С 2,5 - 223 - С 1 - 200 - С 1 - 202 - С 1 - 205 - С 5 + 244 + С 5 + 250 + С 3 + 234 + С 4,5 + 241 + С 4,5 + 244 + С 2,7 - 230 + Н/>
/>
Коефіцієнт Фехнера
/>
Величина Кдосить близька до величини коефіцієнта рангової кореляції Спірмена, що свідчитьпро тісний зв’язок між ознаками х іу.
3. Коефіцієнтиасоціації і контингенції
Для визначеннятісноти зв’язку двох якісних ознак, кожна із котрих складається тільки із двохгруп, використовують коефіцієнти асоціації і контингенції. Для їх розрахункубудується чотирьохклітинна таблиця кореляції, котра виражає зв’язок між двомаявищами, кожне із них в свою чергу повинно бути альтернативним, тобтоскладається із двох якісно відмінних друг від друга значень ознаки (наприклад,хороший, поганий).
Наприклад, прививчені залежності врожайності від кількості внесених в ґрунт добрив виділимопо врожайності і по кількості внесених добрив лише по дві групи. При цій умові можна побудувати наступну чотирьохклітинну таблицю.
Таблиця 4
Удобрено
Урожайність
Добре Погано Всього Високаа
в
a+b
Низькас
d
c+d
Всьогоà+c
b+d
Числа, які стоятьна перетині рядків і граф a, в, c, d показують, скільки дільницьзустрічаються з тою або другою кількістю добрив, що внесені в ґрунт, з тією абодругою врожайністю.
Коефіцієнтасоціації Юла і коефіцієнт контингенції розраховується за наступними формулами:
асоціації Юла />;
контингенції />.
де a, в, c, d — кількісні характеристики досліджувальних груп.
Коефіцієнтконтингенції завжди менший коефіцієнта асоціації Юла. Зв’язокрахується підтвердженим, якщо:
/> або />.
Приклад 3.Дослідити зв’язок між виконанням норм виробітку молодимиробітниками і закінченням ними середньої школи. Результатиобстеження характеризуються даними (табл. 5).
Таблиця 5
Групи робітників Виконують норму Не виконують норму Всього Закінчили середню школу 78 22 100 Не закінчили середню школу 32 68 100 Всього 110 90 200
Рішення.За даними таблиці
/>
/>
Міждосліджувальними ознаками спостерігається чіткий зв’язок, що підтверджуєтьсядосить високими значеннями коефіцієнтів асоціації і контингенції.
4. Коефіцієнт взаємної спряженостіПірсона і ЧупроваЯкщо кожна ізякісних ознак складається більше ніж із двох груп, то для визначення тіснотизв’язку можна використати коефіцієнт взаємної спряженості Пірсона. Цейкоефіцієнт розраховується за наступною формулою:
/>
де q2 — показник взаємної спряженості.
Коефіцієнт Чупрова:
/>,
де К1,К2 — число груп по кожній із ознак.
/>
Розрахуноккоефіцієнта взаємної спряженості проводиться за наступною схемою (табл.6).
Таблиця 6
Групи ознаки А Групи ознак В РазомВ1
В2
В3
А1
f1
f2
f3
n1
A2
f4
f5
f6
n2
A3
f7
f8
f9
n3
Разомт1
т2
т3
Розрахунок q2:
по першому рядку
/>
по другому рядку
/>
по третьому рядку
/>
/>.
Приклад 4.В таблиці 2.7 приведені згруповані данінакладних видатків (х) та собівартості продукції (у).За допомогою коефіцієнта взаємної спряженості дослідити зв’язокміж собівартістю продукції та накладними витратами на реалізацію.
Рішення.
Розрахуємо q2:
/>
по першому рядку />
Таблиця 2.7
Накладні Собівартість Разом витрати нижня середня висока Нижні 19 12 9 40 Середні 7 18 15 40 Високі 4 10 26 40 Разом 30 40 50по другому рядку />
по третьому рядку
/>.
/>.
Підставляємо /> у відповідні формули ізнаходимо:
коефіцієнт Пірсона:/>,
коефіцієнт Чупрова:/>.
Досить високезначення с вказує на наявність зв’язку між собівартістю продукції танакладними витратами на реалізацію.
Непараметричніметоди вимірювання зв’язку використовуються для перевірки умов використанняметода найменших квадратів, незалежності розподілу ознак, однорідності вибірок,наявності тренда в рядах динаміки.
Література
1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.М.,ЮНИТИ. 1998 — 1022 с.
2. Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.«Финансы и статистика», 1985. — 356 с.
3. Доугерти Кристофер. Введение в эконометрику. Пер. с англ. — М.,ИНФРА-М. — XIV. 1997 — 402 c.
4. Maddala G.L., Kim In-Moo Unit Roots, Cointegration, and StructuralChange. Cambridge Univ. Press., 1999.
5. Davidson R., MacKinnon J.G. Estimation and Inference in Econometrics.Oxford Univ. Press., 1993.