Реферат: Исследование статистических зависимостей для контактных систем типа W UMa

--PAGE_BREAK-- 































Фaik

Aaij









Aalk

Aalj






























     Предсказание  элемента  Aij по k-му  столбцу  Aij(k) делается на основание гипотезы о линейной  зависимости между  столбцами, при  этом сначала  вычисляются   коэффициенты  линейной  регрессии  Вjk и Сjk, и по ним находится  элемент Aij(k):

                                  Aij(k)=Bjk*Aik+Cjk.

После того, как будут сделаны  предсказания  Аij(k)  по  всем  р столбцам, не имеющим    пропуска в  i-ой строке, вычисляется средневзвешенная величина элемента:

                   Aij(стб)=(<img width=«31» height=«47» src=«ref-1_152519564-420.coolpic» v:shapes="_x0000_i1025">Aij(k)*Qkj)/(<img width=«31» height=«47» src=«ref-1_152519564-420.coolpic» v:shapes="_x0000_i1026">Qkj)

 Вклад каждого столбца (строки) в результат  предсказания зависит от их  «компетентности»  Q, являющейся  функцией  двух аргументов: «близости» между j-м и k-м столбцами (i-ой и l-ой строками) и «взаимной заполненность»  этих столбцов (строк). «Близость» представляет собой степенную функцию модуля коэффициента линейной корреляции  (Rkj)а  (или (Ril)а). «Взаимная заполненность»  k-го и j-го столбцов (Lkj) равна числу непустых пар элементов этих столбцов Alk и Alj для всех l от 1 до m. Отсюда:

                                      Qil=(Ril)a*Lil

                                      Qkj=(Rkj)a*Lkj .

  Выбор показателя степени а осуществляется следующим образом, при каждом из последовательных значений а (из некоторого заданного диапазона amin<a<amax) выполняется предсказание всех известных  элементов k-го столбца  матрицы  A(i,j). При каждом a вычисляется  расхождение  между  фактическими и предсказанными значениями. Для предсказания  Aij  выбирается то из значений a, при котором была получена  лучшая  средняя точность dj предсказания этих известных значений. Легко увидеть, что, чем больше  (Rkj)a, тем с большим весом будут учитываться  сведения от самых «похожих» столбцов и тем сильнее будут подавляться подсказки от менее «похожих».

     Аналогичная процедура  построения формулы и оценки точности вычисления всех элементов  i-ой строки выполняется для проверки возможности  предсказания  Aij как элемента строки.             

                           Aij(стр)=(<img width=«61» height=«47» src=«ref-1_152520404-548.coolpic» v:shapes="_x0000_i1027">*Qil)/(<img width=«45» height=«47» src=«ref-1_152520952-500.coolpic» v:shapes="_x0000_i1028">)

Данные в матрице A(i,j) предварительно нормированы так, чтобы элементы каждого столбца изменялись в пределах от 0 до 1. После получения оценок предсказания по строкам и столбцам сравнивается точность, с которой удалось предсказать известные элементы i-ой строки  di и j-го столбца  dj. Окончательно  для  предсказания  выбирается  либо  Aij(стб),  либо  Aij(стр), в зависимости от того, где  точность  d  оказалась выше. Эта  точность  рассматривается  в  качестве  ожидаемой ошибки предсказания Aij.

     Итак, в алгоритме ZET можно выделить основные этапы:
1. Проводится нормировка столбцов таблицы исходных данных по дисперсиям.
2. Выбирается  пробел  Aij, находящийся на пересечение  i-ой  строки и j-го столбца.
3. При определение сходства столбцов производится их предварительная  нормировка к интервалу [0,1], и для строк и для  столбцов степень сходства определяется на основе евклидова  расстояния

  rев=[<img width=«88» height=«47» src=«ref-1_152521452-630.coolpic» v:shapes="_x0000_i1029">    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по информатике