Реферат: Исследование статистических зависимостей для контактных систем типа W UMa
--PAGE_BREAK--Фaik
Aaij
Aalk
Aalj
Предсказание элемента Aij по k-му столбцу Aij(k) делается на основание гипотезы о линейной зависимости между столбцами, при этом сначала вычисляются коэффициенты линейной регрессии Вjk и Сjk, и по ним находится элемент Aij(k):
Aij(k)=Bjk*Aik+Cjk.
После того, как будут сделаны предсказания Аij(k) по всем р столбцам, не имеющим пропуска в i-ой строке, вычисляется средневзвешенная величина элемента:
Aij(стб)=(<img width=«31» height=«47» src=«ref-1_152519564-420.coolpic» v:shapes="_x0000_i1025">Aij(k)*Qkj)/(<img width=«31» height=«47» src=«ref-1_152519564-420.coolpic» v:shapes="_x0000_i1026">Qkj)
Вклад каждого столбца (строки) в результат предсказания зависит от их «компетентности» Q, являющейся функцией двух аргументов: «близости» между j-м и k-м столбцами (i-ой и l-ой строками) и «взаимной заполненность» этих столбцов (строк). «Близость» представляет собой степенную функцию модуля коэффициента линейной корреляции (Rkj)а (или (Ril)а). «Взаимная заполненность» k-го и j-го столбцов (Lkj) равна числу непустых пар элементов этих столбцов Alk и Alj для всех l от 1 до m. Отсюда:
Qil=(Ril)a*Lil
Qkj=(Rkj)a*Lkj .
Выбор показателя степени а осуществляется следующим образом, при каждом из последовательных значений а (из некоторого заданного диапазона amin<a<amax) выполняется предсказание всех известных элементов k-го столбца матрицы A(i,j). При каждом a вычисляется расхождение между фактическими и предсказанными значениями. Для предсказания Aij выбирается то из значений a, при котором была получена лучшая средняя точность dj предсказания этих известных значений. Легко увидеть, что, чем больше (Rkj)a, тем с большим весом будут учитываться сведения от самых «похожих» столбцов и тем сильнее будут подавляться подсказки от менее «похожих».
Аналогичная процедура построения формулы и оценки точности вычисления всех элементов i-ой строки выполняется для проверки возможности предсказания Aij как элемента строки.
Aij(стр)=(<img width=«61» height=«47» src=«ref-1_152520404-548.coolpic» v:shapes="_x0000_i1027">*Qil)/(<img width=«45» height=«47» src=«ref-1_152520952-500.coolpic» v:shapes="_x0000_i1028">)
Данные в матрице A(i,j) предварительно нормированы так, чтобы элементы каждого столбца изменялись в пределах от 0 до 1. После получения оценок предсказания по строкам и столбцам сравнивается точность, с которой удалось предсказать известные элементы i-ой строки di и j-го столбца dj. Окончательно для предсказания выбирается либо Aij(стб), либо Aij(стр), в зависимости от того, где точность d оказалась выше. Эта точность рассматривается в качестве ожидаемой ошибки предсказания Aij.
Итак, в алгоритме ZET можно выделить основные этапы:
1. Проводится нормировка столбцов таблицы исходных данных по дисперсиям.
2. Выбирается пробел Aij, находящийся на пересечение i-ой строки и j-го столбца.
3. При определение сходства столбцов производится их предварительная нормировка к интервалу [0,1], и для строк и для столбцов степень сходства определяется на основе евклидова расстояния
rев=[<img width=«88» height=«47» src=«ref-1_152521452-630.coolpic» v:shapes="_x0000_i1029"> продолжение
--PAGE_BREAK--