Линейная модель механизма поиска документов-аналогов.

Аналогами документа называются такие документы информационного массива, которые имеют заданное количество общих терминов с исходным. Задается пороговое значение близости m. Процедура поиска аналогов м.б. усложнена заданием пороговых значений для структурных единиц документов и составлением логических выражений над множеством критериев отбора, связывающих поле и соответствующее пороговое значение.

Выделим в матрице L0 столбец , соответствующий ПОДу рассматриваемого документа, и построим подматрицу LDoc, оставив в матрице L0 те строки, в кот-х . По матрице LDoc строится результирующий вектор запроса на поиск аналогов (QDoc ) и м.б. получен поисковый результат с учетом (или без) некоторого заданного порога «близости» (m). Результирующий вектор QDoc=(q1q2…qm), где qi= , т.е. суммированием элементов столбца. Далее получаем окончательный поисковый результат Kn=(k1…km), ki равно либо 0 (qi<m), документ не является аналогом,либо 1(qi>=m), является аналогом.