ХЕММИНГОВО РАССТОЯНИЕ
(7.4)
используя как мера различия объектов, задаваемых дихотомическими признаками. Хеммингово расстояние равно числу несовпадений значений соответствующих признаков в рассматриваемых i-м и j-м объектах.
В некоторых задачах квалификации в качестве меры близости объектов можно использовать некоторые физически содержательные параметры, так или иначе характеризующие взаимоотношение между объектами. Например, задачу квалификации отраслей народного хозяйства с целью агрегирования решают на основе матрицы межотраслевого баланса.
В данной задаче объектом квалификации являются отрасль народного хозяйства, а матрица межотраслевого баланса представлена элементами Sij, характеризующими сумму годовых поставок i-ой отросли в j-ю в денежном выражении. В качестве меры близости {rij} принимают симметризацию нормированной матрицы межотраслевого баланса. С целью нормирования денежное выражение поставок i-й отрасли j-ю заменяют долей этих поставок по отношению ко всем поставкам i-й отрасли. Симметризацию нормированной матрицы межотраслевого балансаможно выразить через среднее значение близость взаимных поставок между i-й и в j-й отраслью так, что в этом случае rij=rji.
Как правило, решение задач классификации многомерных данных предусматривает в качестве предварительного этапа исследования реализацию методов, позволяющих выбирать из компонент x1,x2,…,xk . рассматривают как объект, подлежащий классификации. После разбиении на небольшое число однородных в некотором смысле групп для дальнейшего исследования оставляют по одному представителю от каждой группы. При этом предполагается, что признаки, попавшие в одну группу, в определенном смысле связаны друг с другом и несут информацию о каком-то одном свойстве объекта.
В качестве близости между отдельными признаками обычно используют различные характеристики степени их коррелированности, в первую очередь коэффициенты корреляции. В ряде задач применяются и другие расстояния (метрики). Выбор метрики определяется структурой признакового пространства и целью классификации. Формализовать этот этап задачи классификации пока не представляется возможным.