Метод К ближайших соседей /Глосарий
Метод К ближайших соседей - один из наиболее простых алгоритмов классификации, относящийся к группе структурных методов.
В качестве обучающей выборки используется набор объектов, каждый из которых принадлежит к одному из двух или более классов. Каждый объект может быть представлен точкой в n-мерном пространстве, где n – число аналититических признаков, используемых для классификации.
Неизвестный объект относится к одному из классов по следующему принципу: находится K ближайших объектов из обучающей выборки в пространстве образов (обычно используется мера расстояния Евклида). Затем определяется, к какому классу принадлежит большинство ближайших объектов обучающей выборки – к этому классу относится и неизвестный объект. Оптимальное число K, как правило, подбирают экспериментальным путем. Увеличение K приводит к уменьшению влияния случайных погрешностей в данных, но при этом разделение на классы становится менее четким.