Los algoritmos de clasificación por vecindad asignan una nueva instancia a la clase más común entre sus k vecinos más cercanos, donde la cercanía se mide mediante una métrica de distancia y k es un parámetro. Estos algoritmos asumen que instancias cercanas tienden a pertenecer a la misma clase. Calcular la distancia entre instancias es trivial para atributos numéricos pero se requiere una métrica adecuada para otros tipos de datos como texto.