Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Distancia euclidiana
1. Distancia de edición = Distancia de Levenshtein
Número de operaciones necesario para
transformar una cadena en otra.
d(“data mining”, “data minino”) = 1 ”,
d(“efecto”, “defecto”) = 1
d(“poda”, “boda”) = 1
d(“night”, natch”) = d(“natch”,”noche “)= 3
Aplicaciones: Correctores ortográficos,
reconocimiento de voz, detección de plagios,
análisis de ADN…
Matemáticamente, si tomamos
dos puntos p y q en una
cuadrícula con coordenadas
p=(p1,p2) y q=(q1,q2), la
distancia Manhattan entre
dichos puntos es la suma de los
valores absolutos de las
diferencias entre las
coordenadas. Es decir:
d(p,q)=|q1-p1|+|q2-p2|
Distancia de Manhattan
En la imagen, podéis ver una cuadrícula en la
que tenemos dos puntos unidos con una línea
recta (en verde), que corresponde con la
distancia habitual (la euclídea), y varias
maneras de unir ambos puntos con un camino
mínimo siguiendo las calles de la cuadrícula (lo
que sería la distancia Manhattan entre ambos
puntos).
Distancia euclidiana:
La distancia euclidiana es el método de medición de distancia más fácil de
entender intuitivamente La distancia en el espacio entre dos puntos que tocamos
en la escuela primaria, secundaria y preparatoria generalmente se refiere a la
distancia euclidiana.
La distancia de Levenshtein, distancia de
edición o distancia entre palabras es el número mínimo
de operaciones requeridas para transformar una cadena de
caracteres en otra, se usa ampliamente en teoría de la
información y ciencias de la computación. Se entiende por
operación, bien una inserción, eliminación o la sustitución
de un carácter. Esta distancia recibe ese nombre en honor
al científico ruso Vladimir Levenshtein, quien se ocupó de
esta distancia en 1965. Es útil en programas que
determinan cuán similares son dos cadenas de caracteres,
como es el caso de los correctores ortográficos.
Por ejemplo, la distancia de Levenshtein entre "casa"
y "calle" es de 3 porque se necesitan al menos tres
ediciones elementales para cambiar uno en el otro.
1. casa → cala (sustitución de 's' por 'l')
2. cala → calla (inserción de 'l' entre 'l' y 'a')
3. calla → calle (sustitución de 'a' por 'e')
2. Distancia de Chebyshev:
En el ajedrez, el rey puede caminar recto, horizontal o diagonalmente,
por lo que el rey puede moverse a cualquiera de las 8 casillas
adyacentes dando un paso. ¿Cuántos pasos necesita el rey para
caminar desde la cuadrícula (x1, y1) a la cuadrícula (x2, y2)? Esta
distancia se llama distancia de Chebyshev.
Distancia del coseno
Cuando los elementos de datos A y B se usan como puntos en el gráfico de coordenadas, la similitud entre los dos es la distancia dist (A,
B), que puede calcularse mediante la fórmula de la distancia euclidiana (también llamada distancia euclidiana):
Cuando se usa como vector, la similitud entre los dos es cosθ, que puede calcularse mediante la fórmula del coseno: