SlideShare una empresa de Scribd logo
1 de 17
Tópicos administrativos I
Algoritmos Supervisados-K-Nearest-
Neighbor
Msc- MST - Especialista en sistemas de información- ALFREDO A. DIAZ CLARO
Universidad Autónoma de Bucaramanga
K-Nearest-Neighbor
K-
Nearest-
Neighbor
• K-Nearest-Neighbor es un algoritmo de clasificación (valores
discretos) o para predecir (regresión, valores continuos).
basado en instancia de tipo supervisado de Machine Learning.
• Usado en sistemas de recomendación, búsqueda semántica
y detección de anomalías.
k-Nearest Neighbor ?
• Basado en Instancia: No aprende
explícitamente un modelo (como en
Regresión Logística o árboles de
decisión).
• No paramétrico: No opera sobre el
patrón de distribución de datos
subyacente.
• Algoritmo perezoso (LAZY) KNN no
tiene un paso de entrenamiento
(aunque veremos algo parecido). Todos
los puntos de datos se usarán solo en el
momento de la predicción. el paso de
predicción es costoso.
• Utiliza la similitud de
características para predecir el clúster
en el que caerá el nuevo punto.
Campo
de
aplicación
• Se utiliza en la resolución de multitud de problemas, como en sistemas de
recomendación, búsqueda semántica y detección de anomalías.
• “Te mudaste a un nuevo barrio y quieres ser amigo de tus
vecinos. Empiezas a socializar con tus vecinos. Decide elegir vecinos que
coincidan con su pensamiento, intereses y pasatiempos. Aquí el
pensamiento, el interés y el hobby son características. Usted decide el
círculo de amigos de tu barrio en función de intereses, pasatiempos y
similitudes de pensamiento. Esto es análogo a cómo funciona KNN”
Ventajas y desventajas
• Es sencillo de aprender e
implementar.
• Utiliza todo el
dataset para entrenar
«cada punto» y por eso
requiere de uso de mucha
memoria y recursos de
procesamiento (CPU).
• kNN puedes funcionar
mejor en datasets
pequeños y sin una
cantidad enorme de
features (las columnas).
• Para reducir la cantidad
de dimensiones (features)
podemos aplicar PCA
Algoritmo • Calcula la distancia entre el item
a clasificar y el resto de items del
dataset de entrenamiento.
• Seleccionar los «k» elementos
más cercanos (con menor
distancia, según la función que se
use)
• Realizar una «votación de
mayoría» entre los k puntos: los
de una clase/etiqueta que
<<dominen>> decidirán su
clasificación final.
Decisión del cluster
• Para decidir la clase
de un punto es
importante el valor
de k, para definir a
qué grupo
pertenecerán los
puntos, en las
«fronteras» entre
grupos.
Las formas distancia en datos
contínuos son: distancia
Euclidiana, Mahattan,
Minkowski , Distancia
Hammingo la Cosine
Similarity (mide el ángulo
de los vectores, cuanto
menores, serán similares).
Ejemplo de
asignación de
centroides
Precisión del modelo
• La precisión se usan la Matriz de Confusión
y el Reporte sobre el conjunto de test.
Ejercicio en Pytohn
Ejercicio en Knime
GRACIAS

Más contenido relacionado

La actualidad más candente

Diagrama De Bloques De Un Computador
Diagrama De Bloques De Un Computador Diagrama De Bloques De Un Computador
Diagrama De Bloques De Un Computador
kemaesmi
 
Sistemas de información
Sistemas de informaciónSistemas de información
Sistemas de información
guestd49fa4
 
Sistemas de informacion y perpectivas de los negocios 2
Sistemas de informacion y perpectivas de los negocios 2Sistemas de informacion y perpectivas de los negocios 2
Sistemas de informacion y perpectivas de los negocios 2
Albel Canelón
 
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
PEDRO LARA MALDONADO
 
2 como simular
2 como simular2 como simular
2 como simular
dantori
 

La actualidad más candente (20)

Diagrama De Bloques De Un Computador
Diagrama De Bloques De Un Computador Diagrama De Bloques De Un Computador
Diagrama De Bloques De Un Computador
 
Prueba De Medias
Prueba De MediasPrueba De Medias
Prueba De Medias
 
Dinamica de-sistemas
Dinamica de-sistemasDinamica de-sistemas
Dinamica de-sistemas
 
5.2 Redes neuronales (RN) [presentación].
5.2 Redes neuronales (RN) [presentación].5.2 Redes neuronales (RN) [presentación].
5.2 Redes neuronales (RN) [presentación].
 
Características de las Redes Neuronales
Características de las Redes NeuronalesCaracterísticas de las Redes Neuronales
Características de las Redes Neuronales
 
Aprendizaje Supervisado | Redes Neuronales Perceptron | Jose Luis Bugarin
Aprendizaje Supervisado | Redes Neuronales Perceptron | Jose Luis BugarinAprendizaje Supervisado | Redes Neuronales Perceptron | Jose Luis Bugarin
Aprendizaje Supervisado | Redes Neuronales Perceptron | Jose Luis Bugarin
 
Sistemas de almacenamiento RAID
Sistemas de almacenamiento RAIDSistemas de almacenamiento RAID
Sistemas de almacenamiento RAID
 
Sistemas de información
Sistemas de informaciónSistemas de información
Sistemas de información
 
Sistemas de informacion y perpectivas de los negocios 2
Sistemas de informacion y perpectivas de los negocios 2Sistemas de informacion y perpectivas de los negocios 2
Sistemas de informacion y perpectivas de los negocios 2
 
Scampi
ScampiScampi
Scampi
 
T1 Gestion De Datos
T1 Gestion De DatosT1 Gestion De Datos
T1 Gestion De Datos
 
Introduction to Machine Learning
Introduction to Machine LearningIntroduction to Machine Learning
Introduction to Machine Learning
 
Gestion de redes
Gestion de redesGestion de redes
Gestion de redes
 
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
 
Gestores de bases de datos cuadros comparativos
Gestores de bases de datos cuadros comparativosGestores de bases de datos cuadros comparativos
Gestores de bases de datos cuadros comparativos
 
Types of clustering and different types of clustering algorithms
Types of clustering and different types of clustering algorithmsTypes of clustering and different types of clustering algorithms
Types of clustering and different types of clustering algorithms
 
Introduccion Medios De Transmision
Introduccion Medios De TransmisionIntroduccion Medios De Transmision
Introduccion Medios De Transmision
 
2 como simular
2 como simular2 como simular
2 como simular
 
Introducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con MicrosoftIntroducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con Microsoft
 
Data Mining
Data MiningData Mining
Data Mining
 

Similar a Modelo supervisado knn

Practicar con weka.pptx
Practicar con weka.pptxPracticar con weka.pptx
Practicar con weka.pptx
DarnelyC
 

Similar a Modelo supervisado knn (20)

El algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datosEl algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datos
 
El algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datosEl algoritmo k nn y su importancia en el modelado de datos
El algoritmo k nn y su importancia en el modelado de datos
 
Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial
 
Curso Big Data. Introducción a Deep Learning by Gabriel Valverde Castilla
Curso Big Data. Introducción a  Deep Learning by Gabriel Valverde CastillaCurso Big Data. Introducción a  Deep Learning by Gabriel Valverde Castilla
Curso Big Data. Introducción a Deep Learning by Gabriel Valverde Castilla
 
Criterios de Búsquedas en Inteligencia artificial
Criterios de Búsquedas en Inteligencia artificialCriterios de Búsquedas en Inteligencia artificial
Criterios de Búsquedas en Inteligencia artificial
 
CIITEC Fundamentos de Deep Learning.pptx
CIITEC  Fundamentos de Deep Learning.pptxCIITEC  Fundamentos de Deep Learning.pptx
CIITEC Fundamentos de Deep Learning.pptx
 
Métodos de Búsquedas en Inteligencia Artificial
Métodos de Búsquedas en Inteligencia ArtificialMétodos de Búsquedas en Inteligencia Artificial
Métodos de Búsquedas en Inteligencia Artificial
 
Tipos de algoritmos del Machine Learning
Tipos de algoritmos del Machine LearningTipos de algoritmos del Machine Learning
Tipos de algoritmos del Machine Learning
 
Feature Selection
Feature SelectionFeature Selection
Feature Selection
 
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
Modelos predictivos para el sector asegurador usando datos masivos (Big Data ...
 
Pruebas de Selección para Cargos de Data Scientist
Pruebas de Selección para Cargos de Data ScientistPruebas de Selección para Cargos de Data Scientist
Pruebas de Selección para Cargos de Data Scientist
 
LATAM Challenge
LATAM ChallengeLATAM Challenge
LATAM Challenge
 
Final
FinalFinal
Final
 
Practicar con weka.pptx
Practicar con weka.pptxPracticar con weka.pptx
Practicar con weka.pptx
 
Mineria de Datos.pdf
Mineria de Datos.pdfMineria de Datos.pdf
Mineria de Datos.pdf
 
Final
FinalFinal
Final
 
BigData 101 / Cursillo (Parte3)
BigData 101 / Cursillo (Parte3)BigData 101 / Cursillo (Parte3)
BigData 101 / Cursillo (Parte3)
 
Sistemas de recomendación & Big Data
Sistemas de recomendación & Big DataSistemas de recomendación & Big Data
Sistemas de recomendación & Big Data
 
Introducción de redes neuronales artificiales
Introducción de redes neuronales artificialesIntroducción de redes neuronales artificiales
Introducción de redes neuronales artificiales
 
Machine Learning para proyectos de seguridad(Pycon)
Machine Learning para proyectos de seguridad(Pycon)Machine Learning para proyectos de seguridad(Pycon)
Machine Learning para proyectos de seguridad(Pycon)
 

Último

FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
El Fortí
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
NancyLoaa
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
zulyvero07
 

Último (20)

FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
plan de capacitacion docente AIP 2024 clllll.pdf
plan de capacitacion docente  AIP 2024          clllll.pdfplan de capacitacion docente  AIP 2024          clllll.pdf
plan de capacitacion docente AIP 2024 clllll.pdf
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 

Modelo supervisado knn

  • 1. Tópicos administrativos I Algoritmos Supervisados-K-Nearest- Neighbor Msc- MST - Especialista en sistemas de información- ALFREDO A. DIAZ CLARO Universidad Autónoma de Bucaramanga
  • 3. K- Nearest- Neighbor • K-Nearest-Neighbor es un algoritmo de clasificación (valores discretos) o para predecir (regresión, valores continuos). basado en instancia de tipo supervisado de Machine Learning. • Usado en sistemas de recomendación, búsqueda semántica y detección de anomalías.
  • 4. k-Nearest Neighbor ? • Basado en Instancia: No aprende explícitamente un modelo (como en Regresión Logística o árboles de decisión). • No paramétrico: No opera sobre el patrón de distribución de datos subyacente. • Algoritmo perezoso (LAZY) KNN no tiene un paso de entrenamiento (aunque veremos algo parecido). Todos los puntos de datos se usarán solo en el momento de la predicción. el paso de predicción es costoso. • Utiliza la similitud de características para predecir el clúster en el que caerá el nuevo punto.
  • 5. Campo de aplicación • Se utiliza en la resolución de multitud de problemas, como en sistemas de recomendación, búsqueda semántica y detección de anomalías. • “Te mudaste a un nuevo barrio y quieres ser amigo de tus vecinos. Empiezas a socializar con tus vecinos. Decide elegir vecinos que coincidan con su pensamiento, intereses y pasatiempos. Aquí el pensamiento, el interés y el hobby son características. Usted decide el círculo de amigos de tu barrio en función de intereses, pasatiempos y similitudes de pensamiento. Esto es análogo a cómo funciona KNN”
  • 6. Ventajas y desventajas • Es sencillo de aprender e implementar. • Utiliza todo el dataset para entrenar «cada punto» y por eso requiere de uso de mucha memoria y recursos de procesamiento (CPU). • kNN puedes funcionar mejor en datasets pequeños y sin una cantidad enorme de features (las columnas). • Para reducir la cantidad de dimensiones (features) podemos aplicar PCA
  • 7. Algoritmo • Calcula la distancia entre el item a clasificar y el resto de items del dataset de entrenamiento. • Seleccionar los «k» elementos más cercanos (con menor distancia, según la función que se use) • Realizar una «votación de mayoría» entre los k puntos: los de una clase/etiqueta que <<dominen>> decidirán su clasificación final.
  • 8. Decisión del cluster • Para decidir la clase de un punto es importante el valor de k, para definir a qué grupo pertenecerán los puntos, en las «fronteras» entre grupos.
  • 9. Las formas distancia en datos contínuos son: distancia Euclidiana, Mahattan, Minkowski , Distancia Hammingo la Cosine Similarity (mide el ángulo de los vectores, cuanto menores, serán similares).
  • 11.
  • 12. Precisión del modelo • La precisión se usan la Matriz de Confusión y el Reporte sobre el conjunto de test.
  • 14.
  • 16.