El documento describe el algoritmo K-Means de aprendizaje no supervisado. K-Means agrupa puntos de datos basándose en su similitud, medida como la distancia euclidiana entre ellos. Asigna cada punto al centroide de clúster más cercano y actualiza los centroides como la media de puntos en cada clúster. El objetivo es minimizar la suma de errores cuadráticos entre puntos y centroides. Se elige el número óptimo de clústeres K usando el método del codo, y se implementa K-Means para clas
El análisis de agrupaciones en un conjunto de datos, o clustering, es una de las técnicas exploratorias de mayor utilidad en la comprensión y caracterización de los problemas.
Esta técnica tiene una gran utilidad en determinar el número óptimo de subconjuntos y sus intervalos dentro de grandes volúmenes de información, lo que a su vez tiene aplicación en áreas como el marketing, la astrofísica o la investigación farmacéutica.
En esta presentación, correspondiente al seminario impartido en Mayo de 2016, aprenderás los conceptos básicos de las técnicas de agrupación y el algoritmo más popular: el cálculo de k-means.
Explicación del algoritmo del Clustering K-Means.
Incluye un ejemplo numérico con la explicación matemática
Puedes ver el video de la explicación en https://www.youtube.com/watch?v=n98fnSEoRiM&t=265s
o visitar mi página en www.rociochavezml.com
El análisis de agrupaciones en un conjunto de datos, o clustering, es una de las técnicas exploratorias de mayor utilidad en la comprensión y caracterización de los problemas.
Esta técnica tiene una gran utilidad en determinar el número óptimo de subconjuntos y sus intervalos dentro de grandes volúmenes de información, lo que a su vez tiene aplicación en áreas como el marketing, la astrofísica o la investigación farmacéutica.
En esta presentación, correspondiente al seminario impartido en Mayo de 2016, aprenderás los conceptos básicos de las técnicas de agrupación y el algoritmo más popular: el cálculo de k-means.
Explicación del algoritmo del Clustering K-Means.
Incluye un ejemplo numérico con la explicación matemática
Puedes ver el video de la explicación en https://www.youtube.com/watch?v=n98fnSEoRiM&t=265s
o visitar mi página en www.rociochavezml.com
Soluciòn de sistemas de ecuaciones lineales con excelVictor Lara
Este texto nos muestra la teoria necesaria para resolver sistemas de ecuaciones lineales de polinomios de diferente grados, aplica para resolver sistemas de ecuaciones de n incognitas por n variables, claro esto se lleva a cabo en excel.
TECNOLÓGICO NACIONAL DE MÉXICO
Ingeniería en Sistemas Computacionales
Fundamentos de Programación
Unidad IV: Arreglos (Vectores)
Retícula ISIC-2010-224: Programa: AED-1285
Soluciòn de sistemas de ecuaciones lineales con excelVictor Lara
Este texto nos muestra la teoria necesaria para resolver sistemas de ecuaciones lineales de polinomios de diferente grados, aplica para resolver sistemas de ecuaciones de n incognitas por n variables, claro esto se lleva a cabo en excel.
TECNOLÓGICO NACIONAL DE MÉXICO
Ingeniería en Sistemas Computacionales
Fundamentos de Programación
Unidad IV: Arreglos (Vectores)
Retícula ISIC-2010-224: Programa: AED-1285
En este documento analizamos ciertos conceptos relacionados con la ficha 1 y 2. Y concluimos, dando el porque es importante desarrollar nuestras habilidades de pensamiento.
Sara Sofia Bedoya Montezuma.
9-1.
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Telefónica
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0xWord escrito por Ibón Reinoso ( https://mypublicinbox.com/IBhone ) con Prólogo de Chema Alonso ( https://mypublicinbox.com/ChemaAlonso ). Puedes comprarlo aquí: https://0xword.com/es/libros/233-big-data-tecnologias-para-arquitecturas-data-centric.html
3Redu: Responsabilidad, Resiliencia y Respetocdraco
¡Hola! Somos 3Redu, conformados por Juan Camilo y Cristian. Entendemos las dificultades que enfrentan muchos estudiantes al tratar de comprender conceptos matemáticos. Nuestro objetivo es brindar una solución inclusiva y accesible para todos.
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informáticavazquezgarciajesusma
En este proyecto de investigación nos adentraremos en el fascinante mundo de la intersección entre el arte y los medios de comunicación en el campo de la informática.
La rápida evolución de la tecnología ha llevado a una fusión cada vez más estrecha entre el arte y los medios digitales, generando nuevas formas de expresión y comunicación.
Continuando con el desarrollo de nuestro proyecto haremos uso del método inductivo porque organizamos nuestra investigación a la particular a lo general. El diseño metodológico del trabajo es no experimental y transversal ya que no existe manipulación deliberada de las variables ni de la situación, si no que se observa los fundamental y como se dan en su contestó natural para después analizarlos.
El diseño es transversal porque los datos se recolectan en un solo momento y su propósito es describir variables y analizar su interrelación, solo se desea saber la incidencia y el valor de uno o más variables, el diseño será descriptivo porque se requiere establecer relación entre dos o más de estás.
Mediante una encuesta recopilamos la información de este proyecto los alumnos tengan conocimiento de la evolución del arte y los medios de comunicación en la información y su importancia para la institución.
Actualmente, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos están en formato digital, siendo este un componente electrónico, por tanto se ha desarrollado y se ofrece un amplio rango de soluciones al problema del almacenamiento de datos.
Inteligencia Artificial y Ciberseguridad.pdfEmilio Casbas
Recopilación de los puntos más interesantes de diversas presentaciones, desde los visionarios conceptos de Alan Turing, pasando por la paradoja de Hans Moravec y la descripcion de Singularidad de Max Tegmark, hasta los innovadores avances de ChatGPT, y de cómo la IA está transformando la seguridad digital y protegiendo nuestras vidas.
3. Algoritmo K-Means
3
• En este Tema 6 vamos a estudiar con más detalle el funcionamiento, implementación y formulación
matemática de un modelo de aprendizaje automático no-supervisado: el algoritmo K-Means
• Los algoritmos de K-Medias (K-Means) son fáciles de implementar y muy eficientes desde el punto de
vista computacional. Estas son las principales razones que explican por qué son tan populares. No
funcionan bien para identificar clases cuando se trata de grupos que no tienen una forma de distribución
esférica
• El algoritmo K-Means tiene como objetivo encontrar y agrupar en clases los puntos de datos que tienen
mayor similitud entre ellos. En los términos del algoritmo, esta similitud se entiende como lo opuesto de
la distancia entre puntos de datos. Cuanto más cerca estén los puntos de datos, más similares y con más
probabilidades de pertenecer al mismo clúster
4. Algoritmo K-Means: formulación matemática
4
• La distancia más comúnmente utilizada en K-Means es la distancia euclídea. Distancia entre dos puntos
x e y en el espacio m-dimensional es:
• La inercia del clúster es el nombre dado a la Suma de Errores Cuadrados (Sum Squared Error):
• Donde μ(j) es el centroide del cluster j, y w(i,j) es 1 si la muestra x(i) está en el cluster j y 0 en caso
contrario
• K-Means puede ser entendido como un problema de optimización: un algoritmo que intentará
minimizar el factor de inercia del cluster
5. Algoritmo K-Means: formulación matemática
5
• Los pasos del algoritmo (método de Forgy) consisten:
1. Primero, necesitamos elegir k, el número de clústers
2. Luego, el algoritmo seleccionará aleatoriamente los centroides de cada grupo
3. Se asignará cada punto de datos al centroide más cercano (utilizando la distancia euclídea vista)
4. Se calculará la inercia del conglomerado (según fórmula previa)
5. Los nuevos centroides se calcularán como la media de los puntos que pertenecen al centroide del paso
anterior. En otras palabras, calculando el error cuadrático mínimo de los puntos de datos al centro de
cada clúster, moviendo el centro hacia ese punto
6. Volver al paso 3
• Hiperparámetros de K-Means:
ü Número de grupos: El número de clusters
ü Máximas iteraciones: del algoritmo para una ejecución
ü Número inicial: El número de veces que el algoritmo se ejecutará con diferentes semillas de centroide
6. Algoritmo K-Means: formulación matemática
6
• Ejemplo: supongamos los datos Oi del primer gráfico. Tenemos siete objetos a clasificar en k=3 clústers.
1. k=3 clústers
2. Seleccionamos, por ejemplo, O1, O4 y O5 como centroides de cada grupo del primer paso
3. Se asignará cada punto de datos al centroide más cercano (utilizando la distancia euclídea vista)
4. Se calculará la inercia del conglomerado (según fórmula previa)
5. Los nuevos centroides se calcularán como la media de los puntos que pertenecen al centroide (símbolo cuadrado)
6. Tal como se observa, en la figura a la derecha, el objeto O2 ha cambiado de grupo, ya que se encuentra más cercano al
centroide del primer cluster que al del segundo
7. Algoritmo K-Means: formulación matemática
7
• ¿Cómo elegir el número K?
• La elección del número correcto de clusters es uno de los puntos clave del algoritmo K-Means. Para encontrar
este número hay algunos métodos, pero el método elbow es el más habitual
• El método del codo (elbow) funciona trazando los valores ascendentes de K frente al error total obtenido al
usar esa K
• El objetivo es encontrar la k adecuada para que
en cada cluster no aumente significativamente la
varianza
• En este caso del ejemplo, elegiremos el k=3,
donde se encuentra el codo o inflexión
8. Algoritmo K-Means: formulación matemática
8
• Aunque K-Means es un buen algoritmo eficiente de agrupación, es especialmente útil cuando sabemos de
antemano el número exacto de grupos y cuando estamos tratando con distribuciones esféricas
• La siguiente imagen muestra lo que obtendríamos si utilizáramos K-Means en cada conjunto distinto de datos,
incluso si conociéramos de antemano el número exacto de grupos
9. Algoritmo K-Means: Implementación
9
• Ejemplo: vamos a aplicar K-Means al problema de clasificación de las flores de iris
• Aplicamos primero el método de elbow para determinar K. Podemos utilizar K=3