El documento presenta una charla sobre cómo hacer que los datos sean atractivos mediante el uso de técnicas de machine learning como K-means. Explica conceptos como el entrenamiento de algoritmos, su ejecución a gran escala y la representación de datos. También describe las tecnologías Docker, Apache Spark, Jupyter Notebook y Apache Toree que se pueden utilizar para analizar y visualizar datos de forma interactiva.
5. Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
Machine Learning
■ Entender el problema
■ Entrenar un algoritmo
■ Ejecutar a gran escala
■ Representa tus datos
10. Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
K-Means
K-means es un método de agrupamiento, que tiene como objetivo la partición
de un conjunto de n observaciones en k grupos en el que cada observación
pertenece al grupo cuyo valor medio es más cercano.
11. Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin
K-Means
K-means es un método de agrupamiento, que tiene como objetivo la partición
de un conjunto de n observaciones en k grupos en el que cada observación
pertenece al grupo cuyo valor medio es más cercano.