REGRESIÓN LINEAL
La regresión lineal es quizás el
método más conocido para
“predecir” el comportamiento de
los datos o intentar hacerlo, en
Machine Learning es considerada
como una de las técnica centrales
del aprendizaje supervisado
XGBOOST
Definición
Algoritmos de aprendizaje automático aplicado a la regresión y
clasificación, pertenece a una familia de algoritmos de impulso y
utiliza el marco de impulso de gradiente (GBM) en su núcleo.
Características
Su Creciente Popularidad De Xgboosts se debe en gran parte a su
éxito sin precedentes en las competiciones De Kaggle
Gran Velocidad y rendimiento
El algoritmo central es paralelizable
Amplia variedad de parámetros de ajuste
INPULSO
El impulso es una técnica secuencial que funciona según el
principio de un conjunto. Combina un conjunto de alumnos
débiles y ofrece una precisión de predicción mejorada
VENTAJAS Y DESVENTAJAS
Ventajas Desventajas
• Puede manejar grandes bases de datos con
múltiples variables.
• Puede manejar valores perdidos.
• Sus resultados son muy precisos.
• Excelente velocidad de ejecución.
• Puede consumir muchos recursos computacionales
en grandes bases de datos.
• Se deben ajustar correctamente los parámetros del
algoritmo a fin de minimizar el error de precisión y
evitar sobreajuste del modelo (lo que puede darse
si se maneja un número muy grande de árboles).
• Solo trabaja con vectores numéricos, por lo que se
requieren convertir previamente los tipos de datos
no numéricos a numéricos
EJEMPLO

Xgboost.pptx

  • 1.
    REGRESIÓN LINEAL La regresiónlineal es quizás el método más conocido para “predecir” el comportamiento de los datos o intentar hacerlo, en Machine Learning es considerada como una de las técnica centrales del aprendizaje supervisado
  • 2.
    XGBOOST Definición Algoritmos de aprendizajeautomático aplicado a la regresión y clasificación, pertenece a una familia de algoritmos de impulso y utiliza el marco de impulso de gradiente (GBM) en su núcleo. Características Su Creciente Popularidad De Xgboosts se debe en gran parte a su éxito sin precedentes en las competiciones De Kaggle Gran Velocidad y rendimiento El algoritmo central es paralelizable Amplia variedad de parámetros de ajuste
  • 3.
    INPULSO El impulso esuna técnica secuencial que funciona según el principio de un conjunto. Combina un conjunto de alumnos débiles y ofrece una precisión de predicción mejorada
  • 4.
    VENTAJAS Y DESVENTAJAS VentajasDesventajas • Puede manejar grandes bases de datos con múltiples variables. • Puede manejar valores perdidos. • Sus resultados son muy precisos. • Excelente velocidad de ejecución. • Puede consumir muchos recursos computacionales en grandes bases de datos. • Se deben ajustar correctamente los parámetros del algoritmo a fin de minimizar el error de precisión y evitar sobreajuste del modelo (lo que puede darse si se maneja un número muy grande de árboles). • Solo trabaja con vectores numéricos, por lo que se requieren convertir previamente los tipos de datos no numéricos a numéricos
  • 5.