HERRAMIENTA DE ANÁLISIS
DE MINERIA DE DATOS
B L A D I M I R C A R R I O N R O J A S
DOCENTE: ING. MARLENY PERALTA ASCUE
• Es una herramienta para análisis de minería de datos.
• Permite el desarrollo de procesos de análisis de datos
mediante el encadenamiento de operadores en un entorno
grafico.
• Desarrollado por la Universidad de Dormund en el año 2001.
¿QUÉ ES RAPIDMINER?
¿QUÉ ES RAPIDMINER?
RapidMiner es un programa informático para el análisis y minería
de datos. Permite el desarrollo de procesos de análisis de datos
mediante el encadenamiento de operadores a través de un
entorno gráfico. Se usa en investigación, educación, capacitación,
creación rápida de prototipos y en aplicaciones empresariales.
RapidMiner es una herramienta de Minería de Datos ampliamente
usada y probada a nivel internacional en aplicaciones
empresariales, de gobierno y academia.
•RapidMiner Studio: Versión stand-alone para analistas. Implementa
todos los operadores de data mining, modelos predictivos, modelos
descriptivos, transformación de datos, series de tiempo, etc.
•RapidMiner Server: Permite trabajo colaborativo, escalable y
concurrente múltiples usuarios, capacidad de delegar en bases de datos
(In-Database Mining) y otras mejoras de funcionalidad como: plataforma
Web de publicación de reportes, implementación de sistemas de scoring,
diseño y navegación Web de Reportes, integración vía Servicios Web,
entre otras.
VERSIONES DE RAPIDMINER
CARACTERÍSTICAS DE RAPIDMINER
Programado en java.
Multiplataforma.
Diferentes modos de uso.
• A través de GUI
• Batch
• Comandos
Incluye gráficos y herramientas de visualización de
datos.
CARACTERÍSTICAS DE RAPIDMINER
La flexibilidad es algo que RapidMiner Studio tiene en gran medida.
BENEFICIOS DE RAPIDMINER
La precisión lo es todo
RapidMiner Studio también ha desarrollado una forma única de
extraer estadísticas precisas al proporcionar a cada usuario
gráficos fáciles de construir que están diseñados para la
generación rápida de información. Entre las diversas
visualizaciones se incluyen dispersiones, matrices de dispersión,
burbujas, paralelas, histogramas, área, gráficos circulares y
gráficos de encuestas.
• Capacidades de modelado
Se compone de una gran cantidad de capacidades de modelado que se
pueden clasificar como aprendizaje administrado y no administrado. Tome
el famoso modelado bayesiano, por ejemplo. El modelado bayesiano es un
proceso en el cual los modelos de Bayes se actualizan para ser
perfectamente aplicables para la extracción de flujo en línea y conjuntos de
datos más grandes.
• Redes neuronales
Está construido con redes neuronales que son vitales para
proporcionar capas diversificadas dentro de la diferente cantidad
de nodos. Estas redes neuronales también se suministran con
diferentes técnicas de entrenamiento y una optimización
automática para el ajuste de tamaño y la velocidad de
aprendizaje.
RapidMiner Studio está escrito con la ayuda del lenguaje de
programación Java. Se compone de flujos de trabajo y numerosos
operadores que trabajan juntos para brindar a cada usuario una
experiencia positiva. Mientras que los operadores actúan en una
sola tarea durante el proceso, su salida juega un papel crucial en la
producción de la entrada que se puede utilizar para la siguiente.
La herramienta también proporciona a los principiantes un
procedimiento paso a paso para usar la aplicación al ofrecer una
gran cantidad de esquemas de aprendizaje. Estos esquemas de
aprendizaje y algoritmos están tomados de los guiones Weka y R
que pueden ponerse en juego con la ayuda de extensiones. Hacer
que RapidMiner sea una mina de oro es que su proceso también se
puede usar como complementos adicionales.
HACIENDO PRUEBA CON LA HERRAMIENTA RAPIDMINER DE MINERIA D
REPOSITORIOS Y OPERADORES DE RAPIDMINER
LISTA DE REGISTRO DE DATOS DEL SISTEMA DE TRANSPORTES_CIVA
RAPIDMINER TIENE MUCHAS GRAFICOS PARA ANALISAR LOS
RESULTADOS DE MINERIA DE DATOS
BASE DE DATOS EN FORMATO CVG EN EXCEL
UTILIZANDO LOS OPERADORES VAMOS A VER UN DIAGRAMA DE ARBOL DE D
VEMOS ACA UN ARBOL DE DESICIONES DE FORMA GRAFICA EN
RAPIDMINER

Rapidminer

  • 1.
    HERRAMIENTA DE ANÁLISIS DEMINERIA DE DATOS B L A D I M I R C A R R I O N R O J A S DOCENTE: ING. MARLENY PERALTA ASCUE
  • 2.
    • Es unaherramienta para análisis de minería de datos. • Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores en un entorno grafico. • Desarrollado por la Universidad de Dormund en el año 2001. ¿QUÉ ES RAPIDMINER?
  • 3.
    ¿QUÉ ES RAPIDMINER? RapidMineres un programa informático para el análisis y minería de datos. Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores a través de un entorno gráfico. Se usa en investigación, educación, capacitación, creación rápida de prototipos y en aplicaciones empresariales. RapidMiner es una herramienta de Minería de Datos ampliamente usada y probada a nivel internacional en aplicaciones empresariales, de gobierno y academia.
  • 4.
    •RapidMiner Studio: Versiónstand-alone para analistas. Implementa todos los operadores de data mining, modelos predictivos, modelos descriptivos, transformación de datos, series de tiempo, etc. •RapidMiner Server: Permite trabajo colaborativo, escalable y concurrente múltiples usuarios, capacidad de delegar en bases de datos (In-Database Mining) y otras mejoras de funcionalidad como: plataforma Web de publicación de reportes, implementación de sistemas de scoring, diseño y navegación Web de Reportes, integración vía Servicios Web, entre otras. VERSIONES DE RAPIDMINER
  • 5.
    CARACTERÍSTICAS DE RAPIDMINER Programadoen java. Multiplataforma. Diferentes modos de uso. • A través de GUI • Batch • Comandos Incluye gráficos y herramientas de visualización de datos.
  • 6.
    CARACTERÍSTICAS DE RAPIDMINER Laflexibilidad es algo que RapidMiner Studio tiene en gran medida.
  • 7.
    BENEFICIOS DE RAPIDMINER Laprecisión lo es todo RapidMiner Studio también ha desarrollado una forma única de extraer estadísticas precisas al proporcionar a cada usuario gráficos fáciles de construir que están diseñados para la generación rápida de información. Entre las diversas visualizaciones se incluyen dispersiones, matrices de dispersión, burbujas, paralelas, histogramas, área, gráficos circulares y gráficos de encuestas.
  • 8.
    • Capacidades demodelado Se compone de una gran cantidad de capacidades de modelado que se pueden clasificar como aprendizaje administrado y no administrado. Tome el famoso modelado bayesiano, por ejemplo. El modelado bayesiano es un proceso en el cual los modelos de Bayes se actualizan para ser perfectamente aplicables para la extracción de flujo en línea y conjuntos de datos más grandes. • Redes neuronales Está construido con redes neuronales que son vitales para proporcionar capas diversificadas dentro de la diferente cantidad de nodos. Estas redes neuronales también se suministran con diferentes técnicas de entrenamiento y una optimización automática para el ajuste de tamaño y la velocidad de aprendizaje.
  • 9.
    RapidMiner Studio estáescrito con la ayuda del lenguaje de programación Java. Se compone de flujos de trabajo y numerosos operadores que trabajan juntos para brindar a cada usuario una experiencia positiva. Mientras que los operadores actúan en una sola tarea durante el proceso, su salida juega un papel crucial en la producción de la entrada que se puede utilizar para la siguiente. La herramienta también proporciona a los principiantes un procedimiento paso a paso para usar la aplicación al ofrecer una gran cantidad de esquemas de aprendizaje. Estos esquemas de aprendizaje y algoritmos están tomados de los guiones Weka y R que pueden ponerse en juego con la ayuda de extensiones. Hacer que RapidMiner sea una mina de oro es que su proceso también se puede usar como complementos adicionales.
  • 10.
    HACIENDO PRUEBA CONLA HERRAMIENTA RAPIDMINER DE MINERIA D
  • 11.
  • 12.
    LISTA DE REGISTRODE DATOS DEL SISTEMA DE TRANSPORTES_CIVA
  • 13.
    RAPIDMINER TIENE MUCHASGRAFICOS PARA ANALISAR LOS RESULTADOS DE MINERIA DE DATOS
  • 14.
    BASE DE DATOSEN FORMATO CVG EN EXCEL
  • 15.
    UTILIZANDO LOS OPERADORESVAMOS A VER UN DIAGRAMA DE ARBOL DE D
  • 16.
    VEMOS ACA UNARBOL DE DESICIONES DE FORMA GRAFICA EN RAPIDMINER