SlideShare una empresa de Scribd logo
1 de 20
Introducción aIntroducción a
DATA MININGDATA MINING
(Minería de Datos)(Minería de Datos)
Maestría en Sistemas Computacionales
MINERIA DE DATOSMINERIA DE DATOS
Catedrático:
Dr. Diego Uribe AgundisDr. Diego Uribe Agundis
Expone:
Ing. Fernando Alfonso Casas De la TorreIng. Fernando Alfonso Casas De la Torre
Matricula: M1317019
Introducción a Data MiningIntroducción a Data Mining
DEFINICION
La minería de datos es el proceso de detectar la información procesable de los
conjuntos grandes de datos. Utiliza el análisis matemático para deducir los
patrones y tendencias que existen en los datos. Normalmente, estos patrones
no se pueden detectar mediante la exploración tradicional de los datos porque
las relaciones son demasiado complejas o porque hay demasiado datos.
Estos patrones y tendencias se pueden recopilar y definir como un modelo de
minería de datos. Los modelos de minería de datos se pueden aplicar en
escenarios como los siguientes:
Escenarios para
Modelos de Minería
de Datos
• Pronostico
• Calculo de Riesgo y Probabilidad
• Recomendaciones
• Búsqueda de secuencias
• Agrupación
Introducción a Data MiningIntroducción a Data Mining
OBJETIVO
El objetivo general del proceso de minería de datos consiste en extraer
información de un conjunto de datos y transformarla en una estructura
comprensible para su uso posterior. Además de la etapa de análisis en bruto,
supone aspectos de gestión de datos y de bases de datos, de procesamiento de
datos, del modelo y de las consideraciones de inferencia, de métricas de
Intereses, de consideraciones de la Teoría de la complejidad computacional, de
post-procesamiento de las estructuras descubiertas, de la visualización y de la
actualización en línea minería de datos es una forma innovadora de obtener
información comercial
Introducción a Data MiningIntroducción a Data Mining
¿QUE NO ES MINERIA DE DATOS?
La Minería de Datos no es agrupar cantidades masivas de información.
El uso de herramientas para ordenar metadatos no elimina la necesidad de
conocer la organización y la información de la misma.. Para usar Minería de
datos se debe conocer la organización o entidad que quiere la información y que
genera los datos.
Los patrones encontrados por la MD deben de ser verificados en el mundo real.
Aunque es una buena herramienta la MD requiere de un buen análisis
estadístico y requiere conocimientos sobre el tema en el que se busca
información.
Introducción a Data MiningIntroducción a Data Mining
CIENCIASCIENCIAS
COMPUTACIONALESCOMPUTACIONALES
• Arquitectura de ComputadorasArquitectura de Computadoras
• Bases de DatosBases de Datos
• Computo CientíficoComputo Científico
• Redes de Computadoras y TICsRedes de Computadoras y TICs
• Sistemas Distribuidos, paralelos y concurrentesSistemas Distribuidos, paralelos y concurrentes
• Ingeniería de SoftwareIngeniería de Software
• Inteligencia ArtificialInteligencia Artificial
• Robótica
• Machine Learning
• Imagenologia
• Redes neuronales
• Aprendizaje cognitivo
• Data Mining
Introducción a Data MiningIntroducción a Data Mining
Estadísticas
y Análisis
Metadatos
Datos
estructurados
Datos no
estructurados
Lo explicito es la búsqueda lineal que se da por medio de
Manejadores de DB’s. Lo no explicito como relaciones y
patrones se da por medio de Minería de Datos.
Introducción a Data MiningIntroducción a Data Mining
La minería de datos ayuda a…
•Asistir al ANALISIS DE NEGOCIOS
•Ayuda en la toma de decisiones y a mejorar su nivel y fiabilidad de respuesta
•Encontrar Patrones y Relaciones en los datos que pueden ser útiles a una
organización sobre algún tópico o sobre el universo de datos.
•Encontrar RELACIONES PREDICTIVAS sobre comportamientos.
Por otro lado la minería de datos …:
•Debe descartar los datos NO RELEVANTES en el
ANALISIS DE DATOS.
•Las RELACIONES PREDICTIVAS no necesariamente
son causas de una acción o comportamiento.
•Los ALGORITMOS son sensibles a la selección o
exclusión de los datos.
•La Minería de Datos no descubre soluciones
automáticamente sin una guía o conocimiento de la
entidad que se analiza
Introducción a Data MiningIntroducción a Data Mining
EJEMPLOS DE USO DE MINERIA DE DATOS
Los métodos convencionales pueden indicar a un banco cuál es el tipo de
cuenta bancaria más rentable de entre las que proporciona. En cambio, la
minería de datos permite al banco crear perfiles de los clientes que ya disponen
de ese tipo de cuenta. El banco puede luego utilizar la minería de datos para
encontrar otros clientes que coinciden con ese perfil, y así poder emprender una
campaña comercial dirigida específicamente a esos clientes.
La minería de datos puede identificar patrones en los datos de la empresa, por
ejemplo, en los registros de compra de un supermercado. Si, por ejemplo, los
clientes compran los productos A y B, ¿qué producto C es más probable que
compren también?
¡Responder con precisión a
preguntas como éstas son una
ayuda muy valiosa para crear
estrategias comerciales!
Introducción a Data MiningIntroducción a Data Mining
Se requiere un conocimiento de la entidad y de los datos
que se buscan.
La Minería de Datos no da soluciones, muestra información
que ya esta ahí y ayuda a la toma de decisiones.
Es vital que se entienda lo que se busca en los datos. Si los
datos no son concisos entonces es que faltan mas datos o
el algoritmo esta mal diseñado.
Introducción a Data MiningIntroducción a Data Mining
PROCESO DE MINERIA DE DATOS
El siguiente diagrama describe las relaciones existentes entre cada paso del
proceso y las tecnologías disponibles como las de Microsoft SQL Server que se
pueden usar para completar cada paso.
Pasos para el Proceso de
Minería de Datos
1.Definir el problema
2.Preparar datos
3.Explorar los datos
4.Generar un modelo
5.Validar el modelo
6.Implementar y actualizar el
modelo
Pasos para el Proceso de
Minería de Datos
1.Definir el problema
2.Preparar datos
3.Explorar los datos
4.Generar un modelo
5.Validar el modelo
6.Implementar y actualizar el
modelo
Introducción a Data MiningIntroducción a Data Mining
Introducción a Data MiningIntroducción a Data Mining
TÉCNICAS DE MINERÍA DE DATOS
Como ya se ha comentado, las técnicas de la minería de datos provienen de la
inteligencia artificial y de la estadística, dichas técnicas, no son más que
algoritmos, más o menos sofisticados que se aplican sobre un conjunto de datos
para obtener unos resultados.
Las técnicas más representativas son:
• Redes neuronales.- Son un paradigma de aprendizaje y
procesamiento automático inspirado en la forma en que
funciona el sistema nervioso de los animales. Se trata de
un sistema de interconexión de neuronas en una red que
colabora para producir un estímulo de salida. Algunos
ejemplos de red neuronal son:
• El perceptrón.
• El perceptrón multicapa.
• Los mapas auto organizados, también conocidos como
redes de Kohonen
Introducción a Data MiningIntroducción a Data Mining
DATAWEREHOUSE
Viene del Inglés DATA = datos y WAREHOUSE = almacén, por eso, una DATA
WAREHOUSE es un almacén de datos.
Esta palabra se utiliza para hablar de un almacén de datos diseñado para permitir
las actividades de inteligencia de un negocio. En definitiva sirve para ayudar
analizar los datos recopilados por la empresa con el fin de mejorar su
rendimiento.
Un Data Warehouse o Almacén de
Datos, es una gran base de datos,
normalmente medida en gigabytes
(miles de millones de caracteres) o
terabytes (billones de letras), que
recoge información de múltiples
fuentes, y que su actividad se centra
en la Toma de Decisiones, es decir,
en el análisis de la información, en
vez de su captura.
Introducción a Data MiningIntroducción a Data Mining
DATAWEREHOUSE
El Datawerehouse es una colección de datos orientada a un tópico integrado, no
volátil y organizado en base al tiempo, o sea con contenido histórico y
referenciado.
Las características de la información de un Datawerehouse son:
•INTEGRADA: Integra datos de diferentes fuentes pero con una sola forma de
identificarlo.
•ATEMPORAL: Con respaldo y referencia contra el tiempo.
•NO VOLATIL: No cambian con el tiempo, debe de ser concisas y fiables.
Introducción a Data MiningIntroducción a Data Mining
Introducción a Data MiningIntroducción a Data Mining
Se debe de hacer
LIMPIEZA DE DATOS
antes de crear el DATA
WERHOUSE eliminando
los datos no necesarios
Los datos que se van a MINAR se
obtienen de las BD que se definieron
como necesarias y de ahí se crea el
depositorio DATA WEREHOUSE
El que una empresa u organización
tenga o no un DATA WEREHOUSE no
es necesario para hacer MINERIA DE
DATOS en sus BD.
La MINERIA DE DATOS
debe ser mas LOGICA
que FISICA (VISTAS) de
los datos contenidos en
las BD’s
La BD deben de
tener soporte
para las
demandas de
minería.
La BD deben de
tener soporte
para consultas
OLAP y OLTP
Introducción a Data MiningIntroducción a Data Mining
DATAWEREHOUSE
Un Datawarehouse es una base de datos corporativa que se caracteriza por
integrar y depurar información de una o más fuentes distintas, para luego
procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes
velocidades de respuesta.
La creación de un datawarehouse representa en la mayoría de las ocasiones el
primer paso, desde el punto de vista técnico, para implantar una solución
completa y fiable de BUSINESS INTELLIGENCE.
BUSINESS INTELLIGENCE es la habilidad para
transformar los datos en información, y la
información en conocimiento, de forma que se
pueda optimizar el proceso de toma de decisiones
en los negocios. La inteligencia de negocio actúa
como un factor estratégico para una empresa u
organización, generando una potencial ventaja
competitiva, que no es otra que proporcionar
información privilegiada para responder a los
problemas de negocio
Introducción a Data MiningIntroducción a Data Mining
DATAWEREHOUSE
Los principales productos de BUSINESS INTELLIGENCE que existen hoy en día
son:
* Cuadros de Mando Integrales (CMI)
* Sistemas de Soporte a la Decisión (DSS)
* Sistemas de Información Ejecutiva (EIS)
Por otro lado, los principales
componentes de orígenes de datos en el
Business Intelligence que existen en la
actualidad son:
* DATAMART
•DATAWAREHOUSE
Introducción a Data MiningIntroducción a Data Mining
REFERENCIAS
•IBM, Portal de discusión
https://www.ibm.com/support/knowledgecenter/es/SSEPGG_9.7.0/com.ibm.im.overview.doc
/c_dm_goals.html
•WIKIPEDIA
https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
•MICROSOFT, portal de documentos y bases de conocimientos
https://docs.microsoft.com/es-es/sql/analysis-services/data-mining/data-mining-concepts
•Portal SINEXUS
http://www.sinnexus.com/business_intelligence/
•Material recopilado en las cátedras de Dr. Urube Agundis del 06 al 08/02/2018.
GRACIAS POR SU ATENCIONGRACIAS POR SU ATENCION
Maestría en Sistemas Computacionales
MINERIA DE DATOSMINERIA DE DATOS
Catedrático:
Dr. Diego Uribe AgundisDr. Diego Uribe Agundis
Expone:
Ing. Fernando Alfonso Casas De la TorreIng. Fernando Alfonso Casas De la Torre
Matricula: M1317019

Más contenido relacionado

La actualidad más candente

Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Sistemas de soporte a la toma de decisiones (DSS)
Sistemas de soporte a la toma de decisiones (DSS)Sistemas de soporte a la toma de decisiones (DSS)
Sistemas de soporte a la toma de decisiones (DSS)Irina Cendrero Sanjurjo
 
Metodos de Auditoría Informatica 4
Metodos de Auditoría Informatica 4 Metodos de Auditoría Informatica 4
Metodos de Auditoría Informatica 4 UNEFA
 
Planificación Auditoria Informática
Planificación Auditoria InformáticaPlanificación Auditoria Informática
Planificación Auditoria InformáticaLuis Eduardo Aponte
 
Propuesta de un modelo de analítica de datos
Propuesta de un modelo de analítica de datosPropuesta de un modelo de analítica de datos
Propuesta de un modelo de analítica de datosivanbouchain
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptxJuanCarlosRomanPerez1
 
El estilo organizacional
El estilo organizacionalEl estilo organizacional
El estilo organizacionalEdison Naranjo
 
Archivos Y Procesamiento
Archivos Y ProcesamientoArchivos Y Procesamiento
Archivos Y Procesamientojorgeabustillo
 
Sistemas De Informacion Para Los Negocios
Sistemas De Informacion Para Los NegociosSistemas De Informacion Para Los Negocios
Sistemas De Informacion Para Los NegociosCarlos Yax
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business IntelligenceCarlos Escobar
 
Sistema de procesamiento de transacciones
Sistema de procesamiento de transaccionesSistema de procesamiento de transacciones
Sistema de procesamiento de transaccionesJavierMartinez702
 

La actualidad más candente (20)

1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
 
Modelo de faria mello
Modelo de faria melloModelo de faria mello
Modelo de faria mello
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Sistemas de soporte a la toma de decisiones (DSS)
Sistemas de soporte a la toma de decisiones (DSS)Sistemas de soporte a la toma de decisiones (DSS)
Sistemas de soporte a la toma de decisiones (DSS)
 
Metodología de auditoría informática
Metodología de auditoría informáticaMetodología de auditoría informática
Metodología de auditoría informática
 
Metodos de Auditoría Informatica 4
Metodos de Auditoría Informatica 4 Metodos de Auditoría Informatica 4
Metodos de Auditoría Informatica 4
 
Planificación Auditoria Informática
Planificación Auditoria InformáticaPlanificación Auditoria Informática
Planificación Auditoria Informática
 
Propuesta de un modelo de analítica de datos
Propuesta de un modelo de analítica de datosPropuesta de un modelo de analítica de datos
Propuesta de un modelo de analítica de datos
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Diagnostico organizacional ok
Diagnostico organizacional okDiagnostico organizacional ok
Diagnostico organizacional ok
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
El estilo organizacional
El estilo organizacionalEl estilo organizacional
El estilo organizacional
 
Flujo de información
Flujo de informaciónFlujo de información
Flujo de información
 
Archivos Y Procesamiento
Archivos Y ProcesamientoArchivos Y Procesamiento
Archivos Y Procesamiento
 
Sistemas De Informacion Para Los Negocios
Sistemas De Informacion Para Los NegociosSistemas De Informacion Para Los Negocios
Sistemas De Informacion Para Los Negocios
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Sistema de procesamiento de transacciones
Sistema de procesamiento de transaccionesSistema de procesamiento de transacciones
Sistema de procesamiento de transacciones
 

Similar a Introduccion a mineria de datos

Similar a Introduccion a mineria de datos (20)

Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
MD: Clase9
MD: Clase9MD: Clase9
MD: Clase9
 
ppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdfppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdf
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BI
 
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.pptINTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
 
Data
DataData
Data
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
bi-180616123404 (1).pptx
bi-180616123404 (1).pptxbi-180616123404 (1).pptx
bi-180616123404 (1).pptx
 
Introducción a la Minería de Datos (1).pdf
Introducción a la Minería de Datos (1).pdfIntroducción a la Minería de Datos (1).pdf
Introducción a la Minería de Datos (1).pdf
 
S15 bi v1-1
S15 bi v1-1S15 bi v1-1
S15 bi v1-1
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
INTELIGENCIA EMPRESARIAL
INTELIGENCIA EMPRESARIALINTELIGENCIA EMPRESARIAL
INTELIGENCIA EMPRESARIAL
 
Inteligencia empresarial bi
Inteligencia empresarial   biInteligencia empresarial   bi
Inteligencia empresarial bi
 
Diapositivas BI
Diapositivas BIDiapositivas BI
Diapositivas BI
 

Más de Fernando Alfonso Casas De la Torre

Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018Fernando Alfonso Casas De la Torre
 
Relación universidad-gobierno: caso de remodelación de una dependencia federal
Relación universidad-gobierno:  caso de remodelación  de una dependencia federalRelación universidad-gobierno:  caso de remodelación  de una dependencia federal
Relación universidad-gobierno: caso de remodelación de una dependencia federalFernando Alfonso Casas De la Torre
 
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?Fernando Alfonso Casas De la Torre
 

Más de Fernando Alfonso Casas De la Torre (20)

Mi Cascarita Proyecto Colibri.ppt
Mi Cascarita Proyecto Colibri.pptMi Cascarita Proyecto Colibri.ppt
Mi Cascarita Proyecto Colibri.ppt
 
Proyecto enlace WiFi Comunidades rurales
Proyecto enlace WiFi Comunidades ruralesProyecto enlace WiFi Comunidades rurales
Proyecto enlace WiFi Comunidades rurales
 
Congreso Academy Journal Tepic 2019
Congreso Academy Journal Tepic 2019Congreso Academy Journal Tepic 2019
Congreso Academy Journal Tepic 2019
 
Academy Journal Morelia 2018
Academy Journal Morelia 2018Academy Journal Morelia 2018
Academy Journal Morelia 2018
 
Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018
 
Congreso Academy Journal Celaya 2017
Congreso Academy Journal Celaya 2017Congreso Academy Journal Celaya 2017
Congreso Academy Journal Celaya 2017
 
IMSS Informatica Actividades 2014 enfriamiento de site
IMSS Informatica Actividades 2014 enfriamiento de siteIMSS Informatica Actividades 2014 enfriamiento de site
IMSS Informatica Actividades 2014 enfriamiento de site
 
Historia de las Videoconsolas
Historia de las VideoconsolasHistoria de las Videoconsolas
Historia de las Videoconsolas
 
Relación universidad-gobierno: caso de remodelación de una dependencia federal
Relación universidad-gobierno:  caso de remodelación  de una dependencia federalRelación universidad-gobierno:  caso de remodelación  de una dependencia federal
Relación universidad-gobierno: caso de remodelación de una dependencia federal
 
Teorema de Naives Bayes
Teorema de Naives BayesTeorema de Naives Bayes
Teorema de Naives Bayes
 
Analisis de incendios forestales mediante WEKA
Analisis de incendios forestales mediante WEKAAnalisis de incendios forestales mediante WEKA
Analisis de incendios forestales mediante WEKA
 
Patron observador
Patron observadorPatron observador
Patron observador
 
Replicación de Bases de Datos con SQL Server 2008
Replicación de Bases de Datos con SQL Server 2008Replicación de Bases de Datos con SQL Server 2008
Replicación de Bases de Datos con SQL Server 2008
 
Patron Singleton
Patron SingletonPatron Singleton
Patron Singleton
 
Incorporacion a la Seguridad Social
Incorporacion a la Seguridad SocialIncorporacion a la Seguridad Social
Incorporacion a la Seguridad Social
 
Plan de Contingencia Informatico
Plan de Contingencia InformaticoPlan de Contingencia Informatico
Plan de Contingencia Informatico
 
Contingencia Informatica
Contingencia InformaticaContingencia Informatica
Contingencia Informatica
 
Las 10 leyes de la Seguridad Informatica
Las 10 leyes de la Seguridad InformaticaLas 10 leyes de la Seguridad Informatica
Las 10 leyes de la Seguridad Informatica
 
Comercializacion de un producto
Comercializacion de un productoComercializacion de un producto
Comercializacion de un producto
 
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?
 

Último

How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxMiguelAtencio10
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfAnnimoUno1
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfvladimiroflores1
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 

Último (11)

How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 

Introduccion a mineria de datos

  • 1. Introducción aIntroducción a DATA MININGDATA MINING (Minería de Datos)(Minería de Datos) Maestría en Sistemas Computacionales MINERIA DE DATOSMINERIA DE DATOS Catedrático: Dr. Diego Uribe AgundisDr. Diego Uribe Agundis Expone: Ing. Fernando Alfonso Casas De la TorreIng. Fernando Alfonso Casas De la Torre Matricula: M1317019
  • 2. Introducción a Data MiningIntroducción a Data Mining DEFINICION La minería de datos es el proceso de detectar la información procesable de los conjuntos grandes de datos. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. Normalmente, estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos. Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los modelos de minería de datos se pueden aplicar en escenarios como los siguientes: Escenarios para Modelos de Minería de Datos • Pronostico • Calculo de Riesgo y Probabilidad • Recomendaciones • Búsqueda de secuencias • Agrupación
  • 3. Introducción a Data MiningIntroducción a Data Mining OBJETIVO El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, supone aspectos de gestión de datos y de bases de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de Intereses, de consideraciones de la Teoría de la complejidad computacional, de post-procesamiento de las estructuras descubiertas, de la visualización y de la actualización en línea minería de datos es una forma innovadora de obtener información comercial
  • 4. Introducción a Data MiningIntroducción a Data Mining ¿QUE NO ES MINERIA DE DATOS? La Minería de Datos no es agrupar cantidades masivas de información. El uso de herramientas para ordenar metadatos no elimina la necesidad de conocer la organización y la información de la misma.. Para usar Minería de datos se debe conocer la organización o entidad que quiere la información y que genera los datos. Los patrones encontrados por la MD deben de ser verificados en el mundo real. Aunque es una buena herramienta la MD requiere de un buen análisis estadístico y requiere conocimientos sobre el tema en el que se busca información.
  • 5. Introducción a Data MiningIntroducción a Data Mining CIENCIASCIENCIAS COMPUTACIONALESCOMPUTACIONALES • Arquitectura de ComputadorasArquitectura de Computadoras • Bases de DatosBases de Datos • Computo CientíficoComputo Científico • Redes de Computadoras y TICsRedes de Computadoras y TICs • Sistemas Distribuidos, paralelos y concurrentesSistemas Distribuidos, paralelos y concurrentes • Ingeniería de SoftwareIngeniería de Software • Inteligencia ArtificialInteligencia Artificial • Robótica • Machine Learning • Imagenologia • Redes neuronales • Aprendizaje cognitivo • Data Mining
  • 6. Introducción a Data MiningIntroducción a Data Mining Estadísticas y Análisis Metadatos Datos estructurados Datos no estructurados Lo explicito es la búsqueda lineal que se da por medio de Manejadores de DB’s. Lo no explicito como relaciones y patrones se da por medio de Minería de Datos.
  • 7. Introducción a Data MiningIntroducción a Data Mining La minería de datos ayuda a… •Asistir al ANALISIS DE NEGOCIOS •Ayuda en la toma de decisiones y a mejorar su nivel y fiabilidad de respuesta •Encontrar Patrones y Relaciones en los datos que pueden ser útiles a una organización sobre algún tópico o sobre el universo de datos. •Encontrar RELACIONES PREDICTIVAS sobre comportamientos. Por otro lado la minería de datos …: •Debe descartar los datos NO RELEVANTES en el ANALISIS DE DATOS. •Las RELACIONES PREDICTIVAS no necesariamente son causas de una acción o comportamiento. •Los ALGORITMOS son sensibles a la selección o exclusión de los datos. •La Minería de Datos no descubre soluciones automáticamente sin una guía o conocimiento de la entidad que se analiza
  • 8. Introducción a Data MiningIntroducción a Data Mining EJEMPLOS DE USO DE MINERIA DE DATOS Los métodos convencionales pueden indicar a un banco cuál es el tipo de cuenta bancaria más rentable de entre las que proporciona. En cambio, la minería de datos permite al banco crear perfiles de los clientes que ya disponen de ese tipo de cuenta. El banco puede luego utilizar la minería de datos para encontrar otros clientes que coinciden con ese perfil, y así poder emprender una campaña comercial dirigida específicamente a esos clientes. La minería de datos puede identificar patrones en los datos de la empresa, por ejemplo, en los registros de compra de un supermercado. Si, por ejemplo, los clientes compran los productos A y B, ¿qué producto C es más probable que compren también? ¡Responder con precisión a preguntas como éstas son una ayuda muy valiosa para crear estrategias comerciales!
  • 9. Introducción a Data MiningIntroducción a Data Mining Se requiere un conocimiento de la entidad y de los datos que se buscan. La Minería de Datos no da soluciones, muestra información que ya esta ahí y ayuda a la toma de decisiones. Es vital que se entienda lo que se busca en los datos. Si los datos no son concisos entonces es que faltan mas datos o el algoritmo esta mal diseñado.
  • 10. Introducción a Data MiningIntroducción a Data Mining PROCESO DE MINERIA DE DATOS El siguiente diagrama describe las relaciones existentes entre cada paso del proceso y las tecnologías disponibles como las de Microsoft SQL Server que se pueden usar para completar cada paso. Pasos para el Proceso de Minería de Datos 1.Definir el problema 2.Preparar datos 3.Explorar los datos 4.Generar un modelo 5.Validar el modelo 6.Implementar y actualizar el modelo Pasos para el Proceso de Minería de Datos 1.Definir el problema 2.Preparar datos 3.Explorar los datos 4.Generar un modelo 5.Validar el modelo 6.Implementar y actualizar el modelo
  • 11. Introducción a Data MiningIntroducción a Data Mining
  • 12. Introducción a Data MiningIntroducción a Data Mining TÉCNICAS DE MINERÍA DE DATOS Como ya se ha comentado, las técnicas de la minería de datos provienen de la inteligencia artificial y de la estadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. Las técnicas más representativas son: • Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: • El perceptrón. • El perceptrón multicapa. • Los mapas auto organizados, también conocidos como redes de Kohonen
  • 13. Introducción a Data MiningIntroducción a Data Mining DATAWEREHOUSE Viene del Inglés DATA = datos y WAREHOUSE = almacén, por eso, una DATA WAREHOUSE es un almacén de datos. Esta palabra se utiliza para hablar de un almacén de datos diseñado para permitir las actividades de inteligencia de un negocio. En definitiva sirve para ayudar analizar los datos recopilados por la empresa con el fin de mejorar su rendimiento. Un Data Warehouse o Almacén de Datos, es una gran base de datos, normalmente medida en gigabytes (miles de millones de caracteres) o terabytes (billones de letras), que recoge información de múltiples fuentes, y que su actividad se centra en la Toma de Decisiones, es decir, en el análisis de la información, en vez de su captura.
  • 14. Introducción a Data MiningIntroducción a Data Mining DATAWEREHOUSE El Datawerehouse es una colección de datos orientada a un tópico integrado, no volátil y organizado en base al tiempo, o sea con contenido histórico y referenciado. Las características de la información de un Datawerehouse son: •INTEGRADA: Integra datos de diferentes fuentes pero con una sola forma de identificarlo. •ATEMPORAL: Con respaldo y referencia contra el tiempo. •NO VOLATIL: No cambian con el tiempo, debe de ser concisas y fiables.
  • 15. Introducción a Data MiningIntroducción a Data Mining
  • 16. Introducción a Data MiningIntroducción a Data Mining Se debe de hacer LIMPIEZA DE DATOS antes de crear el DATA WERHOUSE eliminando los datos no necesarios Los datos que se van a MINAR se obtienen de las BD que se definieron como necesarias y de ahí se crea el depositorio DATA WEREHOUSE El que una empresa u organización tenga o no un DATA WEREHOUSE no es necesario para hacer MINERIA DE DATOS en sus BD. La MINERIA DE DATOS debe ser mas LOGICA que FISICA (VISTAS) de los datos contenidos en las BD’s La BD deben de tener soporte para las demandas de minería. La BD deben de tener soporte para consultas OLAP y OLTP
  • 17. Introducción a Data MiningIntroducción a Data Mining DATAWEREHOUSE Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de BUSINESS INTELLIGENCE. BUSINESS INTELLIGENCE es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. La inteligencia de negocio actúa como un factor estratégico para una empresa u organización, generando una potencial ventaja competitiva, que no es otra que proporcionar información privilegiada para responder a los problemas de negocio
  • 18. Introducción a Data MiningIntroducción a Data Mining DATAWEREHOUSE Los principales productos de BUSINESS INTELLIGENCE que existen hoy en día son: * Cuadros de Mando Integrales (CMI) * Sistemas de Soporte a la Decisión (DSS) * Sistemas de Información Ejecutiva (EIS) Por otro lado, los principales componentes de orígenes de datos en el Business Intelligence que existen en la actualidad son: * DATAMART •DATAWAREHOUSE
  • 19. Introducción a Data MiningIntroducción a Data Mining REFERENCIAS •IBM, Portal de discusión https://www.ibm.com/support/knowledgecenter/es/SSEPGG_9.7.0/com.ibm.im.overview.doc /c_dm_goals.html •WIKIPEDIA https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos •MICROSOFT, portal de documentos y bases de conocimientos https://docs.microsoft.com/es-es/sql/analysis-services/data-mining/data-mining-concepts •Portal SINEXUS http://www.sinnexus.com/business_intelligence/ •Material recopilado en las cátedras de Dr. Urube Agundis del 06 al 08/02/2018.
  • 20. GRACIAS POR SU ATENCIONGRACIAS POR SU ATENCION Maestría en Sistemas Computacionales MINERIA DE DATOSMINERIA DE DATOS Catedrático: Dr. Diego Uribe AgundisDr. Diego Uribe Agundis Expone: Ing. Fernando Alfonso Casas De la TorreIng. Fernando Alfonso Casas De la Torre Matricula: M1317019