SlideShare una empresa de Scribd logo
DATA MINING
KAROL PARDO
MIGUEL VALCERO
CORPORACION UNIVERSITARIA MINUTO DE DIOS
DATA MINING (MINERIA DE DATOS)
 Es un campo de las ciencias de la
computación referido al proceso que
intenta descubrir patrones en grandes
volúmenes de conjuntos de datos.1 Utiliza
los métodos de la inteligencia artificial,
aprendizaje automático, estadística y
sistemas de bases de datos.
OBJETIVO DEL DATA MINING
 El objetivo general del proceso de minería de datos consiste en
extraer información de un conjunto de datos y transformarla en una
estructura comprensible para su uso posterior. Además de la etapa de
análisis en bruto, que involucra aspectos de bases de datos y de
gestión de datos, de procesamiento de datos, del modelo y de las
consideraciones de inferencia, de métricas de Intereses, de
consideraciones de la Teoría de la complejidad computacional, de
post-procesamiento de las estructuras descubiertas, de la
visualización y de la actualización en línea
FUNCIÓN
 La tarea de minería de datos real es el análisis automático
o semi-automático de grandes cantidades de datos para
extraer patrones interesantes hasta ahora desconocidos,
como los grupos de registros de datos (análisis clúster),
registros poco usuales (la detección de anomalías) y
dependencias (minería por reglas de asociación). Esto
generalmente implica el uso de técnicas de bases de datos
como los índices espaciales. Estos patrones pueden
entonces ser vistos como una especie de resumen de los
datos de entrada, y pueden ser utilizados en el análisis
adicional o, por ejemplo, en la máquina de aprendizaje y
análisis predictivo.
PROCESO
 Selección del conjunto de datos
 Análisis de las propiedades de los datos
 Transformación del conjunto de datos de entrada
 Seleccionar y aplicar la técnica de minería de datos
 Extracción de conocimiento
 Interpretación y evaluación de datos
Protocolo de un proyecto de minería de
datos
Un proyecto de minería de datos tiene varias fases necesarias que son,
esencialmente:
 Comprensión: del negocio y del problema que se quiere resolver.
 Determinación, obtención y limpieza: de los datos necesarios.
 Creación de modelos matemáticos.
 Validación, comunicación: de los resultados obtenidos.
 Integración: si procede, de los resultados en un sistema transaccional o
similar
Técnicas de minería de datos
Las técnicas más representativas son:
 Redes neuronales.- Son un paradigma de aprendizaje y procesamiento
automático inspirado en la forma en que funciona el sistema nervioso de los
animales.
 Regresión lineal.- Es la más utilizada para formar relaciones entre datos.
Rápida y eficaz pero insuficiente en espacios multidimensionales donde
puedan relacionarse más de 2 variables.
 Árboles de decisión.- Un árbol de decisión es un modelo de predicción
utilizado en el ámbito de la inteligencia artificial, sirven para representar y
categorizar una serie de condiciones que suceden de forma sucesiva, para la
resolución de un problema.
 Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o
ecuación que se emplea en todos los diseños experimentales y en la regresión
para indicar los diferentes factores que modifican la variable de respuesta.
 Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie
de vectores según criterios habitualmente de distancia; se tratará de disponer
los vectores de entrada de forma que estén más cercanos aquellos que tengan
características comunes.
 Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en
común dentro de un determinado conjunto de datos.
Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican
en supervisados y no supervisados (Weiss y Indurkhya, 1998):
 Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de
ellos) desconocido a priori, a partir de otros conocidos.
 Algoritmos no supervisados (o del descubrimiento del conocimiento): se
descubren patrones y tendencias en los datos.
¿PREGUNTAS?
 ¿Qué es Data mining?
 ¿Cuál es su función importante?
 ¿Cuales son los tipos de técnica del Data mining
que hay?

Más contenido relacionado

La actualidad más candente

Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineria
viktor93
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
Marilyn Jaramillo
 
Data mining
Data miningData mining
Data mining
rubza
 
Data mining
Data miningData mining
Data mining
rubzabet
 

La actualidad más candente (17)

Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineria
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Datamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias BiológicasDatamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias Biológicas
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data mining
Data miningData mining
Data mining
 
Mapa
MapaMapa
Mapa
 
Data mining
Data miningData mining
Data mining
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 

Destacado (7)

5 t218162dw t_mineriadatos
5 t218162dw t_mineriadatos5 t218162dw t_mineriadatos
5 t218162dw t_mineriadatos
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
De Tradicional a Ágil en una institución bancaria
De Tradicional a Ágil en una institución bancariaDe Tradicional a Ágil en una institución bancaria
De Tradicional a Ágil en una institución bancaria
 
Cómo lograr victorias pocos probables con Scrum-Agile
Cómo lograr victorias pocos probables con Scrum-AgileCómo lograr victorias pocos probables con Scrum-Agile
Cómo lograr victorias pocos probables con Scrum-Agile
 
El journey de la transformacion
El journey de la transformacionEl journey de la transformacion
El journey de la transformacion
 
Data mining slides
Data mining slidesData mining slides
Data mining slides
 

Similar a Data mining

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
Ana Delgado
 
_Mundo de los Datos (1).pdf
_Mundo de los Datos  (1).pdf_Mundo de los Datos  (1).pdf
_Mundo de los Datos (1).pdf
KamZee1
 
Act 2.1 grupal blog actividad 2.1
Act  2.1 grupal blog actividad 2.1Act  2.1 grupal blog actividad 2.1
Act 2.1 grupal blog actividad 2.1
Mario Moreno
 

Similar a Data mining (19)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Tecnicas de Mineria de Datos
Tecnicas de Mineria de DatosTecnicas de Mineria de Datos
Tecnicas de Mineria de Datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Técnicas de minería de datos.
Técnicas de minería de datos. Técnicas de minería de datos.
Técnicas de minería de datos.
 
Machine learning
Machine learningMachine learning
Machine learning
 
_Mundo de los Datos (1).pdf
_Mundo de los Datos  (1).pdf_Mundo de los Datos  (1).pdf
_Mundo de los Datos (1).pdf
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos-una_introduccion
Mineria de datos-una_introduccionMineria de datos-una_introduccion
Mineria de datos-una_introduccion
 
Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Tecnicas de minería de datos
Tecnicas de minería de datosTecnicas de minería de datos
Tecnicas de minería de datos
 
Act 2.1 grupal blog actividad 2.1
Act  2.1 grupal blog actividad 2.1Act  2.1 grupal blog actividad 2.1
Act 2.1 grupal blog actividad 2.1
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
Trabajo de sistemas de informacion analistas de sistemas
Trabajo de sistemas de informacion  analistas de sistemasTrabajo de sistemas de informacion  analistas de sistemas
Trabajo de sistemas de informacion analistas de sistemas
 

Más de Bryam Quevedo Garcia (7)

Redes sociales (1)
Redes sociales (1)Redes sociales (1)
Redes sociales (1)
 
Almacenamiento en la nube
Almacenamiento en la nubeAlmacenamiento en la nube
Almacenamiento en la nube
 
Spam
SpamSpam
Spam
 
Presentacion antivirus
Presentacion antivirusPresentacion antivirus
Presentacion antivirus
 
Presentaciã³n deep web
Presentaciã³n deep web  Presentaciã³n deep web
Presentaciã³n deep web
 
Netiquetas
NetiquetasNetiquetas
Netiquetas
 
Los virus
Los virusLos virus
Los virus
 

Último

Presentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdf
Presentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdfPresentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdf
Presentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdf
juancmendez1405
 
Tema 14. Aplicación de Diagramas 26-05-24.pptx
Tema 14. Aplicación de Diagramas 26-05-24.pptxTema 14. Aplicación de Diagramas 26-05-24.pptx
Tema 14. Aplicación de Diagramas 26-05-24.pptx
Noe Castillo
 
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Monseespinoza6
 

Último (20)

Portafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPNPortafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPN
 
Evaluación de los Factores Internos de la Organización
Evaluación de los Factores Internos de la OrganizaciónEvaluación de los Factores Internos de la Organización
Evaluación de los Factores Internos de la Organización
 
Fase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría AnalíticaFase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría Analítica
 
Presentación Propuesta de Proyecto Social Colorido y Juvenil Multicolor y Neg...
Presentación Propuesta de Proyecto Social Colorido y Juvenil Multicolor y Neg...Presentación Propuesta de Proyecto Social Colorido y Juvenil Multicolor y Neg...
Presentación Propuesta de Proyecto Social Colorido y Juvenil Multicolor y Neg...
 
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
 
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATRBIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
 
Presentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdf
Presentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdfPresentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdf
Presentación de medicina Enfermedades Fotográfico Moderno Morado (1).pdf
 
Poemas de Beatriz Giménez de Ory_trabajos de 6º
Poemas de Beatriz Giménez de Ory_trabajos de 6ºPoemas de Beatriz Giménez de Ory_trabajos de 6º
Poemas de Beatriz Giménez de Ory_trabajos de 6º
 
PLAN DE TRABAJO CONCURSO NACIONAL CREA Y EMPRENDE.docx
PLAN DE TRABAJO CONCURSO NACIONAL CREA Y EMPRENDE.docxPLAN DE TRABAJO CONCURSO NACIONAL CREA Y EMPRENDE.docx
PLAN DE TRABAJO CONCURSO NACIONAL CREA Y EMPRENDE.docx
 
El fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docxEl fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docx
 
Diagnostico del corregimiento de Junin del municipio de Barbacoas
Diagnostico del corregimiento de Junin del municipio de BarbacoasDiagnostico del corregimiento de Junin del municipio de Barbacoas
Diagnostico del corregimiento de Junin del municipio de Barbacoas
 
Tarrajeo, tipos de tarrajeos, empastados, solaqueos y otros revestimientos.
Tarrajeo, tipos de tarrajeos, empastados, solaqueos y otros revestimientos.Tarrajeo, tipos de tarrajeos, empastados, solaqueos y otros revestimientos.
Tarrajeo, tipos de tarrajeos, empastados, solaqueos y otros revestimientos.
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
 
Creación WEB. Ideas clave para crear un sitio web
Creación WEB. Ideas clave para crear un sitio webCreación WEB. Ideas clave para crear un sitio web
Creación WEB. Ideas clave para crear un sitio web
 
Material-de-Apoyo-Escuela-Sabatica-02-2-2024.pptx.ppt
Material-de-Apoyo-Escuela-Sabatica-02-2-2024.pptx.pptMaterial-de-Apoyo-Escuela-Sabatica-02-2-2024.pptx.ppt
Material-de-Apoyo-Escuela-Sabatica-02-2-2024.pptx.ppt
 
Tema 14. Aplicación de Diagramas 26-05-24.pptx
Tema 14. Aplicación de Diagramas 26-05-24.pptxTema 14. Aplicación de Diagramas 26-05-24.pptx
Tema 14. Aplicación de Diagramas 26-05-24.pptx
 
Fase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometricoFase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometrico
 
Lección 1: Los complementos del Verbo ...
Lección 1: Los complementos del Verbo ...Lección 1: Los complementos del Verbo ...
Lección 1: Los complementos del Verbo ...
 
Power Point: Luz desde el santuario.pptx
Power Point: Luz desde el santuario.pptxPower Point: Luz desde el santuario.pptx
Power Point: Luz desde el santuario.pptx
 
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
 

Data mining

  • 1. DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS
  • 2. DATA MINING (MINERIA DE DATOS)  Es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos.1 Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos.
  • 3. OBJETIVO DEL DATA MINING  El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y de gestión de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de Intereses, de consideraciones de la Teoría de la complejidad computacional, de post-procesamiento de las estructuras descubiertas, de la visualización y de la actualización en línea
  • 4. FUNCIÓN  La tarea de minería de datos real es el análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (análisis clúster), registros poco usuales (la detección de anomalías) y dependencias (minería por reglas de asociación). Esto generalmente implica el uso de técnicas de bases de datos como los índices espaciales. Estos patrones pueden entonces ser vistos como una especie de resumen de los datos de entrada, y pueden ser utilizados en el análisis adicional o, por ejemplo, en la máquina de aprendizaje y análisis predictivo.
  • 5. PROCESO  Selección del conjunto de datos  Análisis de las propiedades de los datos  Transformación del conjunto de datos de entrada  Seleccionar y aplicar la técnica de minería de datos  Extracción de conocimiento  Interpretación y evaluación de datos
  • 6. Protocolo de un proyecto de minería de datos Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente:  Comprensión: del negocio y del problema que se quiere resolver.  Determinación, obtención y limpieza: de los datos necesarios.  Creación de modelos matemáticos.  Validación, comunicación: de los resultados obtenidos.  Integración: si procede, de los resultados en un sistema transaccional o similar
  • 7. Técnicas de minería de datos Las técnicas más representativas son:  Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales.  Regresión lineal.- Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables.  Árboles de decisión.- Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema.  Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.
  • 8.  Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes.  Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos. Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):  Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos.  Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos.
  • 9. ¿PREGUNTAS?  ¿Qué es Data mining?  ¿Cuál es su función importante?  ¿Cuales son los tipos de técnica del Data mining que hay?