SlideShare una empresa de Scribd logo
1 de 15
Elaborada Por:
Rubzabet
Machado
C.I: 13042916
Definición:



       Es un campo de las ciencias de la
computación referido al proceso que intenta
descubrir patrones en grandes volúmenes de
conjuntos de datos. Utiliza los métodos de la
inteligencia          artificial,        aprendizaje
automático, estadística y sistemas de bases de datos.
Objetivo:


       El objetivo general del proceso de minería de
datos consiste en extraer información de un
conjunto de datos y transformarla en una estructura
comprensible para su uso posterior. Además de la
etapa de análisis en bruto, que involucra aspectos de
bases de datos y gestión de datos, procesamiento de
datos, el modelo y las consideraciones de
inferencia, métricas de Intereses, consideraciones de
la Teoría de la complejidad computacional, post-
procesamiento de las estructuras descubiertas, la
visualización y actualización en línea.
Función:



        El análisis automático o semi-automático de
grandes cantidades de datos para extraer patrones
interesantes hasta ahora desconocidos, como los
grupos      de     registros  de   datos   (análisis
cluster), registros poco usuales (la detección de
anomalías) y dependencias (Asociación Minera
regla).
Un proceso de típico de Data Mining consta de
los siguientes pasos:


  Selección del conjunto de datos.
  Análisis de las propiedades de los datos.
  Transformación del conjunto de datos de entrada.
  Seleccionar y aplicar la técnica de minería de
datos.
  Extracción de conocimiento.
  Interpretación y evaluación de datos.
Protocolo de un proyecto de Data Mining:


  Un proyecto de minería de datos tiene varias fases
necesarias que son, esencialmente:
  Comprensión del negocio y del problema que se
quiere resolver.
  Determinación, obtención y limpieza de los datos
necesarios.
  Creación de modelos matemáticos.
  Validación, comunicación, etc. de los resultados
obtenidos.
  Integración, si procede, de los resultados en un
sistema transaccional o similar.
TECNICAS:


  Redes neuronales.- Se trata de un sistema de
interconexión de neuronas en una red que colabora
para producir un estímulo de salida. ejemplos de red
neuronal son:
   •El Perceptrón.
   •El Perceptrón multicapa.
   •Los Mapas Autoorganizados, también conocidos
   como redes de Kohonen.

  Regresión lineal.- Es la más utilizada para formar
relaciones entre datos. Rápida y eficaz pero
insuficiente en espacios multidimensionales .
TECNICAS:

 Árboles de decisión.- es un modelo de predicción
utilizado en el ámbito de la inteligencia artificial.
Ejemplos:
    •Algoritmo ID3.
    •Algoritmo C4.5.

  Modelos estadísticos.- Es una expresión simbólica
en forma de igualdad o ecuación que se emplea en
todos los diseños experimentales y en la regresión
para indicar los diferentes factores que modifican la
variable de respuesta.
TECNICAS:


  Agrupamiento o Clustering.- Es un procedimiento
de agrupación de una serie de vectores según
criterios habitualmente de distancia;. Ejemplos:
    •Algoritmo K-means.
    •Algoritmo K-medoids.

 Reglas de asociación.- Se utilizan para descubrir
hechos que ocurren en común dentro de un
determinado conjunto de datos.
Ejemplos de uso:

Fraudes

      Un caso análogo es el de la detección de
transacciones de lavado de dinero o de fraude en
el uso de tarjetas de crédito o de servicios de
telefonía móvil e, incluso, en la relación de los
contribuyentes con el fisco. Generalmente, estas
operaciones fraudulentas o ilegales suelen seguir
patrones característicos que permiten, con cierto
grado de probabilidad, distinguirlas de las
legítimas y desarrollar así mecanismos para
tomar medidas rápidas frente a ellas.
Ejemplos de uso:

Comportamiento en Internet

        También es un área en boga el del análisis del
comportamiento de los visitantes —sobre todo,
cuando son clientes potenciales— en una página de
Internet. O la utilización de la información —
obtenida por medios más o menos legítimos— sobre
ellos para ofrecerles propaganda adaptada
específicamente a su perfil. O para, una vez que
adquieren un determinado producto, saber
inmediatamente qué otro ofrecerle teniendo en
cuenta la información histórica disponible acerca de
los clientes que han comprado el primero.
TENDENCIAS:

  La importancia que han cobrado los datos no
estructurados (texto, páginas de Internet, etc.).
  La necesidad de integrar los algoritmos y
resultados obtenidos en sistemas
operacionales, portales de Internet, etc.
  La exigencia de que los procesos funcionen
prácticamente en línea (por ejemplo, en casos de
fraude con una tarjeta de crédito).
  Los tiempos de respuesta. El gran volumen de
datos que hay que procesar en muchos casos para
obtener un modelo válido es un inconveniente; esto
implica grandes cantidades de tiempo de proceso y
hay problemas que requieren una respuesta en
Data mining

Más contenido relacionado

La actualidad más candente

La actualidad más candente (14)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Parte1
Parte1Parte1
Parte1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 
3 1 3_analisis_de_necesidades
3 1 3_analisis_de_necesidades3 1 3_analisis_de_necesidades
3 1 3_analisis_de_necesidades
 
Tema ii si
Tema ii siTema ii si
Tema ii si
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 

Similar a Data mining (20)

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Web mining
Web miningWeb mining
Web mining
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Revista TicNews Marzo 2015
Revista TicNews Marzo 2015
 
Tecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.pptTecnicas Mineria de Datos.ppt
Tecnicas Mineria de Datos.ppt
 
Mineria de datos ensayo
Mineria de datos ensayoMineria de datos ensayo
Mineria de datos ensayo
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 
Data
DataData
Data
 

Data mining

  • 2.
  • 3. Definición: Es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos.
  • 4. Objetivo: El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y gestión de datos, procesamiento de datos, el modelo y las consideraciones de inferencia, métricas de Intereses, consideraciones de la Teoría de la complejidad computacional, post- procesamiento de las estructuras descubiertas, la visualización y actualización en línea.
  • 5. Función: El análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (análisis cluster), registros poco usuales (la detección de anomalías) y dependencias (Asociación Minera regla).
  • 6. Un proceso de típico de Data Mining consta de los siguientes pasos: Selección del conjunto de datos. Análisis de las propiedades de los datos. Transformación del conjunto de datos de entrada. Seleccionar y aplicar la técnica de minería de datos. Extracción de conocimiento. Interpretación y evaluación de datos.
  • 7.
  • 8. Protocolo de un proyecto de Data Mining: Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente: Comprensión del negocio y del problema que se quiere resolver. Determinación, obtención y limpieza de los datos necesarios. Creación de modelos matemáticos. Validación, comunicación, etc. de los resultados obtenidos. Integración, si procede, de los resultados en un sistema transaccional o similar.
  • 9. TECNICAS: Redes neuronales.- Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. ejemplos de red neuronal son: •El Perceptrón. •El Perceptrón multicapa. •Los Mapas Autoorganizados, también conocidos como redes de Kohonen. Regresión lineal.- Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales .
  • 10. TECNICAS: Árboles de decisión.- es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Ejemplos: •Algoritmo ID3. •Algoritmo C4.5. Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.
  • 11. TECNICAS: Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia;. Ejemplos: •Algoritmo K-means. •Algoritmo K-medoids. Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos.
  • 12. Ejemplos de uso: Fraudes Un caso análogo es el de la detección de transacciones de lavado de dinero o de fraude en el uso de tarjetas de crédito o de servicios de telefonía móvil e, incluso, en la relación de los contribuyentes con el fisco. Generalmente, estas operaciones fraudulentas o ilegales suelen seguir patrones característicos que permiten, con cierto grado de probabilidad, distinguirlas de las legítimas y desarrollar así mecanismos para tomar medidas rápidas frente a ellas.
  • 13. Ejemplos de uso: Comportamiento en Internet También es un área en boga el del análisis del comportamiento de los visitantes —sobre todo, cuando son clientes potenciales— en una página de Internet. O la utilización de la información — obtenida por medios más o menos legítimos— sobre ellos para ofrecerles propaganda adaptada específicamente a su perfil. O para, una vez que adquieren un determinado producto, saber inmediatamente qué otro ofrecerle teniendo en cuenta la información histórica disponible acerca de los clientes que han comprado el primero.
  • 14. TENDENCIAS: La importancia que han cobrado los datos no estructurados (texto, páginas de Internet, etc.). La necesidad de integrar los algoritmos y resultados obtenidos en sistemas operacionales, portales de Internet, etc. La exigencia de que los procesos funcionen prácticamente en línea (por ejemplo, en casos de fraude con una tarjeta de crédito). Los tiempos de respuesta. El gran volumen de datos que hay que procesar en muchos casos para obtener un modelo válido es un inconveniente; esto implica grandes cantidades de tiempo de proceso y hay problemas que requieren una respuesta en