¿Qué es la Minería de Datos? Entendamos al proceso de Minería de Datos ( Data Mining , DM) como la búsqueda de conocimiento valioso y útil en grandes volúmenes de datos a través del análisis automático de los mismos... Ahora bien, con esta primera aproximación al concepto, podemos asumir que DM convierte los datos en conocimiento útil y comprensible, que previamente permanecía desconocido .
Características DE la DM Es un termino relativamente moderno que integra numerosas técnicas de análisis de datos y extracción de modelos. Permite extraer patrones, describir tendencias y regularidades, predecir comportamientos. En general permite sacar partido a la información computarizada que nos rodea hoy en día, generalmente heterogénea y en grandes volúmenes. Permite a los individuos y organizaciones comprender y modelar de una manera más eficiente y precisa el contexto en el que deben actuar y tomar decisiones. El resultado de la minería de datos son modelos expresados como conjuntos de reglas,  ecuaciones, árboles de decisión, redes neuronales, grafos, entre otros; los cuales pueden usarse por ejemplo para, responder a preguntas como: Existe un grupo de clientes que se comporta de manera diferenciada? Qué secuencia de tratamientos puede ser más efectiva para un nuevo síndrome ?
La DM nos permite descubrir en los datos analizados, sus patrones o tendencias de comportamiento.  Es así como al comprender estas tendencias en el comportamiento de los datos obtenemos el conocimiento útil para la toma de decisiones en situaciones de la vida cotidiana ¿Y para que nos sirve la DM? Estos son algunos ejemplos de aplicación de la DM En las finanzas Obtención de patrones de uso fraudulento de tarjetas de crédito; Análisis de riegos en créditos En el Mercadeo Análisis de bases de datos de clientes para descubrir conductas o tendencias en el mercado como la segmentación de clientes, fidelidad de los clientes, análisis de cesta de compras En la Industria Detección de piezas defectuosas; Modelos de calidad; Predicción de fallos y accidentes; Estimación de costes En la Medicina Identificación de patologías; Diagnóstico de enfermedades; Análisis de proteínas; Análisis de secuencia de genes Otras Áreas Selección de empleados; Análisis de trafico Web en portales; Detección de Evasión fiscal.
Generalmente la DM utiliza como estrategia construir un modelo de una situación donde se conoce la respuesta, luego se aplica el modelo a una situación de la cual se desconoce la respuesta.  Observa el siguiente esquema ¿Exactamente cuál es la estrategia utilizada?
¿Exactamente cuál es la estrategia utilizada? Los tipos de modelos son dos, el modelo predictivo y el modelo descriptivo…
¿En qué situaciones se utiliza cada modelo? Pretenden estimar valores futuros o desconocidos de variables de interés, que se denominan variables objetivo o dependientes, usando otras variables o campos de la base de datos, llamadas variables independientes o predictivas. Ejemplo, un modelo que permita estimar la demanda de un nuevo producto en función a los gastos de publicidad Identifican patrones que explican o resumen los datos, es decir sirven para explorar las propiedades de los datos examinados, no para predecir nuevos datos. Ejemplo, una agencia de viajes que identifica grupos de personas con los mismos gustos, con el objetivo de organizar diferentes ofertas para cada grupo y poder así remitirles esta información, para ello analiza los viajes que ha realizado sus clientes e infiere un modelo descriptivo que caracteriza estos grupos.
Generemos ideas ¡¡ Con las nociones entregadas, piensa en una situación de la vida cotidiana donde puedas aplicar minería de datos y reflexiona sobre el conocimiento que se desearía encontrar y qué tipo de modelo utilizarías para conseguirlo. Creado por Saibel Ramos para el curso  Introducción a la Minería de Datos  como requisito de aprobación del módulo MPP de FATLA.

Nociones Básicas de la Minería de Datos

  • 1.
    ¿Qué es laMinería de Datos? Entendamos al proceso de Minería de Datos ( Data Mining , DM) como la búsqueda de conocimiento valioso y útil en grandes volúmenes de datos a través del análisis automático de los mismos... Ahora bien, con esta primera aproximación al concepto, podemos asumir que DM convierte los datos en conocimiento útil y comprensible, que previamente permanecía desconocido .
  • 2.
    Características DE laDM Es un termino relativamente moderno que integra numerosas técnicas de análisis de datos y extracción de modelos. Permite extraer patrones, describir tendencias y regularidades, predecir comportamientos. En general permite sacar partido a la información computarizada que nos rodea hoy en día, generalmente heterogénea y en grandes volúmenes. Permite a los individuos y organizaciones comprender y modelar de una manera más eficiente y precisa el contexto en el que deben actuar y tomar decisiones. El resultado de la minería de datos son modelos expresados como conjuntos de reglas, ecuaciones, árboles de decisión, redes neuronales, grafos, entre otros; los cuales pueden usarse por ejemplo para, responder a preguntas como: Existe un grupo de clientes que se comporta de manera diferenciada? Qué secuencia de tratamientos puede ser más efectiva para un nuevo síndrome ?
  • 3.
    La DM nospermite descubrir en los datos analizados, sus patrones o tendencias de comportamiento. Es así como al comprender estas tendencias en el comportamiento de los datos obtenemos el conocimiento útil para la toma de decisiones en situaciones de la vida cotidiana ¿Y para que nos sirve la DM? Estos son algunos ejemplos de aplicación de la DM En las finanzas Obtención de patrones de uso fraudulento de tarjetas de crédito; Análisis de riegos en créditos En el Mercadeo Análisis de bases de datos de clientes para descubrir conductas o tendencias en el mercado como la segmentación de clientes, fidelidad de los clientes, análisis de cesta de compras En la Industria Detección de piezas defectuosas; Modelos de calidad; Predicción de fallos y accidentes; Estimación de costes En la Medicina Identificación de patologías; Diagnóstico de enfermedades; Análisis de proteínas; Análisis de secuencia de genes Otras Áreas Selección de empleados; Análisis de trafico Web en portales; Detección de Evasión fiscal.
  • 4.
    Generalmente la DMutiliza como estrategia construir un modelo de una situación donde se conoce la respuesta, luego se aplica el modelo a una situación de la cual se desconoce la respuesta. Observa el siguiente esquema ¿Exactamente cuál es la estrategia utilizada?
  • 5.
    ¿Exactamente cuál esla estrategia utilizada? Los tipos de modelos son dos, el modelo predictivo y el modelo descriptivo…
  • 6.
    ¿En qué situacionesse utiliza cada modelo? Pretenden estimar valores futuros o desconocidos de variables de interés, que se denominan variables objetivo o dependientes, usando otras variables o campos de la base de datos, llamadas variables independientes o predictivas. Ejemplo, un modelo que permita estimar la demanda de un nuevo producto en función a los gastos de publicidad Identifican patrones que explican o resumen los datos, es decir sirven para explorar las propiedades de los datos examinados, no para predecir nuevos datos. Ejemplo, una agencia de viajes que identifica grupos de personas con los mismos gustos, con el objetivo de organizar diferentes ofertas para cada grupo y poder así remitirles esta información, para ello analiza los viajes que ha realizado sus clientes e infiere un modelo descriptivo que caracteriza estos grupos.
  • 7.
    Generemos ideas ¡¡Con las nociones entregadas, piensa en una situación de la vida cotidiana donde puedas aplicar minería de datos y reflexiona sobre el conocimiento que se desearía encontrar y qué tipo de modelo utilizarías para conseguirlo. Creado por Saibel Ramos para el curso Introducción a la Minería de Datos como requisito de aprobación del módulo MPP de FATLA.