SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
DATA MINNING

¿Qué es Data Mining?

       Cada día generamos una gran cantidad de información, algunas veces
conscientes de que lo hacemos y otras veces inconscientes de ello porque lo
desconocemos. Nos damos cuenta de que generamos información cuando
registramos nuestra entrada en el trabajo, cuando entramos en un servidor para
ver nuestro correo, cuando pagamos con una tarjeta de crédito o cuando
reservamos un boleto de avión. Otras veces no nos damos cuenta de que
generamos información, como cuando conducimos por una vía donde están
contabilizando el número de automóviles que pasan por minuto, cuando se sigue
nuestra navegación por Internet o cuando nos sacan una fotografía del rostro al
haber pasado cerca de una oficina gubernamental.
¿Con qué finalidad queremos generar información? Son muchos los motivos que
nos llevan a generar información, ya que nos pueden ayudar a controlar,
optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar
o tomar decisiones de cualquier ámbito según el dominio en que nos
desarrollemos. La información por sí misma está considerada un bien
patrimonial. De esta forma, si una empresa tiene una pérdida total o parcial de
información provoca bastantes perjuicios. Es evidente que la información debe
ser protegida, pero también explotada.
¿Qué nos ha permitido poder generar tanta información? En los últimos años,
debido al desarrollo tecnológico a niveles exponenciales tanto en el área de
cómputo como en la de transmisión de datos, ha sido posible que se gestionen
de una mejor manera el manejo y almacenamiento de la información. Sin duda
existen cuatro factores importantes que nos han llevado a este suceso:

   El abaratamiento de los sistemas de almacenamiento tanto temporal como
       permanente.
   El incremento de las velocidades de cómputo en los procesadores.
   Las mejoras en la confiabilidad y aumento de la velocidad en la transmisión
       de datos.
   El desarrollo de sistemas administradores de bases de datos más poderosos.

Actualmente todas estas ventajas nos han llevado a abusar del almacenamiento
de la información en las bases de datos. Podemos decir que algunas empresas
almacenan un cierto tipo de datos al que se ha denominado dato-escritura, ya
que sólo se guarda (o escribe) en el disco duro, pero nunca se hace uso de él.
Generalmente, todas las empresas usan un dato llamado dato-escritura-lectura,
que utilizan para hacer consultas dirigidas. Un nuevo tipo de dato al cual se ha
llamado dato-escritura-lectura-análisis es el que proporciona en conjunto un
verdadero conocimiento y nos apoya en las tomas de decisiones. Es necesario
contar con tecnologías que nos ayuden a explotar el potencial de este tipo de
datos. La cantidad de información que nos llega cada día es tan inmensa que
nos resulta difícil asimilarla. Basta con ir al buscador AltavistaÓ y solicitar la
palabra information para ver que existen 171.769.416 sitios donde nos pueden
decir algo al respecto. Suponiendo que nos tomemos un minuto para ver el
contenido de cada página, tardaríamos entonces 326 años en visitarlas todas.
Esto es imposible, y, por lo tanto, existe una clara necesidad de disponer de
tecnologías que nos ayuden en nuestros procesos de búsqueda y, aún más, de
tecnologías que nos ayuden a comprender su contenido.
Como bien sabemos, algunos sistemas producen una cantidad inmensa de
datos; estos datos con frecuencia contienen valiosa información que puede
resultar muy útil y ser vista como vetas de oro por los ojos de un ejecutivo de
una corporación. Las dimensiones de las base de datos grandes (montañas) y
sus velocidades de crecimiento, hacen muy difícil para un humano su análisis y
la extracción de alguna información importante (oro). Aún con el uso de
herramientas estadísticas clásicas esta tarea es casi imposible.

        El Data Mining surge como una tecnología que intenta ayudar a
comprender el contenido de una base de datos. De forma general, los datos son
la materia prima bruta, en el momento que el usuario les atribuye algún
significado especial pasan a convertirse en información. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretación
del confronto entre la información y ese modelo represente un valor agregado,
entonces nos referimos al conocimiento. El Data Mining trabaja en el nivel
superior buscando patrones, comportamientos, agrupaciones, secuencias,
tendencias o asociaciones que puedan generar algún modelo que nos permita
comprender mejor el dominio para ayudar en una posible toma de decisión.

         El descubrimiento de conocimiento en base de datos (KDD, de
Knowledge Discovery in Databases) combina las técnicas tradicionales con
numerosos recursos desarrollados en el área de la inteligencia artificial. En estas
aplicaciones el término quot;Minería de Datosquot; (Data Mining) ha tenido más
aceptación. En algunos casos las herramientas provenientes de la inteligencia
artificial son nuevas, no del todo comprendidas y carentes de un soporte teórico
formal. Pero en este caso el objetivo es tan valioso, que los resultados prácticos
han rebasado a la elegancia académica.
Con todo lo anterior podemos decir que Data Mining es el proceso de descubrir
patrones de información interesante y potencialmente útiles, inmersos en una
gran base de datos en la que se interactúa constantemente. Data Mining es una
combinación de procesos como:
    Extracción de datos
    Limpieza de datos.
    Selección de características.
Algoritmos.
   Análisis de resultados.
Las herramientas de Data Mining exploran gran cantidad de datos dentro de una
BD grande, y mediante su análisis predicen posibles tendencias o
comportamientos futuros entro de una empresa, permitiendo al experto tomar
decisiones en los negocios de una forma rápida y utilizando un conocimiento que
de otra forma no habría encontrado. Mediante la utilización de estas
herramientas se pueden generar nuevas oportunidades de negocio. Algunas
posibilidades que ofrecen estas herramientas son:
   Predicción automatizada de tendencias y comportamientos.
   Descubrimiento automatizado de modelos desconocidos.
   Descubrimiento de anomalías y acciones fraudulentas por parte de clientes.




¿Dónde se utiliza Data Mining?

La utilidad de Data Mining se puede dar dentro de los siguientes aspectos:

   Sistemas parcialmente desconocidos: Si el modelo del sistema que
      produce los datos es bien conocido, entonces no necesitamos de la
      minería de datos ya que todas las variables son de alguna manera
      predecibles. Este no es el caso del comercio electrónico, debido a los
      efectos del comportamiento humano, el clima y de decisiones políticas
      entre otros. En estos casos habrá una parte del sistema que es conocida
      y habrá una parte aparentemente de naturaleza aleatoria. Bajo ciertas
      circunstancias, a partir de una gran cantidad de datos asociada con el
      sistema, existe la posibilidad de encontrar nuevos aspectos previamente
      desconocidos del modelo.
   Enorme cantidad de datos: Al contar con mucha información en algunas
      bases de datos es importante para una empresa encontrar la forma de
      analizar quot;montañasquot; de información (lo que para un humano sería
      imposible) y que ello le produzca algún tipo de beneficio.
   Potente hardware y software: Muchas de las herramientas presentes en la
      minería de datos están basadas en el uso intensivo de la computación, en
      consecuencia, un equipo conveniente y un software eficiente, con el cual
      cuente una compañía, aumentará el desempeño del proceso de buscar y
      analizar información, el cual a veces debe vérselas con producciones de
      datos del orden de los Gbytes/hora (repetimos, algo humanamente
      imposible). Por ejemplo, las técnicas de Data Mining son utilizadas
      habitualmente para el análisis y explotación de datos de un Data
Warehouse(véase la sección 1.2). El uso del Data Mining puede ser
      provechoso en el caso de poseer un Data Warehouse que contenga datos
      sobre sus procesos productivos, datos de seguimiento de clientes, datos
      externos de mercado, datos sobre la actividad de competidores, etc.




Los objetivos principales de Data Mining.


Data Mining persigue ciertos objetivos de manera especifica, a saber:

   Descripción: El principal producto del proceso de la minería de datos es el
      descubrimiento de reglas. Estas mostrarán nuevas relaciones entre las
      variables o excepciones de acuerdo a la empresa en que se utilice este
      proceso. Ello enriquecerá el análisis y la descripción de la forma en que
      trabaja una compañía y ayudará en la planificación y en el diseño de
      futuros cambios. Es posible que algunas de las reglas descubiertas no
      puedan ser cambiadas, pero si resulte posible realizar modificaciones
      apropiadas en la organización con el propósito de mejorar su desempeño.
   Predicción (Forecasting): Una vez descubiertas reglas importantes, estas
      pueden ser utilizadas pera estimar algunas variables de salida. Puede ser
      en el caso de secuencias en el tiempo, o bien en la identificación e
      interrupción a tiempo, de una futura mala experiencia de crédito. En esta
      tarea, se complementan las técnicas estadísticas tradicionales con
      aquellas provenientes de la inteligencia artificial. Conceptos adaptativos
      como los algoritmos genéticos y las redes neuronales, permiten realizar
      predicciones más acertadas, especialmente en casos de gran
      complejidad y con relaciones internas.




CUESTIONARIO DE DATA MINING

¿Que es data minnig?


Data Mining es una combinación de procesos como:
Extracción de datos
   Limpieza de datos.
   Selección de características.
   Algoritmos.
   Análisis de resultados.


   Es el exceso de información que se recibe dia a dia. El abaratamiento de los
       sistemas de almacenamiento tanto temporal como permanente.
   El incremento de las velocidades de cómputo en los procesadores.
   Las mejoras en la confiabilidad y aumento de la velocidad en la transmisión
       de datos.
   El desarrollo de sistemas administradores de bases de datos más poderosos.

¿En donde se utiliza el data minning?

Enorme cantidad de datos
Sistemas parcialmente desconocidos
Potente hardware y software

¿Objetivos principales de data minning?

Descripción: El principal producto del proceso de la minería de datos es el
descubrimiento de reglas. Estas mostrarán nuevas relaciones entre las
variables o excepciones de acuerdo a la empresa en que se utilice este
proceso.

Predicción (Forecasting): Una vez descubiertas reglas importantes, estas
pueden ser utilizadas pera estimar algunas variables de salida. Puede ser en el
caso de secuencias en el tiempo, o bien en la identificación e interrupción a
tiempo, de una futura mala experiencia de crédito.

Más contenido relacionado

La actualidad más candente

Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosCelestino Güemes Seoane
 
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Luis Fernando Aguas Bucheli
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivassgcuadrado
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno BancarioMartín Cabrera
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Fernando Santamaría
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 

La actualidad más candente (18)

Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negocios
 
MD: Clase9
MD: Clase9MD: Clase9
MD: Clase9
 
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno Bancario
 
Aplicaciones difusas:Introducción a BI
Aplicaciones difusas:Introducción a  BIAplicaciones difusas:Introducción a  BI
Aplicaciones difusas:Introducción a BI
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Big data presentacion diapositiva
Big data presentacion diapositivaBig data presentacion diapositiva
Big data presentacion diapositiva
 
Taller 1
Taller 1Taller 1
Taller 1
 
Taller 1
Taller 1Taller 1
Taller 1
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 

Destacado

Data Mining
Data MiningData Mining
Data Miningbrobelo
 
Navegación por la información
Navegación por la informaciónNavegación por la información
Navegación por la informaciónMargarita Roura
 
La edad moderna y sus avances
La edad moderna y sus avancesLa edad moderna y sus avances
La edad moderna y sus avancesAndreszumel
 
Portafolio semana 3. estrategias de diseminación
Portafolio semana 3. estrategias de diseminaciónPortafolio semana 3. estrategias de diseminación
Portafolio semana 3. estrategias de diseminaciónIgnacio Monclús López
 
Design Thinking- Grupo imagina
Design Thinking- Grupo imaginaDesign Thinking- Grupo imagina
Design Thinking- Grupo imaginaSonia Sansone
 
Informació, Internet i participació ciutadana
Informació, Internet  i participació ciutadanaInformació, Internet  i participació ciutadana
Informació, Internet i participació ciutadanaIsmael Peña-López
 
Examen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentas
Examen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentasExamen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentas
Examen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentasMarcelo Honores
 
Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...
Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...
Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...TERRATOX
 
Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...
Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...
Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...Ismael Peña-López
 
Bases para la feria de ciencias 2012
Bases para la feria  de ciencias   2012Bases para la feria  de ciencias   2012
Bases para la feria de ciencias 2012pochito
 
Jesús en el antiguo testamento
Jesús en el antiguo testamentoJesús en el antiguo testamento
Jesús en el antiguo testamentoerik graff
 
Dicotomías en los Entornos Personales de Aprendizaje y las instituciones
Dicotomías en los Entornos Personales de Aprendizaje y las institucionesDicotomías en los Entornos Personales de Aprendizaje y las instituciones
Dicotomías en los Entornos Personales de Aprendizaje y las institucionesIsmael Peña-López
 

Destacado (20)

Data Mining
Data MiningData Mining
Data Mining
 
Grupo 7
Grupo 7Grupo 7
Grupo 7
 
Navegación por la información
Navegación por la informaciónNavegación por la información
Navegación por la información
 
La edad moderna y sus avances
La edad moderna y sus avancesLa edad moderna y sus avances
La edad moderna y sus avances
 
Portafolio semana 3. estrategias de diseminación
Portafolio semana 3. estrategias de diseminaciónPortafolio semana 3. estrategias de diseminación
Portafolio semana 3. estrategias de diseminación
 
Design Thinking- Grupo imagina
Design Thinking- Grupo imaginaDesign Thinking- Grupo imagina
Design Thinking- Grupo imagina
 
Los Guppys
Los GuppysLos Guppys
Los Guppys
 
Ciencia 2
Ciencia 2Ciencia 2
Ciencia 2
 
Informació, Internet i participació ciutadana
Informació, Internet  i participació ciutadanaInformació, Internet  i participació ciutadana
Informació, Internet i participació ciutadana
 
[157 arequipa]-[06-11-2012 12 25-15]-or-157-arequipa
[157 arequipa]-[06-11-2012 12 25-15]-or-157-arequipa[157 arequipa]-[06-11-2012 12 25-15]-or-157-arequipa
[157 arequipa]-[06-11-2012 12 25-15]-or-157-arequipa
 
02 Relatosdeviaxes
02 Relatosdeviaxes02 Relatosdeviaxes
02 Relatosdeviaxes
 
Examen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentas
Examen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentasExamen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentas
Examen de certificacion de ADWORDS: C10: Cómo gestionar varias cuentas
 
Papa's
Papa'sPapa's
Papa's
 
Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...
Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...
Expediente 39506/T Solicita intervención por alarmas, vertidos y containers e...
 
Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...
Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...
Intención de voto en España 1978-2013. ¿Una Segunda Transición hacia una polí...
 
Bases para la feria de ciencias 2012
Bases para la feria  de ciencias   2012Bases para la feria  de ciencias   2012
Bases para la feria de ciencias 2012
 
Jesús en el antiguo testamento
Jesús en el antiguo testamentoJesús en el antiguo testamento
Jesús en el antiguo testamento
 
Ple conference 2010
Ple  conference 2010 Ple  conference 2010
Ple conference 2010
 
Dicotomías en los Entornos Personales de Aprendizaje y las instituciones
Dicotomías en los Entornos Personales de Aprendizaje y las institucionesDicotomías en los Entornos Personales de Aprendizaje y las instituciones
Dicotomías en los Entornos Personales de Aprendizaje y las instituciones
 
Barcelona2
Barcelona2Barcelona2
Barcelona2
 

Similar a Data (20)

INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.pptINTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
 
bi-180616123404 (1).pptx
bi-180616123404 (1).pptxbi-180616123404 (1).pptx
bi-180616123404 (1).pptx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
ppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdfppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdf
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BI
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
El big data
El big dataEl big data
El big data
 
Big data
Big dataBig data
Big data
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
43 17 log_data discovery_1
43 17 log_data discovery_143 17 log_data discovery_1
43 17 log_data discovery_1
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Big data
Big dataBig data
Big data
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Que es big data
Que es big dataQue es big data
Que es big data
 
SEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdfSEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdf
 
Integracion de datos.pdf
Integracion de datos.pdfIntegracion de datos.pdf
Integracion de datos.pdf
 
PlataformasIA
PlataformasIAPlataformasIA
PlataformasIA
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 

Último

Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELmaryfer27m
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxMariaBurgos55
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaarkananubis
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxAlexander López
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 

Último (20)

Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.ppt
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFEL
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptx
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en mina
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 

Data

  • 1. DATA MINNING ¿Qué es Data Mining? Cada día generamos una gran cantidad de información, algunas veces conscientes de que lo hacemos y otras veces inconscientes de ello porque lo desconocemos. Nos damos cuenta de que generamos información cuando registramos nuestra entrada en el trabajo, cuando entramos en un servidor para ver nuestro correo, cuando pagamos con una tarjeta de crédito o cuando reservamos un boleto de avión. Otras veces no nos damos cuenta de que generamos información, como cuando conducimos por una vía donde están contabilizando el número de automóviles que pasan por minuto, cuando se sigue nuestra navegación por Internet o cuando nos sacan una fotografía del rostro al haber pasado cerca de una oficina gubernamental. ¿Con qué finalidad queremos generar información? Son muchos los motivos que nos llevan a generar información, ya que nos pueden ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier ámbito según el dominio en que nos desarrollemos. La información por sí misma está considerada un bien patrimonial. De esta forma, si una empresa tiene una pérdida total o parcial de información provoca bastantes perjuicios. Es evidente que la información debe ser protegida, pero también explotada. ¿Qué nos ha permitido poder generar tanta información? En los últimos años, debido al desarrollo tecnológico a niveles exponenciales tanto en el área de cómputo como en la de transmisión de datos, ha sido posible que se gestionen de una mejor manera el manejo y almacenamiento de la información. Sin duda existen cuatro factores importantes que nos han llevado a este suceso: El abaratamiento de los sistemas de almacenamiento tanto temporal como permanente. El incremento de las velocidades de cómputo en los procesadores. Las mejoras en la confiabilidad y aumento de la velocidad en la transmisión de datos. El desarrollo de sistemas administradores de bases de datos más poderosos. Actualmente todas estas ventajas nos han llevado a abusar del almacenamiento de la información en las bases de datos. Podemos decir que algunas empresas almacenan un cierto tipo de datos al que se ha denominado dato-escritura, ya que sólo se guarda (o escribe) en el disco duro, pero nunca se hace uso de él. Generalmente, todas las empresas usan un dato llamado dato-escritura-lectura, que utilizan para hacer consultas dirigidas. Un nuevo tipo de dato al cual se ha llamado dato-escritura-lectura-análisis es el que proporciona en conjunto un verdadero conocimiento y nos apoya en las tomas de decisiones. Es necesario
  • 2. contar con tecnologías que nos ayuden a explotar el potencial de este tipo de datos. La cantidad de información que nos llega cada día es tan inmensa que nos resulta difícil asimilarla. Basta con ir al buscador AltavistaÓ y solicitar la palabra information para ver que existen 171.769.416 sitios donde nos pueden decir algo al respecto. Suponiendo que nos tomemos un minuto para ver el contenido de cada página, tardaríamos entonces 326 años en visitarlas todas. Esto es imposible, y, por lo tanto, existe una clara necesidad de disponer de tecnologías que nos ayuden en nuestros procesos de búsqueda y, aún más, de tecnologías que nos ayuden a comprender su contenido. Como bien sabemos, algunos sistemas producen una cantidad inmensa de datos; estos datos con frecuencia contienen valiosa información que puede resultar muy útil y ser vista como vetas de oro por los ojos de un ejecutivo de una corporación. Las dimensiones de las base de datos grandes (montañas) y sus velocidades de crecimiento, hacen muy difícil para un humano su análisis y la extracción de alguna información importante (oro). Aún con el uso de herramientas estadísticas clásicas esta tarea es casi imposible. El Data Mining surge como una tecnología que intenta ayudar a comprender el contenido de una base de datos. De forma general, los datos son la materia prima bruta, en el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación del confronto entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. El Data Mining trabaja en el nivel superior buscando patrones, comportamientos, agrupaciones, secuencias, tendencias o asociaciones que puedan generar algún modelo que nos permita comprender mejor el dominio para ayudar en una posible toma de decisión. El descubrimiento de conocimiento en base de datos (KDD, de Knowledge Discovery in Databases) combina las técnicas tradicionales con numerosos recursos desarrollados en el área de la inteligencia artificial. En estas aplicaciones el término quot;Minería de Datosquot; (Data Mining) ha tenido más aceptación. En algunos casos las herramientas provenientes de la inteligencia artificial son nuevas, no del todo comprendidas y carentes de un soporte teórico formal. Pero en este caso el objetivo es tan valioso, que los resultados prácticos han rebasado a la elegancia académica. Con todo lo anterior podemos decir que Data Mining es el proceso de descubrir patrones de información interesante y potencialmente útiles, inmersos en una gran base de datos en la que se interactúa constantemente. Data Mining es una combinación de procesos como: Extracción de datos Limpieza de datos. Selección de características.
  • 3. Algoritmos. Análisis de resultados. Las herramientas de Data Mining exploran gran cantidad de datos dentro de una BD grande, y mediante su análisis predicen posibles tendencias o comportamientos futuros entro de una empresa, permitiendo al experto tomar decisiones en los negocios de una forma rápida y utilizando un conocimiento que de otra forma no habría encontrado. Mediante la utilización de estas herramientas se pueden generar nuevas oportunidades de negocio. Algunas posibilidades que ofrecen estas herramientas son: Predicción automatizada de tendencias y comportamientos. Descubrimiento automatizado de modelos desconocidos. Descubrimiento de anomalías y acciones fraudulentas por parte de clientes. ¿Dónde se utiliza Data Mining? La utilidad de Data Mining se puede dar dentro de los siguientes aspectos: Sistemas parcialmente desconocidos: Si el modelo del sistema que produce los datos es bien conocido, entonces no necesitamos de la minería de datos ya que todas las variables son de alguna manera predecibles. Este no es el caso del comercio electrónico, debido a los efectos del comportamiento humano, el clima y de decisiones políticas entre otros. En estos casos habrá una parte del sistema que es conocida y habrá una parte aparentemente de naturaleza aleatoria. Bajo ciertas circunstancias, a partir de una gran cantidad de datos asociada con el sistema, existe la posibilidad de encontrar nuevos aspectos previamente desconocidos del modelo. Enorme cantidad de datos: Al contar con mucha información en algunas bases de datos es importante para una empresa encontrar la forma de analizar quot;montañasquot; de información (lo que para un humano sería imposible) y que ello le produzca algún tipo de beneficio. Potente hardware y software: Muchas de las herramientas presentes en la minería de datos están basadas en el uso intensivo de la computación, en consecuencia, un equipo conveniente y un software eficiente, con el cual cuente una compañía, aumentará el desempeño del proceso de buscar y analizar información, el cual a veces debe vérselas con producciones de datos del orden de los Gbytes/hora (repetimos, algo humanamente imposible). Por ejemplo, las técnicas de Data Mining son utilizadas habitualmente para el análisis y explotación de datos de un Data
  • 4. Warehouse(véase la sección 1.2). El uso del Data Mining puede ser provechoso en el caso de poseer un Data Warehouse que contenga datos sobre sus procesos productivos, datos de seguimiento de clientes, datos externos de mercado, datos sobre la actividad de competidores, etc. Los objetivos principales de Data Mining. Data Mining persigue ciertos objetivos de manera especifica, a saber: Descripción: El principal producto del proceso de la minería de datos es el descubrimiento de reglas. Estas mostrarán nuevas relaciones entre las variables o excepciones de acuerdo a la empresa en que se utilice este proceso. Ello enriquecerá el análisis y la descripción de la forma en que trabaja una compañía y ayudará en la planificación y en el diseño de futuros cambios. Es posible que algunas de las reglas descubiertas no puedan ser cambiadas, pero si resulte posible realizar modificaciones apropiadas en la organización con el propósito de mejorar su desempeño. Predicción (Forecasting): Una vez descubiertas reglas importantes, estas pueden ser utilizadas pera estimar algunas variables de salida. Puede ser en el caso de secuencias en el tiempo, o bien en la identificación e interrupción a tiempo, de una futura mala experiencia de crédito. En esta tarea, se complementan las técnicas estadísticas tradicionales con aquellas provenientes de la inteligencia artificial. Conceptos adaptativos como los algoritmos genéticos y las redes neuronales, permiten realizar predicciones más acertadas, especialmente en casos de gran complejidad y con relaciones internas. CUESTIONARIO DE DATA MINING ¿Que es data minnig? Data Mining es una combinación de procesos como:
  • 5. Extracción de datos Limpieza de datos. Selección de características. Algoritmos. Análisis de resultados. Es el exceso de información que se recibe dia a dia. El abaratamiento de los sistemas de almacenamiento tanto temporal como permanente. El incremento de las velocidades de cómputo en los procesadores. Las mejoras en la confiabilidad y aumento de la velocidad en la transmisión de datos. El desarrollo de sistemas administradores de bases de datos más poderosos. ¿En donde se utiliza el data minning? Enorme cantidad de datos Sistemas parcialmente desconocidos Potente hardware y software ¿Objetivos principales de data minning? Descripción: El principal producto del proceso de la minería de datos es el descubrimiento de reglas. Estas mostrarán nuevas relaciones entre las variables o excepciones de acuerdo a la empresa en que se utilice este proceso. Predicción (Forecasting): Una vez descubiertas reglas importantes, estas pueden ser utilizadas pera estimar algunas variables de salida. Puede ser en el caso de secuencias en el tiempo, o bien en la identificación e interrupción a tiempo, de una futura mala experiencia de crédito.