SlideShare una empresa de Scribd logo
1 de 4
(*)(Por Marcelo Bosque, DsPC Harvard University)
¿QUE SON EL BIG DATA, LA CIENCIA DE DATOS Y EL DATA MINING? (*)
DATA SCIENCE es el nombre que se le da a la ciencia del tratamiento de datos,
especialmente en lo referente al manejo del BIG DATA y las técnicas de minería de
datos. Un científico de datos debe estar versado en estadísticas, machine learning,
minería de datos, BIG DATA, On Line Analitical Processing e Inteligencia
Artificial.
¿Qué es exactamente Ciencia de Datos?
Para entender qué es la Ciencia de Datos; es necesario remontarse un poco en la
historia; pues exploramos la ruta del nacimiento del término ciencia de datos,
veremos dos temas que se juntan.
BIG DATA
Primero hay que comprender que es Big Data. De acuerdo con la definición de Gartner
realizada en el 2001: Big data es un conjunto de datos de una gran variedad y
formatos; que se acumulan en grandes volúmenes y a una velocidad cada vez
mayor. A esto es lo que se conoce como las 3 V’s (dimensiones) de la Big Data.
Formalmente podemos decir que es la captura y almacenamiento de grandes
volúmenes de datos. Sin embargo, mucha gente usa esta definición refiriéndose
también al tratamiento y análisis de grandes volúmenes de datos usando las técnicas
antes detalladas en el punto "minería de datos". Incluye como almacenar los datos,
que tipos de bases de datos tener, que modelo usar y que técnicas es recomendable
usar para la minería de datos para los casos específicos que se presenten.
(*)(Por Marcelo Bosque, DsPC Harvard University)
En la foto, una nota sobre usos de la mineria de datos para diagnostico medico
Estableciendo esto en un contexto simple; el concepto de Big Data se refiere a datos
masivos y a menudo no estructurados, en los que las capacidades de procesamiento
(*)(Por Marcelo Bosque, DsPC Harvard University)
de las herramientas tradicionales de gestión de datos resultan ser inadecuadas. Big
Data puede ocupar terabytes y petabytes de espacio de almacenamiento en diversos
formatos, incluidos texto, video, sonido, imágenes y más.
Aunque el término Big Data es relativamente nuevo, la tendencia a agrupar y
almacenar grandes volúmenes de información para análisis a futuro es muy antigua.
La minería de datos se usa, (según el autor que se lea), como una especie de sinónimo
de “ciencia de datos” . Se podría pensar también que la ciencia de datos utiliza como
herramienta fundamental a la minería de datos.
Un dato es la representación simbólica de un atributo, que puede ser cualitativo o
cuantitativo, de la información de un objeto; persona; ser viviente; organización; etc.
Por ejemplo: para determinar la información de una persona, se podrían considerar
los siguientes atributos: edad; estatura; género; estado de ánimo; color de ojos; etc.
Esto nos arrojaría un conjunto de condiciones o situaciones que de por si solos no
aportan ninguna información relevante; pero al ser agrupados y analizados se podría
determinar cierto valor o hecho que fuera relevante.
En la foto: Nota sobre los desarrollos de Amazon en mineria de datos
(*)(Por Marcelo Bosque, DsPC Harvard University)
¿Qué es la minería de datos?
La minería de datos es el proceso de analizar un conjunto de datos para encontrar
información. Una vez que los datos se recopilan en el almacén de datos, el proceso de
extracción de datos comienza e involucra todo, desde limpiar los datos de registros
incompletos hasta crear visualizaciones de hallazgos. La minería de datos
generalmente se asocia con el análisis de los grandes conjuntos de datos presentes en
los campos de big data, aprendizaje automático e inteligencia artificial. El proceso
busca patrones, anomalías y asociaciones en los datos con el objetivo de extraer valor.
Por ejemplo, en el caso de los automóviles sin conductor, las asociaciones de datos
podrían ayudar a identificar las acciones de conducción que tienen más
probabilidades de provocar accidentes. Las seis etapas centrales del proceso de
minería de datos incluyen detección de anomalías, modelado de dependencias,
agrupamiento, clasificación, regresión y generación de informes.
En la foto, una nota sobre usos de data science / mineria de datos para el periodismo
Pueden ser:
1) Cuando no tengo una idea predeterminada de lo que busco: Orientadas al
descubrimiento
2) Cuando busco sobre la base de patrones encontrados anteriormente: Orientadas al
modelado predictivo
3)Cuando se aplican patrones para encontrar anomalías: Análisis forense

Más contenido relacionado

La actualidad más candente

Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017Manuel Garrido Peña
 
Introducción a Data Science
Introducción a Data ScienceIntroducción a Data Science
Introducción a Data ScienceCarlos Fuentes
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD travon1
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big DataDaniel Jiménez
 
Herramientas de mineria_de_datos
Herramientas de mineria_de_datosHerramientas de mineria_de_datos
Herramientas de mineria_de_datostravon1
 
Agrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del arteAgrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del artetravon1
 
Lamolinadata
LamolinadataLamolinadata
Lamolinadataeacunaf56
 
Estado de situación del acceso abierto en Argentina: gestión de datos cient...
Estado de situación del acceso abierto en Argentina: gestión de datos cient...Estado de situación del acceso abierto en Argentina: gestión de datos cient...
Estado de situación del acceso abierto en Argentina: gestión de datos cient...Fernando-Ariel Lopez
 
El futuro de las bases de datos
El futuro de las bases de datosEl futuro de las bases de datos
El futuro de las bases de datosceaubaracabr
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN” APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN” VanneA24
 
Taller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky Theory
Taller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky TheoryTaller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky Theory
Taller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky TheoryMario Pérez Esteso
 
APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN” APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN” MPHurtado
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data ScienceSpanishPASSVC
 
Sistemas de gestion de base de datos
Sistemas de gestion de base de datosSistemas de gestion de base de datos
Sistemas de gestion de base de datosGXT
 
Base de datos
Base de datosBase de datos
Base de datosalexvar23
 

La actualidad más candente (20)

Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017
 
Introducción a Data Science
Introducción a Data ScienceIntroducción a Data Science
Introducción a Data Science
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Herramientas de mineria_de_datos
Herramientas de mineria_de_datosHerramientas de mineria_de_datos
Herramientas de mineria_de_datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Agrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del arteAgrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del arte
 
Lamolinadata
LamolinadataLamolinadata
Lamolinadata
 
Estado de situación del acceso abierto en Argentina: gestión de datos cient...
Estado de situación del acceso abierto en Argentina: gestión de datos cient...Estado de situación del acceso abierto en Argentina: gestión de datos cient...
Estado de situación del acceso abierto en Argentina: gestión de datos cient...
 
El futuro de las bases de datos
El futuro de las bases de datosEl futuro de las bases de datos
El futuro de las bases de datos
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN” APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE LA RECEPCIÓN “EL JARDÍN DEL MALECÓN”
 
Taller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky Theory
Taller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky TheoryTaller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky Theory
Taller Big Data, ciencia de datos y R - IEEE SB UMH y Geeky Theory
 
APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN” APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN”
APLICACIÓN DE CONTROL DE INVENTARIO DE CLIENTES DE “EL JARDÍN DEL MALECÓN”
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data Science
 
Big data
Big dataBig data
Big data
 
Sistemas de gestion de base de datos
Sistemas de gestion de base de datosSistemas de gestion de base de datos
Sistemas de gestion de base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 

Similar a Que son el big data la ciencia de datos y el data mining

Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
Kezo. trabajo para subir
Kezo. trabajo para subirKezo. trabajo para subir
Kezo. trabajo para subirkevinalfredo
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de artePepe
 
Data set module 1 - spanish
Data set   module 1 - spanishData set   module 1 - spanish
Data set module 1 - spanishData-Set
 
Teoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de InformacionTeoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de InformacionAlejandro Rodriguez
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Daniela Bedascarrasbure
 
conceptos de teoria de la informacion fuentes de informacion
conceptos de teoria de la informacion  fuentes de informacionconceptos de teoria de la informacion  fuentes de informacion
conceptos de teoria de la informacion fuentes de informacionJose Martinez
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Roman Herrera
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataAlfredo Vela Zancada
 

Similar a Que son el big data la ciencia de datos y el data mining (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
La importancia del Big Data
La importancia del Big DataLa importancia del Big Data
La importancia del Big Data
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Big data-grupo-7
Big data-grupo-7Big data-grupo-7
Big data-grupo-7
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
Big data
Big dataBig data
Big data
 
TRABAJO N°1.pdf
TRABAJO N°1.pdfTRABAJO N°1.pdf
TRABAJO N°1.pdf
 
Kezo. trabajo para subir
Kezo. trabajo para subirKezo. trabajo para subir
Kezo. trabajo para subir
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de arte
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Data set module 1 - spanish
Data set   module 1 - spanishData set   module 1 - spanish
Data set module 1 - spanish
 
Teoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de InformacionTeoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de Informacion
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21
 
conceptos de teoria de la informacion fuentes de informacion
conceptos de teoria de la informacion  fuentes de informacionconceptos de teoria de la informacion  fuentes de informacion
conceptos de teoria de la informacion fuentes de informacion
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.
 
Profesión: Big Data
Profesión: Big DataProfesión: Big Data
Profesión: Big Data
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big Data
 
Qué es big data
Qué es big dataQué es big data
Qué es big data
 

Último

REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfEDUARDO MAMANI MAMANI
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 

Último (20)

REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 

Que son el big data la ciencia de datos y el data mining

  • 1. (*)(Por Marcelo Bosque, DsPC Harvard University) ¿QUE SON EL BIG DATA, LA CIENCIA DE DATOS Y EL DATA MINING? (*) DATA SCIENCE es el nombre que se le da a la ciencia del tratamiento de datos, especialmente en lo referente al manejo del BIG DATA y las técnicas de minería de datos. Un científico de datos debe estar versado en estadísticas, machine learning, minería de datos, BIG DATA, On Line Analitical Processing e Inteligencia Artificial. ¿Qué es exactamente Ciencia de Datos? Para entender qué es la Ciencia de Datos; es necesario remontarse un poco en la historia; pues exploramos la ruta del nacimiento del término ciencia de datos, veremos dos temas que se juntan. BIG DATA Primero hay que comprender que es Big Data. De acuerdo con la definición de Gartner realizada en el 2001: Big data es un conjunto de datos de una gran variedad y formatos; que se acumulan en grandes volúmenes y a una velocidad cada vez mayor. A esto es lo que se conoce como las 3 V’s (dimensiones) de la Big Data. Formalmente podemos decir que es la captura y almacenamiento de grandes volúmenes de datos. Sin embargo, mucha gente usa esta definición refiriéndose también al tratamiento y análisis de grandes volúmenes de datos usando las técnicas antes detalladas en el punto "minería de datos". Incluye como almacenar los datos, que tipos de bases de datos tener, que modelo usar y que técnicas es recomendable usar para la minería de datos para los casos específicos que se presenten.
  • 2. (*)(Por Marcelo Bosque, DsPC Harvard University) En la foto, una nota sobre usos de la mineria de datos para diagnostico medico Estableciendo esto en un contexto simple; el concepto de Big Data se refiere a datos masivos y a menudo no estructurados, en los que las capacidades de procesamiento
  • 3. (*)(Por Marcelo Bosque, DsPC Harvard University) de las herramientas tradicionales de gestión de datos resultan ser inadecuadas. Big Data puede ocupar terabytes y petabytes de espacio de almacenamiento en diversos formatos, incluidos texto, video, sonido, imágenes y más. Aunque el término Big Data es relativamente nuevo, la tendencia a agrupar y almacenar grandes volúmenes de información para análisis a futuro es muy antigua. La minería de datos se usa, (según el autor que se lea), como una especie de sinónimo de “ciencia de datos” . Se podría pensar también que la ciencia de datos utiliza como herramienta fundamental a la minería de datos. Un dato es la representación simbólica de un atributo, que puede ser cualitativo o cuantitativo, de la información de un objeto; persona; ser viviente; organización; etc. Por ejemplo: para determinar la información de una persona, se podrían considerar los siguientes atributos: edad; estatura; género; estado de ánimo; color de ojos; etc. Esto nos arrojaría un conjunto de condiciones o situaciones que de por si solos no aportan ninguna información relevante; pero al ser agrupados y analizados se podría determinar cierto valor o hecho que fuera relevante. En la foto: Nota sobre los desarrollos de Amazon en mineria de datos
  • 4. (*)(Por Marcelo Bosque, DsPC Harvard University) ¿Qué es la minería de datos? La minería de datos es el proceso de analizar un conjunto de datos para encontrar información. Una vez que los datos se recopilan en el almacén de datos, el proceso de extracción de datos comienza e involucra todo, desde limpiar los datos de registros incompletos hasta crear visualizaciones de hallazgos. La minería de datos generalmente se asocia con el análisis de los grandes conjuntos de datos presentes en los campos de big data, aprendizaje automático e inteligencia artificial. El proceso busca patrones, anomalías y asociaciones en los datos con el objetivo de extraer valor. Por ejemplo, en el caso de los automóviles sin conductor, las asociaciones de datos podrían ayudar a identificar las acciones de conducción que tienen más probabilidades de provocar accidentes. Las seis etapas centrales del proceso de minería de datos incluyen detección de anomalías, modelado de dependencias, agrupamiento, clasificación, regresión y generación de informes. En la foto, una nota sobre usos de data science / mineria de datos para el periodismo Pueden ser: 1) Cuando no tengo una idea predeterminada de lo que busco: Orientadas al descubrimiento 2) Cuando busco sobre la base de patrones encontrados anteriormente: Orientadas al modelado predictivo 3)Cuando se aplican patrones para encontrar anomalías: Análisis forense