SlideShare una empresa de Scribd logo
BIG DATA
Jhonatan Steven Cárdenas Ojeda
¿QUÉ ES “BIG DATA”?
Big data (en español, grandes datos o
grandes volúmenes de datos) es un
término evolutivo que describe
cualquier cantidad voluminosa de datos
estructurados, semiestructurados y no
estructurados que tienen el potencial
de ser extraídos para obtener
información.
CARACTERÍSTICAS
DE “BIG DATA”
1. VOLUMEN: Es la cantidad de datos generados y guardados, estos
determinan el potencial y veracidad del mismo.
2. VARIEDAD: Es el tipo y naturaleza de los datos, de este modo se
determina el apoyo que le da al usuario.
3. VELOCIDAD: Esta es la velocidad que se genera para cumplir las
exigencias de los datos.
4. VERACIDAD: Se define como la calidad de los datos, ya que de ésta
depende la variedad y los resultados de la información.
TIPOS DE “BIG DATA”
1. DATOS ESTRUCTURADOS: Son los datos que tienen bien definida su
longitud y su formato, como por ejemplo las bases de datos
relacionales y los almacenes de datos.
2. DATOS NO ESTRUCTURADOS: Son los datos que necesitan un
formato específico, como por ejemplo archivos pdf, documentos
multimedia, correos electrónicos o documentos de texto.
3. DATOS SEMIESTRUCTURADOS: Son datos que no se limitan a
campos determinados pero requieren marcadores para separar la
información, tales como hojas de cálculo, HTML, XML o JSON.
¿DE DÓNDE PROVIENEN TODOS ESTOS DATOS?
1. GENERADOS POR LAS PERSONAS: Enviar información en cualquier red
social o cualquier otra cosa que se registre en base de datos.
2. TRANSACCIONES DE DATOS: La facturación, las llamadas o las
transacciones entre cuentas.
3. MARKETING ELECTRONICO Y WED: Navegación por internet.
4. MÁQUINA A MÁQUINA: Tecnologías que comparten datos mediante
dispositivos. Comunicaciones inalámbricas.
5. BIOMÉTRICA: Datos que provienen de la seguridad, defensa y servicios de
inteligencia.
TRANSFORMACIÓN
Aquí entran en juego las
plataformas extraer, transformar y
cargar (ETL). Su propósito es extraer los
datos de las diferentes fuentes y sistemas,
para después hacer transformaciones
(conversiones de datos, limpieza de datos
sucios, cambios de formato…) y finalmente
cargar los datos en la base de datos
o almacén de datos especificada.
ALMACENAMIENTO NOSQL
Son sistemas que provienen de un almacenamiento más flexible y
concurrente y permitir de manipular grandes cantidades de
información mucho más rápido por lo cual no cumplen con el
esquema entidad – relación.
TIPOS DE DATOS NOQSL
1. ALMACENAMIENTO CLAVE – VALOR: Los datos se almacenan de tal forma que
se acceda con una palabra clave.
2. ALMACENAMIENTO DOCUMENTAL: Son datos semiestructurados que pasan a
llamarse documentos formateados en una misma base de datos que acepte.
3. ALMACENAMIENTO EN GRAFO: Relacionan grandes cantidades de datos que
pueden ser muy variables. Además se establece que la relación son los nodos y
las relaciones entre la información, los artistas.
4. ALMACENAMIENTO ORIENTADO A COLUMNAS: Se orienta a almacenar datos
con tendencia a escalar horizontalmente, por lo que permite guardar diferentes
atributos y objetos bajo la misma clave.
TÉCNICAS DE ANÁLISIS DE DATOS
1. ASOCIACIÓN: Permite encontrar relaciones entre diferentes variables.
2. MINERÍA DE DATOS: Tiene como objetivo encontrar comportamientos
predilectos.
3. AGRUPACIÓN: Metodología para encontrar relaciones entre resultados
y haces una evaluación preliminar de la estructura de los datos
analizados.
4. ANÁLISIS DE TEXTO: Extrae información de datos generados por
personas (mensajes de textos, búsquedas web… etc) de esta forma
moldea temas y asuntos o predecir palabras.
UTILIDAD
El objetivo es que ciudadanos y
empresas puedan reaprovechar
estos datos para generar valor
económico. Podrán construir
sobre ellos una nueva idea que
genere nuevos datos,
conocimientos o incluso la
creación de nuevos servicios que
reporten beneficios económicos y
o sociales.
VISUALIZACIÓN
En los macro datos se llega un paso
más allá, ya que es una plataforma
que permite visualizar la información
a través de los análisis llevados a
cabo sobre los datos que
disponemos. Ésta trata de llegar a un
público más concreto, y una utilidad
más acotada como un cuadro de
mando integral de una información.

Más contenido relacionado

La actualidad más candente

Apuntes de herramientas 1
Apuntes de herramientas 1Apuntes de herramientas 1
Apuntes de herramientas 1
Juana González
 
Apuntes de herramientas 1
Apuntes de herramientas 1Apuntes de herramientas 1
Apuntes de herramientas 1Juana González
 
Apuntes de herramientas 1
Apuntes de herramientas 1Apuntes de herramientas 1
Apuntes de herramientas 1
Juana González
 
Tratamiento de la Informacion
Tratamiento de la InformacionTratamiento de la Informacion
Tratamiento de la InformacionFernando Avila
 
Operaciones básicas de un manejador de base de datos
Operaciones básicas de un manejador de base de datos Operaciones básicas de un manejador de base de datos
Operaciones básicas de un manejador de base de datos
Maria Garcia
 
Cómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datosCómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datosGobierno Local
 
Redes informáticas
Redes informáticasRedes informáticas
Redes informáticas
Xóchitl Ramírez Santiago
 
Derecho e informatica pc
Derecho e informatica   pcDerecho e informatica   pc
Derecho e informatica pc
Rocknald Jmh
 
BASES DE DATOS
BASES DE DATOSBASES DE DATOS
BASES DE DATOS
elsiscarolinacaasest
 
Profundiza unidad 1 Sistemas de Información Gerencial
Profundiza unidad 1 Sistemas de Información GerencialProfundiza unidad 1 Sistemas de Información Gerencial
Profundiza unidad 1 Sistemas de Información Gerencial
melledwin
 
Julieta
JulietaJulieta
Proyección de las bases de datos a futuro
Proyección de las bases de datos a futuroProyección de las bases de datos a futuro
Proyección de las bases de datos a futuroDiego Nitola
 
Diseña y administra base de datos avanzada
Diseña y administra base de datos avanzadaDiseña y administra base de datos avanzada
Diseña y administra base de datos avanzada
Roman_Blunt
 
Los Negocios En Las Ti Cs
Los Negocios En Las Ti CsLos Negocios En Las Ti Cs
Los Negocios En Las Ti Cscristianandres
 
Los Negocios En Las Ti Cs
Los Negocios En Las Ti CsLos Negocios En Las Ti Cs
Los Negocios En Las Ti Csguestff37f5
 

La actualidad más candente (18)

Apuntes de herramientas 1
Apuntes de herramientas 1Apuntes de herramientas 1
Apuntes de herramientas 1
 
Apuntes de herramientas 1
Apuntes de herramientas 1Apuntes de herramientas 1
Apuntes de herramientas 1
 
Apuntes de herramientas 1
Apuntes de herramientas 1Apuntes de herramientas 1
Apuntes de herramientas 1
 
Tratamiento de la Informacion
Tratamiento de la InformacionTratamiento de la Informacion
Tratamiento de la Informacion
 
Operaciones básicas de un manejador de base de datos
Operaciones básicas de un manejador de base de datos Operaciones básicas de un manejador de base de datos
Operaciones básicas de un manejador de base de datos
 
Cómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datosCómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datos
 
Redes informáticas
Redes informáticasRedes informáticas
Redes informáticas
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Talle Nº1
Talle Nº1Talle Nº1
Talle Nº1
 
Derecho e informatica pc
Derecho e informatica   pcDerecho e informatica   pc
Derecho e informatica pc
 
BASES DE DATOS
BASES DE DATOSBASES DE DATOS
BASES DE DATOS
 
Profundiza unidad 1 Sistemas de Información Gerencial
Profundiza unidad 1 Sistemas de Información GerencialProfundiza unidad 1 Sistemas de Información Gerencial
Profundiza unidad 1 Sistemas de Información Gerencial
 
Julieta
JulietaJulieta
Julieta
 
Proyección de las bases de datos a futuro
Proyección de las bases de datos a futuroProyección de las bases de datos a futuro
Proyección de las bases de datos a futuro
 
Gbd1
Gbd1Gbd1
Gbd1
 
Diseña y administra base de datos avanzada
Diseña y administra base de datos avanzadaDiseña y administra base de datos avanzada
Diseña y administra base de datos avanzada
 
Los Negocios En Las Ti Cs
Los Negocios En Las Ti CsLos Negocios En Las Ti Cs
Los Negocios En Las Ti Cs
 
Los Negocios En Las Ti Cs
Los Negocios En Las Ti CsLos Negocios En Las Ti Cs
Los Negocios En Las Ti Cs
 

Similar a BIG DATA - Jhonatan Cárdenas COL

Datos en la era de la información
Datos en la era de la informaciónDatos en la era de la información
Datos en la era de la información
Carolina Guerrero
 
Bases de datos
Bases de datosBases de datos
Bases de datos
Leiber Marquez Ragua
 
Big data
Big dataBig data
Big data
sergio Alfonso
 
Big data-grupo-7
Big data-grupo-7Big data-grupo-7
Big data-grupo-7
Dyllan Raza
 
Base de datos
Base de datosBase de datos
Base de datos
NelvisGonzalez1
 
Metadatos
MetadatosMetadatos
Metadatos
Jimmy Alexander
 
Primera actividad 10% (presentación)-enmanuel morles.27.691.096
Primera actividad 10% (presentación)-enmanuel morles.27.691.096Primera actividad 10% (presentación)-enmanuel morles.27.691.096
Primera actividad 10% (presentación)-enmanuel morles.27.691.096
enmanuelmorlestiller
 
Glosario base de datos
Glosario base de datosGlosario base de datos
Glosario base de datos
Brenda Vargas Moreno
 
Basedatos
BasedatosBasedatos
Basedatos
Ricardo Arcila
 
Taller 1 Y 3 Bases De Datos
Taller 1 Y 3 Bases De DatosTaller 1 Y 3 Bases De Datos
Taller 1 Y 3 Bases De Datos
Beatriz Salazar
 
U1 material didactico-introduccion a la administración de bd
U1 material didactico-introduccion a la administración de bdU1 material didactico-introduccion a la administración de bd
U1 material didactico-introduccion a la administración de bd
Universidad del Papaloapan
 
Guia base de datos
Guia base de datosGuia base de datos
Guia base de datos
wuali gomez
 
Presentación de Base de Dato
Presentación de Base de Dato Presentación de Base de Dato
Presentación de Base de Dato
yanos513
 
Bases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y GeneralidadesBases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y Generalidades
Ricardo Antonio Botero Rios
 
Base de datos
Base de datosBase de datos
Lectura dia 1
Lectura dia 1Lectura dia 1
Lectura dia 1
barrekovunimpro
 
Modelos para la gestión de datos
Modelos para la gestión de datosModelos para la gestión de datos
Modelos para la gestión de datos
Maria Garcia
 
TRABAJO N°1.pdf
TRABAJO N°1.pdfTRABAJO N°1.pdf
TRABAJO N°1.pdf
NelsonWachapa1
 

Similar a BIG DATA - Jhonatan Cárdenas COL (20)

Datos en la era de la información
Datos en la era de la informaciónDatos en la era de la información
Datos en la era de la información
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Big data
Big dataBig data
Big data
 
Big data-grupo-7
Big data-grupo-7Big data-grupo-7
Big data-grupo-7
 
Base de datos
Base de datosBase de datos
Base de datos
 
Metadatos
MetadatosMetadatos
Metadatos
 
Primera actividad 10% (presentación)-enmanuel morles.27.691.096
Primera actividad 10% (presentación)-enmanuel morles.27.691.096Primera actividad 10% (presentación)-enmanuel morles.27.691.096
Primera actividad 10% (presentación)-enmanuel morles.27.691.096
 
Glosario base de datos
Glosario base de datosGlosario base de datos
Glosario base de datos
 
Basedatos
BasedatosBasedatos
Basedatos
 
Taller 1 Y 3 Bases De Datos
Taller 1 Y 3 Bases De DatosTaller 1 Y 3 Bases De Datos
Taller 1 Y 3 Bases De Datos
 
U1 material didactico-introduccion a la administración de bd
U1 material didactico-introduccion a la administración de bdU1 material didactico-introduccion a la administración de bd
U1 material didactico-introduccion a la administración de bd
 
Lab #8
Lab #8   Lab #8
Lab #8
 
Taller 1
Taller 1Taller 1
Taller 1
 
Guia base de datos
Guia base de datosGuia base de datos
Guia base de datos
 
Presentación de Base de Dato
Presentación de Base de Dato Presentación de Base de Dato
Presentación de Base de Dato
 
Bases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y GeneralidadesBases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y Generalidades
 
Base de datos
Base de datosBase de datos
Base de datos
 
Lectura dia 1
Lectura dia 1Lectura dia 1
Lectura dia 1
 
Modelos para la gestión de datos
Modelos para la gestión de datosModelos para la gestión de datos
Modelos para la gestión de datos
 
TRABAJO N°1.pdf
TRABAJO N°1.pdfTRABAJO N°1.pdf
TRABAJO N°1.pdf
 

Último

Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
cofferub
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
rafaelsalazar0615
 
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Telefónica
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
SamuelRamirez83524
 
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfTRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
thomasdcroz38
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
cristianrb0324
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
JulyMuoz18
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
zoecaicedosalazar
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
DanielErazoMedina
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
jjfch3110
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
cdraco
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
cj3806354
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 
Diagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdfDiagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdf
ManuelCampos464987
 
Robótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptxRobótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptx
44652726
 
biogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectosbiogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectos
Luis Enrique Zafra Haro
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
Emilio Casbas
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdfDesarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
AlejandraCasallas7
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
AlejandraCasallas7
 

Último (20)

Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
 
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
 
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfTRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
Diagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdfDiagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdf
 
Robótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptxRobótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptx
 
biogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectosbiogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectos
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdfDesarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
 

BIG DATA - Jhonatan Cárdenas COL

  • 1. BIG DATA Jhonatan Steven Cárdenas Ojeda
  • 2. ¿QUÉ ES “BIG DATA”? Big data (en español, grandes datos o grandes volúmenes de datos) es un término evolutivo que describe cualquier cantidad voluminosa de datos estructurados, semiestructurados y no estructurados que tienen el potencial de ser extraídos para obtener información.
  • 3. CARACTERÍSTICAS DE “BIG DATA” 1. VOLUMEN: Es la cantidad de datos generados y guardados, estos determinan el potencial y veracidad del mismo. 2. VARIEDAD: Es el tipo y naturaleza de los datos, de este modo se determina el apoyo que le da al usuario. 3. VELOCIDAD: Esta es la velocidad que se genera para cumplir las exigencias de los datos. 4. VERACIDAD: Se define como la calidad de los datos, ya que de ésta depende la variedad y los resultados de la información.
  • 4. TIPOS DE “BIG DATA” 1. DATOS ESTRUCTURADOS: Son los datos que tienen bien definida su longitud y su formato, como por ejemplo las bases de datos relacionales y los almacenes de datos. 2. DATOS NO ESTRUCTURADOS: Son los datos que necesitan un formato específico, como por ejemplo archivos pdf, documentos multimedia, correos electrónicos o documentos de texto. 3. DATOS SEMIESTRUCTURADOS: Son datos que no se limitan a campos determinados pero requieren marcadores para separar la información, tales como hojas de cálculo, HTML, XML o JSON.
  • 5. ¿DE DÓNDE PROVIENEN TODOS ESTOS DATOS? 1. GENERADOS POR LAS PERSONAS: Enviar información en cualquier red social o cualquier otra cosa que se registre en base de datos. 2. TRANSACCIONES DE DATOS: La facturación, las llamadas o las transacciones entre cuentas. 3. MARKETING ELECTRONICO Y WED: Navegación por internet. 4. MÁQUINA A MÁQUINA: Tecnologías que comparten datos mediante dispositivos. Comunicaciones inalámbricas. 5. BIOMÉTRICA: Datos que provienen de la seguridad, defensa y servicios de inteligencia.
  • 6. TRANSFORMACIÓN Aquí entran en juego las plataformas extraer, transformar y cargar (ETL). Su propósito es extraer los datos de las diferentes fuentes y sistemas, para después hacer transformaciones (conversiones de datos, limpieza de datos sucios, cambios de formato…) y finalmente cargar los datos en la base de datos o almacén de datos especificada.
  • 7. ALMACENAMIENTO NOSQL Son sistemas que provienen de un almacenamiento más flexible y concurrente y permitir de manipular grandes cantidades de información mucho más rápido por lo cual no cumplen con el esquema entidad – relación.
  • 8. TIPOS DE DATOS NOQSL 1. ALMACENAMIENTO CLAVE – VALOR: Los datos se almacenan de tal forma que se acceda con una palabra clave. 2. ALMACENAMIENTO DOCUMENTAL: Son datos semiestructurados que pasan a llamarse documentos formateados en una misma base de datos que acepte. 3. ALMACENAMIENTO EN GRAFO: Relacionan grandes cantidades de datos que pueden ser muy variables. Además se establece que la relación son los nodos y las relaciones entre la información, los artistas. 4. ALMACENAMIENTO ORIENTADO A COLUMNAS: Se orienta a almacenar datos con tendencia a escalar horizontalmente, por lo que permite guardar diferentes atributos y objetos bajo la misma clave.
  • 9. TÉCNICAS DE ANÁLISIS DE DATOS 1. ASOCIACIÓN: Permite encontrar relaciones entre diferentes variables. 2. MINERÍA DE DATOS: Tiene como objetivo encontrar comportamientos predilectos. 3. AGRUPACIÓN: Metodología para encontrar relaciones entre resultados y haces una evaluación preliminar de la estructura de los datos analizados. 4. ANÁLISIS DE TEXTO: Extrae información de datos generados por personas (mensajes de textos, búsquedas web… etc) de esta forma moldea temas y asuntos o predecir palabras.
  • 10. UTILIDAD El objetivo es que ciudadanos y empresas puedan reaprovechar estos datos para generar valor económico. Podrán construir sobre ellos una nueva idea que genere nuevos datos, conocimientos o incluso la creación de nuevos servicios que reporten beneficios económicos y o sociales.
  • 11.
  • 12. VISUALIZACIÓN En los macro datos se llega un paso más allá, ya que es una plataforma que permite visualizar la información a través de los análisis llevados a cabo sobre los datos que disponemos. Ésta trata de llegar a un público más concreto, y una utilidad más acotada como un cuadro de mando integral de una información.