SlideShare una empresa de Scribd logo
INTRODUCCIÓN AL CONCEPTO DE BIG DATA
raineropenschool.com
Rainer Open School – Big Data
INTRODUCCIÓN
Big Data es un término de actualidad, que
parece dar respuesta a todos los problemas
empresariales. Pero ¿qué es exactamente?
¿En qué se diferencia de otras técnicas?
raineropenschool.com
ALGUNOS CONCEPTOS ERRÓNEOS
Big Data no es:
 Cuando hay que analizar más de 1 TB (o 20).
 Lo que sustituye a las BBDD relacionales.
 Algo imprescindible en la Web 13.7.
RESPONDAMOS A ESTOS MITOS…
 Big Data no tiene que ver exactamente con el volumen de
datos. No se puede poner la cifra arbitraria de 1TB o 20
TB como referencia. Más bien hablamos de problemas
que van “demasiado deprisa”. Ahora lo veremos mejor…
 Las BBDD relacionales no están muertas. De hecho,
TODOS los sistemas de Big Data funcionan con ellas y hay
problemas en los que no se pueden sustituir.
 La Web 2.0 introdujo el contenido dinámico (PHP) y la 3.0
la participación del usuario (Redes sociales). A partir de
ahí se ha perdido un poco el norte y esos números son
más un reclamo comercial que un concepto.
ENTONCES ¿QUÉ ES ESO DE BIG DATA?
Velocidad
Volumen
Variedad
Doug Laney definió en 2001 los problemas de
Big Data como aquellos en los que se dan las
características de velocidad, volumen y
variedad en la generación de datos.
VELOCIDAD
La velocidad se refiere a aquellos escenarios,
como la bolsa, en donde la producción de
datos es muy rápida y continua. El mercado
bursátil funciona a toda velocidad.
VOLUMEN
El volumen de los problemas en Big Data
puede ser descomunal. Nunca será posible
aprehender por completo la complejidad del
análisis meteorológico, por ejemplo.
VARIEDAD
La variedad se refiere a que no sabemos qué
formato van a tener los datos analizados. Hoy
los móviles dan coordenadas GPS, fotos o
sonido. ¿Y mañana?
POR TANTO…
Cuando un problema:
 Genera información a una gran velocidad y sin
interrupción.
 Genera un gran volumen de datos, capaz de
desbordar sistemas convencionales.
 Genera datos en cambio constante, sin que
sepamos su contenido o relación entre sí.
…es candidato a un análisis de Big Data.
NUESTRA DEFINICIÓN…
Big Data es un término genérico para
agrupar un conjunto de técnicas y recursos
destinados a analizar información que no
es viable estudiar por medios tradicionales,
con el objetivo de extraer información de
valor y conclusiones útiles.
POR EJEMPLO…
Indexar páginas web es un problema de Big
Data: no paran de generarse, es una
barbaridad de información y no sabemos qué
vamos a encontrar en ellas.
GENERACIÓN CRECIENTE DE INFORMACIÓN
Esta situación es consecuencia de la creciente
velocidad a la que se genera información, en
especial desde la “inflexión digital” hacia
2002, el momento en que se producen más
datos digitales que analógicos.
DESESTRUCTURACIÓN DEL CONTENIDO
Estructurado -> Tablas
Semiestructurado -> XML
Quasiestructurado -> Registros
Desestructurado –> Imágenes
Otra característica de esta tendencia es que la
información cada vez es más desestructurada;
se genera tan rápido que no se organiza muy
bien. ¿Qué estamos buscando, por ejemplo, en
el contenido de una red social?
EVOLUCIÓN DE LOS SISTEMAS DE ANÁLISIS
Ficheros
tabulados
Hojas de
cálculo
Bases de datos
relacionales
(OLAP)
Centros de
Proceso de
Datos (DW-BI)
Entornos
analíticos
(Sandbox)
De esta forma, se produce una evolución
lógica, apareciendo estrategias de análisis
para los problemas que vamos generando
como sociedad.
BUSINESS INTELLIGENCE VS BIG DATA
Los sistemas de BI se centran más en el
análisis de periodos fijos, mientras que Big
Data se preocupa de explorar relaciones:
¿Qué ha pasado? <- vs -> ¿Qué puede pasar?
UNA NUEVA ECONOMÍA DE DATOS
Dispositivos
Recolectores
Agregadores
Usuarios
Las relaciones entre usuarios, tecnología y
proveedores han definido una “economía de
datos”, donde la comprensión de lo que ocurre
proporciona una ventaja competitiva.
EL PAPEL DEL CIENTÍFICO DE DATOS
En este contexto surge la necesidad de un perfil
que ayude a todos los interlocutores: alguien que
sepa de informática, de estadística y de negocios,
sin llegar a ser un programador, un estadístico o
un empresario: el científico de datos.
HABILIDADES DEL CIENTÍFICO DE DATOS
No hay una “carrera” para ser científico de datos,
sino más bien un conjunto de actitudes y
habilidades que favorecen su trabajo:
 Competencias en matemáticas o estadística.
 Competencia básica en programación.
 Pensamiento crítico y escéptico en el análisis.
 Curiosidad y creatividad.
 Capacidad para comunicación y colaboración.
CONCLUSIONES
 El desarrollo de nuestra sociedad de la
información ha generado un valor de negocio en la
comprensión de los datos que genera.
 Esta necesidad requiere nuevas técnicas de
análisis de la información que hagan frente a la
velocidad, volumen y variedad de datos que se
producen.
 El científico de datos es el profesional que ayuda a
todos los demás a comprender y afrontar este tipo
de problemas.
raineropenschool.com
LECTURAS RECOMENDADAS
Data Science & Big Data
Statistics
EMC Education Services
ISBN: 978-1118876138
http://amzn.to/1QTNWH7
Cap. 1, sobre el contenido
de esta presentación
raineropenschool.com
SOBRE EL AUTOR
Rafael Morales
Consultor y formador en
 Sistemas de información (IT).
 Gestión de proyectos (PM).
 Aseguramiento de la calidad (QA).
En LinkedIn: http://bit.ly/20Qh0oZ
Email: contacto@rafael-morales.com
raineropenschool.com
OTROS CONTENIDOS
Puedes encontrar las notas de
esta conferencia y otras obras
del mismo autor en Amazon:
http://amzn.to/1Rp8yM9
Puedes seguir las novedades
y convocatorias de nuevos
seminarios, cursillos y
presentaciones en
raineropenschool.com
raineropenschool.com

Más contenido relacionado

La actualidad más candente

Big Data
Big DataBig Data
Big Data
Fernando Parra
 
Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
Grupo DIRCOM
 
Que es big data
Que es big dataQue es big data
Que es big data
Sergio Sanchez
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
David Alayón
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
Granada Giménez-Vacas
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
KEEDIO
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptx
nelsonsanchez86
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
Manuel Alejandro Carrero Aponte
 
Big data
Big dataBig data
Big data
marianaflorez20
 
Big data iformatica
Big data iformaticaBig data iformatica
Big data iformatica
Victoria Ana
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponenciales
Leonardo Clavijo
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negociosnnakasone
 
Articulo de Big Data
Articulo de Big DataArticulo de Big Data
Articulo de Big Data
César Sevilla Mejia
 
Big data
Big dataBig data
Big data
TaniaQu
 
Big Data, Big Picture
Big Data, Big PictureBig Data, Big Picture
Big Data, Big Picture
EvaluandoSoftware
 
Wp 2015-07
Wp 2015-07Wp 2015-07
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
Emilio del Prado
 
Clase especial
Clase especialClase especial
Clase especial
tobias taborda
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
Stratebi
 

La actualidad más candente (20)

Big Data
Big DataBig Data
Big Data
 
Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptx
 
Big data
Big dataBig data
Big data
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
 
Big data
Big dataBig data
Big data
 
Big data iformatica
Big data iformaticaBig data iformatica
Big data iformatica
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponenciales
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
 
Articulo de Big Data
Articulo de Big DataArticulo de Big Data
Articulo de Big Data
 
Big data
Big dataBig data
Big data
 
Big Data, Big Picture
Big Data, Big PictureBig Data, Big Picture
Big Data, Big Picture
 
Wp 2015-07
Wp 2015-07Wp 2015-07
Wp 2015-07
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
 
Clase especial
Clase especialClase especial
Clase especial
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 

Destacado

El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big Data
Rafael Morales
 
Técnicas de análisis: Clustering
Técnicas de análisis: ClusteringTécnicas de análisis: Clustering
Técnicas de análisis: Clustering
Rafael Morales
 
Técnicas de análisis: Reglas de asociación
Técnicas de análisis: Reglas de asociaciónTécnicas de análisis: Reglas de asociación
Técnicas de análisis: Reglas de asociación
Rafael Morales
 
Personal Kanban
Personal KanbanPersonal Kanban
Personal Kanban
Rafael Morales
 
Implantación del Sprint zero
Implantación del Sprint zeroImplantación del Sprint zero
Implantación del Sprint zero
Rafael Morales
 
Introducción a la tecnología cluster
Introducción a la tecnología clusterIntroducción a la tecnología cluster
Introducción a la tecnología cluster
Rafael Morales
 
Cómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShareCómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShare
Pedro Bermudez Talavera
 

Destacado (7)

El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big Data
 
Técnicas de análisis: Clustering
Técnicas de análisis: ClusteringTécnicas de análisis: Clustering
Técnicas de análisis: Clustering
 
Técnicas de análisis: Reglas de asociación
Técnicas de análisis: Reglas de asociaciónTécnicas de análisis: Reglas de asociación
Técnicas de análisis: Reglas de asociación
 
Personal Kanban
Personal KanbanPersonal Kanban
Personal Kanban
 
Implantación del Sprint zero
Implantación del Sprint zeroImplantación del Sprint zero
Implantación del Sprint zero
 
Introducción a la tecnología cluster
Introducción a la tecnología clusterIntroducción a la tecnología cluster
Introducción a la tecnología cluster
 
Cómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShareCómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShare
 

Similar a Introducción a Big Data

Presentación BigDataMachine para Marketing
Presentación BigDataMachine para MarketingPresentación BigDataMachine para Marketing
Presentación BigDataMachine para Marketing
BigDataMachine
 
Big data
Big dataBig data
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.
Roman Herrera
 
Is big data so big
Is big data so bigIs big data so big
Is big data so big
conectarc
 
Afc module 1 translated
Afc module 1 translatedAfc module 1 translated
Afc module 1 translated
SoniaNaiba
 
Gestionar la Digitalización: datos, personas y Tecnología
Gestionar la Digitalización: datos, personas y TecnologíaGestionar la Digitalización: datos, personas y Tecnología
Gestionar la Digitalización: datos, personas y Tecnología
Club Asturiano de Calidad
 
Big data
Big dataBig data
Rolando Archila
Rolando ArchilaRolando Archila
Rolando Archila
Rolando Archila Dehesa
 
Business intelligence y Big Data en la ciudad
Business intelligence y Big Data en la ciudadBusiness intelligence y Big Data en la ciudad
Business intelligence y Big Data en la ciudad
UOC Estudios de Informática, Multimedia y Telecomunicación
 
BIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdfBIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdf
Dr.Ing. Uriel
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
Carlos Cuesta
 
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Joan David Baena
 
La importancia del Big Data
La importancia del Big DataLa importancia del Big Data
La importancia del Big Data
José Antonio Zavaleta López
 
Big data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaBig data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontología
Juan Carlos Munévar
 
Revista Mundo Contact Septiembre 2012
Revista Mundo Contact Septiembre 2012Revista Mundo Contact Septiembre 2012
Revista Mundo Contact Septiembre 2012
Mundo Contact
 

Similar a Introducción a Big Data (20)

Presentación BigDataMachine para Marketing
Presentación BigDataMachine para MarketingPresentación BigDataMachine para Marketing
Presentación BigDataMachine para Marketing
 
Big data
Big dataBig data
Big data
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.
 
Fundamentos.pptx
Fundamentos.pptxFundamentos.pptx
Fundamentos.pptx
 
Is big data so big
Is big data so bigIs big data so big
Is big data so big
 
Afc module 1 translated
Afc module 1 translatedAfc module 1 translated
Afc module 1 translated
 
Gestionar la Digitalización: datos, personas y Tecnología
Gestionar la Digitalización: datos, personas y TecnologíaGestionar la Digitalización: datos, personas y Tecnología
Gestionar la Digitalización: datos, personas y Tecnología
 
Big data
Big dataBig data
Big data
 
Rolando Archila
Rolando ArchilaRolando Archila
Rolando Archila
 
Business intelligence y Big Data en la ciudad
Business intelligence y Big Data en la ciudadBusiness intelligence y Big Data en la ciudad
Business intelligence y Big Data en la ciudad
 
BIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdfBIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdf
 
Big data
Big dataBig data
Big data
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
 
Big data bbva
Big data bbvaBig data bbva
Big data bbva
 
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
La importancia del Big Data
La importancia del Big DataLa importancia del Big Data
La importancia del Big Data
 
¿Qué es el Big Data?
¿Qué es el Big Data?¿Qué es el Big Data?
¿Qué es el Big Data?
 
Big data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaBig data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontología
 
Revista Mundo Contact Septiembre 2012
Revista Mundo Contact Septiembre 2012Revista Mundo Contact Septiembre 2012
Revista Mundo Contact Septiembre 2012
 

Último

TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666
LizetTiradoRodriguez
 
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxDiapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
WalterOrdoez22
 
Tecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdfTecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdf
uriel132
 
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNATREGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
yafethcarrillo
 
Flujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotelFlujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotel
f4llenangel345
 
Presentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptxPresentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptx
hlscomunicaciones
 
El narcisismo actualmente en el mundo 2024
El narcisismo actualmente en el mundo 2024El narcisismo actualmente en el mundo 2024
El narcisismo actualmente en el mundo 2024
pepepinon408
 
Mapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptxMapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptx
diegoandrerodriguez2
 
Morfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCSMorfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCS
LisaCinnamoroll
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
JosMuoz943377
 
Análisis Datos imprecisos con lógica difusa.pdf
Análisis Datos imprecisos con lógica difusa.pdfAnálisis Datos imprecisos con lógica difusa.pdf
Análisis Datos imprecisos con lógica difusa.pdf
ReAViILICo
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
Emisor Digital
 
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
EliseoLuisRamrez
 
CORFEINE_4587888920140526_2aSE_P04_2.pdf
CORFEINE_4587888920140526_2aSE_P04_2.pdfCORFEINE_4587888920140526_2aSE_P04_2.pdf
CORFEINE_4587888920140526_2aSE_P04_2.pdf
CarlosMJmzsifuentes
 
ORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesietORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesiet
Maria Apellidos
 
Portada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdf
Portada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdfPortada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdf
Portada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdf
ssusere34b451
 
Licencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chileLicencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chile
franciscasalinaspobl
 
Desarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento InformaticaDesarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento Informatica
floralbaortega88
 
Ojiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datosOjiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datos
JaimeYael
 
Diagnóstico Institucional en psicologia.docx
Diagnóstico  Institucional en psicologia.docxDiagnóstico  Institucional en psicologia.docx
Diagnóstico Institucional en psicologia.docx
cabreraelian69
 

Último (20)

TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666
 
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxDiapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
 
Tecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdfTecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdf
 
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNATREGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
 
Flujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotelFlujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotel
 
Presentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptxPresentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptx
 
El narcisismo actualmente en el mundo 2024
El narcisismo actualmente en el mundo 2024El narcisismo actualmente en el mundo 2024
El narcisismo actualmente en el mundo 2024
 
Mapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptxMapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptx
 
Morfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCSMorfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCS
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
 
Análisis Datos imprecisos con lógica difusa.pdf
Análisis Datos imprecisos con lógica difusa.pdfAnálisis Datos imprecisos con lógica difusa.pdf
Análisis Datos imprecisos con lógica difusa.pdf
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
 
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
 
CORFEINE_4587888920140526_2aSE_P04_2.pdf
CORFEINE_4587888920140526_2aSE_P04_2.pdfCORFEINE_4587888920140526_2aSE_P04_2.pdf
CORFEINE_4587888920140526_2aSE_P04_2.pdf
 
ORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesietORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesiet
 
Portada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdf
Portada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdfPortada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdf
Portada De Revista De Ciencia Elegante Moderno Azul y Amarillo.pdf
 
Licencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chileLicencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chile
 
Desarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento InformaticaDesarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento Informatica
 
Ojiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datosOjiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datos
 
Diagnóstico Institucional en psicologia.docx
Diagnóstico  Institucional en psicologia.docxDiagnóstico  Institucional en psicologia.docx
Diagnóstico Institucional en psicologia.docx
 

Introducción a Big Data

  • 1. INTRODUCCIÓN AL CONCEPTO DE BIG DATA raineropenschool.com Rainer Open School – Big Data
  • 2. INTRODUCCIÓN Big Data es un término de actualidad, que parece dar respuesta a todos los problemas empresariales. Pero ¿qué es exactamente? ¿En qué se diferencia de otras técnicas? raineropenschool.com
  • 3. ALGUNOS CONCEPTOS ERRÓNEOS Big Data no es:  Cuando hay que analizar más de 1 TB (o 20).  Lo que sustituye a las BBDD relacionales.  Algo imprescindible en la Web 13.7.
  • 4. RESPONDAMOS A ESTOS MITOS…  Big Data no tiene que ver exactamente con el volumen de datos. No se puede poner la cifra arbitraria de 1TB o 20 TB como referencia. Más bien hablamos de problemas que van “demasiado deprisa”. Ahora lo veremos mejor…  Las BBDD relacionales no están muertas. De hecho, TODOS los sistemas de Big Data funcionan con ellas y hay problemas en los que no se pueden sustituir.  La Web 2.0 introdujo el contenido dinámico (PHP) y la 3.0 la participación del usuario (Redes sociales). A partir de ahí se ha perdido un poco el norte y esos números son más un reclamo comercial que un concepto.
  • 5. ENTONCES ¿QUÉ ES ESO DE BIG DATA? Velocidad Volumen Variedad Doug Laney definió en 2001 los problemas de Big Data como aquellos en los que se dan las características de velocidad, volumen y variedad en la generación de datos.
  • 6. VELOCIDAD La velocidad se refiere a aquellos escenarios, como la bolsa, en donde la producción de datos es muy rápida y continua. El mercado bursátil funciona a toda velocidad.
  • 7. VOLUMEN El volumen de los problemas en Big Data puede ser descomunal. Nunca será posible aprehender por completo la complejidad del análisis meteorológico, por ejemplo.
  • 8. VARIEDAD La variedad se refiere a que no sabemos qué formato van a tener los datos analizados. Hoy los móviles dan coordenadas GPS, fotos o sonido. ¿Y mañana?
  • 9. POR TANTO… Cuando un problema:  Genera información a una gran velocidad y sin interrupción.  Genera un gran volumen de datos, capaz de desbordar sistemas convencionales.  Genera datos en cambio constante, sin que sepamos su contenido o relación entre sí. …es candidato a un análisis de Big Data.
  • 10. NUESTRA DEFINICIÓN… Big Data es un término genérico para agrupar un conjunto de técnicas y recursos destinados a analizar información que no es viable estudiar por medios tradicionales, con el objetivo de extraer información de valor y conclusiones útiles.
  • 11. POR EJEMPLO… Indexar páginas web es un problema de Big Data: no paran de generarse, es una barbaridad de información y no sabemos qué vamos a encontrar en ellas.
  • 12. GENERACIÓN CRECIENTE DE INFORMACIÓN Esta situación es consecuencia de la creciente velocidad a la que se genera información, en especial desde la “inflexión digital” hacia 2002, el momento en que se producen más datos digitales que analógicos.
  • 13. DESESTRUCTURACIÓN DEL CONTENIDO Estructurado -> Tablas Semiestructurado -> XML Quasiestructurado -> Registros Desestructurado –> Imágenes Otra característica de esta tendencia es que la información cada vez es más desestructurada; se genera tan rápido que no se organiza muy bien. ¿Qué estamos buscando, por ejemplo, en el contenido de una red social?
  • 14. EVOLUCIÓN DE LOS SISTEMAS DE ANÁLISIS Ficheros tabulados Hojas de cálculo Bases de datos relacionales (OLAP) Centros de Proceso de Datos (DW-BI) Entornos analíticos (Sandbox) De esta forma, se produce una evolución lógica, apareciendo estrategias de análisis para los problemas que vamos generando como sociedad.
  • 15. BUSINESS INTELLIGENCE VS BIG DATA Los sistemas de BI se centran más en el análisis de periodos fijos, mientras que Big Data se preocupa de explorar relaciones: ¿Qué ha pasado? <- vs -> ¿Qué puede pasar?
  • 16. UNA NUEVA ECONOMÍA DE DATOS Dispositivos Recolectores Agregadores Usuarios Las relaciones entre usuarios, tecnología y proveedores han definido una “economía de datos”, donde la comprensión de lo que ocurre proporciona una ventaja competitiva.
  • 17. EL PAPEL DEL CIENTÍFICO DE DATOS En este contexto surge la necesidad de un perfil que ayude a todos los interlocutores: alguien que sepa de informática, de estadística y de negocios, sin llegar a ser un programador, un estadístico o un empresario: el científico de datos.
  • 18. HABILIDADES DEL CIENTÍFICO DE DATOS No hay una “carrera” para ser científico de datos, sino más bien un conjunto de actitudes y habilidades que favorecen su trabajo:  Competencias en matemáticas o estadística.  Competencia básica en programación.  Pensamiento crítico y escéptico en el análisis.  Curiosidad y creatividad.  Capacidad para comunicación y colaboración.
  • 19. CONCLUSIONES  El desarrollo de nuestra sociedad de la información ha generado un valor de negocio en la comprensión de los datos que genera.  Esta necesidad requiere nuevas técnicas de análisis de la información que hagan frente a la velocidad, volumen y variedad de datos que se producen.  El científico de datos es el profesional que ayuda a todos los demás a comprender y afrontar este tipo de problemas. raineropenschool.com
  • 20. LECTURAS RECOMENDADAS Data Science & Big Data Statistics EMC Education Services ISBN: 978-1118876138 http://amzn.to/1QTNWH7 Cap. 1, sobre el contenido de esta presentación raineropenschool.com
  • 21. SOBRE EL AUTOR Rafael Morales Consultor y formador en  Sistemas de información (IT).  Gestión de proyectos (PM).  Aseguramiento de la calidad (QA). En LinkedIn: http://bit.ly/20Qh0oZ Email: contacto@rafael-morales.com raineropenschool.com
  • 22. OTROS CONTENIDOS Puedes encontrar las notas de esta conferencia y otras obras del mismo autor en Amazon: http://amzn.to/1Rp8yM9 Puedes seguir las novedades y convocatorias de nuevos seminarios, cursillos y presentaciones en raineropenschool.com raineropenschool.com