El documento describe las aplicaciones, tecnologías y mejores prácticas de Big Data. Explica que Big Data involucra grandes volúmenes de datos estructurados y no estructurados de diversas fuentes que pueden analizarse para obtener información valiosa. Describe aplicaciones de Big Data en varias industrias y tecnologías clave como Hadoop, bases de datos no relacionales y columnares. También cubre mejores prácticas como partir de hipótesis, construir infraestructura flexible y permitir que empleados de distintas á
Big Data no es una moda ni algo que esté por venir. Gran parte de las organizaciones ya cuentan con bases de datos tan grandes que requieren usar herramientas especiales. Ésta presentación nos ayuda a dar el primer paso, a conocer que en realidad qué es y como funciona, así como a adentrarnos en este maravilloso mundo de los datos al por mayor.
Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
http://university.solidq.com
Introducción a Big Data. Gracias a la nueva tecnología Microsoft Hadoop, tanto on-premise como en la nube, y a sus capacidades de almacenamiento, procesamiento y escalabilidad, podemos analizar grandes volúmenes de datos del orden de Terabytes o Petabytes de una forma rápida y con buen rendimiento. Es ahora el momento de familiarizarnos con la nueva forma de trabajar en Hadoop a la hora de extraer esa información distribuida por nuestros nodos. De la misma forma que hacemos con SQL Server, en esta sesión aprenderemos a desplegar y almacenar esa información en nuestros nodos, a crear consultas para extraer las partes que nos sean más útiles.
Big Data no es una moda ni algo que esté por venir. Gran parte de las organizaciones ya cuentan con bases de datos tan grandes que requieren usar herramientas especiales. Ésta presentación nos ayuda a dar el primer paso, a conocer que en realidad qué es y como funciona, así como a adentrarnos en este maravilloso mundo de los datos al por mayor.
Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
http://university.solidq.com
Introducción a Big Data. Gracias a la nueva tecnología Microsoft Hadoop, tanto on-premise como en la nube, y a sus capacidades de almacenamiento, procesamiento y escalabilidad, podemos analizar grandes volúmenes de datos del orden de Terabytes o Petabytes de una forma rápida y con buen rendimiento. Es ahora el momento de familiarizarnos con la nueva forma de trabajar en Hadoop a la hora de extraer esa información distribuida por nuestros nodos. De la misma forma que hacemos con SQL Server, en esta sesión aprenderemos a desplegar y almacenar esa información en nuestros nodos, a crear consultas para extraer las partes que nos sean más útiles.
Presentación de Gobierno de Datos en DAMA MéxicoRamón Hernández
Presentación del área de conocimiento de Gobierno de Datos según la 1a edición del DMBoK, la versión más reciente disponible es 2da edición, para que lo consideres cuando descargues esta presentación.
Esta presentación se dió en el año 2016 en un meetup de DAMA Capítulo México por parte de Ramón Hernández - VP de Marketing.
¿que es gobierno de datos?, ¿que es gestión de datos?, ¿cuales son las 10 funciones del gobierno de datos?, diagrama de contexto del gobierno de datos, actividades del gobierno de datos
Presentación introductoria al Big Data, y su aplicación en los negocios, impartida en la jornada organizada por Ascentic y PCTCAN en Santander, 12/05/2016
Calidad de datos: La base del éxito para la modernización de sistemas de información
La ponencia tratará los aspectos más importantes a considerar para llevar a cabo una exitosa migración de datos de una organización en la modernización de los sistemas de información o la adquisición de nuevos sistemas o aplicaciones. Se cubren aspectos como la metodología, buenas prácticas y el proceso para la migración de bases de datos, haciendo énfasis en el análisis de la calidad de los datos.
Ponente; Magda Meléndez
Obtenga las instrucciones necesarias sobre arquitectura para crear sus aplicaciones de big data y aproveche al máximo la infraestructura de nube de AWS.
Presentación de Gobierno de Datos en DAMA MéxicoRamón Hernández
Presentación del área de conocimiento de Gobierno de Datos según la 1a edición del DMBoK, la versión más reciente disponible es 2da edición, para que lo consideres cuando descargues esta presentación.
Esta presentación se dió en el año 2016 en un meetup de DAMA Capítulo México por parte de Ramón Hernández - VP de Marketing.
¿que es gobierno de datos?, ¿que es gestión de datos?, ¿cuales son las 10 funciones del gobierno de datos?, diagrama de contexto del gobierno de datos, actividades del gobierno de datos
Presentación introductoria al Big Data, y su aplicación en los negocios, impartida en la jornada organizada por Ascentic y PCTCAN en Santander, 12/05/2016
Calidad de datos: La base del éxito para la modernización de sistemas de información
La ponencia tratará los aspectos más importantes a considerar para llevar a cabo una exitosa migración de datos de una organización en la modernización de los sistemas de información o la adquisición de nuevos sistemas o aplicaciones. Se cubren aspectos como la metodología, buenas prácticas y el proceso para la migración de bases de datos, haciendo énfasis en el análisis de la calidad de los datos.
Ponente; Magda Meléndez
Obtenga las instrucciones necesarias sobre arquitectura para crear sus aplicaciones de big data y aproveche al máximo la infraestructura de nube de AWS.
Introducción básica a Big Data e inventario de herramientas efectivas para Bi...Sebastián Ramírez Montaño
Presentación de una de las conferencias sobre Big Data dadas en SENASoft - Colombia, el evento sobre TIC más importante de Colombia organizado por el SENA sobre tecnologías de la información y la comunicación.
Por: Sebastián Ramírez
Twitter: @tiangolo
Sin el boom de las redes sociales, el Big Data no sería lo que es ahora. En la sesión se presentarán casos de uso y ejemplos de las posibilidades de la minería de datos sociales y geolocalizados en la generación de valor para diferentes sectores
Sobre el ponente
Oscar Marín Miró (outliers.es)
Ingeniero de Telecomunicaciones, trabaja e investiga desde el año 2001 en lo que ahora llamamos ‘Big Data’. Especializado en el análisis de texto, redes sociales, datos urbanos y visualización de datos. Fundador del colectivo Outliers, desde donde se fomenta la aplicación del valor de los datos a todos los campos (Ciencia, Periodismo, Urbanismo, Sociología, Marketing…).
Miembro del equipo de investigación transdisciplinar DatAnalysis15m, enfocado en el análisis entre la viralidad y el contenido emocional del mensaje. En la faceta docente, imparte cursos regularmente sobre análisis y visualización de datos, en diversas Universidades, Compañías e Instituciones (UOC, UAB, Telenoika Audiovisual Community, Convent de Sant Agustí, Telefónica Digital).
Además Óscar és profesor de nuestro Postgrado en Business Intelligence
Introducción al concepto Big Data en español, con ejemplos de aplicaciones y caso de estudio. El seminario tiene una duración aproximada de 3 horas a lo largo de las cuales se repasan los siguientes puntos:
Contexto
Definición
Utilidades (Casos de aplicación)
Arquitectura y software
-->Ejemplo de aplicación: Metamail
-->Cuadrante mágico de aplicaciones
Caso de estudio: Obama 2012
Análisis con Big Data
Cuándo y cómo empezar?
Gobierno de datos
Espero que os guste!
En esta presentación vemos aspectos de introducción a Big Data.
Saludos,
Ing. Eduardo Castro, PhD
Microsoft SQL Server MVP
http://tinyurl.com/comunidadwindows
Empieza a utilizar Big Data en tus análisis
Vivimos en un mundo “Big Data”. Este término está relacionado con la tecnología para manejar inmensas cantidades de datos, recogidas en diferentes formatos y a partir de una gran variedad de orígenes cada segundo. Estos datos hablan de nosotros, de nuestra vida diaria y son recogidos tanto de fuentes nuevas como tradicionales, constituyendo una gran oportunidad de mejorar el conocimiento de los clientes.
Uno de los principales factores de éxito en las empresas de hoy es convertir esos grandes volúmenes de datos, siempre cambiantes y de orígenes diversos, en información válida para la toma de decisiones.
En este curso de big data aprenderás, desde un punto de vista práctico y realista, a abordar y resolver problemáticas analíticas desde entornos big data, dando respuestas a través de soluciones tecnológicas tanto en tiempo real como en diferido. Recorreremos contigo el camino desde el área de análisis de cliente, CRM o B.I. tradicionales hacia los nuevos retos en proyectos Big Data.
¿Quieres convertirte en un experto en Big Data?
En esta presentación se introducen los conceptos de Big Data, así como las soliciones de Horton Works sobre Windows y el Microsoft Analytics Platform System (PDW Paralled Data Warehouse)
Saludos,
Eduardo Castro, PhD
SQL Server MVP
Comunidad Windows Costa Rica
En es presentación vemos las herramientas con las cuales cuenta un científico de datos con tecnología Microsoft y también con tecnología OpenSource es se puede integrar con Plataformas Microsoft en la nube con Azure o con Servidores OnPremises.
Saludos,
Ing. Eduardo Castro, PhD
Microsoft SQL Server MVP
Costa Rica
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
Primera parte del Tema, impartido dentro de la asignatura "Sistemas de Información Avanzados (Comercio electrónico)" dentro del
Máster de estudios avanzados en dirección de empresas de la Universidad de Sevilla
Big Data es la profesión de moda y empresas de todos los sectores buscan especialistas. La consultora McKinsey prevé una brecha en torno al 50% entre la demanda y la oferta de puestos de trabajo relacionados con Big Data para 2017-2018
Pero ¿qué hay detrás de este nuevo paradigma? La transformación digital en las empresas implica una inflación de datos que las organizaciones no saben cómo usar y gestionar. Es un campo muy amplio y se necesitan perfiles muy variados desconocidos hasta ahora en nuestra sociedad.
Ante esta demanda de profesionales especializados en las tecnologías de big data y business intelligence, la gran baza para muchos ingenieros que quieran lograr un trabajo interesante y bien remunerado es formarse en estas especialidades
Dentro del rompecabezas de Big Data podemos diferenciar entre las habilidades técnicas en torno a Hadoop, MapReduce y frameworks comerciales y las competencias relacionadas con la Ciencia de los Datos (Data Science), que son las más demandadas y difíciles de encontrar. Por tanto, estamos ante un periodo para decidir sobre qué tipo de cursos deberían ser diseñados con el objetivo de producir talento cualificado para alimentar la industria de Big Data. En este sentido CICE ofrece una carrera profesional con varias especializaciones y masteres que abarca una alta variedad de conceptos y herramientas tecnologícas que se ajustan al mercado laboral.
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...CICE
Big Data es la profesión de moda y empresas de todos los sectores buscan especialistas. La consultora McKinsey prevé una brecha en torno al 50% entre la demanda y la oferta de puestos de trabajo relacionados con Big Data para 2017-2018
Pero ¿qué hay detrás de este nuevo paradigma? La transformación digital en las empresas implica una inflación de datos que las organizaciones no saben cómo usar y gestionar. Es un campo muy amplio y se necesitan perfiles muy variados desconocidos hasta ahora en nuestra sociedad.
Ante esta demanda de profesionales especializados en las tecnologías de big data y business intelligence, la gran baza para muchos ingenieros que quieran lograr un trabajo interesante y bien remunerado es formarse en estas especialidades
Dentro del rompecabezas de Big Data podemos diferenciar entre las habilidades técnicas en torno a Hadoop, MapReduce y frameworks comerciales y las competencias relacionadas con la Ciencia de los Datos (Data Science), que son las más demandadas y difíciles de encontrar. Por tanto, estamos ante un periodo para decidir sobre qué tipo de cursos deberían ser diseñados con el objetivo de producir talento cualificado para alimentar la industria de Big Data. En este sentido CICE ofrece una carrera profesional con varias especializaciones y masteres que abarca una alta variedad de conceptos y herramientas tecnológicas que se ajustan al mercado laboral.
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
En esta presentación vemos los conceptos de Big Data y cómo podemos integrar las herramientas de BI de SQL Server 2012 con Hadoop y con HDInsigth Server y con PowerPivot.
Saludos
Ing. Eduardo Castro
Microsoft SQL Server MVP
Hablando de BigData y SmallData a gerentes de turismo corporativo y agencias de viaje, esta es la pesnetación realizada en el mi charla de “Big Data para la toma de decisiones en viajes corporativos y reuniones de negocio” en el evento ViajesCorp que se hizo el pasado 11 de abril del 2016 en Cartagena CO
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleoCICE
BIG DATA. Nuevos perfiles y oportunidades de empleo.
Conviértete en un experto en la gestión de grandes volúmenes de datos y en la inteligencia de negocio.
www.cice.es
¿Qué pasa con el Big Data? Los datos plantean tantas preguntas como solucionan, para conocer más sobre ellos. Veremos los pasos que hemos de seguir para convertirnos en una empresa Data Smart y a dar contestación definitiva a preguntas como:
¿Son los datos inteligentes, o las empresas que trabajan con ellos?
Las dudas del Big Data, América Economía Internacional febrero 2014David Cornejo
Mientras América Latina implementa el Big Data en una etapa exploratoria, en el mundo se espera su consolidación con el incremento de la oferta de las compañías tecnológicas.
Analizamos el mundo a través de un rompecabezas, conformado por piezas de conocimientos que se agrupan en categorizaciones, grupos, familias y etiquetas. Así es como la ciencia ha podido “saber más“ en detalle sobre los diferentes aspectos de la realidad. Pero, ¿qué pasaría si quisiéramos tener un entendimiento completo de una situación “x”? Deberíamos comenzar a descubrir el cuadro completo “big data, big picture” que se esconde detrás de toda pieza analizada.
PREVENCION DELITOS RELACIONADOS COM INT.pptxjohnsegura13
Concientizar y sensibilizar a los funcionarios, sobre la importancia de promover la seguridad en sus operaciones de comercio internacional, mediante la unificación de criterios relacionados con la trazabilidad de sus operaciones.
Anna Lucia Alfaro Dardón, Harvard MPA/ID. The international successful Case Study of Banco de Desarrollo Rural S.A. in Guatemala - a mixed capital bank with a multicultural and multisectoral governance structure, and one of the largest and most profitable banks in the Central American region.
INCAE Business Review, 2010.
Anna Lucía Alfaro Dardón
Dr. Ivan Alfaro
Dr. Luis Noel Alfaro Gramajo
2. A. Definición de Big Data
B. Aplicaciones
C. Tecnologías
D. Mejores prácticas
E. Reflexión final
3. • Hacia 2020, 5,200 Gigabytes de
datos serán generados para cada ser
humano del planeta.
• Un motor de jet en un vuelo de
Londres a Nueva York genera 10
Terabytes de datos cada 30
minutos.
4. • El 90% de los datos del mundo
actuales fueron generados en los
últimos 2 años.
• Según MIT, las organizaciones
grandes tienen en promedio 5.000
fuentes de datos, pero 1-2% terminan
en su Data Warehouse.
5. • El crecimiento exponencial se torna
cada vez mas difícil de administrar.
• Los datos contienen información
poco obvia que las empresas
podrían descubrir para mejorar sus
resultados.
• Las medidas de datos son relativas.
Cada industria enfrenta desafíos de
distinto tamaño.
6. A. Definición de
Big Data!
B. Aplicaciones
C. Tecnologías
D. Mejores prácticas
E. Reflexión final
7. ¿Qué es Big Data?
¿Análisis Predictivo
¿Business Intelligence?
¿Data Discovery?
¿Visualizaciones e infografías?
10. ¿Cual es nuestra frontera?
MB GB TB PB
tabla
base
de
datos
fotos
w
eb
audio
social video
m
obile
tiem
po
real
casitiem
po
real
periodico
batch
Velocidad
Volumen
Variedad
20. Big Data es la frontera de una
firma para almacenar, procesar y
acceder a todos los datos que
necesita para operar eficazmente,
tomar decisiones, reducir riesgos
y servir a los clientes.
21. A. Definición de Big Data
B. Aplicaciones!
C. Tecnologías
D. Mejores Prácticas
E. Reflexión final
23. Banca
Bienes de
Consumo
IT
Telcos y
comunicaciones
Servicio al
consumidor
Análisis
sentimental
Seguridad
informática
Churn
Riesgo
crediticio
Recomendación
de productos
Escabilidad de
Infraestructura
Gestión de
promociones
Detección de
Transacciones
fraudulentas
Predicción de
demanda en
tiempo real
Optimización de
protocolos
Alocación
inteligente de
capacidad
Upsell y cross-sell
de productos
Vista 360 del
consumidor
Predicción de
fallos
M2M
24. Gobierno y
ciudad
Biología y
Medicina
Energía y
utilidades
Internet
Predicción y
prevención del
delito
Genómica
Medidores
inteligentes
Asistente
virtual
Ciudad
inteligente
Registro de
enfermedades
Redes
mixtas
Contenido
personalizado
Digitalización de
documentos
Diagnóstico
médico en la
nube
Predicción de la
demanda
Aprendizaje
profundo
Open
Government
“Yo” cuantificado
Gestión de
energía desde el
consumidor
Internet of
Things
25. A. Definición de Big Data
B. Aplicaciones
C. Tecnologías!
D. Mejores prácticas
E. Reflexión final
32. Hadoop
• Almacenaje y procesamiento
barato y a escala.
• Es la tecnología dominante
para procesamiento distribuido
a gran escala. Crece 60%
anual a tasa compuesta.
• Sin embargo su nivel de
utilización se encuentra por
debajo del 6% en empresas.
33.
34. Hadoop instala herramientas en cada nodo:
• Librerías y scripts en Java
• Un filesystem de alta
disponibilidad -> HDFS
• Una plataforma de gestión
de recursos de cómputo -> YARN
• Un motor de
extracción -> Map-Reduce
38. Soy maestro primario… tengo una caja de
lápices de color y cajas más pequeñas
->
Caja de
lápices
Un alumno:
toma lápiz, le
pone etiqueta, y
lo vuelca en su
caja (Ejemplo:
Rojo, 1)
->
Otro alumno:
toma caja y
suma los 1s
-> Lápices
por color
input
Map(..)
Reduce(..)
output
39. Map Reduce
Storm!
Drill!
HANA
Spark
Alto volumen, alta latencia Alto volumen, baja latencia
Procesamiento en batch Acceso a datos en memoria
Se define proceduralmente
Son queries a bases de datos
columnares como HBase,
Cassandra o MongoDB
Es adecuado para el
procesamiento total de datos
Es adecuado para producir
reportes ah-hoc y procesamiento
en tiempo real
40. • Persistencia
Cassandra, HBase
• Manipulación de datos
Pig, Pandas
• Búsqueda de texto
Solr, Lucene
Tecnologías complementarias
que hay que saber obligado
41. Tecnologías complementarias
que hay que saber obligado
• Machine Learning
Mahout, R, SAS, MADLib
• Real-time processing
Drill, Storm, Impala
• In-memory
SAP HANA, Apache Spark
42. fácil ranking de ventas por
región
difícil clientes que estén por
dejar el servicio
ultra difícil clientes que
muestran insatisfacción sobre
problemas aún no identificados
Consulta SQL
Clasificador
Programación
neuro linguistica
44. fácil ranking de ventas por
región
difícil clientes que estén por
dejar el servicio
ultra difícil clientes que
muestran insatisfacción sobre
problemas aún no identificados
Microstrategy
Modelo en R
Luminoso
45. Las bases de datos columnares
tienen grandes beneficios
• Aprovechamiento de procesamiento
masivo en paralelo (MPP).
• Posibilitan el almacenamiento en
memoria RAM.
• Fáciles de administrar y de leer
(viejo y conocido SQL)
• Soportan un volumen del orden de
los TBs sin problemas
46. Analytics in-database y funciones
definidas por el usuario
• Ganancia cualitativa en performance.
• Compatibles con lenguajes de markup
para aplicaciones de Data Mining
(PMML)
• Contendientes: Aster Data, Vertica,
Netezza, Greenplum (EMC), ParAccel,
SAP Sybase
48. A. Definición de Big Data
B. Aplicaciones
C. Tecnologías
D. Mejores prácticas!
E. Reflexión final
49.
50.
51. Algunas Mejores
prácticas
1. Partir siempre de una hipótesis
antes de actuar sobre los datos
2. No construir Legacy
3. Definir una “autopista de la
información”
4. Seguir pensando en dimensiones e
indicadores
52. Algunas Mejores
prácticas
5. Construir una infraestructura
flexible y escalable (la nube)
6. Implementar flujos conectados a
las etapas de caché anteriores
7. Los datos mas próximos van a ser
sucios, pero debe agregarse valor
en la etapas subsiguientes
53. A. Definición de Big Data
B. Aplicaciones
C. Tecnologías
D. Kimball
E. Reflexión
final
54.
55. –Brett Sheppard, director de Big Data, Splunk
“2014 will be the year of the big data non-
specialist. Until recently, many big data
projects—including those built with Hadoop—
have required the skills of highly trained data
scientists. They’ve also tended to rely on fixed
schemas and scheduled reporting that limit
the kinds of questions the system can answer.
Starting in 2014, line-of-business
employees will be able to ask and
answer their own questions using
raw, unstructured big data from
disparate sources. They won’t need to
rely on specialists to unlock the value of big
data. Inevitably, they’ll start using data to help
make decisions they previously might have
made on gut-feel alone. Decision-making will
also become a more creative process, as
employees of all kinds start asking questions
of their data to test hypotheses and explore
new approaches to old problems.”
Fuente: http://inside-bigdata.com/2013/12/09/big-data-predictions-2014/
56. Fuente: Read Write Web, 26 de Diciembre 2013, http://readwrite.com/2013/12/26/big-data-myths-reality
58. Resumiendo
1. Las empresas pueden
capturar más datos que
nunca.
2. La explosión del social
media y del Internet of
Things son los principales
disparadores.
59. Resumiendo
3. Identificar lo importante
entre tanto ruido depende
del las capacidades
intuitivas y de la apertura del
tomador de decisiones.
4. Hadoop es una herramienta
extremadamente flexible
que pocos ejecutivos
entienden.
60. Resumiendo
5. El cliente va cambiando. Las
gerencias de negocio son
las nuevas compradoras de
software.
6. La apuesta es a largo plazo,
pero con foco en lo diario.
Las empresas necesitan de
la prueba y el error.
61. Big Data es pensar en nuevos
modelos de negocio basados
en las necesidades del futuro