Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
http://university.solidq.com
Introducción a Big Data. Gracias a la nueva tecnología Microsoft Hadoop, tanto on-premise como en la nube, y a sus capacidades de almacenamiento, procesamiento y escalabilidad, podemos analizar grandes volúmenes de datos del orden de Terabytes o Petabytes de una forma rápida y con buen rendimiento. Es ahora el momento de familiarizarnos con la nueva forma de trabajar en Hadoop a la hora de extraer esa información distribuida por nuestros nodos. De la misma forma que hacemos con SQL Server, en esta sesión aprenderemos a desplegar y almacenar esa información en nuestros nodos, a crear consultas para extraer las partes que nos sean más útiles.
Esta es una actualización de el proyecto de Big Data que ha llegado a un primer resultado, El mapa de emotividad basada en Twitter, por cada entidad de México. El siguiente paso será hacer esto en tiempo real.
En esta presentación vemos aspectos de introducción a Big Data.
Saludos,
Ing. Eduardo Castro, PhD
Microsoft SQL Server MVP
http://tinyurl.com/comunidadwindows
Big Data para analizar las redes socialesDatKnoSys
El principal objetivo es mostrar el análisis de cantidades elevadas de información que nos proporcionan las redes sociales gracias a sistemas Big Data. Haciendo frente a la complejidad de la variedad de orígenes, el gran volumen de las mismas y la velocidad de procesamiento que se necesita.
Se incidirá principalmente en los siguientes puntos clave: la recogida de datos, su procesamiento (con ejemplo de text mining para conseguir descifrar el sentimiento) y en la visualización final.
¿Sabías que cada minuto se mandan 13 millones de mensajes se suben 48 horas de vídeo a YouTube y se crean 571 nuevas páginas web? Internet es un generador de grandes cantidades de información y este contenido lo generan los usuarios, nuestros clientes, por eso hay que saber adaptarse a este nuevo socio económico y aprovechar el valor de la información que nos ofrece. Es importante implantar sistemas de Big Data que nos ayuden a almacenar, buscar, compartir, analizar y visualizar estas grandes cantidades de datos y con ello conseguir valor. No hay que olvidar que tan importante como es instalar un sistema big data, es definirlo conforme a nuestras necesidades.
Presentación introductoria al Big Data, y su aplicación en los negocios, impartida en la jornada organizada por Ascentic y PCTCAN en Santander, 12/05/2016
Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
http://university.solidq.com
Introducción a Big Data. Gracias a la nueva tecnología Microsoft Hadoop, tanto on-premise como en la nube, y a sus capacidades de almacenamiento, procesamiento y escalabilidad, podemos analizar grandes volúmenes de datos del orden de Terabytes o Petabytes de una forma rápida y con buen rendimiento. Es ahora el momento de familiarizarnos con la nueva forma de trabajar en Hadoop a la hora de extraer esa información distribuida por nuestros nodos. De la misma forma que hacemos con SQL Server, en esta sesión aprenderemos a desplegar y almacenar esa información en nuestros nodos, a crear consultas para extraer las partes que nos sean más útiles.
Esta es una actualización de el proyecto de Big Data que ha llegado a un primer resultado, El mapa de emotividad basada en Twitter, por cada entidad de México. El siguiente paso será hacer esto en tiempo real.
En esta presentación vemos aspectos de introducción a Big Data.
Saludos,
Ing. Eduardo Castro, PhD
Microsoft SQL Server MVP
http://tinyurl.com/comunidadwindows
Big Data para analizar las redes socialesDatKnoSys
El principal objetivo es mostrar el análisis de cantidades elevadas de información que nos proporcionan las redes sociales gracias a sistemas Big Data. Haciendo frente a la complejidad de la variedad de orígenes, el gran volumen de las mismas y la velocidad de procesamiento que se necesita.
Se incidirá principalmente en los siguientes puntos clave: la recogida de datos, su procesamiento (con ejemplo de text mining para conseguir descifrar el sentimiento) y en la visualización final.
¿Sabías que cada minuto se mandan 13 millones de mensajes se suben 48 horas de vídeo a YouTube y se crean 571 nuevas páginas web? Internet es un generador de grandes cantidades de información y este contenido lo generan los usuarios, nuestros clientes, por eso hay que saber adaptarse a este nuevo socio económico y aprovechar el valor de la información que nos ofrece. Es importante implantar sistemas de Big Data que nos ayuden a almacenar, buscar, compartir, analizar y visualizar estas grandes cantidades de datos y con ello conseguir valor. No hay que olvidar que tan importante como es instalar un sistema big data, es definirlo conforme a nuestras necesidades.
Presentación introductoria al Big Data, y su aplicación en los negocios, impartida en la jornada organizada por Ascentic y PCTCAN en Santander, 12/05/2016
En el último año, Big Data se ha transformado en uno de los pilares más importantes de la estrategia de negocio de los Bancos de Chile y el mundo. En un entorno cada vez más competitivo y con altos niveles de regulación, las organizaciones deben comenzar a tomar decisiones en función de los datos y no de la intuición. Para tomar dichas decisiones, se vuelve necesario procesar grandes volúmenes de información de manera eficiente, incorporando nuevas fuentes de datos y automatizando las decisiones a través de algoritmos analíticos avanzados. Durante esta presentación, analizaremos qué deben hacer los Bancos para transformar su arquitectura de datos tradicional, en una arquitectura de datos moderna con soporte para big data y así estar preparados para abordar los nuevos desafíos que plantea la transformación digital del negocio financiero.
Big Data no es una moda ni algo que esté por venir. Gran parte de las organizaciones ya cuentan con bases de datos tan grandes que requieren usar herramientas especiales. Ésta presentación nos ayuda a dar el primer paso, a conocer que en realidad qué es y como funciona, así como a adentrarnos en este maravilloso mundo de los datos al por mayor.
Jornada en enpresa digitala: Mitos y Realidades del Big DataUrko Zurutuza
Esta presentación es la que utilicé como ponente de Mondragon Unibertsitatea para introducir al público asistente a la jornada de "Mitos y Realidades del Big Data" de Enpresa Digitala en su nodo de Goiru (http://www.euskadinnova.net/es/enpresa-digitala/agenda/mitos-realidades-data/8956.aspx?utm_source=rss_feed&utm_medium=rss&utm_campaign=accesos_rss). Se trata de una presentación donde se explican qué es y qué no es Big Data, enfocando sobre todo en la parte de almacenamiento, infraestructura, y análisis de los datos.
El big data le permite recopilar datos de redes sociales, visitas a páginas web, registros de llamadas y otras fuentes para mejorar la experiencia de interacción, así como maximizar el valor ofrecido.
Conociendo los servicios adicionales en big dataSpanishPASSVC
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación.
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningDenodo
Watch full webinar here: https://bit.ly/3CIN2NT
Los proyectos de Big Data y Machine Learning en muchos casos no logran los beneficios esperados y los lagos de datos se convierten en nuevos silos de datos que aportan poco valor a negocio. Los principales desafíos que encuentran las empresas para un aprovechamiento de las iniciativas de Big Data y Machine Learning son los siguientes:
- Identificación de fuentes de datos relevantes para el análisis del caso de negocio
- Dificultad para la integración de las fuentes de datos, se invierte mucho tiempo en tareas rutinarias de limpieza y preparación
- Problemas de colaboración en el equipo de trabajo: falta de visibilidad de las transformaciones realizadas, dificultad para la compartición de conocimiento y código
- Dificultad para soportar distintos perfiles con niveles de conocimiento dispares (e.g. analistas de negocio vs científicos de datos)
- Compartir resultados con los usuarios de negocio, evitar un nuevo silo de datos en la organización
- Dificultad a la hora de operacionalizar los algoritmos, surtir de datos a los algoritmos para extraer la información
- Las arquitecturas de Data Fabric vienen a facilitar el ciclo de vida de las iniciativas de Big Data y Machine Learning:
- Exploración e identificación de datos relevantes para el análisis mediante el Catálogo de Datos
- Preparación de los datos para alimentar los algoritmos de ML (con total trazabilidad de las combinaciones y transformaciones realizadas)
- Parametrización del algoritmo, tuning y adiestramiento mediante data science notebooks conectados a la capa de virtualización
- Operacionalización del algoritmo como un servicio de datos para usuarios de negocio
- Ofrecen una capa de gobierno y seguridad sobre las fuentes de datos
Los ponentes debatirán las distintas alternativas y cómo las arquitecturas de Data Fabric se han convertido en piezas clave para soportar iniciativas de Big Data y Machine Learning.
Sin el boom de las redes sociales, el Big Data no sería lo que es ahora. En la sesión se presentarán casos de uso y ejemplos de las posibilidades de la minería de datos sociales y geolocalizados en la generación de valor para diferentes sectores
Sobre el ponente
Oscar Marín Miró (outliers.es)
Ingeniero de Telecomunicaciones, trabaja e investiga desde el año 2001 en lo que ahora llamamos ‘Big Data’. Especializado en el análisis de texto, redes sociales, datos urbanos y visualización de datos. Fundador del colectivo Outliers, desde donde se fomenta la aplicación del valor de los datos a todos los campos (Ciencia, Periodismo, Urbanismo, Sociología, Marketing…).
Miembro del equipo de investigación transdisciplinar DatAnalysis15m, enfocado en el análisis entre la viralidad y el contenido emocional del mensaje. En la faceta docente, imparte cursos regularmente sobre análisis y visualización de datos, en diversas Universidades, Compañías e Instituciones (UOC, UAB, Telenoika Audiovisual Community, Convent de Sant Agustí, Telefónica Digital).
Además Óscar és profesor de nuestro Postgrado en Business Intelligence
Big Data Analytics: Automatización de Modelos PredictivosDMC Perú
Big Data Analytics requiere de forma ineludible la automatización de las distintas etapas involucradas en el desarrollo y mantenimiento de modelos. Se analizan las características de la utomatización en tres áreas del Analytics: Forecasting, Minería de Datos y Optimización, sus potencialidades y limitaciones. Se extraen también algunas conclusiones sobre cómo mejorar la práctica actual del analista.
En el último año, Big Data se ha transformado en uno de los pilares más importantes de la estrategia de negocio de los Bancos de Chile y el mundo. En un entorno cada vez más competitivo y con altos niveles de regulación, las organizaciones deben comenzar a tomar decisiones en función de los datos y no de la intuición. Para tomar dichas decisiones, se vuelve necesario procesar grandes volúmenes de información de manera eficiente, incorporando nuevas fuentes de datos y automatizando las decisiones a través de algoritmos analíticos avanzados. Durante esta presentación, analizaremos qué deben hacer los Bancos para transformar su arquitectura de datos tradicional, en una arquitectura de datos moderna con soporte para big data y así estar preparados para abordar los nuevos desafíos que plantea la transformación digital del negocio financiero.
Big Data no es una moda ni algo que esté por venir. Gran parte de las organizaciones ya cuentan con bases de datos tan grandes que requieren usar herramientas especiales. Ésta presentación nos ayuda a dar el primer paso, a conocer que en realidad qué es y como funciona, así como a adentrarnos en este maravilloso mundo de los datos al por mayor.
Jornada en enpresa digitala: Mitos y Realidades del Big DataUrko Zurutuza
Esta presentación es la que utilicé como ponente de Mondragon Unibertsitatea para introducir al público asistente a la jornada de "Mitos y Realidades del Big Data" de Enpresa Digitala en su nodo de Goiru (http://www.euskadinnova.net/es/enpresa-digitala/agenda/mitos-realidades-data/8956.aspx?utm_source=rss_feed&utm_medium=rss&utm_campaign=accesos_rss). Se trata de una presentación donde se explican qué es y qué no es Big Data, enfocando sobre todo en la parte de almacenamiento, infraestructura, y análisis de los datos.
El big data le permite recopilar datos de redes sociales, visitas a páginas web, registros de llamadas y otras fuentes para mejorar la experiencia de interacción, así como maximizar el valor ofrecido.
Conociendo los servicios adicionales en big dataSpanishPASSVC
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación.
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningDenodo
Watch full webinar here: https://bit.ly/3CIN2NT
Los proyectos de Big Data y Machine Learning en muchos casos no logran los beneficios esperados y los lagos de datos se convierten en nuevos silos de datos que aportan poco valor a negocio. Los principales desafíos que encuentran las empresas para un aprovechamiento de las iniciativas de Big Data y Machine Learning son los siguientes:
- Identificación de fuentes de datos relevantes para el análisis del caso de negocio
- Dificultad para la integración de las fuentes de datos, se invierte mucho tiempo en tareas rutinarias de limpieza y preparación
- Problemas de colaboración en el equipo de trabajo: falta de visibilidad de las transformaciones realizadas, dificultad para la compartición de conocimiento y código
- Dificultad para soportar distintos perfiles con niveles de conocimiento dispares (e.g. analistas de negocio vs científicos de datos)
- Compartir resultados con los usuarios de negocio, evitar un nuevo silo de datos en la organización
- Dificultad a la hora de operacionalizar los algoritmos, surtir de datos a los algoritmos para extraer la información
- Las arquitecturas de Data Fabric vienen a facilitar el ciclo de vida de las iniciativas de Big Data y Machine Learning:
- Exploración e identificación de datos relevantes para el análisis mediante el Catálogo de Datos
- Preparación de los datos para alimentar los algoritmos de ML (con total trazabilidad de las combinaciones y transformaciones realizadas)
- Parametrización del algoritmo, tuning y adiestramiento mediante data science notebooks conectados a la capa de virtualización
- Operacionalización del algoritmo como un servicio de datos para usuarios de negocio
- Ofrecen una capa de gobierno y seguridad sobre las fuentes de datos
Los ponentes debatirán las distintas alternativas y cómo las arquitecturas de Data Fabric se han convertido en piezas clave para soportar iniciativas de Big Data y Machine Learning.
Sin el boom de las redes sociales, el Big Data no sería lo que es ahora. En la sesión se presentarán casos de uso y ejemplos de las posibilidades de la minería de datos sociales y geolocalizados en la generación de valor para diferentes sectores
Sobre el ponente
Oscar Marín Miró (outliers.es)
Ingeniero de Telecomunicaciones, trabaja e investiga desde el año 2001 en lo que ahora llamamos ‘Big Data’. Especializado en el análisis de texto, redes sociales, datos urbanos y visualización de datos. Fundador del colectivo Outliers, desde donde se fomenta la aplicación del valor de los datos a todos los campos (Ciencia, Periodismo, Urbanismo, Sociología, Marketing…).
Miembro del equipo de investigación transdisciplinar DatAnalysis15m, enfocado en el análisis entre la viralidad y el contenido emocional del mensaje. En la faceta docente, imparte cursos regularmente sobre análisis y visualización de datos, en diversas Universidades, Compañías e Instituciones (UOC, UAB, Telenoika Audiovisual Community, Convent de Sant Agustí, Telefónica Digital).
Además Óscar és profesor de nuestro Postgrado en Business Intelligence
Big Data Analytics: Automatización de Modelos PredictivosDMC Perú
Big Data Analytics requiere de forma ineludible la automatización de las distintas etapas involucradas en el desarrollo y mantenimiento de modelos. Se analizan las características de la utomatización en tres áreas del Analytics: Forecasting, Minería de Datos y Optimización, sus potencialidades y limitaciones. Se extraen también algunas conclusiones sobre cómo mejorar la práctica actual del analista.
Big Data - Desarrollando soluciones efectivasJoseph Lopez
Como continuación a la presentación titulada "Introducción al mundo de las Bodegas de datos", esta presentación le explicará qué es Big Data y sus beneficios, incluyendo casos de uso. Así mismo, discutiremos cómo Hadoop, la nube y procesamiento masivamente paralelo (MPP) está cambiando la forma en los almacenes de datos se están construyendo. Hablaremos de arquitecturas híbridas que combinan datos in situ con datos en la nube, así como datos relacionales y no relacionales de datos (no estructurados). Veremos también los beneficios del MPP en SMP y cómo integrar datos desde dispositivos en la Internet (IoT). Aprenderemos también lo que debería verse como un almacén de datos moderno y cómo cuadra su papel de un mar de datos y Hadoop. Al finalizar esta exposición, tendremos una orientación sobre la mejor solución para el almacén de datos en el futuro.
Tercera Jornada de BI y analítica aplicada a tu negocio.pptxIT-NOVA
La entrega, visualización y gestión de datos para la toma de decisiones, sigue siendo una de las prioridades y tendencias de los CIO para el 2023.
Por esto, queremos que conozcas y logres comparar algunas de las plataformas de #bi y #analítica mejor valoradas en el cuadrante de Gartner: entre las cuales se encuentran #Jaspersoft, #Spotfire, #DOMO #Powerbi #sapanalyticscloud. Que te pueden ayudar a resolver tus retos de negocio.
Visita nuestra página it-nova.co y conoce más al respecto.
Palabras clave: analitica, analytics, business intelligence, data, domo, jaspersoft, microsoft, powerbi, sap, spotfire software, tibco jaspersfot, tibco spotfire.
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
En esta presentación vemos los conceptos de Big Data y cómo podemos integrar las herramientas de BI de SQL Server 2012 con Hadoop y con HDInsigth Server y con PowerPivot.
Saludos
Ing. Eduardo Castro
Microsoft SQL Server MVP
Big Data para la Gestión Eficiente de la Información (Presentación webinar)Schneider Electric
Según un estudio reciente, la gran mayoría de las empresas españolas ya han analizado o están analizando cómo el Big Data puede beneficiar a sus negocios. ¿Y usted?
Durante esta presentación, Antonio Morán — Consultor experto en Big Data — introduce ampliamente el concepto de Big Data explicando los casos en los que es necesario su uso, así como los resultados y beneficios que reporta esta tecnología.
Descargue la presentación para descubrir:
- En qué escenarios se aplican soluciones de Big Data
- Cómo enriquece Big Data los actuales procesos de análisis de negocio
- Cómo rentabilizar toda la información de la que se dispone actualmente
uerona es un almacén de datos virtual de autoservicio que permite una transición instantánea a un motor de SQL alojado en nube como SQL Server Data Warehouse.
¿Cuál es el futuro de la estrategia de datos?Denodo
Watch full webinar here: https://bit.ly/2JANh47
En la era del Big Data, la Inteligencia Artificial y el cloud computing, el volumen y la diversidad de datos no para de crecer. El desafío es crear los procesos, estándares y protocolos necesarios que pongan la información al servicio del negocio.
En este webinar hablaremos de las cuatro tendencias tecnológicas que guían las estrategias de datos de las compañías de todo el mundo. No te lo pierdas si quieres estar al día sobre cómo elevar el dato a la categoría de activo estratégico para ser (de verdad) data-driven:
- ¿Cuál es la evolución de las arquitecturas de provisión y gestión del dato en las grandes organizaciones? ¿Cómo ayuda el concepto de 'data fabric'?
- ¿Cómo gestionar la integración de datos distribuidos en múltiples localizaciones derivados de los cambios forzados por la migración a la nube?
- ¿Cómo las compañías pueden monetizar la infraestructura de data as service construida durante los últimos años?
- ¿Qué papel pueden jugar las técnicas de voice computing en el futuro de la analítica de datos?
Similar a Expert Day 2013 - Trabaja al tope con tus datos BIG DATA (20)
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataJohn Bulla
En esta sesión veremos una introducción al nuevo lenguaje de U-SQL, que une las ventajas de SQL con el poder expresivo de su propio código donde millones de desarrolladores SQL y .NET ahora pueden procesar y analizar todos sus datos con los conocimientos que ya tienen. El apoyo del lenguaje U-SQL en Azure Data Lake Tools para Visual Studio incluye ayuda técnica para la creación, depuración y rendimiento avanzado de funciones de análisis para aumentar la productividad al optimizar los trabajos que se ejecutan a través de miles de nodos.
La Base de Datos de SQL de Microsoft Azure es la mejor base de datos relacional como un servicio en la nube, que brinda escalabilidad, performance predecible, continuidad del negocio, protección de datos y administración de casi cero a desarrolladores y arquitectos de soluciones. En esta sesión veremos un overview de los servicios actuales que soporta la plataforma de datos de Microsoft Azure.
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL ServerJohn Bulla
El método de Microsoft para administrar el ciclo de vida de las aplicaciones (Application Lifecycle Management, ALM) proporciona un entorno flexible y ágil que se adapta a las necesidades del equipo, elimina barreras entre roles y optimiza los procesos, de manera que puede centrarse en ofrecer software de gran calidad de un modo más rápido y eficiente. En esta sesión nos concentraremos en los proyectos de base de datos que toman una gran importancia en un mundo en el que el desarrollo de software es cada vez más importante para el éxito de un negocio.
Utilizando el plan cache para optimizar procesos deJohn Bulla
Presentación donde se emplean todas las bondades del Plan Cache que nos brinda SQL Server para fortalecer las ejecuciones de las consultas en nuestros escenarios de datos.
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...John Bulla
24 Horas en Español 2012. En esta sesión veremos las capacidades de ADO.Net Entity Framework con su integración con SQL Server 2012 que incluye soporte para más objetos y SQL Server Data Tools que ofrece una experiencia de desarrollo moderna para crear aplicaciones de bases de datos para entornos on-premise y en la nube y como los desarrolladores pueden ser más productivos.
Integración de datos de multiples origenes con data explorerJohn Bulla
¿Alguna vez has tenido problemas para encontrar los datos que necesitaba? O la combinación de datos procedentes de fuentes diferentes e incompatibles? ¿Qué te parece compartir los resultados con los demás de un modo Web-amigable? Si es así, Data Explorer" proporciona una revolucionaria forma de trabajar con tus datos!
Es un diagrama para La asistencia técnica o apoyo técnico es brindada por las compañías para que sus clientes puedan hacer uso de sus productos o servicios de la manera en que fueron puestos a la venta.
3Redu: Responsabilidad, Resiliencia y Respetocdraco
¡Hola! Somos 3Redu, conformados por Juan Camilo y Cristian. Entendemos las dificultades que enfrentan muchos estudiantes al tratar de comprender conceptos matemáticos. Nuestro objetivo es brindar una solución inclusiva y accesible para todos.
Inteligencia Artificial y Ciberseguridad.pdfEmilio Casbas
Recopilación de los puntos más interesantes de diversas presentaciones, desde los visionarios conceptos de Alan Turing, pasando por la paradoja de Hans Moravec y la descripcion de Singularidad de Max Tegmark, hasta los innovadores avances de ChatGPT, y de cómo la IA está transformando la seguridad digital y protegiendo nuestras vidas.
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
1. TRABAJA AL TOPE CON TUS DATOS: BIG DATA
Julio Avellaneda
John Alexander Bulla Torres
Twitter
Blog
Twitter
@JohnBulla
Blog
http://bit.ly/johnbulla
Linkedin http://www.linkedin.com/in/johnbulla
MVP ASP.NET/IIS
Core Group BDotNet
MCT | MCSD | MCTS | MCP
@julitogtu
http://julitogtu.com
PASS – Regional Mentor Latin America
Director BDotNet
MCS | MCP | MCTS
7. Big Data – La revolución en los datos
Los datos digitales crecerán
40x próxima década
En 2015, servicios de nube pública tendrán
de crecimiento neto en gasto de ti
46%
8. Qué es Big Data?
"Big data" es un término aplicado a
conjuntos de datos que superan la
capacidad del software habitual para
ser capturados, gestionados y
procesados en un tiempo razonable.
9. Qué es Big Data?
Big data es una colección de conjuntos de
datos tan grande y complejo que se vuelve
difícil para trabajar con el uso de
herramientas de gestión de base de datos
tradicionales. Las dificultades incluyen la
captura, almacenamiento, búsqueda,
intercambio, análisis y visualización.
Fuente: Eduardo Castro MVP – SQL Saturday #247 Bogotá
10. Qué es Big Data?
Big Data: “ Barreras para que una
organización o equipo puedan
almacenar, procesar y acceder todos los
datos que necesitan para operar con
eficiencia, tomar decisiones, reducir
riesgos, etc.”
Fuente: SolidQ
12. Ejemplos de Big Data
12 Tb
día
21 Pb
Hadoop
cluster
7 Pb
mes
1 Tb
7 Tb
tweets/dia
datos/dia
75
Million
4 Billion
scores/day
14 Tb
Hadoop
cluster
Graph
edg/day
13. Escenarios de Business Analytics
• Análisis sencillo de gran cantidad de datos no estructurados:
Microsoft HDInsight
• Análisis sencillo de datos en memoria: Microsoft StreamInsight
• Análisis en profundidad: SQL Server y Self-Service BI
14. ¿Qué es Hadoop?
• Plataforma de almacenamiento de datos y análisis para Big
Data
• Open Source
• Optimizado para manejar
• Datos masivos a través de paralelismo
• Variedad de datos (Estructurados, No-estructurados, Menos
estructurados)
• Uso de hardware económico
• No para OLTP / OLAP
15. Hadoop - Ventajas
Escalable
Escala linealmente en capacidad de almacenamiento y
computación
Tolerante a Fallos
Proporcionado por el Sistema de ficheros distribuido y el
framework de lectura
Procesamiento distribuido
Sigue la estrategia de divide y vencerás
16. HDInsight
• Project Isotope
• Proporciona Apache Hadoop en
• Windows Server
• Windows Azure
• Active Directory & System Center
18. Explorando datos no-relacionales
Hadoop cluster en HDP para Windows y HDInsight
Windows Azure
Gestión de datos no-relacionels
Basado 100% Apache
Simplicidad de gestión en Windows
Traer Hadoop para software, appliance,
cloud
30. Julio Avellaneda
MVP ASP.NET/IIS
Core Group BDotNet
MCT | MCSD | MCTS | MCP
John Alexander Bulla Torres
Twitter
Blog
Twitter
@JohnBulla
Blog
http://bit.ly/johnbulla
Linkedin http://www.linkedin.com/in/johnbulla
@julitogtu
http://julitogtu.com
PASS – Regional Mentor Latin America
Director BDotNet
MCS | MCP | MCTS
Muchas Gracias