1. Visualización de BigData con PowerView
28 de Agosto (12 pm GMT -5)
Eduardo Castro
Resúmen:
En esta sesión veremos ejemplos,de como realizar
análisis de big data con PowerView integrato con
HDInsight y HortonWorks.
Próximos Eventos
Mejores prácticas de SQL Server
para implementar SharePoint
3 de Septiembre
David Sánchez
Indices columnares en SQL
Server 2014
10 de Septiembre
José L. Rivera
Aprendamos DAX
10 de Septiembre
José Ahias López Portillo
Está por comenzar:
2. Visualización de Big Data con Power View
27 Agosto 2014
Eduardo Castro
SQL Server MVP
PASS Regional Mentor
Comunidad Windows PASS Chapter
3. Objetivos de la sesión
Qué es Big data
Introducción a HDInsight
Autoservicio de Inteligencia de Negocios (BI):
Excel 2013 PowerPivot
Excel 2013 Power View
Características de BI de Excel 2013
Creación de un solución de BI con Big Data BI dentro de Excel 2013
4. Qué es Big Data?
Petabytes
Terabytes
Gigabytes
Megabytes
BIG DATA
WEB
CRM
ERP
Web logs
Customer Touches
Support Contacts
Offer details
Segmentation
Spatial & GPS Coordinates
Search Marketing
Offer history
A/B testing
Dynamic Pricing
Affiliate Networks
Behavioral Targeting
Dynamic Funnels
User Generated Content
Mobile Web
Sentiment SMS/MMS
External Demographics
HD Video, Audio, Images
Speech to Text
Product/Service Logs
Social Interactions & Feeds
Business Data Feeds
User Click Stream
Sensors / RFID / Devices
Incremento de variedad y cantidad de datos
Transacciones +
Interacciones
= BIG DATA
5. Dominio Escenarios de grandes volúmenes datos comunes
Servicios financieros Modelado riesgo verdadero
Análisis de las amenazas y detección de fraude
Vigilancia Comercio
El puntaje de crédito y análisis
Medios y Entretenimiento Los motores de recomendación
Focalización Ad
Buscar calidad
Los abusos y detección de fraude de clics
Venta al por menor Punto de análisis de las transacciones de ventas
Análisis de la pérdida de clientes
El análisis de sentimientos (sentiment analysis)
Telecomunicaciones Cliente prevención del churn
La optimización del rendimiento de la red
Detalles de llamadas (CDR) y su análisis
Predicción de fallos de red
Gobierno Seguridad Cibernética (botnets, fraudes)
La congestión del tráfico y re-enrutamiento
Monitoreo Ambiental
Monitoreo Antisocial través de medios sociales
Salud La investigación del genoma
La investigación del cáncer
Pandemias detección temprana
Monitoreo de la calidad del aire
7. La naturaleza cambiante del Big Data
Volumen - La cantidad de datos que han creado las empresas
a través de
La web
Dispositivos móviles
Infraestructura de TI
y otras fuentes está creciendo exponencialmente cada año.
8. Principales fuentes de datos
Redes sociales y medios de comunicación
700 millones de usuarios de Facebook, 250 millones de usuarios de
Twitter y 156 millones de blogs públicos
Dispositivos móviles
Más de 5 mil millones de teléfonos móviles en uso en todo el mundo
Transacciones en Internet
miles de millones de compras en línea, operaciones de bolsa y otras
transacciones ocurren todos los días
Dispositivos de red y sensores
10. Integración con herramientas Microsoft
Integración con las
herramientas de
Análisis de Microsoft
DATA SYSTEMS APPLICATIONS
Aplicaciones Microsoft
HORTONWORKS
DATA PLATFORM
For Windows
DATA SOURCES
MOBILE
DATA
OLTP, POS
SYSTEMS
Fuentes tradicionales
(RDBMS, OLTP, OLAP)
Nuevas Fuentes
(web logs, email, sensor data, social media)
12. HDP para Windows
Hortonworks
Data Platform (HDP)
For Windows
100% Open Source Enterprise Hadoop
Manage &
Operate at
PLATFORM SERVICES
HORTONWORKS
DATA PLATFORM (HDP)
For Windows
HADOOP CORE DATA
SERVICES
Store,
Process and
Access Data
OPERATIONAL
SERVICES
Manage &
Operate at
Scale
Scale
Store,
Process and
Access Data
Distributed
Storage & Processing
Enterprise Readiness
13.
14. Parallel Data Warehouse
HDP
Windows Azure
La distribución de Apache Hadoop distribución
desarrollado por Hortonworks y Microsoft
Integrado con Microsoft BI
Microsoft HDInsight
15. Big data + BI tradicional = BI Poderoso
grandes
cantidades
de datos
Microsoft
HDInsight
Tabular
OLAP
SQL
010101010101010101
1010101010101010
01010101010101
101010101010
Visualización
PDW +
Polibase
16. Microsoft Azure HDInsight
Cómo instalar un clúster HDInsight
Introducción a HDFS
Ejecución de una tarea de Map / Reduce
El procesamiento de los datos con Pig
Creación de tablas Hive
Cargando Tablas Datos en Hive
Consulta de Tablas con HiveQL
19. Creación de tablas Hive
• Utilice la sentencia CREATE TABLE HiveQL
• Define los metadatos del esquema que se establece sobre los datos
en una carpeta cuando se consulta la table
• Especifica el formato de archivo y ubicación
• Por defecto el formato es un archivo secuencial en la ruta
/hive/warehouse/<table_name>
• Crear tablas internas o tablas externas
20. Crear tabla externa
CREATE EXTERNAL TABLE table_name
({<column_definition>}[,..n ])
{WITH (
DATA_SOURCE = <data_source>,
FILE_FORMAT = <file_format>,
LOCATION =‘<file_path>’,
[REJECT_VALUE = <value>],
…)};
Hacer referencia a la fuente de datos
externa
1
Hacer referencia a formato de
archivo externo
2
Ruta de acceso del archivo / carpeta
Hadoop
3
(4 Opcional) Rechazar parámetros
21. Cargando Datos en Hive
• Guarde los archivos de datos en los directories
para tablas
• Utilice la instrucción LOAD
• Mueve o copia los archivos al directorio correspondiente
• Utilice la sentencia INSERT
• Inserta datos de una tabla a otra
22. Crear origen de datos externo
CREATE EXTERNAL DATA SOURCE datasource_name
{WITH (
TYPE = <data_source>,
LOCATION =‘<location>’,
[JOB_TRACKER_LOCATION = ‘<jb_location>’]
};
1 Tipo de fuente de datos externa
2 Lugar de origen de datos externos
La activación o desactivación de la
generación de trabajo MapReduce
3
23. Consulta de Tablas con HiveQL
• Consultar datos utilizando la sentencia TSQL
SELECT
• Hive traduce la consulta en tareas de Map/Reduce
y aplica el esquema de la tabla a los archivos de
datos
24. Big Data en Excel
Acceso a Hadoop o HDInsight desde Excel
Uso del proveedor Hive ODBC
Uso de las consultas con HDInsight
25. Acceder HDInsight desde Excel
• Driver Hive ODBC para HDInsight
• Soporta sintaxis similar a T-SQL para consultar las tablas
del clúster
• Requiere un clúster HDInsight activo
• PowerQuery
• Soporta la importación de datos desde cualquier archivo
en HDFS
• Se puede utilizar cuando el clúster HDInsight está
inactivo
26. Instalar el Hive ODBC Driver
1. Descargue e instale el driver Hive ODBC para
HDInsight
2. Crear un nombre de origen de datos (DSN) para
el clúster de HDInsight
3. Utilice el Asistente para la conexión de datos en
Excel para importar datos
27. Importación de datos Windows Azure Marketplace En Excel
• Puede importar datos de Windows Azure
Marketplace directamente en Excel usando:
• PowerQuery
• PowerPivot
• PowerView
31. Planning on attending PASS Summit 2014? Start saving
today!
• The world’s largest gathering of SQL Server & BI professionals
• Take your SQL Server skills to the next level by learning from the world’s SQL
Server experts, in 190+ technical sessions
• Over 5000 attendees, representing 2000 companies, from 52 countries,
ready to network & learn
Ask your Chapter Leader how to
save $150 off registration!
$1,895
UNTIL SEPTEMBER 26, 2014
32. PASS Virtual Chapters Listing
Check out the sqlpass.org for more information on all the Virtual Chapters:
• Application Development
• Big Data
• Book Readers
• Business Analytics
• Business Intelligence
• Cloud
• Data Architecture
• Database Administration
• DBA Fundamentals
• Excel BI
• Healthcare
• High Availability and Disaster Recovery
• InMemory
• Master DataData Quality
• Oracle SQL
• Performance
• Powershell
• Professional Development
• Security
• Virtualization
• Women in Technology
• Global Chinese
• Global French
• Global Hebrew
• Global Italian
• Global Portuguese
• Global Russian
• Global Spanish
33. Virtual Chapter Meetings – August
VIRTUAL CHAPTER MEETING TOPIC
DBA Fundamentals Aug 5 11:00– 12:00 CDT (UTC -05:00) Rolling Upgraders, The Easy Way
Presented by Argenis Fernandez
Global Spanish Aug 6 12:00-12:30 (UTC -05:00) Los Caso de Uso Para In-Memory OLTP
Presented by Warner Chaves
Global Hebrew Aug 10 17:30-18:30 JDT (UTC +02:00) Take Your SQL Server Development
Process Forward!
Presented by Itai Binyamin
Professional
Development
Aug 12 12:00-13:00 EDT (UTC -04:00) Bridging the Communication Gap
Between DBA and Developer
Presented by Robert Davis
High Availability and
Disaster Recovery
Aug 12 12:00-13:00 CDT (UTC -05:00) Mirroring Start to Finish
Presented by Ryan Adams
34. Virtual Chapter Meetings – August
VIRTUAL CHAPTER MEETING TOPIC
Global Spanish Aug 13 12:00-13:00 (UTC -05:00) Haciendo Preguntas Básicas en Power
BI
Presented by Andrei Garzon
Excel Business
Intelligence
Aug 14 11:00-12:00 EDT (UTC-04:00) Advanced Analytics: Excel Solver
Presented by Dan Fylstra
Business Intelligence Aug 14 11:00-12:00 EDT (UTC -04:00) Continuous Integration for Reporting
Services
Presented by Nat Sundar
DBA Fundamentals Aug 19 11:00-12:00 CDT (UTC -05:00) The Roadmap to Better Performance:
Reading Query Plans
Presented by Erin Stellato
Global Spanish Aug 20 12:00-12:30 (UTC -05:00) Fundamentos sobre lost indices end
SQL
Presented by Enrique Puig
35. Virtual Chapter Meetings – August
VIRTUAL CHAPTER MEETING TOPIC
Global Russian Aug 20 15:00-16:30 (UTC +03:00) SSIS - Повышение
производительности обработки
потоков данных
Global French Aug 21 20:00-21:00 RST (UTC +01:00) Power BI Hybride avec la Passerelle de
Gestion de Données
Presented by Jean-Pierre Riehl
Business Analytics Aug 21 12:00-13:00 CDT (UTC -05:00) Looking Through the Windshield:
Creating forward-looking Dashboards
and KPI’s
Presented by Brian Larson
Business Intelligence Aug 27 12:00-13:00 GMT (UTC-00:00) Intro to R
Presented by Stephanie Locke
Global Spanish Aug 27 12:00-13:00 (UTC-05:00) Visualización de Big Data Con Power
View
Presented by Eduardo Castro
36. Upcoming SQLSaturdays
Upcoming North America Events Upcoming International Events
• Aug 2 #324 Baton Rouge
• Aug 9 #304 Indianapolis
• Aug 23 #328 Birmingham
• Aug 23 #309 Oklahoma City
• Sep 6 #320 Raleigh
• Sep 13 #300 Kansas City
• Sep 20 #331 Denver
• Sept 20 # 340 San Diego
• Aug 30 #327 Johannesburg
• Aug 30 #317 Oslo
• Sep 6 #301 Cape Town
• Sep 13 # 323 Paris
• Sep 20 #290 Kiev
• Sep 20 #310 Dublin
• Sep 27 #325 Sao Paulo
Visit www.sqlsaturday.com to
register for an event near you!
37. 37
Volunteering with PASS
Volunteer Today!
Now it’s easier than ever to volunteer with PASS.
Let us know your volunteer preferences by updating the
“myVolunteering” section of your myPASS profile.
PASS would not exist without our passionate, dedicated,
and hardworking volunteers from around the globe.
38. 38
Volunteering with PASS
Outstanding Volunteer Award
Do you know a volunteer that has gone
above and beyond recently?
Nominate them for the monthly OVA.
VolunteerRecognition@sqlpass.org
PASSion Award
The highest of PASS accolades presented
yearly to a volunteer.
Nominations will open in August 2014.
Stay tuned!
39. Stay Involved!
• Sign up for a free membership today at sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
40. Programa de Reconocimiento
Programa de Voluntario Sobresaliente
• PASS le invita a nominar a su voluntario favorito para ser “Voluntario Sobresaliente del Mes”
• Enviar nominaciones en todo momento a: VolunteerRecognition@sqlpass.org
Favor proveer:
• Información de contacto del nominado,
• una lista breve de los programas de PASS que a participado el nominado
• los años que lleva activo en la comunidad
• una corta descripción por el cual considera que esta persona debe ser reconocida
• Los nominados seleccionados serán anunciados en la edición del boletín PASS Connector y recibirán un
certificado de apreciación.
41. Mejores prácticas de SQL Server para
implementar sharepoint
3 de Septiembre (12 pm GMT -5)
David Sánchez
Resúmen:
En esta sesión tendremos la oportunidad de
conocer las mejores prácticas para una
implementación de SQL Server para la plataforma
de SharePoint Server.
Próximo Evento