SlideShare una empresa de Scribd logo
1 de 28
Introducción a Data Science
19 de Agosto 2015 (12 pm GMT -5)
José L Rivera
Resumen:
En esta sesión estaremos viendo que es “Data Science”, que
necesitamos saber o aprender para poder convertirnos en un
científico de datos y estaremos viendo algunos ejemplos de usos
muy comunes usando lenguajes como Python, R y el cómo
podemos integrar estos en SQL Server y Azure . Al final de esta
charla tendrás un entendimiento más amplio de las técnicas de
manejos de datos, modelamiento, visualización y los lenguajes y
productos para poner tus proyectos en marcha
Está por comenzar:
Próximos Eventos
Conociendo los servicios
adicionales en BigData
26 de Agosto
Freddy Angarita
SQL Server Rápido y Furioso
2 de Setiembre
Alejandro Cordero
SQL como un servicio en la nube
9 de Setiembre
Warner Chaves
Moderador: Carlos Ulate
Manténgase conectado a nosotros!
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
Oportunidades de Voluntariado
PASS no pudiera existir sin personas apasionadas y
dedicadas de todas partes del mundo que dan de su
tiempo como voluntarios.
Se un voluntario ahora!!
Para identificar oportunidades locales visita
volunteer.sqlpass.org
Recuerda actualizar tu perfil en las secciones de
“MyVolunteering” y MyPASS para mas detalles.
Sigan Participando!
• Obtén tu membresía gratuita en sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
Introducción a Data Science
19 de Agosto de 2015
Jose L Rivera, MBA
MVP | MCSE | MCSA | MCITP | MCSE
Chapter Leader – PASS Global Spanish VC
@SQLConqueror
Moderador: Carlos Ulate
Agenda
• Conceptos básicos de Data Science (DS)
• Herramientas Microsoft para DS
• Herramientas OpenSource para DS
• Demos
• Q&A
Conceptos Básicos
hechos y estadísticas almacenadas para referencia o análisis
BI es un termino sombrilla que reúne a una variedad de aplicaciones
usadas para analizar la data de una empresa. Esta disciplina esta compuesta
de actividades relacionadas a minería de datos, procesamiento analítico (OLAP),
queries y reportes.
Data
Business Intelligence
Conceptos Básicos
es la extracción de conocimiento de grandes volúmenes de
datos estructurados y no estructurados mediante el uso de
técnicas de minería de datos y análisis predictivo
Data Science
Que es Data Science?
• Análisis Estadístico
• estadística inferencial
• Algoritmos
• Experimentos
• Programación
• “Hacking”
• Python, R, etc..
• Conocimiento del Negocio
• Reglas y procesos
Copyright © 2014 by Steven Geringer Raleigh, NC.
Permision is granted to use, distribute or modify this image,
Provided that this copyright notice remains intact.
Recopilación de Datos
Eventos Comportamiento Acción/Pruebas Resultado Observación Conjuntos
de Datos
• Características
• Ambiente
• Actividades
significativas al
negocio
• Medidas • Estructurada
• No Estructurada
• Semi-Estructurada
Quieres ser un Data Scientist?
Quieres ser un Data Scientist?
Resultados 2014
R vs Python
http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html
Reloj de Data Science
http://www.exploringdatascience.com/the-data-science-clock/
• Destrezas básicas
• Fundamentos
• Análisis estadístico
• Machine Learning
• Text Mining/NLP
• Visualización
• Big Data
• Data Ingestion + Munging
• Herramientas
Ciclo de vida
Descubrimiento
de los datos
Preparación de
los datos
Desarrollo del
Modelo
Evaluación
Publicación
Monitoreo
SSAS Data Mining
• SQL Server 2005+
• Excel Add-in
Tipo de Algoritmo Uso Común
Clasificación
predice una o más variables discretas basadas en los otros atributos
del conjunto de datos
Regresión
predice una o más variables continuas basadas en los otros atributos
del conjunto de datos
Segmentación
divide los datos en grupos (clusters) de elementos que tiene
propiedades similares
Asociación
encuentra correlaciones entre los diferentes atributos en un conjunto
de datos
Análisis Secuencial
resume las secuencias frecuentes o episodios de los datos
SSAS Data Mining
DEMO
Excel Data Mining Add-in
R
• CRAN (versión oficial) - http://cran.r-project.org/
• 5,000+ paquetes (librerías)
• v 3.2.4
• RStudio (http://www.rstudio.com/)
• IDE para R
• Provee un experiencia integrada y simple
• Revolution Analytics (http://www.revolutionanalytics.com/)
• Otra versión de R
• Paralelismo y Rendimiento
• SQL Server 2016
Python
• Lenguaje de programación de uso general
• OOP
• Open Source - http://www.python.org/
• v 3.4.3 | 2.7.10
• Multiples IDEs
• IDLE
• Canopy
• IPython Notebook
DEMO
R en RStudio
Azure ML
• Servicio en la nube
• Algoritmos de ML
• Componentes para R y Python
• Publicación a Web-Service
DEMO
Azure Machine Learning (ML)
Recursos Adicionales
• www.r-bloggers.com/
• www.datasciencecentral.com
jose@sqlconqueror.com
Conociendo los servicios adicionales en BigData
26 de Agosto (12 pm GMT -5)
Freddy Angarita
Resúmen:
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte
los lenguajes usados para su consumo, pero poco se hablado de los
servicios complementarios que pueden enriquecer la experiencia BigData,
conozca estos servicios y su aplicación
Próximo Evento

Más contenido relacionado

La actualidad más candente

1. introduccion a la programación orientada a objeto (poo)
1.  introduccion a la programación orientada a objeto (poo)1.  introduccion a la programación orientada a objeto (poo)
1. introduccion a la programación orientada a objeto (poo)Roberto Rojas
 
Tecnicas y herramientas de desarrollo de software(1)
Tecnicas y herramientas de desarrollo de software(1)Tecnicas y herramientas de desarrollo de software(1)
Tecnicas y herramientas de desarrollo de software(1)Gustavo Gualsema
 
Analisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A ObjetosAnalisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A Objetosyoiner santiago
 
ADMINISTRACION DE BASE DE DATOS.ppt
ADMINISTRACION DE BASE DE DATOS.pptADMINISTRACION DE BASE DE DATOS.ppt
ADMINISTRACION DE BASE DE DATOS.pptCristianFlasher1
 
Tipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia ArtificialTipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia ArtificialJuank Grifin
 
Tecnicas y herramientas para el desarrollo de software
Tecnicas y herramientas para el desarrollo de softwareTecnicas y herramientas para el desarrollo de software
Tecnicas y herramientas para el desarrollo de softwareReynaldo Mayz
 
Herramientas de visualización de datos
Herramientas de visualización de datosHerramientas de visualización de datos
Herramientas de visualización de datosBBVA API Market
 
El estilo organizacional
El estilo organizacionalEl estilo organizacional
El estilo organizacionalEdison Naranjo
 
Examen De Estructura De Datos
Examen De Estructura De DatosExamen De Estructura De Datos
Examen De Estructura De Datosvanessa peñafiel
 
Fundamentos de la auditoria informatica
Fundamentos de la auditoria informaticaFundamentos de la auditoria informatica
Fundamentos de la auditoria informaticamppc
 
Proyecto administracion de una biblioteca
Proyecto administracion de una bibliotecaProyecto administracion de una biblioteca
Proyecto administracion de una bibliotecaUniversidad de Panamá
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 

La actualidad más candente (20)

1. introduccion a la programación orientada a objeto (poo)
1.  introduccion a la programación orientada a objeto (poo)1.  introduccion a la programación orientada a objeto (poo)
1. introduccion a la programación orientada a objeto (poo)
 
Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
 
Tecnicas y herramientas de desarrollo de software(1)
Tecnicas y herramientas de desarrollo de software(1)Tecnicas y herramientas de desarrollo de software(1)
Tecnicas y herramientas de desarrollo de software(1)
 
Analisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A ObjetosAnalisis Y DiseñO Orientado A Objetos
Analisis Y DiseñO Orientado A Objetos
 
Diagrama de contexto
Diagrama de contextoDiagrama de contexto
Diagrama de contexto
 
Ciencia de datos en 20'
Ciencia de datos en 20'Ciencia de datos en 20'
Ciencia de datos en 20'
 
ADMINISTRACION DE BASE DE DATOS.ppt
ADMINISTRACION DE BASE DE DATOS.pptADMINISTRACION DE BASE DE DATOS.ppt
ADMINISTRACION DE BASE DE DATOS.ppt
 
Tipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia ArtificialTipos de búsqueda en Inteligencia Artificial
Tipos de búsqueda en Inteligencia Artificial
 
Tecnicas y herramientas para el desarrollo de software
Tecnicas y herramientas para el desarrollo de softwareTecnicas y herramientas para el desarrollo de software
Tecnicas y herramientas para el desarrollo de software
 
Metodología CommonKADS
Metodología CommonKADSMetodología CommonKADS
Metodología CommonKADS
 
Programacion Orientada a Objetos
Programacion Orientada a ObjetosProgramacion Orientada a Objetos
Programacion Orientada a Objetos
 
Herramientas de visualización de datos
Herramientas de visualización de datosHerramientas de visualización de datos
Herramientas de visualización de datos
 
El estilo organizacional
El estilo organizacionalEl estilo organizacional
El estilo organizacional
 
Presentación de Base de datos II
Presentación de Base de datos IIPresentación de Base de datos II
Presentación de Base de datos II
 
Presentacion bases de datos
Presentacion bases de datosPresentacion bases de datos
Presentacion bases de datos
 
Examen De Estructura De Datos
Examen De Estructura De DatosExamen De Estructura De Datos
Examen De Estructura De Datos
 
Fundamentos de la auditoria informatica
Fundamentos de la auditoria informaticaFundamentos de la auditoria informatica
Fundamentos de la auditoria informatica
 
Modelo Entidad Relacion
Modelo Entidad RelacionModelo Entidad Relacion
Modelo Entidad Relacion
 
Proyecto administracion de una biblioteca
Proyecto administracion de una bibliotecaProyecto administracion de una biblioteca
Proyecto administracion de una biblioteca
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 

Destacado

Análisis de datos con Python
Análisis de datos con PythonAnálisis de datos con Python
Análisis de datos con Pythongoyodiaz
 
Introducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistIntroducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistCarlos Toxtli
 
Python en ciencia Pycon Argentina 2009
Python en ciencia Pycon Argentina 2009Python en ciencia Pycon Argentina 2009
Python en ciencia Pycon Argentina 2009Sebastian Bassi
 
Aplicaciones e impacto de la informatica en la Sociedad Actual
Aplicaciones e impacto de la informatica en la Sociedad Actual Aplicaciones e impacto de la informatica en la Sociedad Actual
Aplicaciones e impacto de la informatica en la Sociedad Actual Montserrat PG
 
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUALAPLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUALMontserrat PG
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedadImpacto de las tics en la sociedad
Impacto de las tics en la sociedadAngge_05
 
What is r in spanish.
What is r in spanish.What is r in spanish.
What is r in spanish.Ajay Ohri
 
Summer school python in spanish
Summer school python in spanishSummer school python in spanish
Summer school python in spanishAjay Ohri
 
De los datos a las predicciones
De los datos a las prediccionesDe los datos a las predicciones
De los datos a las prediccionesCleverTask
 
Power point Impacto Social de La Informatica
Power point Impacto Social de La InformaticaPower point Impacto Social de La Informatica
Power point Impacto Social de La Informatica0973332505
 
Impacto tic en_la_sociedad
Impacto tic en_la_sociedadImpacto tic en_la_sociedad
Impacto tic en_la_sociedadPaúl Machado
 
Importancia de las tic para la sociedad
Importancia de las tic para la sociedadImportancia de las tic para la sociedad
Importancia de las tic para la sociedadLilianaChancusig
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedad Impacto de las tics en la sociedad
Impacto de las tics en la sociedad rcoyagop
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantesCarlos Toxtli
 
IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY  IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY carlos27507
 

Destacado (20)

Análisis de datos con Python
Análisis de datos con PythonAnálisis de datos con Python
Análisis de datos con Python
 
Introducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistIntroducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientist
 
Python en ciencia Pycon Argentina 2009
Python en ciencia Pycon Argentina 2009Python en ciencia Pycon Argentina 2009
Python en ciencia Pycon Argentina 2009
 
¿Conoces swift?
¿Conoces swift?¿Conoces swift?
¿Conoces swift?
 
Swift
SwiftSwift
Swift
 
Aplicaciones e impacto de la informatica en la Sociedad Actual
Aplicaciones e impacto de la informatica en la Sociedad Actual Aplicaciones e impacto de la informatica en la Sociedad Actual
Aplicaciones e impacto de la informatica en la Sociedad Actual
 
Análisis de datos: R vs Python
Análisis de datos: R vs PythonAnálisis de datos: R vs Python
Análisis de datos: R vs Python
 
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUALAPLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
 
Developing iOS apps with Swift
Developing iOS apps with SwiftDeveloping iOS apps with Swift
Developing iOS apps with Swift
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedadImpacto de las tics en la sociedad
Impacto de las tics en la sociedad
 
What is r in spanish.
What is r in spanish.What is r in spanish.
What is r in spanish.
 
Summer school python in spanish
Summer school python in spanishSummer school python in spanish
Summer school python in spanish
 
De los datos a las predicciones
De los datos a las prediccionesDe los datos a las predicciones
De los datos a las predicciones
 
Python + Ciencia = ♥
Python + Ciencia = ♥Python + Ciencia = ♥
Python + Ciencia = ♥
 
Power point Impacto Social de La Informatica
Power point Impacto Social de La InformaticaPower point Impacto Social de La Informatica
Power point Impacto Social de La Informatica
 
Impacto tic en_la_sociedad
Impacto tic en_la_sociedadImpacto tic en_la_sociedad
Impacto tic en_la_sociedad
 
Importancia de las tic para la sociedad
Importancia de las tic para la sociedadImportancia de las tic para la sociedad
Importancia de las tic para la sociedad
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedad Impacto de las tics en la sociedad
Impacto de las tics en la sociedad
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantes
 
IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY  IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY
 

Similar a Introduccion a Data Science

Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016jorge Muchaypiña
 
Herramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de DatosHerramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de DatosEduardo Castro
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. GustavoMartin46
 
Visualización de Big Data con Power View
Visualización de Big Data con Power ViewVisualización de Big Data con Power View
Visualización de Big Data con Power ViewEduardo Castro
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Denodo
 
Dts y analysis services 2000
Dts y analysis services 2000Dts y analysis services 2000
Dts y analysis services 2000Salvador Ramos
 
Cursos Big Data Open Source
Cursos Big Data Open SourceCursos Big Data Open Source
Cursos Big Data Open SourceStratebi
 
Visualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de InvestigaciónVisualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de InvestigaciónIAB México
 
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negociosAzure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negociosJuan Alvarado
 
Servicios de datos en Microsoft Azure
Servicios de datos en Microsoft AzureServicios de datos en Microsoft Azure
Servicios de datos en Microsoft AzureJohn Bulla
 
BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1Cristian Vergara
 
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server  Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server avanttic Consultoría Tecnológica
 
Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerSpanishPASSVC
 
GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)GFI Informática
 

Similar a Introduccion a Data Science (20)

Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016
 
Herramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de DatosHerramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de Datos
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero.
 
Azure Data Lake
Azure Data LakeAzure Data Lake
Azure Data Lake
 
Azure data lake
Azure data lakeAzure data lake
Azure data lake
 
Visualización de Big Data con Power View
Visualización de Big Data con Power ViewVisualización de Big Data con Power View
Visualización de Big Data con Power View
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
Dts y analysis services 2000
Dts y analysis services 2000Dts y analysis services 2000
Dts y analysis services 2000
 
Cursos Big Data Open Source
Cursos Big Data Open SourceCursos Big Data Open Source
Cursos Big Data Open Source
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
Visualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de InvestigaciónVisualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de Investigación
 
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negociosAzure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
 
Servicios de datos en Microsoft Azure
Servicios de datos en Microsoft AzureServicios de datos en Microsoft Azure
Servicios de datos en Microsoft Azure
 
BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1
 
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server  Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
 
Oracle Data Mining.pptx
Oracle Data Mining.pptxOracle Data Mining.pptx
Oracle Data Mining.pptx
 
Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint Server
 
GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)
 
Querona
QueronaQuerona
Querona
 
capacitación Data science.pptx
capacitación Data science.pptxcapacitación Data science.pptx
capacitación Data science.pptx
 

Más de SpanishPASSVC

Creación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeCreación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeSpanishPASSVC
 
Analizando la performance del subsistema de IO
Analizando la performance del subsistema de IOAnalizando la performance del subsistema de IO
Analizando la performance del subsistema de IOSpanishPASSVC
 
AlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasAlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasSpanishPASSVC
 
Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016SpanishPASSVC
 
Mejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalMejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalSpanishPASSVC
 
Como leer planes de ejecución
Como leer planes de ejecuciónComo leer planes de ejecución
Como leer planes de ejecuciónSpanishPASSVC
 
AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016SpanishPASSVC
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureSpanishPASSVC
 
Tecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoTecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoSpanishPASSVC
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETLSpanishPASSVC
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzureSpanishPASSVC
 
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosMejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosSpanishPASSVC
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC
 
La receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosLa receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosSpanishPASSVC
 
Introducción a Azure Machine Learning
Introducción a Azure Machine LearningIntroducción a Azure Machine Learning
Introducción a Azure Machine LearningSpanishPASSVC
 
Cuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesCuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesSpanishPASSVC
 
Automatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosAutomatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosSpanishPASSVC
 
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”SpanishPASSVC
 
Administrando soluciones de Power BI
Administrando soluciones de Power BIAdministrando soluciones de Power BI
Administrando soluciones de Power BISpanishPASSVC
 
Vista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoVista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoSpanishPASSVC
 

Más de SpanishPASSVC (20)

Creación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeCreación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nube
 
Analizando la performance del subsistema de IO
Analizando la performance del subsistema de IOAnalizando la performance del subsistema de IO
Analizando la performance del subsistema de IO
 
AlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasAlwaysON Lecciones Aprendidas
AlwaysON Lecciones Aprendidas
 
Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016
 
Mejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalMejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación Transaccional
 
Como leer planes de ejecución
Como leer planes de ejecuciónComo leer planes de ejecución
Como leer planes de ejecución
 
AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y Azure
 
Tecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoTecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreo
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft Azure
 
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosMejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizados
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
La receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosLa receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datos
 
Introducción a Azure Machine Learning
Introducción a Azure Machine LearningIntroducción a Azure Machine Learning
Introducción a Azure Machine Learning
 
Cuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesCuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partes
 
Automatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosAutomatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatos
 
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
 
Administrando soluciones de Power BI
Administrando soluciones de Power BIAdministrando soluciones de Power BI
Administrando soluciones de Power BI
 
Vista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoVista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan Alvarado
 

Último

Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 

Último (10)

Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 

Introduccion a Data Science

  • 1. Introducción a Data Science 19 de Agosto 2015 (12 pm GMT -5) José L Rivera Resumen: En esta sesión estaremos viendo que es “Data Science”, que necesitamos saber o aprender para poder convertirnos en un científico de datos y estaremos viendo algunos ejemplos de usos muy comunes usando lenguajes como Python, R y el cómo podemos integrar estos en SQL Server y Azure . Al final de esta charla tendrás un entendimiento más amplio de las técnicas de manejos de datos, modelamiento, visualización y los lenguajes y productos para poner tus proyectos en marcha Está por comenzar: Próximos Eventos Conociendo los servicios adicionales en BigData 26 de Agosto Freddy Angarita SQL Server Rápido y Furioso 2 de Setiembre Alejandro Cordero SQL como un servicio en la nube 9 de Setiembre Warner Chaves Moderador: Carlos Ulate
  • 2. Manténgase conectado a nosotros! Visítenos en http://globalspanish.sqlpass.org /SpanishPASSVC lnkd.in/dtYBzev /user/SpanishPASSVC /SpanishPASSVC
  • 3.
  • 4. Oportunidades de Voluntariado PASS no pudiera existir sin personas apasionadas y dedicadas de todas partes del mundo que dan de su tiempo como voluntarios. Se un voluntario ahora!! Para identificar oportunidades locales visita volunteer.sqlpass.org Recuerda actualizar tu perfil en las secciones de “MyVolunteering” y MyPASS para mas detalles.
  • 5. Sigan Participando! • Obtén tu membresía gratuita en sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org
  • 6. Introducción a Data Science 19 de Agosto de 2015 Jose L Rivera, MBA MVP | MCSE | MCSA | MCITP | MCSE Chapter Leader – PASS Global Spanish VC @SQLConqueror Moderador: Carlos Ulate
  • 7.
  • 8. Agenda • Conceptos básicos de Data Science (DS) • Herramientas Microsoft para DS • Herramientas OpenSource para DS • Demos • Q&A
  • 9. Conceptos Básicos hechos y estadísticas almacenadas para referencia o análisis BI es un termino sombrilla que reúne a una variedad de aplicaciones usadas para analizar la data de una empresa. Esta disciplina esta compuesta de actividades relacionadas a minería de datos, procesamiento analítico (OLAP), queries y reportes. Data Business Intelligence
  • 10. Conceptos Básicos es la extracción de conocimiento de grandes volúmenes de datos estructurados y no estructurados mediante el uso de técnicas de minería de datos y análisis predictivo Data Science
  • 11. Que es Data Science? • Análisis Estadístico • estadística inferencial • Algoritmos • Experimentos • Programación • “Hacking” • Python, R, etc.. • Conocimiento del Negocio • Reglas y procesos Copyright © 2014 by Steven Geringer Raleigh, NC. Permision is granted to use, distribute or modify this image, Provided that this copyright notice remains intact.
  • 12. Recopilación de Datos Eventos Comportamiento Acción/Pruebas Resultado Observación Conjuntos de Datos • Características • Ambiente • Actividades significativas al negocio • Medidas • Estructurada • No Estructurada • Semi-Estructurada
  • 13. Quieres ser un Data Scientist?
  • 14. Quieres ser un Data Scientist? Resultados 2014
  • 16. Reloj de Data Science http://www.exploringdatascience.com/the-data-science-clock/ • Destrezas básicas • Fundamentos • Análisis estadístico • Machine Learning • Text Mining/NLP • Visualización • Big Data • Data Ingestion + Munging • Herramientas
  • 17. Ciclo de vida Descubrimiento de los datos Preparación de los datos Desarrollo del Modelo Evaluación Publicación Monitoreo
  • 18. SSAS Data Mining • SQL Server 2005+ • Excel Add-in Tipo de Algoritmo Uso Común Clasificación predice una o más variables discretas basadas en los otros atributos del conjunto de datos Regresión predice una o más variables continuas basadas en los otros atributos del conjunto de datos Segmentación divide los datos en grupos (clusters) de elementos que tiene propiedades similares Asociación encuentra correlaciones entre los diferentes atributos en un conjunto de datos Análisis Secuencial resume las secuencias frecuentes o episodios de los datos
  • 21. R • CRAN (versión oficial) - http://cran.r-project.org/ • 5,000+ paquetes (librerías) • v 3.2.4 • RStudio (http://www.rstudio.com/) • IDE para R • Provee un experiencia integrada y simple • Revolution Analytics (http://www.revolutionanalytics.com/) • Otra versión de R • Paralelismo y Rendimiento • SQL Server 2016
  • 22. Python • Lenguaje de programación de uso general • OOP • Open Source - http://www.python.org/ • v 3.4.3 | 2.7.10 • Multiples IDEs • IDLE • Canopy • IPython Notebook
  • 24. Azure ML • Servicio en la nube • Algoritmos de ML • Componentes para R y Python • Publicación a Web-Service
  • 28. Conociendo los servicios adicionales en BigData 26 de Agosto (12 pm GMT -5) Freddy Angarita Resúmen: Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación Próximo Evento