Tener una plataforma interna para analítica de datos brinda una forma poderosa de monitorear tus datos en tiempo real y entender el impacto que tiene tu organización.
Presentado por Ángel Alvarado en SG Virtual Conference 2020
TWC LOGD: A Portal for Linking Government DataAlvaro Graves
Experiencias de LOGD un portal sobre open government data. En él es posible encontrar datasets, demos, tutoriales, etc. El mayor colaborador del Linked Data cloud y un socio importante del gobierno de EEUU.
Mejores Prácticas de SQL Server para implementar SharePoint ServerSpanishPASSVC
En esta sesión tendremos la oportunidad de conocer las mejores prácticas para una implementación de SQL Server para la plataforma de SharePoint Server.
Orquestando Pipelines de Datosen AWS con Step Function y AWS GlueGlobant
Speaker: Sebastián Suárez
Video: https://youtu.be/gWr_htOg-iY
Describir a la audiencia como puede orquestar flujos de datos complejos usando AWS Glue y AWS Step Functions. Con estas herramientas se puede orquestar pasos que incluyen scripts SQL, scripts python usando Pandas o Numpy, jobs spark.
---------------------------------------------------------------------------------------------------------------------------------------------------------------
Hay trabajos y hay carreras. Las oportunidades vienen a golpear la puerta cuando menos lo esperas. La decisión es tuya. Desde tener la oportunidad de hacer algo significativo día tras día, hasta estar rodeado de gente supremamente inteligente y motivada.
¿Estás listo?
Descúbre todas nuestras oportunidades acá: https://bit.ly/2PWKky9
---------------------------------------------------------------------------------------------------------------------------------------------------------------
Síguenos en:
Facebook: https://www.facebook.com/Globant/
Twitter: https://twitter.com/Globant
Instagram: https://www.instagram.com/globantpics/
Linkedin: https://www.linkedin.com/company/globant
Visita nuestra página web: https://bit.ly/2XLVYQD
TWC LOGD: A Portal for Linking Government DataAlvaro Graves
Experiencias de LOGD un portal sobre open government data. En él es posible encontrar datasets, demos, tutoriales, etc. El mayor colaborador del Linked Data cloud y un socio importante del gobierno de EEUU.
Mejores Prácticas de SQL Server para implementar SharePoint ServerSpanishPASSVC
En esta sesión tendremos la oportunidad de conocer las mejores prácticas para una implementación de SQL Server para la plataforma de SharePoint Server.
Orquestando Pipelines de Datosen AWS con Step Function y AWS GlueGlobant
Speaker: Sebastián Suárez
Video: https://youtu.be/gWr_htOg-iY
Describir a la audiencia como puede orquestar flujos de datos complejos usando AWS Glue y AWS Step Functions. Con estas herramientas se puede orquestar pasos que incluyen scripts SQL, scripts python usando Pandas o Numpy, jobs spark.
---------------------------------------------------------------------------------------------------------------------------------------------------------------
Hay trabajos y hay carreras. Las oportunidades vienen a golpear la puerta cuando menos lo esperas. La decisión es tuya. Desde tener la oportunidad de hacer algo significativo día tras día, hasta estar rodeado de gente supremamente inteligente y motivada.
¿Estás listo?
Descúbre todas nuestras oportunidades acá: https://bit.ly/2PWKky9
---------------------------------------------------------------------------------------------------------------------------------------------------------------
Síguenos en:
Facebook: https://www.facebook.com/Globant/
Twitter: https://twitter.com/Globant
Instagram: https://www.instagram.com/globantpics/
Linkedin: https://www.linkedin.com/company/globant
Visita nuestra página web: https://bit.ly/2XLVYQD
El término “Data Science” se ha vuelto muy popular recientemente con el aumento de popularidad de las redes sociales, análisis predictivos y el análisis de datos no estructurados como parte del crecimiento del “Big Data”. En esta sesión estaremos viendo que es “Data Science”, que necesitamos saber o aprender para poder convertirnos en un científico de datos y estaremos viendo algunos ejemplos de usos muy comunes usando lenguajes como Python, R y el cómo podemos integrar estos en SQL Server y Azure . Al final de esta charla tendrás un entendimiento más amplio de las técnicas de manejos de datos, modelamiento, visualización y los lenguajes y productos para poner tus proyectos en marcha.
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataJohn Bulla
En esta sesión veremos una introducción al nuevo lenguaje de U-SQL, que une las ventajas de SQL con el poder expresivo de su propio código donde millones de desarrolladores SQL y .NET ahora pueden procesar y analizar todos sus datos con los conocimientos que ya tienen. El apoyo del lenguaje U-SQL en Azure Data Lake Tools para Visual Studio incluye ayuda técnica para la creación, depuración y rendimiento avanzado de funciones de análisis para aumentar la productividad al optimizar los trabajos que se ejecutan a través de miles de nodos.
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Denodo
Watch full webinar here: https://bit.ly/36j4ATO
Las técnicas avanzadas de ciencia de datos, como el aprendizaje automático (machine learning), son herramientas extremadamente útiles para obtener información valiosa de los datos. Sin embargo, suponen más presión para los data scientists, que tienen que buscar los datos correctos y limpiarlos para que sean utilizables. Este proceso, al final, consume la mayor parte de su tiempo.
En este webinar, explicaremos cómo la virtualización de datos ayuda a obtener la información necesaria de una manera más eficiente y ágil. Asista para descubrir:
- Cómo la virtualización de datos acelera la adquisición y el procesamiento de datos
- Cómo la solución de virtualización de datos de Denodo se integra con herramientas como Spark, Python, Zeppelin, etc.
- Cómo la virtualización de datos permite una gestión más eficiente de grandes volúmenes de datos
- Dos casos de éxito de clientes y una demo de analítica predictiva
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasGuillermo Álvaro Rey
Lección "Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas" del Curso de Verano 2010 de la UPM: "Linked Data: ¿Una oportunidad o un riesgo?"
Wikipedia, sirviendo la totalidad del conocimiento humano con software libre
En la Fundación Wikimedia (organización sin ánimo de lucro que mantiene Wikipedia y muchos otros proyectos de conocimiento libre) trabajamos con un presupuesto financiado exclusivamente con donaciones. Con 280 empleados, y la inestimable ayuda de voluntarios, mantenemos algunas de las webs más visitadas del mundo, con miles de millones de usuarios al mes.
En esta charla se hará un breve resumen de nuestra filosofía de trabajo (respeto a la privacidad de los usuarios, uso exclusivo de software libre, desarrollo comunitario, transparencia, independencia) y de cómo funciona por dentro nuestra infraestructura técnica; así como de invitar a desarrolladores o cualquier persona con motivaciones técnica a colaborar en nuestra comunidad y proyectos, y a conocer los recursos técnicos que ofrece.
Cómo construir tu propia data platform. From zero to hero. GustavoMartin46
Esta presentación es el resultado de la ponencia presentada el día 28 de abril de 2023 en la Salmorejo Tech https://salmorejo.tech/2023/.
Con esta ponencia se buscaba explicar a una audiencia con conocimientos básicos de tecnología, las distintas herramientas que se pueden emplear para construir una plataforma de datos.
La ponencia comienza con una configuración sencilla, que prácticamente cualquier persona del mundo de la informática puede entender. Termina con una configuración compleja, donde sin entrar en muchos detalles, sí permite a la audiencia hacerse una idea de qué herramientas se requieren para implementar la solución.
En esta sesión veremos diferentes métodos para cargar datos en un cluster de HDInsight (Hadoop). Veremos como cada método es válido para: datos desde origenes OLTP, datos desde origenes sin estructura y datos a los que se dota estructura para presentarselos a HDInsight. En cada escenario se debe considerar el uso posterior que se le dará al dato para hacerlo de la forma más eficiente. Habrá casos en los que el dato se serializa con librerías .NET y en otros casos el dato se procesará como texto puro
Sabes ¿cuántos alumnos, docentes tiene la escuela de tu (hijo, hermano, su escuela, primo, sobrino, etc.)?¿Conoces los resultados de las evaluaciones de su escuela?…Porque estoy trabajando en el desarrollo de una aplicación que muestra todos esos datos, además, todo lo que generamos no pagamos ningún tipo de licencia para el desarrollo y para que tú puedas ver esos datos no necesitas pagar, ni registrarte, solamente te conectas a internet y ahí puedes conocer todos los datos. ¿Te gustaría conocer qué y cómo lo hacemos? Con gusto, puedo platicarte y enseñarte qué hicimos y con qué herramientas de software lo desarrollamos.
Presentado por: Cristina Romero
Estructuras de datos avanzadas: Casos de uso realesSoftware Guru
La utilización de estructuras de datos adecuadas para cada problema hace que se simplifiquen en gran medida los tiempos de respuestas y la cantidad de cómputo realizada.
Por Nelson González
Más contenido relacionado
Similar a Cómo construir una plataforma poderosa de datos en un ambiente con recursos restringidos
El término “Data Science” se ha vuelto muy popular recientemente con el aumento de popularidad de las redes sociales, análisis predictivos y el análisis de datos no estructurados como parte del crecimiento del “Big Data”. En esta sesión estaremos viendo que es “Data Science”, que necesitamos saber o aprender para poder convertirnos en un científico de datos y estaremos viendo algunos ejemplos de usos muy comunes usando lenguajes como Python, R y el cómo podemos integrar estos en SQL Server y Azure . Al final de esta charla tendrás un entendimiento más amplio de las técnicas de manejos de datos, modelamiento, visualización y los lenguajes y productos para poner tus proyectos en marcha.
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataJohn Bulla
En esta sesión veremos una introducción al nuevo lenguaje de U-SQL, que une las ventajas de SQL con el poder expresivo de su propio código donde millones de desarrolladores SQL y .NET ahora pueden procesar y analizar todos sus datos con los conocimientos que ya tienen. El apoyo del lenguaje U-SQL en Azure Data Lake Tools para Visual Studio incluye ayuda técnica para la creación, depuración y rendimiento avanzado de funciones de análisis para aumentar la productividad al optimizar los trabajos que se ejecutan a través de miles de nodos.
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Denodo
Watch full webinar here: https://bit.ly/36j4ATO
Las técnicas avanzadas de ciencia de datos, como el aprendizaje automático (machine learning), son herramientas extremadamente útiles para obtener información valiosa de los datos. Sin embargo, suponen más presión para los data scientists, que tienen que buscar los datos correctos y limpiarlos para que sean utilizables. Este proceso, al final, consume la mayor parte de su tiempo.
En este webinar, explicaremos cómo la virtualización de datos ayuda a obtener la información necesaria de una manera más eficiente y ágil. Asista para descubrir:
- Cómo la virtualización de datos acelera la adquisición y el procesamiento de datos
- Cómo la solución de virtualización de datos de Denodo se integra con herramientas como Spark, Python, Zeppelin, etc.
- Cómo la virtualización de datos permite una gestión más eficiente de grandes volúmenes de datos
- Dos casos de éxito de clientes y una demo de analítica predictiva
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasGuillermo Álvaro Rey
Lección "Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas" del Curso de Verano 2010 de la UPM: "Linked Data: ¿Una oportunidad o un riesgo?"
Wikipedia, sirviendo la totalidad del conocimiento humano con software libre
En la Fundación Wikimedia (organización sin ánimo de lucro que mantiene Wikipedia y muchos otros proyectos de conocimiento libre) trabajamos con un presupuesto financiado exclusivamente con donaciones. Con 280 empleados, y la inestimable ayuda de voluntarios, mantenemos algunas de las webs más visitadas del mundo, con miles de millones de usuarios al mes.
En esta charla se hará un breve resumen de nuestra filosofía de trabajo (respeto a la privacidad de los usuarios, uso exclusivo de software libre, desarrollo comunitario, transparencia, independencia) y de cómo funciona por dentro nuestra infraestructura técnica; así como de invitar a desarrolladores o cualquier persona con motivaciones técnica a colaborar en nuestra comunidad y proyectos, y a conocer los recursos técnicos que ofrece.
Cómo construir tu propia data platform. From zero to hero. GustavoMartin46
Esta presentación es el resultado de la ponencia presentada el día 28 de abril de 2023 en la Salmorejo Tech https://salmorejo.tech/2023/.
Con esta ponencia se buscaba explicar a una audiencia con conocimientos básicos de tecnología, las distintas herramientas que se pueden emplear para construir una plataforma de datos.
La ponencia comienza con una configuración sencilla, que prácticamente cualquier persona del mundo de la informática puede entender. Termina con una configuración compleja, donde sin entrar en muchos detalles, sí permite a la audiencia hacerse una idea de qué herramientas se requieren para implementar la solución.
En esta sesión veremos diferentes métodos para cargar datos en un cluster de HDInsight (Hadoop). Veremos como cada método es válido para: datos desde origenes OLTP, datos desde origenes sin estructura y datos a los que se dota estructura para presentarselos a HDInsight. En cada escenario se debe considerar el uso posterior que se le dará al dato para hacerlo de la forma más eficiente. Habrá casos en los que el dato se serializa con librerías .NET y en otros casos el dato se procesará como texto puro
Sabes ¿cuántos alumnos, docentes tiene la escuela de tu (hijo, hermano, su escuela, primo, sobrino, etc.)?¿Conoces los resultados de las evaluaciones de su escuela?…Porque estoy trabajando en el desarrollo de una aplicación que muestra todos esos datos, además, todo lo que generamos no pagamos ningún tipo de licencia para el desarrollo y para que tú puedas ver esos datos no necesitas pagar, ni registrarte, solamente te conectas a internet y ahí puedes conocer todos los datos. ¿Te gustaría conocer qué y cómo lo hacemos? Con gusto, puedo platicarte y enseñarte qué hicimos y con qué herramientas de software lo desarrollamos.
Presentado por: Cristina Romero
Estructuras de datos avanzadas: Casos de uso realesSoftware Guru
La utilización de estructuras de datos adecuadas para cada problema hace que se simplifiquen en gran medida los tiempos de respuestas y la cantidad de cómputo realizada.
Por Nelson González
Onboarding new members into an engineering team is not easy on anyone. In a short period of time, the new team member is required to be able to bring professional
Por Victoriya Kalmanovich
El secreto para ser un desarrollador SeniorSoftware Guru
En esta charla platicaremos sobre el “secreto” y el camino para llegar a ser un desarrollador Senior, experiencia, consejos y recomendaciones que en estos 8 años
Por René Sandoval
Apache Airflow es una plataforma en la que podemos crear flujos de datos de manera programática, planificarlos y monitorear de manera centralizada.
Por Yesi Díaz
How thick data can improve big data analysis for business:Software Guru
En esta presentación hablaré sobre cómo el Análisis de Datos Gruesos, específicamente el análisis antropológico y semiótico, puede ayudar a mejorar los resultados del Big Data
Por Martin Cuitzeo
CoDi® es la nueva forma de realizar pagos digitales desarrollada por el Banco de México. Por medio de CoDi puedes realizar cobros y pagos desde tu celular, utilizando una cuenta bancaria o de alguna institución financiera, sin comisiones.
Por Cristian Jaramillo
Gestionando la felicidad de los equipos con Management 3.0Software Guru
En las metodologías agiles hablamos de equipos colaborativos, autogestionados y felices. hablamos de lideres serviciales. El management 3.0 nos ayuda a cultivar el mindset correcto, aquel que servirá como el terreno fértil para que la agilidad florezca.
Por Andrea Vélez Cárdenas
Taller: Creación de Componentes Web re-usables con StencilJSSoftware Guru
Hoy por hoy las experiences de usuario pueden ser enriquecidas mediante el uso de Web Components, que son un estándar de la W3C soportado por la mayoría de los navegadores web modernos.
Por Alex Arriaga
Así publicamos las apps de Spotify sin stressSoftware Guru
En Spotify tenemos 1600+ ingenieros, trabajando en 280+ squads. Aún a esta escala, hemos logrado adoptar prácticas que nos han permitido acelerar la forma en que desarrollamos nuestro producto. Presentado por Erick Camacho en SG Virtual Conference 2020
Achieving Your Goals: 5 Tips to successfully achieve your goalsSoftware Guru
he measure of the executive, Peter F. Drucker reminds us, is the ability to "get the right things done." This involves having clarity on what are the right things as well as avoiding what is unproductive. Intelligence, creativity, and knowledge may all be wasted if not put to work on the things that matter.
Presentado por Cristina Nistor en SG Virtual Conference 2020
Acciones de comunidades tech en tiempos del Covid19Software Guru
Acciones de Comunidades Tech en tiempo del COVID-19 es una platica para informar acerca de las acciones que están realizando algunas comunidades de tecnología en México para luchar contra la propagación del COVID-19. Desde análisis de datos, visualizaciones, simulaciones de contagio, etc.
Presentado por Juana Martínez, Adriana Vallejo y Eduardo Ramírez en SG Virtual Conference 2020
De lo operativo a lo estratégico: un modelo de management de diseñoSoftware Guru
La charla presenta un modelo claro, generado por la ponente, para atender los niveles desde lo operativo a lo estratégico.
Presentado por Gabriela Salinas en SG Virtual Conference
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informáticavazquezgarciajesusma
En este proyecto de investigación nos adentraremos en el fascinante mundo de la intersección entre el arte y los medios de comunicación en el campo de la informática.
La rápida evolución de la tecnología ha llevado a una fusión cada vez más estrecha entre el arte y los medios digitales, generando nuevas formas de expresión y comunicación.
Continuando con el desarrollo de nuestro proyecto haremos uso del método inductivo porque organizamos nuestra investigación a la particular a lo general. El diseño metodológico del trabajo es no experimental y transversal ya que no existe manipulación deliberada de las variables ni de la situación, si no que se observa los fundamental y como se dan en su contestó natural para después analizarlos.
El diseño es transversal porque los datos se recolectan en un solo momento y su propósito es describir variables y analizar su interrelación, solo se desea saber la incidencia y el valor de uno o más variables, el diseño será descriptivo porque se requiere establecer relación entre dos o más de estás.
Mediante una encuesta recopilamos la información de este proyecto los alumnos tengan conocimiento de la evolución del arte y los medios de comunicación en la información y su importancia para la institución.
Es un diagrama para La asistencia técnica o apoyo técnico es brindada por las compañías para que sus clientes puedan hacer uso de sus productos o servicios de la manera en que fueron puestos a la venta.
3Redu: Responsabilidad, Resiliencia y Respetocdraco
¡Hola! Somos 3Redu, conformados por Juan Camilo y Cristian. Entendemos las dificultades que enfrentan muchos estudiantes al tratar de comprender conceptos matemáticos. Nuestro objetivo es brindar una solución inclusiva y accesible para todos.
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Telefónica
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0xWord escrito por Ibón Reinoso ( https://mypublicinbox.com/IBhone ) con Prólogo de Chema Alonso ( https://mypublicinbox.com/ChemaAlonso ). Puedes comprarlo aquí: https://0xword.com/es/libros/233-big-data-tecnologias-para-arquitecturas-data-centric.html
Cómo construir una plataforma poderosa de datos en un ambiente con recursos restringidos
1. Cómo construir una
plataforma poderosa de
datos en un ambiente con
recursos restringidos
Ángel Alvarado
Créditos:
Sarah Thomason - UC Berkeley: análisis de “US census data”
Fernando Bustos - iOS Dev: pruebas del código compartido en esta plática
New York Times COVID19 data:
https://www.nytimes.com/interactive/2020/us/coronavirus-us-cases.html.
Unidos compartiendo y aprendiendo
#SGVirtual
3. Unidos compartiendo y aprendiendo
#SGVirtual
● Nonprofit 10,000
miembros en USA
● 8 capítulos
● 50k migrates sin
documentos
● Buscando abrir un
capítulo en México:
dulce@techqueria.org
4. ¿Objetivo de esta platica?
Qué aprendas cómo
implementar una plataforma
de datos de bajo costo con
herramientas de software libre.
5. Agenda
● ¿Por qué una plataforma de este tipo?
● Herramientas-Arquitectura
● ¿Cómo se ve?
● Flujo de trabajo ejemplo 1
● Flujo de trabajo ejemplo 2
● Consideraciones en Producción
6. ¿Por qué crear una
plataforma de este tipo?
● No tecnología propietaria y ni elevado costo.
● Privacidad de datos
● No hay $ para invertir en personal dedicado
a ingeniería de datos
● Entry-level para desarrolladores web y móvil.
● Diferentes departamentos en tu empresa
quieren analizar datos de manera sencilla.
● Equipos muy pequeños
11. Herramientas: ¿Por qué Docker?
● Ligero y facil de instalar
● Permite empaquetar en
contenedores tus
● Facilita deployments
12. Herramientas: ¿Por qué Rails y
Mysql?
● Framework web común
● Gran comunidad
● Rails scheduler/jobs
● Database schema
● Migrations
● Mysql
● Base de datos relacional
● Escalable hasta cierto
punto
15. Herramientas: ¿Por qué Superset y
Redis?
● Alivia la carga de la
base de datos (Cache)
● Creada por
● Facilita la
representación de los
datos en D3.js
● Open source
16. ¿Y el Big Data?
● Streamsets
○ Apache spark
○ Scala, Java
○ Apache Kafka
○ Druid-HDFS
○ ElasticSearch
○ Google Cloud
○ ...
● Scheduler
○ Rails+Streamsets ó Airflow+Streamsets
● Supersets
○ Druid, Drill, Impala, BigQuery
○ ElasticSearch y muchos más
17. ¿Cuál es el flujo de desarrollo en esta
plataforma?
Caso de uso:
Preparar plataforma de datos para permitir a
investigadores y científicos analizar datos de
Covid19 en US generados por el New York
Times
18. Paso 0: Haz un fork de la plataforma y
levantala localmente
22. Paso 2: Genera tus 'data pipelines': ETL ó Streaming
● Datos Covid19
● Los datos son
https://github.com/AngelAlvarado/data-platform-with-open-source/pull/1/files
23. Paso 2: 'data pipelines': data wrangling
● Datos Covid19
● Los datos son
https://github.com/AngelAlvarado/data-platform-with-open-source/pull/1/files
38. Consideraciones para enviar a producción/staging
● Infraestructura
○ Digital Ocean, AWS/GC
○ Streamsets cloud
○ Docker compose o desacoplar aún más
● Integración continua
○ Tests
● Alertas
● Logging
● Visualizaciones y/o dashboards
○ usuarios finales
● Científicos de datos/investigadores: jupyter notebook -> analisis
39. Crea tu propia plataforma
Github:
https://github.com/AngelAlvarado/data-platform-
with-open-source
Créditos:
Sarah Thomason - UC Berkeley: análisis de “US census data”
Fernando Bustos - iOS Dev: pruebas del código compartido en esta plática
New York Times COVID19 data:
https://www.nytimes.com/interactive/2020/us/coronavirus-us-cases.html.
Unidos compartiendo y aprendiendo
#SGVirtual