Este documento describe el periodismo de base de datos (PBD), incluyendo ejemplos de noticias creadas con PBD y las operaciones involucradas como la búsqueda, extracción, procesamiento y visualización de grandes volúmenes de información. Explica herramientas como Google Drive y Fusion Tables que permiten procesar y visualizar datos para crear historias basadas en hechos.
El documento describe cómo las nuevas tecnologías están transformando la producción, circulación y consumo de información en el periodismo. Explica que la producción de noticias digitales depende de las plataformas, características del medio digital como la hipertextualidad e interactividad, y las potencialidades de Internet como la búsqueda de información. También analiza cómo la información circula a través de los medios, usuarios y aplicaciones, y cómo los usuarios consumen activamente las noticias de forma ubicua. Finalmente, resume los conocimientos y
Este documento presenta diferentes formas de registrar sitios web encontrados durante un proceso de búsqueda de información, como procesadores de texto, favoritos offline y online, discos virtuales, y capturas de pantalla. También describe tipos de fuentes de información digitales como primarias, secundarias y terciarias, e incluye ejemplos como agencias de noticias y directorios. Por último, detalla criterios para evaluar la confiabilidad de sitios web, como identificar al autor u organización responsable y verificar su afiliación.
Este documento presenta diferentes formas de registrar sitios web encontrados durante un proceso de búsqueda de información, como procesadores de texto, favoritos online y offline, discos virtuales, y capturas de pantalla. También describe fuentes primarias, secundarias y terciarias de información digital y criterios para evaluar la autoridad y contenido de sitios web, como la identificación del autor, afiliación, tipo de organización y actualización.
Este documento presenta una introducción a la investigación en Internet, describiendo los diferentes tipos de buscadores de la Web visible como directorios, motores de búsqueda y metabuscadores. Explica conceptos como la navegación web, la indización de información, y operadores de búsqueda avanzada. También desmitifica falsos supuestos sobre la calidad y cantidad de información disponible en Internet.
Este documento describe los diferentes tipos de web: la web visible, la web invisible y la web semántica. La web visible solo representa alrededor del 17% de toda la web y es indexada por los buscadores comunes. La web invisible incluye contenido privado, propietario y dinámico que no es indexado. La web semántica permitirá búsquedas más inteligentes a través de ontologías y lenguajes como OWL, RDF y SPARQL. También presenta ejemplos de buscadores como Wolfram Alpha que pueden acceder a
El documento describe las diferencias entre la WWW visible e invisible. La WWW visible es la porción indexada por buscadores y comprende solo un 17% de la web. La WWW invisible incluye contenido no indexado como páginas privadas, dinámicas o de acceso restringido. Se explican ejemplos de buscadores especializados que permiten acceder a la WWW invisible, como directorios de bases de datos científicas o Wayback Machine para ver versiones antiguas de sitios. Finalmente, se detalla el objetivo de la WWW semántica de mejorar
Este documento resume los principales cambios en los medios de comunicación, profesionales y usuarios debido a la digitalización y convergencia tecnológica. Explica que la producción, circulación y recepción de información ahora ocurren en múltiples plataformas, y que los usuarios se han vuelto más activos como "prosumidores". También describe cómo los nuevos profesionales deben ser multiplataforma y versátiles, y cómo los paradigmas de la profesión han cambiado de audiencia a usuario, de medio a conten
El documento describe diferentes formas de registrar y almacenar recursos digitales encontrados en la web. Explica que se pueden guardar las direcciones URL, el contenido de los recursos y capturas de pantalla en procesadores de texto, favoritos, discos virtuales y más. Además, define las fuentes primarias, secundarias y terciarias de información digital y ejemplos de cada tipo.
El documento describe cómo las nuevas tecnologías están transformando la producción, circulación y consumo de información en el periodismo. Explica que la producción de noticias digitales depende de las plataformas, características del medio digital como la hipertextualidad e interactividad, y las potencialidades de Internet como la búsqueda de información. También analiza cómo la información circula a través de los medios, usuarios y aplicaciones, y cómo los usuarios consumen activamente las noticias de forma ubicua. Finalmente, resume los conocimientos y
Este documento presenta diferentes formas de registrar sitios web encontrados durante un proceso de búsqueda de información, como procesadores de texto, favoritos offline y online, discos virtuales, y capturas de pantalla. También describe tipos de fuentes de información digitales como primarias, secundarias y terciarias, e incluye ejemplos como agencias de noticias y directorios. Por último, detalla criterios para evaluar la confiabilidad de sitios web, como identificar al autor u organización responsable y verificar su afiliación.
Este documento presenta diferentes formas de registrar sitios web encontrados durante un proceso de búsqueda de información, como procesadores de texto, favoritos online y offline, discos virtuales, y capturas de pantalla. También describe fuentes primarias, secundarias y terciarias de información digital y criterios para evaluar la autoridad y contenido de sitios web, como la identificación del autor, afiliación, tipo de organización y actualización.
Este documento presenta una introducción a la investigación en Internet, describiendo los diferentes tipos de buscadores de la Web visible como directorios, motores de búsqueda y metabuscadores. Explica conceptos como la navegación web, la indización de información, y operadores de búsqueda avanzada. También desmitifica falsos supuestos sobre la calidad y cantidad de información disponible en Internet.
Este documento describe los diferentes tipos de web: la web visible, la web invisible y la web semántica. La web visible solo representa alrededor del 17% de toda la web y es indexada por los buscadores comunes. La web invisible incluye contenido privado, propietario y dinámico que no es indexado. La web semántica permitirá búsquedas más inteligentes a través de ontologías y lenguajes como OWL, RDF y SPARQL. También presenta ejemplos de buscadores como Wolfram Alpha que pueden acceder a
El documento describe las diferencias entre la WWW visible e invisible. La WWW visible es la porción indexada por buscadores y comprende solo un 17% de la web. La WWW invisible incluye contenido no indexado como páginas privadas, dinámicas o de acceso restringido. Se explican ejemplos de buscadores especializados que permiten acceder a la WWW invisible, como directorios de bases de datos científicas o Wayback Machine para ver versiones antiguas de sitios. Finalmente, se detalla el objetivo de la WWW semántica de mejorar
Este documento resume los principales cambios en los medios de comunicación, profesionales y usuarios debido a la digitalización y convergencia tecnológica. Explica que la producción, circulación y recepción de información ahora ocurren en múltiples plataformas, y que los usuarios se han vuelto más activos como "prosumidores". También describe cómo los nuevos profesionales deben ser multiplataforma y versátiles, y cómo los paradigmas de la profesión han cambiado de audiencia a usuario, de medio a conten
El documento describe diferentes formas de registrar y almacenar recursos digitales encontrados en la web. Explica que se pueden guardar las direcciones URL, el contenido de los recursos y capturas de pantalla en procesadores de texto, favoritos, discos virtuales y más. Además, define las fuentes primarias, secundarias y terciarias de información digital y ejemplos de cada tipo.
Este documento presenta diferentes formas de registrar sitios web encontrados durante un proceso de búsqueda de información, como procesadores de texto, favoritos o marcadores online y offline, discos virtuales, y capturas de pantalla. También describe las fuentes primarias, secundarias y terciarias de información digitales y cómo evaluar sitios web en base a indicadores relacionados con el autor y el contenido.
Este documento resume los conceptos de Web visible, Web invisible y Web semántica. Explica que la Web invisible contiene el 95% de la información en la Web pero no puede ser indexada por buscadores comunes debido a que incluye páginas privadas, protegidas y dinámicas. También describe algunos buscadores especializados como Google, SciELO y Wayback Machine que permiten acceder a contenidos en la Web invisible. Finalmente, introduce la Web semántica como una extensión de la Web actual que permitiría búsquedas más inteligentes a trav
El documento habla sobre el registro y fuentes de información digitales. Explica que existen varias formas de registrar recursos web como guardar las direcciones URL, almacenar el contenido en un disco virtual o guardar páginas o sitios completos. También describe las fuentes primarias, secundarias y terciarias de información digital, señalando que las primarias incluyen comunicaciones directas, noticias de ciudadanos, agencias de noticias y otros recursos como libros, revistas e informes de investigación.
El documento describe las diferentes capas de la World Wide Web, incluyendo la Web Visible, Invisible y Semántica. Explica que la Web Invisible contiene información que no puede ser indexada por buscadores comunes como la Web Privada, Opaca y Propietaria. También describe algunos buscadores especializados como Communication Invisible y SciELO que permiten acceder a la Web Invisible a través de búsquedas por categorías o palabras clave. Finalmente, introduce el concepto de Web Semántica y su objetivo de mejorar las búsquedas a través
Este documento describe el uso de las redes sociales y plataformas digitales en diferentes contextos como la educación, el entretenimiento y la distribución de información. Explica algunas redes sociales populares como Facebook, YouTube y Twitter y cómo se usan para compartir contenido y conectarse con otros. También cubre plataformas para blogs, hojas de cálculo en línea y almacenamiento en la nube. Concluye que las redes sociales son importantes para que las empresas aumenten las ventas al permitir una mayor exposición y una interacción más directa con
La vigilancia tecnológica implica el seguimiento sistemático de fuentes de información para detectar cambios tecnológicos, de mercado y competidores. Esto permite a las empresas anticiparse a las tendencias y tomar decisiones estratégicas. El documento describe varias herramientas y técnicas para realizar la vigilancia tecnológica, como Google Alerts, redes sociales, RSS y motores de búsqueda personalizados. También explica cómo gestionar y compartir la información obtenida dentro de la empresa.
informe sobre motores de búsqueda y herramientas web Nelly Perez
Este documento describe los motores de búsqueda y las páginas web. Explica que los motores de búsqueda como Google son aplicaciones de software que encuentran recursos digitales al ingresar palabras clave. También describe que las páginas web presentan información en varios formatos y son útiles para que las empresas se den a conocer y capturen nuevos clientes de forma global las 24 horas del día.
El documento describe las fases del proceso de producción y comunicación de periodismo de datos, incluyendo compilar, limpiar y contextualizar datos, combinar múltiples conjuntos de datos, visualizar la información, narrar historias, compartir análisis y conectar los datos con las personas. También proporciona ejemplos de herramientas útiles para cada fase.
Este documento describe la "Internet profunda" y cómo funciona. La Internet profunda consiste en páginas web dinámicas y bases de datos que no son indexadas por los motores de búsqueda tradicionales. Representa aproximadamente el 95% de toda la información en Internet. Aunque es difícil acceder a ella, contiene una enorme cantidad de datos valiosos de varios dominios como ingeniería, finanzas, medicina y más. Los motores de búsqueda continúan mejorando para poder acceder e indexar más efectivamente la información en la Internet profunda.
Este documento presenta una introducción a los recursos de información en ciencia y tecnología. Explica que las redes de información son espacios virtuales para el intercambio de conocimientos entre especialistas a nivel mundial, regional y local. También describe portales y núcleos de investigación en Internet, así como bases de datos especializadas que proveen información de alta calidad en diferentes campos.
1. Capacitar a periodistas ciudadanos y profesionales de América Latina para acceder, procesar y publicar información sobre desarrollo sostenible.
2. Lograr que los periodistas aprendan a movilizar audiencias y obtener apoyo para cubrir estos temas.
3. Orientar a cada participante en proponer un proyecto periodístico sobre el curso.
Presentación sobre herramientas digitales para la cobertura periodística del desarrollo sostenible presentada durante los cursos del Centro de Periodismo Digital.
La importancia de la web y sus buscadores se resume en 3 puntos: 1) Han permitido compartir conocimiento de manera creativa y atractiva para estudiantes y maestros, 2) Han mejorado la comunicación mundial de forma rápida y económica, y 3) Son herramientas indispensables para la educación que deben dominarse para no quedar rezagados tecnológicamente.
El documento presenta un curso sobre el uso de Internet que consta de 4 encuentros. El primer encuentro explica qué es Internet, sus servicios principales como correo electrónico y chat, y cómo funciona a través de sitios web, direcciones URL y navegadores. También muestra los beneficios y limitaciones de Internet para la educación.
Este documento presenta estrategias y herramientas para la investigación en línea. Se discuten nuevas formas de producción y estructuración de la información en la web, así como recursos confiables para la investigación como sitios académicos, índices y bases de datos. También se explican estrategias como identificar palabras clave, usar operadores booleanos y evaluar la calidad de los sitios web.
Los Navegadores, su uso, algunas estadísticas.
Búsquedas, ciclo de una búsqueda, motores de búsquedas, recuperar información de la Web.
Profesores: Jorge Luis Quintero Valera y Marelvy Sanoja Torres.
Programa de Estudios Avanzados.
Vicerrectorado de Producción Agrícola.
UNELLEZ, Guanare, Portuguesa, Venezuela
Este documento trata sobre la Web Semántica. Explica que la Web Semántica busca dotar de significado a los datos en la web a través de etiquetas especiales que permiten a los computadores comprender el contenido. También describe cómo funciona la Web Semántica a través del uso de metadatos y lenguajes como RDF para establecer relaciones semánticas entre datos. Finalmente, presenta algunos ejemplos de proyectos de Web Semántica como DBpedia y sitios web que han adoptado este enfoque.
Este documento presenta una introducción a la Web Semántica. Explica las diferencias entre la Web 1.0, 2.0 y 3.0 (Web Semántica), y cómo esta última permite a las máquinas ayudar a buscar y generar información. También resume las tecnologías clave de la Web Semántica como RDF, OWL y SPARQL, y menciona algunos proyectos y herramientas relacionadas.
Este documento habla sobre el periodismo de datos y contiene tres oraciones o menos:
El periodismo de datos implica la búsqueda, extracción, procesamiento y visualización de grandes volúmenes de información para crear noticias. Incluye el periodismo de investigación, precisión, análisis y asistido por computadora. Explica las herramientas y métodos para cada una de estas operaciones.
El documento describe qué es Big Data. Explica que se refiere a conjuntos de datos tan grandes que son difíciles de manejar con herramientas de bases de datos tradicionales de manera rentable. Describe las características clave de Big Data como el gran volumen, variedad y velocidad de los datos, así como la importancia de que la información sea válida. Explica conceptos como Hadoop, MapReduce y Cloudera, que son tecnologías clave para el procesamiento de Big Data.
Visualización de datos con Tableau Public - Comité de InvestigaciónIAB México
Este documento presenta una introducción a la visualización de datos con Tableau Public para el Comité de Investigación de IAB México. Explica los objetivos de mostrar las características básicas de Tableau y practicar con una base de datos de ejemplo. Incluye secciones sobre los antecedentes de la visualización de datos, Tableau Software, una demostración práctica y recomendaciones para continuar el aprendizaje.
Este documento describe diferentes tipos de redes, incluyendo LAN (redes de área local), MAN (redes de área metropolitana), WAN (redes de amplia cobertura), e incluye ejemplos de cada tipo. También menciona varios navegadores populares como Google, Ask Jeeves, Scroogle y Hakia, resumiendo brevemente sus características.
Este documento presenta diferentes formas de registrar sitios web encontrados durante un proceso de búsqueda de información, como procesadores de texto, favoritos o marcadores online y offline, discos virtuales, y capturas de pantalla. También describe las fuentes primarias, secundarias y terciarias de información digitales y cómo evaluar sitios web en base a indicadores relacionados con el autor y el contenido.
Este documento resume los conceptos de Web visible, Web invisible y Web semántica. Explica que la Web invisible contiene el 95% de la información en la Web pero no puede ser indexada por buscadores comunes debido a que incluye páginas privadas, protegidas y dinámicas. También describe algunos buscadores especializados como Google, SciELO y Wayback Machine que permiten acceder a contenidos en la Web invisible. Finalmente, introduce la Web semántica como una extensión de la Web actual que permitiría búsquedas más inteligentes a trav
El documento habla sobre el registro y fuentes de información digitales. Explica que existen varias formas de registrar recursos web como guardar las direcciones URL, almacenar el contenido en un disco virtual o guardar páginas o sitios completos. También describe las fuentes primarias, secundarias y terciarias de información digital, señalando que las primarias incluyen comunicaciones directas, noticias de ciudadanos, agencias de noticias y otros recursos como libros, revistas e informes de investigación.
El documento describe las diferentes capas de la World Wide Web, incluyendo la Web Visible, Invisible y Semántica. Explica que la Web Invisible contiene información que no puede ser indexada por buscadores comunes como la Web Privada, Opaca y Propietaria. También describe algunos buscadores especializados como Communication Invisible y SciELO que permiten acceder a la Web Invisible a través de búsquedas por categorías o palabras clave. Finalmente, introduce el concepto de Web Semántica y su objetivo de mejorar las búsquedas a través
Este documento describe el uso de las redes sociales y plataformas digitales en diferentes contextos como la educación, el entretenimiento y la distribución de información. Explica algunas redes sociales populares como Facebook, YouTube y Twitter y cómo se usan para compartir contenido y conectarse con otros. También cubre plataformas para blogs, hojas de cálculo en línea y almacenamiento en la nube. Concluye que las redes sociales son importantes para que las empresas aumenten las ventas al permitir una mayor exposición y una interacción más directa con
La vigilancia tecnológica implica el seguimiento sistemático de fuentes de información para detectar cambios tecnológicos, de mercado y competidores. Esto permite a las empresas anticiparse a las tendencias y tomar decisiones estratégicas. El documento describe varias herramientas y técnicas para realizar la vigilancia tecnológica, como Google Alerts, redes sociales, RSS y motores de búsqueda personalizados. También explica cómo gestionar y compartir la información obtenida dentro de la empresa.
informe sobre motores de búsqueda y herramientas web Nelly Perez
Este documento describe los motores de búsqueda y las páginas web. Explica que los motores de búsqueda como Google son aplicaciones de software que encuentran recursos digitales al ingresar palabras clave. También describe que las páginas web presentan información en varios formatos y son útiles para que las empresas se den a conocer y capturen nuevos clientes de forma global las 24 horas del día.
El documento describe las fases del proceso de producción y comunicación de periodismo de datos, incluyendo compilar, limpiar y contextualizar datos, combinar múltiples conjuntos de datos, visualizar la información, narrar historias, compartir análisis y conectar los datos con las personas. También proporciona ejemplos de herramientas útiles para cada fase.
Este documento describe la "Internet profunda" y cómo funciona. La Internet profunda consiste en páginas web dinámicas y bases de datos que no son indexadas por los motores de búsqueda tradicionales. Representa aproximadamente el 95% de toda la información en Internet. Aunque es difícil acceder a ella, contiene una enorme cantidad de datos valiosos de varios dominios como ingeniería, finanzas, medicina y más. Los motores de búsqueda continúan mejorando para poder acceder e indexar más efectivamente la información en la Internet profunda.
Este documento presenta una introducción a los recursos de información en ciencia y tecnología. Explica que las redes de información son espacios virtuales para el intercambio de conocimientos entre especialistas a nivel mundial, regional y local. También describe portales y núcleos de investigación en Internet, así como bases de datos especializadas que proveen información de alta calidad en diferentes campos.
1. Capacitar a periodistas ciudadanos y profesionales de América Latina para acceder, procesar y publicar información sobre desarrollo sostenible.
2. Lograr que los periodistas aprendan a movilizar audiencias y obtener apoyo para cubrir estos temas.
3. Orientar a cada participante en proponer un proyecto periodístico sobre el curso.
Presentación sobre herramientas digitales para la cobertura periodística del desarrollo sostenible presentada durante los cursos del Centro de Periodismo Digital.
La importancia de la web y sus buscadores se resume en 3 puntos: 1) Han permitido compartir conocimiento de manera creativa y atractiva para estudiantes y maestros, 2) Han mejorado la comunicación mundial de forma rápida y económica, y 3) Son herramientas indispensables para la educación que deben dominarse para no quedar rezagados tecnológicamente.
El documento presenta un curso sobre el uso de Internet que consta de 4 encuentros. El primer encuentro explica qué es Internet, sus servicios principales como correo electrónico y chat, y cómo funciona a través de sitios web, direcciones URL y navegadores. También muestra los beneficios y limitaciones de Internet para la educación.
Este documento presenta estrategias y herramientas para la investigación en línea. Se discuten nuevas formas de producción y estructuración de la información en la web, así como recursos confiables para la investigación como sitios académicos, índices y bases de datos. También se explican estrategias como identificar palabras clave, usar operadores booleanos y evaluar la calidad de los sitios web.
Los Navegadores, su uso, algunas estadísticas.
Búsquedas, ciclo de una búsqueda, motores de búsquedas, recuperar información de la Web.
Profesores: Jorge Luis Quintero Valera y Marelvy Sanoja Torres.
Programa de Estudios Avanzados.
Vicerrectorado de Producción Agrícola.
UNELLEZ, Guanare, Portuguesa, Venezuela
Este documento trata sobre la Web Semántica. Explica que la Web Semántica busca dotar de significado a los datos en la web a través de etiquetas especiales que permiten a los computadores comprender el contenido. También describe cómo funciona la Web Semántica a través del uso de metadatos y lenguajes como RDF para establecer relaciones semánticas entre datos. Finalmente, presenta algunos ejemplos de proyectos de Web Semántica como DBpedia y sitios web que han adoptado este enfoque.
Este documento presenta una introducción a la Web Semántica. Explica las diferencias entre la Web 1.0, 2.0 y 3.0 (Web Semántica), y cómo esta última permite a las máquinas ayudar a buscar y generar información. También resume las tecnologías clave de la Web Semántica como RDF, OWL y SPARQL, y menciona algunos proyectos y herramientas relacionadas.
Este documento habla sobre el periodismo de datos y contiene tres oraciones o menos:
El periodismo de datos implica la búsqueda, extracción, procesamiento y visualización de grandes volúmenes de información para crear noticias. Incluye el periodismo de investigación, precisión, análisis y asistido por computadora. Explica las herramientas y métodos para cada una de estas operaciones.
El documento describe qué es Big Data. Explica que se refiere a conjuntos de datos tan grandes que son difíciles de manejar con herramientas de bases de datos tradicionales de manera rentable. Describe las características clave de Big Data como el gran volumen, variedad y velocidad de los datos, así como la importancia de que la información sea válida. Explica conceptos como Hadoop, MapReduce y Cloudera, que son tecnologías clave para el procesamiento de Big Data.
Visualización de datos con Tableau Public - Comité de InvestigaciónIAB México
Este documento presenta una introducción a la visualización de datos con Tableau Public para el Comité de Investigación de IAB México. Explica los objetivos de mostrar las características básicas de Tableau y practicar con una base de datos de ejemplo. Incluye secciones sobre los antecedentes de la visualización de datos, Tableau Software, una demostración práctica y recomendaciones para continuar el aprendizaje.
Este documento describe diferentes tipos de redes, incluyendo LAN (redes de área local), MAN (redes de área metropolitana), WAN (redes de amplia cobertura), e incluye ejemplos de cada tipo. También menciona varios navegadores populares como Google, Ask Jeeves, Scroogle y Hakia, resumiendo brevemente sus características.
El documento describe el proceso de creación de un portal de datos abiertos en el Ayuntamiento de Lorca en España. Comenzaron reutilizando datos tras el verano de 2013 y crearon un software llamado SEPADA para extraer y publicar datos de manera automatizada desde diferentes bases de datos. Lanzaron su versión alpha de datos.lorca.es en octubre de 2013 con 21 conjuntos de datos.
Este documento presenta una introducción a Big Data, definiendo sus características principales y tecnologías clave. Explica que Big Data involucra grandes cantidades de datos estructurados y no estructurados que requieren nuevas formas de procesamiento. También describe herramientas como Hadoop, bases de datos NoSQL e in-memory que permiten el análisis de grandes datos. Concluye que Big Data cambia la forma en que las empresas toman decisiones y recomienda crear repositorios centralizados de metadatos para aprovechar al máximo los
Este documento presenta una introducción al periodismo de datos. Explica cómo las herramientas digitales permiten acceder y analizar grandes cantidades de datos, detectar patrones e informar a la sociedad. También cubre temas como datos abiertos, extracción de datos, análisis estadístico, visualización de datos y ejemplos exitosos de periodismo de datos. El objetivo final es que los periodistas usen un enfoque basado en datos para mejorar la calidad de la información disponible para el público.
Este documento presenta lineamientos para el diseño de salida de un sistema de información. Explica que es importante identificar las necesidades de salida del sistema y los objetivos del diseño de salida. Asimismo, detalla cómo se debe presentar la información de manera clara, siguiendo pautas para el uso de tablas, gráficas e iconos. Finalmente, analiza los diferentes tipos de diseño de salida, tanto impresa como en pantalla.
El documento define Big Data como grandes cantidades de datos estructurados, no estructurados y semiestructurados que son difíciles de procesar con herramientas tradicionales. Explica que Big Data se refiere generalmente a petabytes y exabytes de datos y proporciona ejemplos de fuentes como redes sociales, dispositivos móviles, registros transaccionales y biométricos. Describe los componentes clave de una plataforma Hadoop para el análisis de Big Data y cómo los científicos e investigadores están aprovech
This repository was created as a final project of the Big Data subject at the University of Cuenca. The objective was to demonstrate the knowledge acquired throughout the semester with the development of an application that queries about the data of historical flights of United States airlines. This project was designed to work as a front-end on a lambda architecture implemented with Hadoop-Spark on the backend.
Check the live demo here: https://sparkend-hosting.web.app/
Source code here: https://github.com/TheWorstOne/Sparkend
Este documento presenta información sobre bases de datos. Incluye preguntas sobre la definición de una base de datos, ejemplos de su implementación, elementos que las componen, la función de un motor de base de datos, la importancia de los sistemas de base de datos, programas para crear y administrar bases de datos, y la definición de un SGBD. También incluye respuestas a las preguntas planteadas sobre estos temas.
Este documento presenta preguntas sobre bases de datos. Proporciona ejemplos de cómo se pueden implementar bases de datos en diferentes contextos como un centro de estudios, una colección de música y un hospital. También describe los elementos que componen una base de datos como tablas, consultas, formularios e informes. Explica el propósito de un motor de base de datos y algunos programas populares para crear y administrar bases de datos como SQL Server, MySQL, Access y Oracle.
BigData se refiere a las herramientas para manipular, gestionar y analizar grandes volúmenes de datos de diversos tipos. El documento describe cómo el aumento de usuarios de Internet y la disminución de costos de almacenamiento llevaron a un crecimiento exponencial de datos, haciendo que las empresas se enfocaran en BigData para mejorar la experiencia del usuario, hacer predicciones, personalizar productos y comprender mejor el negocio. También resume las tecnologías clave de procesamiento como MapReduce, Hadoop, Spark y Storm.
En esta sesión se presentarán ejemplos de cómo realizar análisis de big data con Power View integrado con HDInsight y HortonWorks. Se mostrarán las mejores prácticas para visualizar grandes cantidades de datos con herramientas de Excel como PowerPivot y Power View accediendo a datos almacenados en HDInsight.
Este documento presenta información sobre la materia de informática. Explica conceptos clave como periféricos, herramientas de ofimática como Word, Excel y PowerPoint. Incluye tutoriales para el uso de herramientas web 2.0 como Google Drive y SlideShare. Los objetivos son conocer estas herramientas y poder aplicarlas en el ámbito académico.
Taller orientado a trabajar las mejores prácticas en la presentación de datos, familiarizarse con el movimiento Open Data, explorar distintos repositorios de datos y conocer algunas características de Business Intelligence.
Este documento presenta una introducción a las arquitecturas y herramientas de Big Data. Explica conceptos clave como volumen, velocidad y variedad de datos, y muestra casos de uso comunes como la administración pública y el transporte. Luego describe las arquitecturas de referencia de Hadoop, incluidos HDFS para almacenamiento y YARN para recursos, y herramientas como MapReduce, Spark y Sqoop para procesamiento por lotes e ingesta de datos.
Sabes ¿cuántos alumnos, docentes tiene la escuela de tu (hijo, hermano, su escuela, primo, sobrino, etc.)?¿Conoces los resultados de las evaluaciones de su escuela?…Porque estoy trabajando en el desarrollo de una aplicación que muestra todos esos datos, además, todo lo que generamos no pagamos ningún tipo de licencia para el desarrollo y para que tú puedas ver esos datos no necesitas pagar, ni registrarte, solamente te conectas a internet y ahí puedes conocer todos los datos. ¿Te gustaría conocer qué y cómo lo hacemos? Con gusto, puedo platicarte y enseñarte qué hicimos y con qué herramientas de software lo desarrollamos.
Presentado por: Cristina Romero
El documento proporciona información sobre las Tecnologías de la Información y la Comunicación (TIC), incluyendo definiciones, ejemplos de aplicaciones como Google Drive y Docs, ventajas y desventajas, y pasos para usar Google Drive. También incluye secciones sobre buscadores, metabuscadores, Internet, mapas mentales, Excel y editores de video.
Durante el desarrollo embrionario, las células se multiplican y diferencian para formar tejidos y órganos especializados, bajo la regulación de señales internas y externas.
En la ciudad de Pasto, estamos revolucionando el acceso a microcréditos y la formalización de microempresarios informales con nuestra aplicación CrediAvanza. Nuestro objetivo es empoderar a los emprendedores locales proporcionándoles una plataforma integral que facilite el acceso a servicios financieros y asesoría profesional.
Ofrecemos herramientas y metodologías para que las personas con ideas de negocio desarrollen un prototipo que pueda ser probado en un entorno real.
Cada miembro puede crear su perfil de acuerdo a sus intereses, habilidades y así montar sus proyectos de ideas de negocio, para recibir mentorías .
1. TECNOLOGÍA DE LATECNOLOGÍA DE LA
COMUNICACIÓN I
Lic. en Periodismo
Periodismo Universitario
FCH-UNSL (Año 2015)
2. CLASE IV
“PERIODISMO DE BASE DE DATOS:
BÚSQUEDA, EXTRACCIÓN,
PROCESAMIENTO Y VISUALIZACIÓNPROCESAMIENTO Y VISUALIZACIÓN
DE GRANDES VOLÚMENES DE
INFORMACIÓN”
CREATIVE COMMONS RECONOCIMIENTO-NOCOMERCIAL-
COMPARTIRIGUAL 3.0 UNPORTED LICENSE
3. ¿QUÉ ES EL PERIODISMO DE BASE DE
DATOS (PBD)?
Es una manera de crear o complementar noticias haciendo uso de los datos
existentes en la WWW.
Incluye el PI (periodismo de investigación) para revelar una verdad social
desconocida; el PP (periodismo de precisión) cuando aplica métodos de la
investigación social, el PA (periodismo analítico) porque analiza una realidad
compleja para lograr la comprensión del público y el PAC (periodismo asistido porcompleja para lograr la comprensión del público y el PAC (periodismo asistido por
computadora) para el análisis estadístico de los datos.
4. EJEMPLOS DE NOTICIAS CON PBD
ARTÍCULOS BASADOS EN DATOS
Se desarrollan en base a información ya existente en la red. Son artículos de corta a
mediana extensión (http://www.lanacion.com.ar/1484852-los-millones-de-la-ape-
como-se-repartio-en-2011-la-caja-que-era-de-moyano)
6. Al igual que en el
caso anterior se
basan en
información ya
existente en la red.
EJEMPLOS DE NOTICIAS CON PBD
VISUALIZACIONES INTERACTIVAS
La diferencia
radica en las
noticias, en las que
un título o
descripción basta.
(http://www.lanacio
n.com.ar/1546303-
los-bienes-de-los-
funcionarios-en-la-
primera-news-
application-de-la-
nscion)
8. Son recopilados por los propios periodistas debido a la ausencia de acceso
abierto por parte de las organizaciones
(http://data.lanacion.com.ar/dashboards/5068/inflacion-y-precios)
EJEMPLOS DE NOTICIAS CON PBD
CONJUNTO DE DATOS ABIERTOS
9. Son desarrolladas por periodistas y programadores
(http://gastopublicobahiense.org). Permiten agrupar y analizar variables
mediante diversos parámetros..
EJEMPLOS DE NOTICIAS CON PBD
APLICACIONES DE NOTICIAS
11. Publican la información en blogs
(http://soloopendata.blogspot.com.ar/)
EJEMPLOS DE NOTICIAS CON PBD
BLOGS DE DATOS
12. Se encuentran dentro de una sección de un medio digital
(http://www.lanacion.com.ar/data)
EJEMPLOS DE NOTICIAS CON PBD
CANALES DE DATOS
13. OPERACIONES QUE IMPLICA
EL PBD
•BÚSQUEDA•BÚSQUEDA
•EXTRACCIÓN
•PROCESAMIENTO y
•VISUALIZACIÓN de la
información…
14. OPERACIONES DEL PBD
BÚSQUEDA DE DATOS:
Puede ser realizada…
-mediante buscadores de la Web Invisible (Google Búsqueda Avanzada, Google
Scholar, Scielo, Wayback Machine, Socialmention, Twitterfall, etc.)
15. OPERACIONES DEL PBD
BÚSQUEDA DE DATOS:
Puede ser realizada…
-mediante buscadores internos de sitios web que almacenan bases de datos
(por ej. del sitio del Boletín Oficial del Gobierno de la Provincia de San Luis, del
Ministerio de Educación de San Luis, etc.)
16. OPERACIONES DEL PBD
EXTRACCIÓN o SCRAPING DE
DATOS:
Cuando los datos no son abiertos, es decir, no permiten la descarga y/o
copias de la información (por ej. se encuentran en un formato .pdf y no
.xls o .csv) se puede hacer uso de herramientas que nos permitan
acceder a los datos abiertos, antes de tener que producirla de forma
manual.
Las herramientas que se utilizan son:
- OCR
- ZAMZAR
- NITRO PDF,
- TABULA, etc.
18. EXTRACCIÓN MEDIANTE OCR
OPERACIONES DEL PBD
Puede utilizarse para extraer el texto de la primera página de un
documento y en la actualidad se está perfeccionando para convertir
hasta las primeras 10 páginas de un documento.
19. Permite extraer el
contenido textual y
gráfico de un
documento y el envío
de la conversión se
EXTRACCIÓN MEDIANTE ZAMZAR
OPERACIONES DEL PBD
de la conversión se
realiza por email.
Actualmente es uno
de los sitios en línea
gratuito cuyo proceso
de conversión
funciona.
20. EXTRACCIÓN MEDIANTE NITRO PDF
OPERACIONES DEL PBD
Funciona de modo similar a ZAMZAR, pero es gratuito durante un
período de prueba. Al finalizar el mismo, se debe comprar el software
para continuar su uso. Es muy completo y funciona muy bien.
21. Permite extraer textos
y gráficos, a través de
un programa gratuito
que se instala en la
computadora y realiza
el proceso de
EXTRACCIÓN MEDIANTE TABULA
OPERACIONES DEL PBD
el proceso de
extracción por partes.
Su uso es
independiente de la
conexión a Internet y
garantiza su
durabilidad en el
tiempo.
22. Implica la creación y/o procesamiento de los datos
a través de diversas herramientas:
PROCESAMIENTO
OPERACIONES DEL PBD
a través de diversas herramientas:
-Google Drive (gratuita y de rápido acceso)
-Socrata, Document Cloud y Junar (son de código
abierto o pagas, especializadas, profesionales, y
exigen condiciones antes de permitir el uso del
servicio).
23. PROCESAMIENTO CON DOCUMENT CLOUD
OPERACIONES DEL PBD
Es de código abierto y puede ser utilizada por periodistas u otro
usuario que realice PBD. Exige muestra de informes y permisos
para ser contribuyente. Tarda al menos dos semanas para la
otorgación de una cuenta.
24. PROCESAMIENTO CON SOCRATA Y JUNAR
OPERACIONES DEL PBD
Son utilizadas por importantes medios de comunicación del mundo que
abogan por el acceso abierto a los datos. Permiten la descarga de una
versión de demostración antes de decidirse pagar por el servicio. Son
muy completas, potentes y poseen ayuda y soporte en línea.
25. PROCESAMIENTO CON GOOGLE DRIVE
OPERACIONES DEL PBD
Es la aplicación que utilizaremos porque posibilita que el periodista
pueda, a través de una hoja de cálculo, administrar gran cantidad de
datos de forma gratuita y operar con ellos mediante diversos tipos de
fórmulas. Además, es de rápido acceso y permite la integración con
aplicaciones en línea que permiten su visualización de forma gráfica.
26. Requiere del análisis profundo de los datos para decidir no solo qué formulas usar,
sino también en qué casos hacerlo
(https://docs.google.com/spreadsheet/ccc?key=0AgX1zNUFm5hcdEVPNjY0cUpWV
GVQYl9jQ2pNQlUwc0E&usp=drive_web#gid=7)
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
27. Con los datos de una planilla pueden efectuarse diversos cálculos. Los más
comunes son:
A B C
1 2010 2011
2 Ecuador 372,163 409,125
3 El Salvador 2,918 3,574
4 Guatemala 1,738 1,959
MAX
Permite obtener el mayor valor de
un conjunto de datos.
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
Dominicana 84,721 90,278
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR
PROMEDIO
un conjunto de datos.
En su sintaxis pide que se coloque
el primer y último valor del rango de
datos separado por el símbolo “:”
=MAX (B2:B10)
=MAX (C2:C10)
28. A B C
1 2010 2011
2 Ecuador 372,163 409,125
3 El Salvador 2,918 3,574
4 Guatemala 1,738 1,959
MIN
Permite obtener el mínimo valor de
un conjunto de datos.
En su sintaxis pide que se coloque
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
Dominicana 84,721 90,278
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR 1,172 1,291
PROMEDIO
el primer y último valor del rango de
datos separado por el símbolo “:”
=MIN (B2:B10)
=MIN (C2:C10)
29. A B C
1 2010 2011
2 Ecuador 372,163 409,125
3 El Salvador 2,918 3,574
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
PROMEDIO
Permite obtener el valor
promedio de un conjunto de
datos.
En su sintaxis pide que se
coloque el primer y último
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
Dominicana 84,721 90,278
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR 1,172 1,291
PROMEDIO 71,6122222 78,5242222
coloque el primer y último
valor del rango de datos
separado por el símbolo “:”
=AVERAGE (B2:B10)
=AVERAGE (C2:C10)
30. EXISTEN OTRAS FORMULAS QUE PODEMOS
APLICAR, ENTRE ELLAS:
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD
APLICAR, ENTRE ELLAS:
- Mode (Moda): devuelve el valor que más se
repite dentro de un conjunto de datos.
- Median: devuelve el valor que deja el mismo
número de datos antes y después que él.
- Varianza: devuelve la dispersión entre datos,
etc.
31. Para el procesamiento de datos numéricos
en general existen además numerosas
PROCESAMIENTO
OPERACIONES DEL PBD
en general existen además numerosas
herramientas en línea, entre ellas:
- Calculadoras virtuales (comunes,
científicas, de porcentaje, etc.)
- Conversores de unidades (de área,
volumen, longitud, etc.)
34. Implica representar los datos en una
VISUALIZACIÓN
OPERACIONES DEL PBD
Implica representar los datos en una
forma gráfica que facilite su interpretación
por parte de los lectores.
Aquí se utilizan herramientas como
Tableau Public, Datawrapper y
Google Fusion Tables.
35. VISUALIZACIÓN CON TABLEU PUBLIC
OPERACIONES DEL PBD
Es complejo en su manejo porque requiere de un minucioso y
controlado proceso a la hora de subir los conjuntos de datos y
obtener su visualización. Su uso es gratuito.
36. VISUALIZACIÓN CON TABLEU PUBLIC
OPERACIONES DEL PBD
Otorga un código en Java Script que permite su inserción dentro de
un sitio web. Es importante tener instalado en la PC la última
versión de Java para que Tableu Public funcione adecuadamente.
37. VISUALIZACIÓN CON DATA WRAPPER
OPERACIONES DEL PBD
Es más sencillo y posee menores restricciones. Requiere registro al
igual que Tableau Public y brinda código de programación para su
inserción en sitios web.
38. VISUALIZACIÓN CON DATA WRAPPER
OPERACIONES DEL PBD
Al igual que en Tableau Public las planillas pueden ser generadas
en el mismo sitio o bien importadas en formato .xls o .csv
(estándares para los grandes volúmenes de datos).
39. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Es la aplicación que utilizaremos pues aunque se encuentra aún en
fase de experimentación y no posee un proceso de trabajo sencillo,
es gratuita y permite la interacción con otras aplicaciones de Google,
como las planillas de cálculo creadas en Drive.
40. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Al crear una nueva fusión de tablas, el programa nos solicita la hoja
de datos que podrá estar almacenada en la computadora, en línea, o
bien, deberá ser creada desde cero. En este caso particular los datos
ya se encuentran en línea (opción Spreadsheets).
41. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Cuando los datos están en línea deben ser seleccionados y
posteriormente autorizados para poder dar inicio al proceso de
fusión de los datos.
42. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Solo si los datos importados son correctos, se visualizarán
satisfactoriamente y se podrá continuar con el siguiente paso.
43. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
El título del gráfico, autor, enlaces relacionados (si posee) y
descripción son también importantes de definir previa generación de
la visualización.
44. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Finalmente, la visualización admite diversas posibilidades: mapa,
gráficos, resumen, etc. Las más utilizadas son las dos primeras.
46. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Visualización
mediante un
gráfico de
COLUMNAS
(todos los(todos los
países en
todos los
años)
47. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Visualización mediante un
gráfico CIRCULAR (todos los
países en un año en particular)
48. VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Visualización
mediante un gráfico
CARDS (útil para
pocos datos porque
permite concentrar enpermite concentrar en
una sola vista toda la
información de la que
se dispone )
49. VISUALIZACIÓN CON GOOGLE FUSION
TABLES
OPERACIONES DEL PBD
EMBEBER GRÁFICOS EN UN SITIO WEB
Posibilita insertar uno o más gráficos generados en la
aplicación Google Fusion Tables en un sitio web.
Para ello se debe:
• Hacer públicas la/s tabla/s generada/s en esta aplicación
(no se puede compartir lo que no está permitido)
• Obtener el código de inserción provisto por cada tipo de
gráfico (solo tiene sentido si la/s tabla/s son pública/s)…
50. VISUALIZACIÓN CON GOOGLE FUSION
TABLES
OPERACIONES DEL PBD
HACER PÚBLICAS LAS TABLAS EN DRIVE
Permite el posterior acceso a las mismas desde la Web…
51. VISUALIZACIÓN CON GOOGLE FUSION
TABLES
OPERACIONES DEL PBD
OBTENER EL CÓDIGO DE INSERCIÓN DE CADA GRÁFICO
Permite insertar un gráfico como parte de los contenidos de un
sitio ya existente…
52. FIN DE PRESENTACIÓN
Gracias por su atención…
Elaborado por Prof. Viviana M. Ponce
vmponce@unsl.edu.ar
Fac. de Cs. Humanas- UNSL