Visuse es un metabuscador que clasifica y muestra los resultados de búsqueda de forma visual centrándose en contenido multimedia. Usa Python, Django y JavaScript para comunicarse con buscadores como YouTube y Flickr, organizar los resultados y mostrarlos de manera optimizada en el navegador del usuario.
Presentación realizada para el CUSL nacional.
Se puede probar la última versión de Visuse en www.visuse.com
Más información sobre el proyecto en http://visuse.wordpress.com
ANÁLISIS MEDIANTE SIG DEL APROVECHAMIENTO POTENCIAL PASCÍCOLA
EN ZONAS FORESTALES: APLICACIÓN A LA COMUNIDAD AUTÓNOMA DE LA RIOJA
Y SU INTEGRACIÓN EN EL SIGPAC.
Presentación realizada para el CUSL nacional.
Se puede probar la última versión de Visuse en www.visuse.com
Más información sobre el proyecto en http://visuse.wordpress.com
ANÁLISIS MEDIANTE SIG DEL APROVECHAMIENTO POTENCIAL PASCÍCOLA
EN ZONAS FORESTALES: APLICACIÓN A LA COMUNIDAD AUTÓNOMA DE LA RIOJA
Y SU INTEGRACIÓN EN EL SIGPAC.
Lessons learnt from applying PyData to GetYourGuide marketingJose Luis Lopez Pino
For all e-commerce sites, marketing is a big part of the business and marketing efficiency and effectiveness are critical to their success. Companies must make many data-driven decisions in order to reach customers that their competitors don’t, maximize the revenue of each click, decide wisely what are the costs to cut, enter new markets, etc.
GetYourGuide has been working for more than two years on building a marketing intelligence that allows us growing our marketing efforts in the travel market without building a huge team or buying extremely expensive tools.
All the decisions are supported by a dedicated system that runs on the PyData stack that allows marketers to extract valuable insights from data and performs critical marketing tasks: keyword mining, campaign automation, predictive modeling, omni-channel marketing data integration, customer segmentation, pattern mining from click data, etc.
As a result of this, we were able to scale up 3 times our marketing efforts, launch campaigns in 13 markets and automate 75% of our work only in the last 8 months. But this is not the end of our journey, GetYourGuide is building a Data Science team to understand travelers needs and wants and make our Customers' trips amazing.
Slides from my talk at Big Data Spain 2014 in Madrid.
In this talk, we will discuss our approach to bring large scale deep analytics to the masses. R is an extremely popular numerical computer environment, but scientific data processing frequently hits its memory limits. On the other hand, system to execute data intensive tasks like Hadoop or Stratosphere are not popular among R users because writing programs using these paradigms is cumbersome. We present an innovative approach to overcome these limitations using the Stratosphere/Apache Flink big data platform by means of a R package and ready-to-use distributed algorithm.
This solution allows the user, with small modifications in the R code, to easily execute distributed scenarios using popular machine learning techniques. We will cover the implementation details of the proposed solution including the architecture of the system, the functionality implemented and working examples.
In addition, we will cover what are the differences between our approach and other solutions that integrate R with Hadoop or other large-scale analytics systems. Finally, the results of the performance tests show that this solution is competitive with the already existing R implementations for small amounts of data and able to scale-up to gigabyte level.
Lessons learnt from applying PyData to GetYourGuide marketingJose Luis Lopez Pino
For all e-commerce sites, marketing is a big part of the business and marketing efficiency and effectiveness are critical to their success. Companies must make many data-driven decisions in order to reach customers that their competitors don’t, maximize the revenue of each click, decide wisely what are the costs to cut, enter new markets, etc.
GetYourGuide has been working for more than two years on building a marketing intelligence that allows us growing our marketing efforts in the travel market without building a huge team or buying extremely expensive tools.
All the decisions are supported by a dedicated system that runs on the PyData stack that allows marketers to extract valuable insights from data and performs critical marketing tasks: keyword mining, campaign automation, predictive modeling, omni-channel marketing data integration, customer segmentation, pattern mining from click data, etc.
As a result of this, we were able to scale up 3 times our marketing efforts, launch campaigns in 13 markets and automate 75% of our work only in the last 8 months. But this is not the end of our journey, GetYourGuide is building a Data Science team to understand travelers needs and wants and make our Customers' trips amazing.
Slides from my talk at Big Data Spain 2014 in Madrid.
In this talk, we will discuss our approach to bring large scale deep analytics to the masses. R is an extremely popular numerical computer environment, but scientific data processing frequently hits its memory limits. On the other hand, system to execute data intensive tasks like Hadoop or Stratosphere are not popular among R users because writing programs using these paradigms is cumbersome. We present an innovative approach to overcome these limitations using the Stratosphere/Apache Flink big data platform by means of a R package and ready-to-use distributed algorithm.
This solution allows the user, with small modifications in the R code, to easily execute distributed scenarios using popular machine learning techniques. We will cover the implementation details of the proposed solution including the architecture of the system, the functionality implemented and working examples.
In addition, we will cover what are the differences between our approach and other solutions that integrate R with Hadoop or other large-scale analytics systems. Finally, the results of the performance tests show that this solution is competitive with the already existing R implementations for small amounts of data and able to scale-up to gigabyte level.
In this talk, we will discuss our approach to bring large scale deep analytics to the masses. R is an extremely popular numerical computer environment, but scientific data processing frequently hits its memory limits. On the other hand, system to execute data intensive tasks like Hadoop or Stratosphere are not popular among R users because writing programs using these paradigms is cumbersome. We present an innovative approach to overcome these limitations using the Stratosphere/Apache Flink big data platform by means of a R package and ready-to-use distributed algorithm.
This solution allows the user, with small modifications in the R code, to easily execute distributed scenarios using popular machine learning techniques. We will cover the implementation details of the proposed solution including the architecture of the system, the functionality implemented and working examples.
In addition, we will cover what are the differences between our approach and other solutions that integrate R with Hadoop or other large-scale analytics systems.
Finally, the results of the performance tests show that this solution is competitive with the already existing R implementations for small amounts of data and able to scale-up to gigabyte level.
This presentation is part of my work for the course 'Heterogeneous and Distributed Information Systems' at TU Berlin within the IT4BI (Information Technology for Business Intelligence) master programme.
This presentation is part of my work for the course 'Big Data Seminar' at TU Berlin within the IT4BI (Information Technology for Business Intelligence) master programme.
This presentation is part of my work for the course 'Big Data Analytics Projects' at TU Berlin within the IT4BI (Information Technology for Business Intelligence) master programme.
RDFa: introduction, comparison with microdata and microformats and how to use itJose Luis Lopez Pino
Report for the course 'XML and Web Technologies' of the IT4BI Erasmus Mundus Master's Programme. Introduction, motivation, target domain, schema, attributes, comparing RDFa with RDF, comparing RDFa with Microformats, comparing RDFa with Microdata, how to use RDFa to improve websites, how to extract metadata defined with RDFa, GRDDL and a simple exercise.
RDFa: introduction, comparison with microdata and microformats and how to use itJose Luis Lopez Pino
Presentation for the course 'XML and Web Technologies' of the IT4BI Erasmus Mundus Master's Programme. Introduction, motivation, target domain, schema, attributes, comparing RDFa with RDF, comparing RDFa with Microformats, comparing RDFa with Microdata, how to use RDFa to improve websites, how to extract metadata defined with RDFa, GRDDL and a simple exercise.
¿Qué es la esteganografía?
¿Qué NO es la esteganografía?
Esteganografía y criptografía
¿Por qué usarla?
Esteganografía física
Técnicas de esteganografía digital
Usos curiosos de la esteganografía digital
Ataques
Técnicas de ataque
Estegoanálisis
Marcas de agua
Introducción a Firefox, navegador libre de Mozilla
Versión 2:
- Arreglada imagen sobre el consumo de RAM.
- Incluidos los ejemplos.
- Incluidas extensiones buscadas para la presentación en Económicas.
Versión 3:
- Nuevas extensiones: Cooliris, Peers y Speed Dial.
- Algunas características que se van a incluir en próximas versiones de Firefox.
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Telefónica
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0xWord escrito por Ibón Reinoso ( https://mypublicinbox.com/IBhone ) con Prólogo de Chema Alonso ( https://mypublicinbox.com/ChemaAlonso ). Puedes comprarlo aquí: https://0xword.com/es/libros/233-big-data-tecnologias-para-arquitecturas-data-centric.html
Es un diagrama para La asistencia técnica o apoyo técnico es brindada por las compañías para que sus clientes puedan hacer uso de sus productos o servicios de la manera en que fueron puestos a la venta.
En este documento analizamos ciertos conceptos relacionados con la ficha 1 y 2. Y concluimos, dando el porque es importante desarrollar nuestras habilidades de pensamiento.
Sara Sofia Bedoya Montezuma.
9-1.
1. Visuse
José Luis López Pino
Tutor:
Juan Julián Merelo Guervós
2. ¿Qué es Visuse?
Visuse es un acrónimo de VISUal Search
Engine, el proyecto consiste en un
metabuscador que clasifica y muestra los
resultados obtenidos de distintos buscadores y
sitios web de forma visual, centrándose sobre
todo en contenidos multimedia como
imágenes, vídeo y audio.
Esto permite visualizar de una forma más
cómoda los resultados, además de resultar
muy útil para niños, personas que tengan
problemas para leer o dispositivos en los que
sea incómodo leer.
3. ¿Qué es un metabuscador?
Un metabuscador es un buscador que, en vez
de indexar contenidos, realiza consultas a otros
buscadores y los clasifica y muestra como una
única lista (en el caso de Visuse, de forma
visual), consiguiendo así mayor cantidad de
resultados sin que el usuario tenga que
consultar uno por uno cada buscador.
4. Estado del arte:
proyectos similares
Bing:
Sustituir búsquedas textuales por visuales.
Silverlight.
Metabuscadores:
oSkope.
Spezify.
5. Estado del arte:
distribución de imágenes
1979: Daniel Selator: package in two
dimensions.
1997: S.A. para anuncios en guías.
1999: S.A. para periódico online.
Dispositivos móviles, album de imágenes...
En todos estos casos se ciñen a la estructura
de columnas y los tamaños de los anuncios no
eran modicables.
6. Objetivos
Lograr la intercomunicación con los distintos
buscadores (creación de módulos).
Organizar la información proveniente de los
buscadores.
Puntuación de los distintos resultados, según la
cadena de búsqueda introducida.
Mostrar los resultados como un ”muro”,
aprovechando al máximo la ventana del
navegador.
Mostrar los mejores contenidos con un tamaño
mayor.
7. Requisitos
Que funcione en la mayor cantidad de
navegadores posible, pero sin renunciar a
funcionalidades importantes.
Que se adapte a la resolución del dispositivo
en el que se esté usando.
Fácil extensibilidad mediante módulos para los
distintos buscadores.
Una carga de resultados y una buena
experiencia de usuario en general.
¡Software libre!
9. ¿Cómo funciona? (II)
Search engines
El usuario introduce un término
en el cuadro de texto.
El cliente (JavaScript), solicita Big bang
theory?
al servidor de Visuse que Big bang
theory?
Big bang
busque un dicho término en theory?
una serie de buscador. Se trata Visuse
de peticiones HTTP corrientes. (Metasearch Engine)
El servidor Visuse a su vez Big bang
transmite a los distintos theory?
buscadores la petición del
usuario y recibe la respuesta.
10. ¿Cómo funciona? (III)
Search engines
Conforme recibe las
respuestas, determina la
importancia de cada resultado y
los devuelve en JSON*.
El servidor va enviando los
resultados al cliente, como
Visuse
respuesta a las peticiones (Metasearch Engine)
HTTP que había realizado.
El cliente estudia la mejor
manera de mostrar los
resultados y los muestra al
usuario.
13. Resultados: servidor
Módulos:
Youtube
Picasa
Wikicommons
Flickr
Google Images
Yahoo Search
Algoritmos de puntuación.
Fácil extensibilidad y configuración.
Test.
14. Resultados: cliente
Ordenación y visualización de los resultados
mostrados según la puntuación.
Paginación de los resultados.
Direcciones estáticas y amigables para las
búsquedas.
Rápida carga.
Tolerancia a fallos.
El usuario no tiene que abandonar la página
para consultar las imágenes/vídeos.
15. Algoritmo voraz para la
disposición de los resultados
Basado en el trabajo de James Padolsey.
Muy importante la organización de resultados
antes de aplicarlo.
Representación del espacio disponible en una
matriz.
Va colocando las imágenes en el punto libre
que se encuentre más arriba.
Se intenta situar del máximo tamaño posible y
si no cumple el tamaño mínimo, se descarta.
17. Aplicando enfriamiento simulado
Se aplica sobre el orden en que considera el
algoritmo voraz los resultados.
Adaptación del código de Jesús González
Peñalver.
La función de fitness es el número de huecos
que quedan en la imagen.
Tiempo de ejecución muy alto.
Cuello de botella: función de fitness.
No se consiguen mejoras en un tiempo de
ejecución razonable.
18. Resultados del s. a.
Sin s. a. s. a. 10 iteraciones s. a. 50 iteraciones
19. Eso es todo
El proyecto se puede probar en
http://www.visuse.com
Software e información:
http://visuse.wordpress.com
¿Alguna pregunta?
Imagen de Discoveryschool.com