1. Análisis de
redes en la nube
usando NoSQL
J o a q u í n S a l v a c h ú a
J s a l v a c h u a @ d i t . u p m . e s
jueves 25 de noviembre de 2010
2. El AZAR y la
Necesidad
jueves 25 de noviembre de 2010
3. Indice
Problema: Matemáticas vs. Ordenador.
Computación distribuida.
Bases de datos NoSQL: Grafos.
Soluciones computacionales.
Conclusiones
jueves 25 de noviembre de 2010
10. Computación sobre
el grafo social
Grafo que almacena una red social y sus
propiedades.
Necesidad de computación en tiempo real:
Muro de Facebook.
Seguidores de Twitter.
Cualquier otro servicio social.
jueves 25 de noviembre de 2010
11. Web Semántico
Estas tecnologías están habilitando realmente
la web semántica.
También son grafos y una de sus limitaciones
han sido computacionales.
Nueva oportunidad con Open-Data.
jueves 25 de noviembre de 2010
14. Un ordenador tiene
recursos limitados
Diferentes algoritmos :
Necesidad de cálculos rápidos.
Pseudotiempo real blando.
Complejidad algorítmica.
jueves 25 de noviembre de 2010
15. Si no entra en
memoria principal
Todo va muy lento.
jueves 25 de noviembre de 2010
18. Librerias de
computación
paralela
Sistemas tipo GRID (MPI)
Sin resistencia a fallos.
Si alguno para hay que empezar de nuevo.
jueves 25 de noviembre de 2010
20. A que huelen las
nubes
jueves 25 de noviembre de 2010
21. Clasificación ?aas
SaaS (Software as a Service) (gmail,
salesforce.com, Google Apps).
PaaS (Platform as a Service) (Amazon simple
DB, MS Azure, Google app engine).
IaaS (Infrastructure as a Service) (HaaS)
(Virtualizadores )
Cloud es el Matrix de los servicios (virtuales).
jueves 25 de noviembre de 2010
40. Computación sobre
cloud y NOSQL
Problemas isomorfos….
PageRank.
BigTable & Map Reduce.
jueves 25 de noviembre de 2010
41. MAP-REDUCE
Diseño de google para calculo del PageRank.
Librería simple, asíncrona, autoajustable
Desgraciadamente el ensamblador de los
algoritmos.
jueves 25 de noviembre de 2010
42. Descripción
Tenemos MAP
jueves 25 de noviembre de 2010
43. Descripción
Tenemos REDUCE
jueves 25 de noviembre de 2010
44. Descripción
Fase MAP:
Analizamos los datos y los convertimos en
tuplas < clave, valor >.
Barajado : se ordenan y agrupan por la clave
Fase REDUCE:
Todos los valores asociados a una clave se
procesan juntos.
jueves 25 de noviembre de 2010
47. Arquitectura
distribuida
jueves 25 de noviembre de 2010
48. Problemas
Su bajo nivel: Dificil programar.
Exceso de comunicación.
No para todo tipo de cálculo sobre grafos.
jueves 25 de noviembre de 2010
49. ¿Posible solución?
Pregel
Librería sencilla
Pagerank:12 líneas.
Erlang clones.
jueves 25 de noviembre de 2010
50. Diversos elementos
Vertices (nocos) activos.
Enlaces creando y destruyendo.
Aplicación algoritmo local hasta que vertice
decide parar.
Cuando todos los vertices han parado se ha
acabado.
jueves 25 de noviembre de 2010
51. El principio de un
largo camino
Sistemas “tuneados”:
Twitter - Facebook.
Cálculos muy simples.
No hay solución DEFINITIVA.
jueves 25 de noviembre de 2010