1 1 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cache Juan Jiménez Trillo
2 2 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Tecnología Caché : Todos los navegadores del mercado, de un modo u otro van capturando en memoria y en disco las páginas HTML, elementos gráficos, etc., que van descargando de la red a medida que el usuario va recorriendo enlaces. Esto es bueno, porque si el usuario decide consultar la misma página en otro momento encontrará que, por un lado, se carga muy rápidamente. Además, el proveedor de contenidos en Internet se verá menos saturado.
3 3 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cache Ventajas de la tecnología caché Para el usuario cliente Una velocidad de navegación mucho mayor. Para el proveedor de contenidos en Internet Una menor carga en sus servidores y líneas de comunicación. Para la red de Internet Un menor tráfico y congestión, por el transito de objetos repetidos. Juan Jiménez Trillo
4 4 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Inconvenientes de la tecnología caché Para el usuario cliente Puede visualizarse un objeto existente en la caché que puede haberse actualizado posteriormente. Para el proveedor de contenidos en Internet Se necesita un mecanismo de control de cambios o páginas expiradas. Para la red de Internet Los contenidos consultados por un cliente se van quedando almacenados en lugares intermedios, que pueden ser consultados por otras personas
5 5 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Mecanismo de control de caducidad Cuando un usuario consulta una página, su navegador conserva una copia en el disco duro, eliminando los objetos antiguos a medida que se llena el disco. Si mas tarde se vuelve a consultar una misma página, el navegador antes de entregársela consulta con el servidor acerca de su caducidad. Si la página hubiera cambiado, el servidor envía la nueva en otro caso el navegador la recoge de la caché del disco, esto hace que le proceso de mostrar una página, sea muy rápido
6 6 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo La cabecera de Control de Caché Es una cabecera que se envía hacia el servidor y viceversa. HTTP/1.1 200 OK Date: Sun, 13 Jun 2004 02:55:38 GMT Server: Apache/1.3.12 (Unix) AuthMySQL/2.20 PHP/3.0.15 Cache-Control: private Expires: Mon, 14 Jun 16:05:39 2004 GMT Last-Modified: Thu, 10 Jun 2004 12:22:03 GMT Connection: close Content-Type: text/html; charset=iso- 8859-1
7 7 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Tipos de Cabecera de Control de Caché Navegador al servidor no-cache No-store max-age max.stale min.-fresh no.transfor only-if-cache Servidor al Navegador public private no-cache no-store no-transform must-revalidate proxi-revalidate max-age s-maxage
8 8 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Web Cache Centralized Web Cache Navegador Cache Navegador Web Server Navegador Cache Navegador Cliente 2 Cliente 1 InternetRed Corporativa
9 9 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Navegador Cache Navegador Web Server Navegador Cache Navegador Cliente 2 Cliente 1 InternetRed Corporativa Web Cache Cooperativa Web Cache
10 10 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Descentralizada Web Cache Navegador Cache Navegador Web Server Navegador Cache Navegador Cliente 2 Cliente 1 InternetRed Corporativa
11 11 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Tabla Hash Distribuida Servicio de localización Peer-to-peer: Pastry Auto organizada y totalmente descentralizada Tolerancia a Fallos, escalable, eficiente Operaciones: Insertar(k,v) buscar(k) k6,v6 k1,v1 k5,v5 k2,v2 k4,v4 k3,v3 nodo s Peer-to-peer localización y encaminamien to
12 12 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Ventajas del sistema peer-to-peer 1.Menor coste dedicado a la web cache No necesita Hardware adicional 2.Menor esfuerzo de Administracion El sistema es automatico 3.Beneficios de escalabilidad La fuente son los propios clientes
13 13 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Topología Red Corporativa Desde 100 – 100.000 PC Situados en un edificio o un campus En cada nodo se ejecuta una instancia de Squirrel La union de todos es como un Mega Proxy
14 14 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Trazando Squirrel sobre Pastry Dos aproximaciones: Home-store (almacenamiento principal) Directorio
15 15 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Modelo Home-store cliente home RED Internet URL hash
16 16 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Modelo de directorio Los nodos de cliente siempre almacenan de objetos localmente (caché). Home-store: El nodo principal también guarda objetos. Directory: El nodo principal solo guarda punteros a clientes recientes y peticiones adelantadas.
17 17 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Ventajas del modelo de Directorio Parece el mas sofisticado de los dos. Evita guardar copias innecesarias de objetos. El directorio cambia rápidamente para mejorar la carga y equilibrado sobre los objetos frecuentemente consultados. El Modelo Home-store es mas sencillo y elegante y logra cargas mucho mas bajas.
18 18 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Modelo Directorio: inconvenientes El almacenamiento en la caché solo sucede en los clientes, por tanto: los clientes activos guardan todos los objetos populares, los clientes inactivos desperdician la mayor parte de su almacenamiento. Consecuencias: 1.En la practica un tamaño reducido de cache. 2.No hay balanceo de carga.
19 19 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Directorio: Ejemplo en punta de carga. Pçagina Web, que incluye muchas imagenes.gif or.jpg Momentos de mucha consulta Muchos nodos de la home, apuntan a los mismos clientes.
20 20 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Características de la muestra
21 21 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Total Tráfico Externo 85 90 95 100 105 0.0010.010.1110100 Directorio Home-store No web cache Centralizada cache [Mejor lo mas bajo] Tamaño Por-nodo cache (en MB) Total Tráfico Externo (GB) Redmon d
22 22 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Total Tráfico Externo 5.5 5.6 5.7 5.8 5.9 6 6.1 0.0010.010.1110100 Total Tráfico Externo (GB) [Mejor lo mas bajo] Tamaño Por-nodo cache (en MB) Directory Home-store No web cache Centralizada cache Cambrig e
23 23 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo 0% 20% 40% 60% 80% 100% 0123456 Total de saltos dentro de la LAN CentralizadaHome-storeDirectorio % de demandas cacheables Saltos en la LAN Redmon d
24 24 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo 0% 20% 40% 60% 80% 100% 012345 CentralizadaHome-storeDirectorio Total de saltos dentro de la LAN % de demandas cacheables Saltos en la LAN Cambrig e
25 25 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo 1 10 100 1000 10000 100000 01020304050 Numero de veces observadas Maximo de objetos servidos por nodo y segundo Home-store Directorio Carga en peticiones por segundo Redmon d
26 26 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo 1 10 100 1000 10000 100000 1e+06 1e+07 01020304050 Numero de veces observadas Maximo de objetos servidos por nodo y segundo Home-store Directorio Cambrig e Carga en peticiones por segundo
27 27 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Tolerancia a fallos Los subitos fallos en el nodo provocan pérdida parcial de volumen de caché. Home-store: Proporcianal a los fallos en los nodos. Directorio: Es mas vulnerable.
28 28 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Tolerancia a Fallos Home-storeDirectorio Redmond Min 1% Max 1.77% Min 1.71% Max 19.3% Cambridge Min 1% Max 3.52% Min 1.65% Max 9.8% Suponiendo un 1% de caida abrupta en los nodos de Squirrel nodes, Las perdidas relativas en el contenido de la cache son:
29 29 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Conclusiones ES posible descentralizar la Web Caché Rendimiento comparable a una centralizada Web Cache, Es mejor en terminos de escalabilidad, costes y menor esfuerzo de administración Bajo mi perspectiva es mejor el modelo Home-Store que el de Directorio.
30 30 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo Otros aspecto de Squirrel Repetición adaptable –Anulacion de hotspot –Mejora de Robusted Route caching –Menores Picos en la LAN
31 31 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo (backup) Utilización del Almacenamiento Redmond Home-storeDirectorio Total 97641 MB61652 MB Min por-nodo 2.6 MB 1.6 MB Max por-nodo 1664 MB
32 32 Universidad Rey Juan Carlos Squirrel: a decentralized peer-to-peer web cacheJuan Jiménez Trillo (backup) tolerancia a Fallos Home-storeDirectorio Ecuaciones Min H/O Max H max /O Min (H+S)/O Max max(H max,S max )/O Redmond Min 0.0027% Max 0.0048% Min 0.198% Max 1.5% Cambridge Min 0.95% Max 3.34% Min 1.68% Max 12.4%