2. Definición
Un sistema de archivos distribuidos, es una implementación
distribuida del clásico modelo de tiempo compartido de un sistema
de archivos, donde varios usuarios comparten archivos y almacenan
recursos.
3. Conceptos de base
Sistema Distribuido: colección de máquinas interconectadas por una red
de comunicación.
Máquina: puede ser una estación o un mainframe
Recursos locales: recursos con los que cuenta la máquina
Recursos remotos: el resto de las máquina y sus recursos
Servicio: software ejecutándose en una o más máquinas que
proporcionan un tipo particular de función
Servidor: software de servicio en una sola máquina
Un servidor es un proceso que implementa servicios
Cliente: proceso que puede invocar un servicio a través de un conjunto
de operaciones que forman su interfaz de cliente
4. Características
DFS proporciona servicios de archivos a clientes
Clientes, servidores, y dispositivos de almacenamiento se encuentran
dispersos entre las máquinas de un sistema distribuido
Diversidad de clientes y de archivos
Desempeño:
tiempo para satisfacer varias peticiones de servicio.
convencional:
tiempo acceso disco + tiempo procesamiento CPU
DFS:
sobrecarga debido a la estructura distribuida
5. Principales componentes
Servicio directorio resolución nombres, añadir y borrar archivos
Servicio autorización eficiencia y/o lista de control de acceso
Servicio transacción admón. de concurrencia y duplicidad
archivos básico lectura/escritura archivos y atributos
Servicio sistema admón. de dispositivos, caché y bloques
6. Nombramiento y Transparencia
Nombramiento:
mapeo entre objetos lógicos y físicos
usuario = objetos lógicos de datos
sistema = objetos físicos
Transparencia
“esconder” el lugar de la red donde se encuentra
el archivo (file replication)
7. Nociones de Nombramiento
- Transparencia de la ubicación
- Independencia de la ubicación
Importante diferencias dos nociones relacionadas que involucran
mapeo de nombres dentro de los DFS
8. Independencia de ubicación
vs
transparencia estática de la ubicación
“Divorciar” datos de la ubicación
Transparencia estática de ubicación proporciona a los
usuarios una forma conveniente de compartir datos
La independencia de la ubicación separa la jerarquía de
nombres de la jerarquía de los dispositivos de almacenamiento
dentro de la estructura de la computadora.
9. Esquemas de nombramiento
1. Archivos son nombrados a partir de una combinación del
host y de un nombre local, (por ejemplo windows )
2. Proporcionar un medio para “atar” directorios remotos a
directorios locales, (por ejemplo NFS )
3. Una sola estructura de nombres global se encarga de nombrar
todos los archivos del sistema
10. Técnicas de
implementación
Se requiere de una forma de realizar un mapeo entre un nombre de
archivo y su ubicación física.
Métodos posibles:
duplicidad, caching local, o ambos
Posibles técnicas:
introducción de identificadores independientes de la ubicación
11. Montaje de archivos
Una operación de montaje del cliente ata un sistema de archivos
remoto a la jerarquía del sistema de archivos del cliente
El punto de montaje generalmente es una hoja de la jerarquía que
contiene un subdirectorio vacío.
Montajes son operaciones privilegiadas que pueden realizarse en tres
diferentes instantes:
Montaje explícito
Montaje de booteo
Automontaje
Desventaja: requiere conocimiento de la localización de los servidores
12. Registro de servidores
Útil en el caso de un sistema con múltiples servidores que proporcionan
el mismo servicio de archivos.
Servidor puede localizarse de dos formas:
1. Servidores se registran en un servicio de registro
2. Clientes realizan un broadcast de una petición de automontaje
Estas dos formas son esencialmente un protocolo de resolución de
nombres o direcciones.
Algunas veces el montaje de archivos se hace en forma de cascada,
un sistema de archivos montado puede contener subdirectorios montados
de otros directorios.
13. Acceso de archivos remotos
Mecanismo servicio remoto:
peticiones de acceso son pasadas al servidor,
servidor realiza el acceso
sus resultados son regresados al usuario
El compartir archivos significa que varios clientes pueden tener acceso
al mismo archivo al mismo tiempo, para lo cual:
1. se tienen que hacer coincidir operaciones de acceso
2. se tienen que intercalar operaciones de acceso
La primera implica que existen diferentes copias del mismo archivo,
mientras que la segunda implica el intercalar a múltiples granularidades
de operaciones de acceso de datos.
14. Tipos acceso a datos
Acceso remoto
ningún dato del archivo es dejado en la máquina del cliente
Acceso cache
una pequeña parte de la información es almacenada en la
caché local
Acceso de download/updown
Todo el archivo es bajado para poder consultarlo o
modificarlo localmente
15. Características coherencia datos
Todas las copias son idénticas en todo el tiempo
Copias son percibidas como idénticas tan solo en
algunos puntos en el tiempo
Usuarios siempre leen los datos más recientes en las
copias
Operaciones de escritura siempre son realizadas
“inmediatamente” y sus resultados son propagados
16. Tipos operaciones
Simple RW (Lectura/Escritura)
Cada operación de lectura y escritura es un acceso
independiente de tipo petición/respuesta al servidor
Transacción
Una secuencia de operaciones lectura/escritura es tratada
como una unidad fundamental de acceso a archivo
Sesión
Una sesión consiste de una secuencia de transacciones y de
operaciones simples de lectura/escritura, con semánticas
adicionales asociadas con la sesión de acuerdo a la aplicación
17. Concurrencias de espacio y tiempo en acceso
de archivos
espacio acceso acceso acceso
tiempo remoto cache carga down/up
RW simple no es un verdadero control control
DFS coherencia coherencia
transacción control concurrencia coherencia y coherencia y
concurrencia concurrencia
sesión no aplicable no aplicable ignora el
compartir