La organizacic3b3n-lc3b3gica-y-fc3adsica-de-los-sistemas-de-archivo-y-sus-mecanismos-de-acceso-de-archivo
1. Sistemasoperativos
Oscar Uriel LorenzoSalomón
La organizaciónlógicayfísica delossistemasdearchivoysusmecanismosde
acceso de archivo.
Se refiere a las diferentes maneras en las que puede ser organizada la información de los
archivos, así como las diferentes maneras en que ésta puede ser accesada. Dado que hay 2
niveles de visión de los archivos (físico y lógico), se puede hablar también de 2 aspectos de
organización de archivos: Organización de archivoslógicos y de archivos físicos.
Fig. 5.1Organización de un sistema de archivos utilizando
directorios.
El sistema de archivos está relacionado especialmente con la administración del espacio de
almacenamiento secundario, fundamentalmente con el almacenamiento de disco.
Una forma de organización de un sistema de archivos puede ser la siguiente:
Se utiliza una “raíz ” para indicar en qué parte del disco comienza el “directorio
raíz ” .
El “directorio raíz ” apunta a los “directorios de usuarios”.
Un “directorio de usuario” contiene una entrada para cada uno de los archivos del
usuario.
Cada entrada de archivo apunta al lugar del disco donde está almacenado el archivo
referenciado.
Esta forma de organización se muestra en la Fig. 5.4.1.
Los nombres de archivos solo necesitan ser únicos dentro de un directorio de usuario dado.
El nombre del sistema para un archivo dado debe ser único para el sistema de archivos.
2. Sistemasoperativos
Oscar Uriel LorenzoSalomón
En sistemas de archivo “jerárquicos” el nombre del sistema para un archivo suele estar
formado como el “nombre de la trayectoria” del directorio raíz al archivo.
Organización lógica.
La mayoría de las computadoras organizan los archivos en jerarquías llamadas carpetas,
directorios o catálogos . (El concepto es el mismo independientemente de la terminología
usada.) Cada carpeta puede contener un número arbitrario de archivos, y también puede
contener otras carpetas. Las otras carpetas pueden contener todavía más archivos y
carpetas, y así sucesivamente, construyéndose un estructura en árbol en la que una
«carpeta raíz» (el nombre varía de una computadora a otra) puede contener cualquier
número de niveles de otras carpetas y archivos. A las carpetas se les puede dar nombre
exactamente igual que a los archivos (excepto para la carpeta raíz, que a menudo no tiene
nombre). El uso de carpetas hace más fácil organizar los archivos de una manera lógica.
La mayor parte de las estructuras de organizaciones alternativas de archivos se encuentran
dentro de estas cinco categorías:
Pilas
Fig. 5.2 Archivo de pilas: Registro de longitud variable. Conjunto variable de campos.
Orden cronológico.
Es la forma más fácil de organizar un archivo. Los datos se recogen en el orden en que
llegan.
Su objetivo es simplemente acumular una masa de datos y guardarla.
Los registros pueden tener campos diferentes o similares en un orden distinto. Cada
campo debe ser autodescriptivo, incluyendo tanto un campo de nombre como el valor. La
longitud de cada campo debe indicarse implícitamente con delimitadores, explícitamente
incluidos como un sub-campo más.
El acceso a los registros se hace por búsquedas exhaustiva y son fáciles de actualizar. Si se
quiere encontrar un registro que contiene un campo particular y un valor determinado, es
necesario examinar cada registro de la pila hasta encontrar el registro deseado. Si se
3. Sistemasoperativos
Oscar Uriel LorenzoSalomón
quieren encontrar todos los registros que contienen un campo particular o que tienen un
valor determinado para ese campo, debe buscarse el archivo entero.
Se aplica cuando los datos se recogen o almacenan antes de procesarlos o cuando no son
fáciles de organizar. Esta clase de archivo aprovecha bien el espacio cuando los datos
almacenados varían en tamaño y estructura. Fuera de estos usos limitados, este tipo de
archivos no se adapta a la mayoría de las aplicaciones.
Archivos secuenciales
Fig. 5.3 Archivo secuencial: Registro de longitud fija. Conjunto fijo de campos en orden
constante. Orden secuencial por el campo clave.
Es la forma más común de estructura de archivos.
Se emplea un formato fijo para los registros, son de la misma longitud y constan del mismo
número de campos de tamaño fijo con un orden determinado.
Se necesita almacenar los valores de cada campo; el nombre del campo y la longitud de
cada uno son atributos de la estructura del archivo. Cada registro tiene un campo clave que
lo identifica (generalmente es el primero de cada registro). Los registros se almacenan en
secuencia por la clave.
Se utilizan normalmente en aplicaciones de procesos por lotes, ya que es la única
organización de archivos que se puede guardar tanto en cintas como en discos.
Para las aplicaciones interactivas que incluyen peticiones o actualizaciones de registros
individuales, los archivos secuenciales no son óptimos. El acceso requiere una búsqueda
secuencial de correspondencias con la clave. Si el archivo entero o gran parte de él pueden
traerse a la memoria principal de una sola vez, se podrán aplicar técnicas de búsquedas
más eficientes. Al acceder un registro de un archivo secuencial grande, se produce un
procesamiento extra y un retardo considerable.
La organización física del archivo en una cinta o disco se corresponde exactamente con la
organización lógica del archivo, por lo tanto el procedimiento habitual es ubicar los nuevos
4. Sistemasoperativos
Oscar Uriel LorenzoSalomón
registros en un archivo de pila separado, es llamado archivo de registro o archivo de
transacciones.
Una alternativa es organizar físicamente el archivo secuencial como una lista enlazada, en
cada bloque físico se almacena uno o más registros y cada bloque del disco contienen un
puntero al bloque siguiente. La inserción de un nuevo registro implica la manipulación de
puntero, pero no requiere que el nuevo registro ocupe una posición particular del bloque
físico.
Archivos secuenciales indexados
Fig. 5.4 Archivo secuencial indexado.
Los registros se organizan en una secuencia basada en un campo clave presentando dos
características, un índice del archivo para soportar los accesos aleatorios y un archivo de
desbordamiento. El índice proporciona una capacidad de búsqueda para llagar
rápidamente al registro deseado y el archivo de desbordamiento es similar al archivo de
registros usado en un archivo secuencial, pero está integrado de forma que los archivos de
desbordamiento se ubiquen siguiendo un puntero desde su registro predecesor.
La estructura más simple tiene como índice un archivo secuencial simple, cada registro del
archivo índice tiene dos campos, un campo clave igual al del archivo principal y un puntero
al archivo principal. Para encontrar un campo especifico se busca en el índice hasta
encontrar el valor mayor de la clave que es iguale o precede al valor deseado de la clave, la
búsqueda continua en el archivo principal a partir de la posición que indique el puntero.
Cada registro del archivo principal tiene un campo adicional que es un puntero al archivo
de desbordamiento. Cuando se inserta un nuevo registro al archivo, también se añade al
archivo de desbordamiento. El registro del archivo principal que precede inmediatamente
al nuevo registro según la secuencia lógica se actualiza con un puntero del registro nuevo
en el archivo de desbordamiento, si el registro inmediatamente anterior está también en el
archivo de desbordamiento se actualizará el puntero en el registro.
5. Sistemasoperativos
Oscar Uriel LorenzoSalomón
Para procesar secuencialmente un archivo completo los registros del archivo principal se
procesarán en secuencia hasta encontrar un puntero al archivo de desbordamiento, el
acceso continua en el archivo de desbordamiento hasta que encuentra un puntero nulo,
entonces renueva el acceso donde se abandonó en el archivo principal.
Archivos indexados
Fig. 5.5 Archivo indexado.
A los registros se accede solo a través de sus índices. No hay resticción en la ubicación de
los registros, al menos un índice contiene un puntero a cada registro y pueden emplearse
registros de longitud variable.
Se suelen utilizar dos tipos de índices, uno exhaustivo que contiene una entrada para cada
registro del archivo principal y se organiza como un archivo secuencial para facilitar la
búsqueda, el otro índice es parcial que contiene entrada a los registros donde esté el campo
de interés.
Con registro de longitud variable, algunos registros no contendrán todos los campos y
cuando se añade un registro al archivo principal, todos los archivos de índices deben
actualizarse.
Archivos directos o de dispersión
Explotan la capacidad de los discos para acceder directamente a cualquier bloque de
dirección conocida.
Se requiere un campo clave en cada registro.
Los archivos directos son muy usados donde se necesita un acceso muy rápido, donde se
usan registros de longitud fija y donde siempre se accede a los registros de una vez.
Organización física.
6. Sistemasoperativos
Oscar Uriel LorenzoSalomón
Los datos son arreglados por su adyacencia física, es decir, de acuerdo con el dispositivo de
almacenamiento secundario. Los registros son de tamaño fijo o de tamaño variable y
pueden organizarse de varias formas para constituir archivos físicos.
Cinta magnética.
Fig. 5.6 Cintas magnéticas
En este dispositivo el archivo físico esta formado por un conjunto de registros físicos, y los
bloques están organizados en forma consecutiva, ya que se asigna en igual forma.
Además tales registros puede contener etiquetas que permitan un mayor control sobre los
datos almacenados, y son las siguientes:
- Etiqueta de volumen.- Contiene información que permite identificar la cinta, el nombre
del propietario y cualquier información general requerida.
- Etiqueta de archivo.- Se utilizan por pares para indicar el inicio y fin del archivo, contiene
información acerca del nombre del archivo, fecha de creación.
- Etiqueta de usuario.- Sirven para guardar información adicional de importancia para el
usuario; no son procesados por el sistema operativo.
Discos Magnéticos.
Fig. 5.7 Discos magnéticos
El archivo físico en un disco es una colección de registros físicos de igual tamaño, los cuales
pueden estar organizados en forma consecutiva, ligada o con una tabla de mapeo.
7. Sistemasoperativos
Oscar Uriel LorenzoSalomón
En la organización contigua, el archivo utiliza registros físicos contiguos, siguiendo la
secuencia normal de direcciones.
La organización encadenada consiste un conjunto de bloques, cada uno de los cuales tiene
un campo destinado para indicar la dirección del siguiente registro, o sea, para lo que se ha
llamado enlace o liga.
Otra forma de organización es la tabla de mapeo que consiste en una tabla de apuntadores
a los registros físicos que forman el archivo.
La organización física de un archivo en el almacenamiento secundario depende de la
estrategia de agrupación y de la estrategia de asignación de archivos.
Para elegir una organización de archivos se deben tener en cuenta ciertos criterios:
Si un archivo va a procesar solamente por lotes, accediendo cada vez a todos los registros,
entonces el acceso rápido para la recuperación de un único registro es una preocupación
mínima. Un archivo almacenado en CD-ROM nunca será actualizado, por lo que
la facilidad de actualización no se considera. Para la economía de almacenamiento ,
debería existir una mínima redundancia de los datos, ésta redundancia es el medio
fundamental para incrementar la velocidad de acceso a los datos.
Este tipo de organización muestra a su vez, 2 aspectos importantes: Métodos De
Asignación De Espacio Libre y Asignación De Espacio De Almacenamiento
Del Archivo.
Existen varios mecanismos para acceder los archivos: Directorios, descriptores de
archivos, mecanismos de control de acceso y procedimientos para abrir y cerrar archivos.
Descriptores de archivos.
El descriptor de archivos o bloque de control de archivos es un bloque de control que
contiene información que el sistema necesita para administrar un archivo.
Es una estructura muy dependiente del sistema.
Puede incluir la siguiente información:
Nombre simbólico del archivo.
Localización del archivo en el almacenamiento secundario.
Organización del archivo (método de organización y acceso).
Tipo de dispositivo.
8. Sistemasoperativos
Oscar Uriel LorenzoSalomón
Datos de control de acceso.
Tipo (archivo de datos, programa objeto, programa fuente, etc.).
Disposición (permanente contra temporal).
Fecha y tiempo de creación.
Fecha de destrucción.
Fecha de la última modificación.
Suma de las actividades de acceso (número de lecturas, por ejemplo).
Los descriptores de archivos suelen mantenerse en el almacenamiento secundario; se
pasan al almacenamiento primario al abrir el archivo.
El descriptor de archivos es controlado por el sistema de archivos ; el usuario puede no
hacer referencia directa a él.
A cada uno de los archivos se le asigna un descriptor el cual contendrá toda la información
que necesitará el sistema de archivos para ejecutar con él los comandos que se le soliciten.
El descriptor se mantendrá en memoria principal desde que el archivo es abierto hasta que
sea cerrado, y debe tener al menos la siguiente información, identificación del archivo,
lugar de almacenamiento, información del modo de acceso.
Identificación del archivo. Consiste de dos partes que es el nombre simbólico que es el que
le da el usuario y un identificador interno que es asignado por el sistema operativo
(número). Lugar de almacenamiento así como el tamaño del archivo. Modo de acceso. Se
debe indicar en forma explícita quien puede accesar el archivo y conque derecho.
Mecanismo de control de acceso.
Control de un sistema de información especializado en detectar los intectos de acceso,
permitiendo el paso de las entidades autorizadas, y denegando el paso a todas las demás.
Involucra medios técnicos y procedimientos operativos.
Mecanismo que en función de la identificación ya autenticada permite acceder a datos o
recursos.
Los Directorios son utilizados por el sistema operativo para llevar un registro de los
archivos que incluye el nombre, los atributos y las direcciones en disco donde se
almacenan los datos del archivo referenciado.
Open (abrir): antes de utilizar un archivo, un proceso debe abrirlo. La finalidad es
permitir que el sistema traslade los atributos y la lista de direcciones en disco a la memoria
principal para un rápido acceso en llamadas posteriores.
9. Sistemasoperativos
Oscar Uriel LorenzoSalomón
Close (cerrar): cuando concluyen los accesos, los atributos y direcciones del disco ya no
son necesarios, por lo que el archivo debe cerrarse y liberar la tabla de espacio interno.
Referencia:
http://sistemasoperativos.angelfire.com/html/5.4.html
http://sistemasoperativos.angelfire.com/html/5.5.html