Existen muchas definiciones y no siempre coincidentes. Nosotros diremos que un sistema distribuido es un conjunto de computadores independientes que se presenta a los usuarios como un sistema único. En esta definición cabe destacar dos aspectos. Uno, el hardware. La definición habla de máquinas autónomas, es decir, que pueden operar sin la supervisión de ninguna otra. Dos, el software, que debe conseguir que los usuarios del sistema lo vean como una máquina central convencional única.
El diseño e investigación de herramientas para los sistemas operativos centralizados convencionales, los cuales corren en sistemas de uno o varios procesadores, está muy bien entendido. Sin embargo la proliferación de estaciones de trabajo personales y redes de área local ha llevado al desarrollo de nuevos conceptos del sistema operativo, a saber sobre, sistemas operativos en red y sistemas operativos distribuidos.
Antes de empezar no hay que confundir un Sistema Operativo de Red con un Sistema Operativo Distribuido. En un Sistema Operativo de Red las computadoras están interconectadas por medios de comunicación: software y hardware. En este tipo de red los usuarios saben dónde están ejecutando su trabajo y guardando su información. En cambio en los Sistemas Operativos Distribuidos existe un software que distribuye las tareas de los usuarios sobre una red de computadoras y para los usuarios es transparente donde realizan sus tareas y guardan su información.
Existen dos esquemas básicos de éstos sistemas. Un sistema fuertemente acoplado es a es aquel que comparte la memoria y un reloj global, cuyos tiempos de acceso son similares para todos los procesadores. En un sistema débilmente acoplado los procesadores no comparten ni memoria ni reloj, ya que cada uno cuenta con su memoria local.
Existen muchas definiciones y no siempre coincidentes. Nosotros diremos que un sistema distribuido es un conjunto de computadores independientes que se presenta a los usuarios como un sistema único. En esta definición cabe destacar dos aspectos. Uno, el hardware. La definición habla de máquinas autónomas, es decir, que pueden operar sin la supervisión de ninguna otra. Dos, el software, que debe conseguir que los usuarios del sistema lo vean como una máquina central convencional única.
El diseño e investigación de herramientas para los sistemas operativos centralizados convencionales, los cuales corren en sistemas de uno o varios procesadores, está muy bien entendido. Sin embargo la proliferación de estaciones de trabajo personales y redes de área local ha llevado al desarrollo de nuevos conceptos del sistema operativo, a saber sobre, sistemas operativos en red y sistemas operativos distribuidos.
Antes de empezar no hay que confundir un Sistema Operativo de Red con un Sistema Operativo Distribuido. En un Sistema Operativo de Red las computadoras están interconectadas por medios de comunicación: software y hardware. En este tipo de red los usuarios saben dónde están ejecutando su trabajo y guardando su información. En cambio en los Sistemas Operativos Distribuidos existe un software que distribuye las tareas de los usuarios sobre una red de computadoras y para los usuarios es transparente donde realizan sus tareas y guardan su información.
Existen dos esquemas básicos de éstos sistemas. Un sistema fuertemente acoplado es a es aquel que comparte la memoria y un reloj global, cuyos tiempos de acceso son similares para todos los procesadores. En un sistema débilmente acoplado los procesadores no comparten ni memoria ni reloj, ya que cada uno cuenta con su memoria local.
2. Introducción.
RAID (Redundant Array of Independent Disks) o conjunto redundante de discos independientes
es un sistema de almacenamiento de datos que usa múltiples discos, dependiendo de la
configuración de RAID (niveles) que se posea los datos se almacenan de diferentes formas.
Las ventajas más relevantes de utilizar el arreglo RAID son, mayor tolerancia a fallos del
sistema o de hardware, mayor integridad, mayor rendimiento y mayor capacidad. Los niveles
del RAID estándar son, RAID 0 (data Striping), RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6,
RAID 5E y RAID 6E.
En la siguiente práctica implementaremos el arreglo RAID 5 o arreglo distribuido con paridad en
el cual se crea una división de bloques distribuyendo la información con paridad entre todos los
discos del conjunto.
La implementación de RAID 5 se ha vuelto muy popular ha tenido mucha acogida en empresas
de Internet y comercio electronico, debido a su tolerancia inminente de fallos sin sacrificar la
cantidad de disco necesario en otras configuraciones como RAID 1 ; RAID 5 es muy factible en
entornos de producción donde los datos se replican a través de multiples servidores.
2
3. Para la gestión del RAID 5 utilizaremos el virtualizador VirtualBox.
Antes de iniciar debemos tener 3 dispositivos SATA previamente montados en el VirtualBox.
Seleccionando en la configuración del VirtualBox, Almacenamiento > Controlador SATA >
Agregar disco duro > Crear un nuevo disco. Seguimos los parámetros que deseemos
configurar y al final debemos tener 3 dispositivos así;
Para implementar el RAID por software se utilizará el gestor de RAID MDADM.
MDADM (Multiple Device Administrator) es un conjunto de herramientas utilizadas por
GNU/Linux para la gestión para el conjunto redundante de discos independientes, este software
proporciona amabilidad y robusticidad en la gestión de arrays de software.
MDADM puede manejar cualquier tipo de dispositivo de bloques que se pueda presentar en el
kernel. Por defecto, este paquete no viene instalado en el sistema operativo CentOS 6.2, así que
llevamos a cabo la instalación del paquete a través del siguiente comando.
Luego de llevar a cabo la instalación del software MDADM es importante que confirmemos el
tamaño de los discos agregados recientemente, el tamaño de estos discos debe ser igual en
los tres casos para de esta forma llevar correctamente la configuración del RAID, mediante el
comando fdisk l [nombre del dispositivo], de esta forma listamos la tabla de particiones del
dispositivo /dev/sdb.
3
5. Mediante el siguiente comando podemos ver el estado del arreglo RAID.
Ahora, le daremos formato a las particiones RAID.
Crearemos el directorio /mnt/var mediante el comando mkdir, ya que el directorio /var será el
punto de montaje de nuestro arreglo RAID. Posteriormente procedemos a montar el directorio
de dispositivo de bloques /dev/md0 en el directorio creado recientemente /mnt/var.
Verificamos que sí se haya montado de manera exitosa el directorio.
El próximo paso será sincronizar el directorio /var con el directorio /mnt/var, esto se lleva a cabo
mediante el comando rsync el cual nos permite sincronizar directorios y archivos, las opciones
v (incrementa la verbosidad) z (descomprime los datos del archivo) a (modo recursivo y
conservación de todo).
5
6. Podemos confirmar que efectivamente el directorio /var del sistema se encuentra en el
directorio /mnt/var.
Luego de tener montado el directorio, procedemos a registrar el UUID (Identificador único
universal) del arreglo RAID (/dev/md0) al fichero /etc/fstab en el cual, se aloja la información de
cómo se montan los dispositivos de disco duro en el sistema de ficheros del sistema.
6
8. Para verificar el funcionamiento y cumplimiento de la tarea del RAID, haremos lo siguiente en
VirtualBox.
En el modo de configuración del VirtualBox eliminaremos un disco de los que habíamos creado
anteriormente y agregaremos otro totalmente nuevo; esto se puede llevar a cabo mediante lo
siguiente: Configuración > Almacenamiento > Seleccionamos el disco a eliminar y en la parte
inferior pulsamos sobre el icono de eliminación > Agregamos un disco nuevo > Aceptar.
Al iniciar la máquina podemos observar mediante el comando cat /proc/mdstat
Podemos observar que los dispositivos que pertenecen actualmente arreglo RAID han
cambiado, ya que anteriormente en el arreglo estaban los dispositivos [sdb,sdc,sdd], ahora sólo
contamos con los dispositivos [sdb,sdc] ya que el dispositivo que eliminamos fue el sdd.
Para agregar nuevos dispositivos al RAID ejecutamos lo siguiente con el comando mdadm.
La sintaxis es la siguiente: mdadm (comando para gestionar RAID) manage (es utilizado para
manipular dispositivos en un array activo, añadir o eliminar discos de un array en
funcionamiento) a (ensambla un RAID preexistente) /dev/md127 (directorio donde se
encuentran montadas los dispositivos pertenecientes al RAID) /dev/sdd (dispositivo nuevo que
será añadido al arreglo RAID)
Luego de haber agregado el dispositivo sdd al arreglo podemos confirmar que ya hace parte del
arreglo RAID.
8
9. Conclusiones.
El arreglo RAID posee varios niveles que se ajustan de acuerdo a las necesidades que el
administrador requiera.
El gestor mdadm es una herramienta para la gestión de RAID por software.
Es necesario instalar el paquete correspondiente al software mdadm para implementar el
mismo.
El arreglo RAID proporciona alta disponibilidad de datos.
El arreglo RAID proporciona tolerancia a fallos y permite a varios discos trabajar en paralelo,
aumentando así el rendimiento del sistema.
RAID soporta dos técnicas para aumentar la fiabilidad, la redundancia de datos y la alta
disponibilidad.
9