TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
Cluster
1. 1. ¿Qué es un clúster de servidores?
Esta tecnología comenzó a finales de los años 50 y se puede considerar inventada por
Gene Amdhal de IBM. Es un conjunto de varios servidores que se construyen e instalan
para trabajar como si fuesen uno solo. Generalmente están unidos mediante una red
de alta velocidad. No es necesario que los equipos que integran el clúster sean iguales a
nivel hardware ni software. Con este tipo de sistemas se busca conseguir: alta
disponibilidad, alto rendimiento, balanceo de carga y escalabilidad. Son ampliamente
utilizados; por ejemplo, en 2003 el clúster de Google llegó a estar formado por más de
15000 ordenadores personales. Ejemplos: TOP500
Clústers de servidores Francesc Pérez Fdez.
2. 2. Tipos de clústers
Existen tres tipos de clústers:
- Clúster de alto rendimiento (HC o High Performance Clusters): ejecutan tareas que
necesitan una gran capacidad de cálculo y/o del uso de grandes cantidades de
memoria.
- Clústers de alta disponibilidad (HA o High Availability): dan disponibilidad y
confiabilidad a los servicios que ofrecen. Para ello se suele utilizar hardware duplicado
(redundancia), de modo que al no tener un único punto de fallos se garantiza la
disponibilidad del sistema. Por otra parte, incorporan software de detección y
recuperación de fallos, con objeto de hacer más confiable el sistema para su uso.
- Clúster de alta eficiencia (HT o High Throughout): el objetivo central de diseño es que
Clústers de servidores Francesc Pérez Fdez.
- Clúster de alta eficiencia (HT o High Throughout): el objetivo central de diseño es que
puedan ejecutar el mayor número de tareas en el menor tiempo posible.
Los clusters pueden también clasificar como Clusters de IT Comerciales (Alta
disponibilidad, Alta eficiencia) y Clusters Científicos (Alto rendimiento).
3. 3. Componentes de los clústers
- Nodos: es el nombre genérico que se dará a cualquier máquina que utilicemos para
montar un clúster. Aún cuando podemos utilizar cualquier tipo de hardware para
montar nuestro sistema, es siempre buena idea que haya cierto parecido entre las
capacidades de todos los nodos, ya que, en caso contrario, habrá siempre cierta
tendencia a enviar el trabajo a realizar a aquel equipo que disponga de una mayor
capacidad de procesamiento.
- Sistema operativo: podemos utilizar cualquier sistema operativo que tenga dos
características básicas: debe ser multiproceso y multiusuario. Ejemplos: GNU/Linux
(OPenMosix, Cóndor, Kerrighed, Rocks, Sun Grid Engine), Unix (Solaris, HP-UX, AIX),
Windows (NT, 200 Server, 2003 Server, 2008 Server), MAC OS X (Xgrid), Solaris,
Clústers de servidores Francesc Pérez Fdez.
Windows (NT, 200 Server, 2003 Server, 2008 Server), MAC OS X (Xgrid), Solaris,
FreeBSD.
- Conexión de red: es necesario que los distintos nodos de nuestra red estén conectados
entre sí. Para ello podemos utilizar una conexión Ethernet u otros sistemas de alta
velocidad como FastEthernet (100Mbps), GigabitEthernet (1/10Gbps), Myrinet
(2/10Gbps), Infiniband (96Gbps), SCI (5,3Gbps), etc.
- Middleware: es el nombre que recibe el software que se encuentra entre el sistema
operativo y las aplicaciones. Su objetivo es que el usuario del clúster tenga la sensación
de estar frente a un único superordenador ya que provee de una interfaz única de
acceso al sistema (SSI Single System Image). Mediante este software se consigue
optimizar el uso del sistema y realizar operaciones de balanceo de carga, tolerancia a
fallos, etc. Se ocupa además de detectar nuevos nodos que vayamos añadiendo al
clúster, dotándolo de una gran posibilidad de escalabilidad.
4. 3. Componentes de los clústers
- Sistema de almacenamiento: cuando trabajamos con clusters podemos hacer uso de
un sistema de almacenamiento interno en los equipos, utilizando los discos duros de
manera similar a como lo hacemos en un PC (IDE/ATA hasta 166MB/s, SATA hasta
600MB/s, SCSI hasta 640MB/s, SAS hasta 600MB/s), o bien recurrir a sistemas de
almacenamiento externos más complejos, que proporcionan una mayor eficiencia y
disponibilidad de los datos, como son los dispositivos NAS (Network Attaches Storages)
o las redes SAN (Storage Area Network). El protocolo más comúnmente utilizado es NFS
(Network File System), sistema de ficheros compartido entre servidor y los nodos. Sin
embargo existen sistemas de ficheros específicos para clusters como Lustre (CFS) y
PVFS2.
Clústers de servidores Francesc Pérez Fdez.
PVFS2.
4. Almacenamiento externo
- NAS (Network Attaches Storage): son dispositivos de almacenamiento específicos, a
los cuales se accede utilizando protocolos de red, generalmente TCP/IP. La idea consiste
en que el usuario solicita al servidor un fichero completo y, cuando lo recibe, lo maneja
localmente, lo cual hace que este tipo de tecnología sea ideal para el uso con ficheros
de tamaño reducido, ofreciendo la posibilidad de manejar una gran cantidad de ellos
desde los equipos clientes. Permite, con bajo coste, realizar balanceo de carga y
tolerancia a fallos, por lo que es cada vez más utilizado en servidores Web para proveer
servicios de almacenamiento, especialmente contenidos multimedia. Suelen estar
compuestos por uno o más dispositivos que se disponen en RAID, lo que permite
aumentar su capacidad, eficiencia y tolerancia a fallos.
5. 4. Almacenamiento externo
- SAN (Storage Area Network): red con área de almacenamiento pensada para conectar
servidores, discos de almacenamiento, etc., utilizando tecnología de fibra (hasta 8Gb/s).
De modo general, un dispositivo de almacenamiento no es propiedad exclusiva de un
servidor, lo que permite que varios servidores puedan acceder a los mismos recursos. El
funcionamiento se basa en las peticiones de datos que realizan las aplicaciones al
servidor, que se ocupa de obtener los datos del disco concreto donde estén
almacenados.
Dependiendo de la cantidad de información manejada, podremos optar por el uso de
una u otra tecnología. Para grandes volúmenes sería conveniente utilizar una red SAN,
Clústers de servidores Francesc Pérez Fdez.
una u otra tecnología. Para grandes volúmenes sería conveniente utilizar una red SAN,
mientras que para pequeños volúmenes sería conveniente utilizar NAS. Esto no quiere
decir que ambas tecnologías sean excluyentes; existe de hecho la posibilidad de
combinarlas en sistemas cuyas características así lo requieran.