SISTEMAS DE
ALMACENAMIENTO
Estructura de contenidos 2
CONCEPTOS GENERALES DE SISTEMAS DE ALMACENAMIENTO 3
Definiciones previas 4
CLASIFICACIÓN DE LOS SISTEMAS DE ALMACENAMIENTO
POR DISPONIBILIDAD DE DATOS 6
SISTEMAS DE ALMACENAMIENTO BASADOS EN HARDWARE 6
Sistema de almacenamiento RAID 6
Ventajas y desventajas de los RAID’s 7
Clasificación del sistema RAID’s 7
RAID Estándar 8
Ventajas y desventajas de los nivel RAID estándar 13
Cuadro comparativo de parámetros del nivel RAID estándar 14
Sistema de almacenamiento SAN 16
Definición de SAN 16
Ventajas y desventajas de SAN 17
Sistema de almacenamiento NAS 17
Definición de NAS 17
Ventajas y desventajas de NAS 18
SISTEMAS DE ALMACENAMIENTO BASADO EN SOFTWARE 19
BIBLIOGRAFÍA 20
MATERIAL AUDIOVISUAL 22
GLOSARIO 23
3
Sistemas de Almacenamiento
CONCEPTOS GENERALES DE LOS
SISTEMAS DE ALMACENAMIENTO
INTRODUCCIÓN
El especialista en administración de bases de datos, debe tener la per-
cepción del funcionamiento de cada uno de los componentes lógicos y
físicos que integran el sistema de base de datos; esto con el fin de que
posean los conocimientos suficientes para seleccionar adecuadamente las
herramientas que se necesitan para desempeñar el rol de DBA (database
administrator) administrador de base de datos.
Los entornos de producción que incluyen sistemas de bases de datos
para almacenar la información requieren de unos niveles de confiabili-
dad, rendimiento y disponibilidad que deben ser cumplidos mediante
distintas estrategias, una de las que resulta frecuentemente implementa-
da es el uso de arreglos de discos basados en software o en hardware
para el almacenamiento redundante de la información.
Con el estudio de este contenido se introducirán
a los sistemas de almacenamiento,
en donde abordaran temas como:
conceptos, tipos, ventajas, costos
y consideraciones de rendimiento,
para la selección adecuada de los
dispositivos de almacenamiento,
de acuerdo con los requerimientos
del sistema.
4
DEFINICIONES PREVIAS
Fracasos: Cambios físicos detectables en el hardware del equipo,
su solución implica remplazo del componente afectado.
Fallas: Son contingencias que afectan el funcionamiento normal
del sistema, pueden ser:
•Suaves: cuando son fallas raramente repetibles y se
deben a causas fortuitas.
•Duras: cuando son fallas repetibles y se deben a
fracasos.
Errores: Son la manifestación de las fallas ya sean suaves o
duras y estos producen valores incorrectos en el
sistema.
Confiabilidad: Probabilidad de que el sistema no falle en el futuro, se
tienen en cuenta los siguientes parámetros:
•MTTF: Mean Time To Failure – Tiempo medio entre
fallas: expresa la confiabilidad del sistema, se mide en
unidades de tiempo e indica el tiempo que el sistema
puede funcionar sin presentar fallas.
•MTTR: Mean Time To Repair – Tiempo medio para
reparar: es el tiempo que toma reponer el disco que fallo.
Disponibilidad: Probabilidad de que el sistema se encuentre
funcionando en cualquier instante.
Rendimiento: Tiempo que toma una unidad de disco en responder a
una petición completa de entrada - salida de datos,
depende de dos aspectos:
•Limitaciones mecánicas y eléctricas de la unidad de disco.
•Carga de entrada salida impuesta por el sistema
Redundancia: Almacenamiento de los mismos datos en dos o más
unidades de disco.
Sistemas de Almacenamiento
5
Evitación de fallas: Estrategias que se implementan con el fin de
disminuir la probabilidad de fallos en el sistema.
Tolerancia a fallos: Capacidad del sistema de neutralizar los efectos
de una falla en cualquiera de sus módulos, esto se
logra con la redundancia de los componentes de
un módulo.
Persistencia: Capacidad de un sistema para mantener en el
tiempo los datos en un estado que permita su
posterior recuperación.
Códigos de Hamming:Es método utilizado para la detección y corrección
de errores en las unidades de discos duros.
Sistemas de Almacenamiento
6
Sistemas de Almacenamiento
CLASIFICACIÓN DE LOS SISTEMAS DE
ALMACENAMIENTO POR DISPONIBILIDAD DE DATOS
Los distintos niveles de RAID (Redundant Array of Independent Disks),
con su configuración característica responden satisfactoriamente a al
menos un nivel de la siguiente clasificación de sistemas de almacenamien-
to propuesta por RAID Advisory Board en 1996:
• FRDS - Sistema de discos resistente a fallas: Evita la pérdida de los
datos almacenados en el arreglo, cuando falla una de sus unidades
de disco.
• FTDS - Sistema de discos tolerante a fallas: Mantiene los datos
accesibles cuando falla cuando cualquiera de los componentes
del arreglo.
• DTDS - Sistema de discos tolerante a desastres: Mantiene los
datos almacenados en el arreglo de discos disponibles mediante
dos o más sistemas de acceso redundantes e independientes.
SISTEMAS DE ALMACENAMIENTO
BASADOS EN HARDWARE
El comportamiento de las distintas configuraciones de los sistemas de
almacenamiento basados en hardware, son evaluados mediante los
siguientes parámetros:
• Confiabilidad – Integridad y persistencia de la información.
• Rendimiento (throughput) – Tiempo de respuesta.
• Disponibilidad – Tolerancia a fallos.
SISTEMA DE ALMACENAMIENTO RAID
El sistema de discos independientes en arreglo redundante o RAID por las
letras iniciales de las palabras que componen la frase en ingles Redundant
Array of Independent Disks; es el término utilizado para referirse a los sis-
temas de almacenamiento basados en discos duros que tienen la capaci-
dad de actuar colectivamente para replicar los datos en distintas unidades,
con el fin de garantizar la disponibilidad y la persistencia de la información
almacenada en cada uno de los discos que hacen parte del arreglo.
7
Sistemas de Almacenamiento
VENTAJAS Y DESVENTAJAS DE LOS RAID’S
CLASIFICACIÓN DEL SISTEMA RAID’S
• RAID's Estándar (Niveles 0,1, 2, 3, 4, 5 y 6): cada uno de los 7 nive-
les que componen el estándar RAID proporcionan una configuración distin-
ta para almacenar los datos en más de un disco.
• RAID's Anidados (Niveles 0+1, 1+0, 10, 30, 50, 53 y 100): son
combinaciones derivadas de los niveles estándar de RAID, que toman los
aspectos positivos de cada configuración con el fin obtener un mejor rendi-
miento en el arreglo de discos.
• RAID's Propietarios: son implementaciones de RAID que han sido
desarrolladas por las empresas como diseños propietarios.
• No protege los datos ante un
virus, un borrado accidental o
un fallo de otro componente
del sistema.
• No simplifica la recuperación de
los datos cuando sucede un fallo.
• No mejora el rendimiento de
todas las aplicaciones.
• Aumentan la tasa de
transferencia sostenida cuando
hay operaciones de lectura
lineales.
• Mejora el rendimiento de
aplicaciones que trabajan con
ficheros grandes (edición de
vídeo e imágenes).
• La redundancia de datos en
múltiples discos proporciona
tolerancia a fallos.
• El hardware RAID ofrece mejor
rendimiento que un solo disco.
• Facilita las operaciones de
respaldo de datos cuando se
realizan de disco a disco.
8
Sistemas de Almacenamiento
RAID Estándar: se compone de 7 niveles en los que cada uno de ellos
proporcionan una configuración particular para almacenar los datos en
más de un disco.
Raid 0
Las unidades de discos utilizadas en RAID 0 son conectados en
paralelo con el fin de que el sistema lo detecte como uno de mayor
capacidad.
Las unidades de discos están compuestas de múltiples bloques
sobre los que se almacena de forma no secuencial los segmentos
en que se ha divido la información. De esta forma un archivo guar-
dado con RAID 0 es dividido en bloques y almacenado en diferentes
partes del arreglo de discos.
Segmentación de información a
nivel de bloque sin tolerancia
al error.
9
Raid 1
Raid 2
El Nivel RAID 1 estándar está compuesto por mínimo dos unida-
des de disco que contienen en todo momento una copia exacta de
los datos almacenados, de esta forma se mejora la tolerancia a
fallos mediante la redundancia de hardware y se asegura disponi-
bilidad de los datos.
Conjunto de discos con
información en espejo.
Segmentación de la información a
nivel de bits con código Hamming
para la corrección de errores
El nivel RAID 2 estándar, segmenta la información a nivel de bits
e implementa el método de códigos de Hamming para la detec-
ción y corrección de errores.
Este nivel se considera innecesario y solo se utiliza cuando se
tienen discos antiguos que no tienen detección de errores interna,
esto lo hace de muy poca utilidad práctica, ya que todas las uni-
dades de disco modernas traen incorporado esta característica.
Sistemas de Almacenamiento
10
Sistemas de Almacenamiento
Raid 3
Segmentación de información a
nivel de bytes con disco de paridad
dedicado.
El nivel RAID 3 estándar, segmenta la información a nivel de byte's y luego
la distribuye en múltiples unidades de disco; la redundancia de los datos
se logra implementando un disco de paridad dedicado, el cual mediante
chequeo de paridad se encarga de detectar y corregir errores en los datos
cuando falla una unidad de disco.
Esta implementación requiere mínimo de tres unidades de discos y en uno
de ellos se almacenan exclusivamente los datos paridad, en caso de fallar
esta unidad se pierde la redundancia sobre los datos.
11
Sistemas de Almacenamiento
Raid 4
Segmentación de información a
nivel de bloque con disco de
paridad dedicado
El nivel RAID 4 estándar, segmenta la información a nivel de bloque
y luego la distribuye en múltiples discos; la redundancia de los
datos se consigue implementando un disco de paridad dedicado, el
cual mediante chequeo de paridad se encarga de detectar y corregir
errores en los datos cuando falla una unidad de disco. En caso de
fallar el disco de paridad se pierde la redundancia sobre los datos.
Raid 5
Segmentación de información a
nivel de bloque, con datos de
paridad distribuidos.
El nivel RAID 5 estándar, segmenta la información a nivel de bloque
y luego la distribuye entre las unidades de discos; cada dato de
paridad creado es almacenado de forma que nunca coincida con el
disco en el que han sido guardados los segmentos de la información
original, de esta forma se consigue redundancia sobre la informa-
ción sin utilizar un disco de paridad dedicado. Se requiere de
mínimo tres discos para realizar una implementación de este tipo.
12
Sistemas de Almacenamiento
Raid 6
Segmentación de información a
nivel de bloque, con doble
paridad distribuida
El nivel RAID 6 estándar, segmenta la información a nivel de
bloques e implementa datos de paridad doble que son distribuidos
entre las diferentes unidades que conforman el arreglo de discos. La
configuración de RAID 6 permite que dos unidades de disco distintas
fallen simultáneamente, pudiéndose aun así recuperar los datos.
13
Sistemas de Almacenamiento
VENTAJAS Y DESVENTAJAS DE
LOS NIVELES RAID ESTÁNDAR
• En caso de que una unidad de disco
falle, no es posible recuperar los
datos.
• No posee tolerancias a fallos si, falla
una unidad de disco el sistema
queda fuera de servicio.
• No posee redundancia de datos.
• Las aplicaciones convencionales de
escritorio no muestran mejora
notable en el rendimiento.
• Es más costoso puesto que se
necesita el doble del espacio para
almacenar los datos.
• La escritura de los datos es más
lenta ya que se debe realizar en
dos localizaciones.
• Si se escriben datos corruptos en
una unidad estos son duplicados en
la otra.
• Es una solución costosa por la
cantidad de discos que se necesitan
para guardar los códigos de error.
• Tiempo de escritura bastante lento.
• No puede usarse con discos SCSI.
• No hay implementaciones
comerciales de este nivel.
• Al fallar el disco de paridad se
pierde la redundancia de los datos.
• El disco de paridad puede
convertirse en un cuello de botella
para el sistema.
• No puede atender múltiples
peticiones de lectura-escritura.
• Mayor capacidad de
almacenamiento, por lo que no
duplica los datos.
• Proporciona mayor velocidad de
lectura y escritura.
• Mejora el rendimiento de
transferencia lineal.
• Se utiliza toda la capacidad
del disco.
• Si una unidad de disco fzalla, es
posible recuperar los datos
mediante el disco espejo.
• Es tolerante a fallos, en caso de
que una unidad falle el sistema
puede seguir en servicio.
• Mayor rendimiento en la lectura
de datos.
• Mejora la demanda y la
velocidad de transferencia.
• Realiza detección y correcciones
de errores con código de
Hamming.
• Implementa un disco de paridad
para corrección de errores.
• Puede fallar un disco y es
posible recuperar la
información.
• Alto rendimiento para acceso
secuencial de grandes archivos.
RAID 0
RAID 1
RAID 2
RAID 3
14
Sistemas de Almacenamiento
RAID 5
RAID 6
RAID 4
• El disco de paridad es un punto
único fallo que puede producir la
perdida de redundancia sobre los
datos.
• La escritura de datos pequeños
resulta más lenta.
• Si fallan 2 unidades de disco
simultáneamente el sistema deja
de funcionar.
• No aumenta el rendimiento de las
aplicaciones.
• Es ineficiente con pocos discos.
• Puede atender peticiones
simultáneas de lectura-escritura.
• Las operaciones de lectura se
realizan más rápido.
• Tiene un mejor desempeño al
trabajar con múltiples transacciones
pequeñas.
• Ideal para aplicaciones con
procesamiento transaccional.
• Es posible recuperar los datos
hasta con dos unidades de
disco en falla.
16
Sistemas de Almacenamiento
SISTEMAS DE ALMACENAMIENTO SAN
DEFINICIÓN DE SAN - STORAGE AREA NETWORK
Las SAN son sistemas dedicados de almacenamiento en red que acceden
a los recursos mediante conexiones directas entre el servidor y los disposi-
tivos de almacenamiento de manera que no causan impacto sobre la LAN
El alojamiento y compartición de archivos se realiza mediante un disco vir-
tual que conforman todos los dispositivos que pertenecen a la red y es en
esté, donde la información se consolida y se comparte entre los diferentes
servidores.
Un aspecto importante de las SAN es que al estar los datos distribuidos
entre los dispositivos de la red, estos tienen una alta disponibilidad y
redundancia en caso de fallo en cualquier componente del sistema.
TCP
/
IP
LAN
Servidor
Fiber Channel Switch
Servidor
Servidor
Servidor
Raid Disk Array
To Tape
Almacenamiento SAN
17
Sistemas de Almacenamiento
• La implementación resulta más
costosa que otros sistemas de
almacenamiento.
• El rendimiento del sistema
depende de la tecnología en
que está diseñada la red.
• La arquitectura utiliza tecnología
que resulta ser más costosa.
• Administración centralizada.
• Flexibilidad y escalabilidad en
la configuración.
• Alta disponibilidad y rendimiento.
• Confiabilidad en la transferencia
de los datos.
• No afecta el trafico de la red LAN.
• Es compatible con dispositivos
SCSI.
• Optimiza el espacio disponible
para el almacenamiento.
SISTEMAS DE ALMACENAMIENTO NAS
DEFINICIÓN DE NAS – NETWORK ATTACHED STORAGE
Los SAN como su nombre lo indica son dispositivos dedicados de almace-
namiento en red, que utilizan los recursos de la redes LAN para prestar el
servicio de almacenamiento. Estos dispositivos integran un sistema opera-
tivo que ha sido específicamente desarrollado para cumplir con el propósi-
to de alojar y compartir archivos dentro de una red LAN.
Las características avanzadas que proporcionan los NAS permiten estable-
cer políticas de acceso y redundancia sobre los datos con el objeto de
mantener la seguridad de los mismos.
VENTAJAS Y DESVENTAJAS DE LOS SAN
18
Sistemas de Almacenamiento
Almacenamiento NAS
Almacenamiento NAS
Almacenamiento NAS
Servidor
Servidor
Servidor
Servidor
Raid Disk Array
To Tape NAS Head
TCP / IP LAN
NFS / CIFS PROTOCOL
• Genera mucho tráfico en la red
en entornos con elevada
demanda de archivos.
• Presenta menor rendimiento por
el uso compartido de la red.
• Los dispositivos NAS son más
lentos que una arquitectura SAN.
• La limitaciones en distancias son
impuestas por el alcance de la
tecnología en que está diseñada
la red.
• Es un sistema orientado a prestar
el servicio de almacenamiento de
datos.
• El acceso de los datos no depende
de un servidor.
• El acceso de los datos se puede
realizar desde múltiples
plataformas.
VENTAJAS Y DESVENTAJAS DE LOS NAS
19
Sistemas de Almacenamiento
• No requiere de licencias multiusuario
• Optimiza la capacidad de almacenamiento.
• Permite escalabilidad en la capacidad de
almacenamiento.
SISTEMAS DE ALMACENAMIENTO BASADOS
EN SOFTWARE
Las aplicaciones de uso específico que permiten crear sistemas de almace-
namiento por software, requieren trabajar en conjunto con el sistema ope-
rativo y sobre todo necesitan de recursos de hardware adecuados para
realizar adecuadamente las implementaciones de este tipo de sistemas.
Los sistemas de almacenamiento basado en software resultan menos cos-
tosos que los convencionales basados en hardware, pero requieren una
configuración más minuciosa por parte del administrador del sistema.
El inconveniente que se presenta en los
sistemas de almacenamiento basados en
software, es que producen sobrecarga en el
sistema operativo, lo que genera un detri-
mento en el rendimiento del sistema y un
deficiente servicio al usuario.
La excesiva sobrecarga de procesamiento
puede llevar continuamente a que el sistema
colapse, con el agravante de que si ocurre en
un sistema en producción, esto definitiva-
mente no es tolerable bajo ninguna circuns-
tancia puesto que cada colapso implicaría
tiempo en que el sistema de almacenamien-
to no está disponible.
Algunos ejemplos de
sistemas de almacena-
miento basado en soft-
ware son:
• Linux MD RAID 10
• Sun Microsystem –
StorEdge T3
• IBM ServeRAID 1E
• Intel Matrix RAID
• Sun Microsystem –
RAID Z
Almacenamiento NAS
Almacenamiento NAS
Almacenamiento
BASADO EN SOFTWARE
20
Sistemas de Almacenamiento
BIBLIOGRAFÍA
¿Solución de alta disponibilidad de base de datos por hardware o por
software? López, L. Edgar y Felipe Alejandro. (2005). Universidad de
San Carlos de Guatemala. Facultad de Ingeniería, Escuela de Ingeniería
en Ciencias y Sistemas.
WEBGRAFIA
The RAID tutorial
http://www.ecs.umass.edu/ece/koren/architecture/Raid/raidhome.html
Definición RAID
http://www.pcguide.com/ref/hdd/perf/raid/index.htm
Intro to Nested-RAID: RAID-01 and RAID-10:
http://www.linux-
mag.com/id/7928/?hq_e=el&hq_m=1151565&hq_l=36&hq_v=3fa9646c
7f
Tipos de RAID
http://jmegias89.blogspot.es/1270590666/
Niveles RAID
http://www.raids.co.uk/raid_1.htm
http://orlandoolguin.wordpress.com/2010/06/21/arreglos-de-
discos-raid/
Niveles RAID estándar
http://www.sindominio.net/~apm/articulos/raid/niveles.html
http://www.ecs.umass.edu/ece/koren/architecture/Raid/basicRAID.html
http://www.pcguide.com/ref/hdd/perf/raid/levels/single.htm
21
Niveles RAID no estándar
http://www.raidrecoverylabs.com/non_standard_raid_levels/
Niveles RAID anidados
http://www.pcguide.com/ref/hdd/perf/raid/levels/mult.htm
RAID por hardware, por software y propietarios
http://arqordenadores.wiki-
site.com/index.php/RAID_propietarios:_paridad_doble%2C_1.5%2C_7%
2C_10
Nueva Clasificación RAID – Cuadro comparativo
http://en.wikipedia.org/wiki/RAID
NAS - Network Attached Storage
http://es.wikipedia.org/wiki/Network-attached_storage
SAN - Storage Area Network
http://es.wikipedia.org/wiki/Storage_Area_Network
22
Sistemas de Almacenamiento
MATERIAL AUDIOVISUAL
Tipos de RAID: estándar, anidado y propietario
http://www.youtube.com/watch?v=_44JjMZZYQw&feature=related
Contiene información sobre el concepto, historia, ventajas y desventajas de los
RAID y Niveles de RAID
http://www.youtube.com/watch?v=7ZEP9rkvKuM
Parte 1 - Contiene Introducción, conceptos básicos, que es RAID, niveles de
RAID 0-4
http://www.youtube.com/watch?v=f5q49QVYKYA&feature=related
Parte 2 - tipos de RAID 5-6, bidimencionales
http://www.youtube.com/watch?NR=1&v=gZOaZUKvR10:
Parte 1 - Descripción de RAID, sus niveles 1 y 2, aplicaciones y características.
http://www.youtube.com/watch?v=hO2-W-e9lek&feature=related
Parte 2 – Niveles RAID 3-5
http://www.youtube.com/watch?NR=1&v=fjdZJmLi4L0b
Parte 1
http://www.youtube.com/watch?v=WmDUROs2LZc&feature=related
Parte 2
http://www.youtube.com/watch?v=4KsHeYqglqA&feature=related
23
GLOSARIO
Backup Copia de la base de datos en un medio removible.
Confiabilidad Probabilidad de que el sistema no falle en el futuro.
DBA (Database Administrator), administrador de base de datos.
Disponibilidad Probabilidad de que el sistema se encuentre funcionando
en cualquier instante.
DTDS Sistema de discos tolerante a desastres
“Disaster-tolerant disk systems”
Error Manifestación de las fallas en que se producen valores
incorrectos en el sistema.
Fallas Contingencias que afectan el funcionamiento normal
del sistema.
Fracaso Probabilidad de que el sistema se encuentre funcionando
en cualquier instante.
FRDS Sistema de discos resistente a fallas
“Failure-Resistant Disk Systems”
FTDS Sistema de discos tolerante a fallos
“Failure-tolerant disk systems”
Sistemas de Almacenamiento
24
Sistemas de Almacenamiento
MTTR Tiempo medio para reparar
“Mean Time To Repair”
Persistencia Capacidad de un sistema para mantener en el tiempo
los datos en un estado que permita su posterior
recuperación.
RAID Arreglo redundante de discos independientes
“Redundant Array Independent Disk”
Redundancia Almacenamiento de los mismos datos en dos o más
unidades de discos.
Rendimiento Tiempo que toma una unidad de disco en responder
a una petición completa de entrada – salida de datos.
SAN Red de área de Almacenamiento
“Storage Area Network”
NAS Almacenamiento en red
“Network Attached Storage”
MRRF Tiempo medio entre fallas
“Mean Time To Failure”