Raid final

FIABILIDAD Y TOLERANCIA A FALLOS DE UN
SISTEMA RAID.
“Palma Steven”, “Ramírez Inés”, “Rocafuerte Andrea”, “Torres Joselyn”, “Vera Jonathan”
Facultad de Sistemas y Telecomunicaciones
Carrera de Electrónica y Telecomunicaciones
Universidad Estatal Península de Santa Elena
La Libertad – Ecuador
“steven_palma2013@hotmail.com”, “inesol1@hotmail.com”, “andrearg2212@hotmail.com”,
“joselyntorresgonzalez@hotmail.com”, “jonathan_51194@hotmail.com”
dquirumbay@upse.edu.ec
SISTEMAS OPERATIVOS
Resumen
El uso de las computadoras se ha vuelto muy importante para todo ser humano,
no solo se las usan en hogares y escuelas sino también para cosas de suma
importancia como para casos médicos, científicos, civiles y más. Una posibilidad
es que el fallo se deba a daños físicos en uno o más componentes de hardware,
con la consiguiente pérdida de la información almacenada.

I. INTRODUCCIÓN
Como personas naturales quienes
usamos una computadora para
labores normales, cuando llega a un
momento en que se traba o se apaga
y se nos borra la información, eso es
algo q nos molesta mucho. Ahora
imaginar cuan valiosa información
tienen las grandes empresas en el
mundo, debido a esto presentamos
el siguiente tema de fiabilidad y
tolerancia a fallos.
II. DESARROLLO
III. Fiabilidad Y
Tolerancia A Fallos
Sistema Raid
Como primera parte debemos saber
los conceptos básicos de fiabilidad y
todo lo que se refiera a lo que
significa fallo y sus tipos.
Fiabilidad: es una medida de su
conformidad con una especificación
autorizada de su comportamiento.
Avería: es una desviación del
comportamiento de un sistema
respecto de su especificación.
Fallo: Avería o imperfección que
impide el buen funcionamiento de
una cosa.
Tipos de fallos
 Fallos transitorios.
Desaparecen solos al cabo de un
tiempo ejemplo: interferencias en
comunicaciones.
 Fallos permanentes.
Permanecen hasta que se
reparan ejemplo: roturas de
hardware, errores de software.
 Fallos intermitentes.
Fallos transitorios que ocurren de
vez en cuando ejemplo:
calentamiento de un componente
de hardware.
Redundancia: Debido a diferentes
fallas o errores de hardware que
pueden desencadenar en la perdida
de datos importantes es que se ha
desarrollado la redundancia
protectora, la cual consiste en un
conjunto de dispositivos adicionales
que permiten al sistema continuar
operando correctamente aun cuando
el hardware falle.
 Redundancia Estática
Abarca el uso de componentes extra,
tales que los efectos de una falla en
un circuito, componente,
subsistema, señal o programa son

cubiertos inmediatamente por otros
circuitos que operan constantemente
y paralelamente al resto. La técnica
de redundancia estática más simple
es la redundancia modular triple
(TMR). Esta es implementada
usando tres módulos idénticos
operando en forma paralela.
 Redundancia Dinámica
abarca solo una unidad operativa a
la vez con varias piezas de repuesto
esperando para ser usadas si una
falla es detectada. Este sistema
requiere dos métodos o
procedimientos de cambio:
1. Cambio lógico: Es cuando
todas las piezas de repuesto
son puestas en
funcionamiento, cuando una
falla es detectada la salida del
siguiente repuesto es
colocada dentro del circuito y
la pieza defectuosa es
sacada.
2. Cambio de poder: requiere
que sólo una unidad operativa
sea encendida.
Cuando una falla es detectada, la
unidad con falla es apagada y la
siguiente pieza de repuesto es
encendida. Este procedimiento aísla
los repuestos del circuito y no gasta
energía en otros repuestos que no
hacen operaciones útiles.
 Redundancia Híbrida
Híbrida combina la redundancia
estática y la dinámica. La
redundancia estática, usada para
proveer detección de fallas, es
combinada con el conjunto de piezas
de repuesto para reemplazar
cualquier módulo con falla en el
sistema estático. El sistema básico
de redundancia híbrida es el TMR +
sistemas de repuestos (Hybrid (3,S)
system).
El sistema híbrido posee todas las
ventajas de la redundancia dinámica
sin el problema de construir
complejos procedimientos de
detección de fallas. Además, los
circuitos de escrutinio de un sistema
híbrido enmascaran el efecto de
alguna falla. Sin embargo el sistema
de cambio en la redundancia híbrida
es más complejo a los anteriores
sistemas de redundancia. Por lo
tanto, la redundancia híbrida puede
provocar una desactivación total del
sistema durante el cambio de una
pieza defectuosa.

Tolerancia a fallos
 Prevención de fallos
Se trata de evitar que se introduzcan
fallos en el sistema antes de que
entre en funcionamiento.
 Tolerancia de fallos
Se trata de conseguir que el sistema
continúe funcionando, aunque se
produzcan fallos.
 Evitación de fallos
Se trata de impedir que se
introduzcan fallos durante la
construcción del sistema.
 Eliminación de fallos
Consiste en encontrar y eliminar los
fallos que se producen en el sistema
una vez construido.
Técnicas de evitación de fallos
 Hardware
1) Utilización de componentes
fiables.
2) Técnicas rigurosas de
montaje de subsistemas.
3) Apantallamiento de hardware
 Software
1) Especificación rigurosa o
formal de requisitos.
2) Métodos de diseño
comprobados.
3) Lenguajes con abstracción de
datos y modularidad.
4) Utilización de entornos de
desarrollo con computador
(CASE) adecuados para
gestionar los componentes.
Técnicas de eliminación de fallos
1) Comprobaciones.
2) Revisiones de diseño.
3) Verificación de programas.
4) Inspección de código.
En cuanto a los niveles de RAID
cada uno de ellos tiene diferentes
formas de tolerancia a fallos, esto no
hace que uno sea mejor que el otro,
cada uno de ellos se adecua para
cada uso.
Niveles RAID
RAID 0: Disk Striping "La más alta
transferencia, pero sin tolerancia
a fallos".
Los datos se desglosan en pequeños
segmentos y se distribuyen entre
varias unidades. Este nivel de "array"
o matriz no ofrece tolerancia al fallo.
RAID 1: Mirroring "Redundancia.
Igual de rápido, pero más seguro”.
Ofrece una excelente disponibilidad
de los datos mediante la

redundancia total de los mismos.
Para ello, se duplican todos los datos
de una unidad o matriz en otra. De
esta manera se asegura la integridad
de los datos y la tolerancia al fallo,
pues en caso de avería, la
controladora sigue trabajando con
los discos no dañados sin detener el
sistema.
RAID 2: "Acceso paralelo con
discos especializados, la
redundancia a través del código
Hamming”
Adapta la técnica usada para
detectar y corregir errores en
memorias de estado sólido.
RAID 3: "Acceso síncrono con un
disco dedicado a paridad”
Dedica un único disco al
almacenamiento de información de
paridad.
Se necesita un mínimo de tres
unidades para implementar una
solución RAID 3.
RAID 4: "Comprobación. Acceso
Independiente con un disco
dedicado a paridad.”
Dedica un disco para guardar la
información de paridad de los otros
discos.
RAID 5: "Comprobación y rapidez.
Seguridad y velocidad. Acceso
independiente con paridad
distribuida.”
Este array ofrece tolerancia al fallo,
pero, además, optimiza la capacidad
del sistema permitiendo una
utilización de hasta el 80% de la
capacidad del conjunto de discos.
La implementación de la tolerancia a
fallos requiere que el sistema de
almacenamiento guarde la misma
información en más de un soporte
físico (redundancia), o en un equipo
o dispositivo externo a modo de
respaldo. De esta forma, si se
produce alguna falla que pueda
ocasionar pérdida de datos, el
sistema debe ser capaz de
restablecer toda la información,
recuperando los datos necesarios a
partir de algún medio de respaldo
disponible.
Por lo general, el concepto de
tolerancia a fallos se identifica con el
sistema de almacenamiento en RAID
(Redundant Array of Independent
Disks). Los sistemas RAID (a
excepción de RAID 0) se basan en la
técnica mirroring, en espejo, que
permite la escritura simultánea de los
datos en más de un disco del array.

IV. CONCLUSIÓN
Es importante para todos nosotros
entender que es la fiabilidad y
tolerancia a fallos de un sistema
RAID porque debemos saber cómo
nuestra información está siendo
cuidada y respaldada, saber qué
hacer en caso de que falle y para qué
sirve y en qué parte de nuestra
computadora se encuentra.
En informática, la tolerancia a fallos
o conmutación por error se refiere a
la capacidad de un sistema de
acceder a la información, aun en
caso de producirse algún fallo o
anomalía en el sistema.
V. REFERENCIAS
Bibliografía
Pablo, U. C. (2010). “RECONOCIMIENTO Y DEFINICIÓN DEL PROBLEMA”.

Raid final

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (12)

Similar a Raid final

Similar a Raid final (20)

Último

Último (16)

Raid final