SlideShare una empresa de Scribd logo
1 de 16
Modelo de falhas
Sistemas Distribuídos 2011.2
• Define e classifica as falhas, fornecendo uma base para a
  análise de seus efeitos em potencial e para projetar
  sistemas capazes de tolerar certos tipos de falhas e
  continuar funcionando




Conceito
• Defeito – Sistema não cumpre o que foi especificado
• Erro – Estado do sistema causado por uma falha




Conceitos Básicos
• Estes atributos podem ocorrem tanto em Processos de
  sistema como em canais de comunicação




Ocorrência de falhas
• A tolerância a falhas é a propriedade de um sistema
  distribuído que lhe permite recuperar da existência de
  falhas, sem introduzir comportamentos incorretos.
Um sistema deste tipo pode mascarar as falhas e
continuar a operar, ou parar e voltar a operar
mais tarde, de forma coerente, após reparação
da falha.




Definições
• Disponibilidade - mede a fração de tempo em que um
  serviço está a operar corretamente, isto é, de acordo com
  a sua especificação.
Para um sistema ser altamente disponível (highly available)
deve combinar um reduzido número de falhas com um curto
período de recuperação das falhas (durante o qual não está
disponível).




Definições
• Confiabilidade - mede o tempo desde um instante inicial
  até à primeira falha, isto é, o tempo que um sistema
  funciona corretamente sem falhas.
Um sistema que falha com grande frequência e recupere
rapidamente tem baixa confiabilidade, mas alta
disponibilidade.




Definições
• Pontualidade - Em sistemas de tempo real é a garantia de
  que o sistema é capaz de obedecer a constrangimentos
  temporais, isto é, a capacidade que o sistema tem de
  garantir limites para o tempo que as diferentes ações
  levam a executar.




Definições
• Falhas por omissão
  • De envio
  • De recebimento
• Falhas arbitrárias
• Falhas de tempo
• Falhas de resposta
  • Valor
  • Transição de estado
• Falhas por queda




Classificação
Falhas de omissão e arbitrárias
Falhas de tempo
• Transiente
– Ocorre uma vez e depois desaparece
– Se a operação for repetida, a falha não acontecera novamente
• Intermitente
– Ocorre e desaparece por “sua própria vontade”.
– Difícil de diagnosticar;
• Permanente
– Continua a existir até que o componente faltoso seja substituído




Tipos
• Técnicas para mascarar falhas
• Redundância de informação
– Bits extras são adicionados para permitir recuperação de
bits deteriorados
• Redundância de tempo para falhas de omissão
– Uma ação é realizada e, então, se for preciso, ela é
executada novamente.
• Redundância física
– Componentes físicos replicados são usados

Mascaramento de Falha
por Redundância
• O termo comunicação confiável é definido em termos de validade e
  integridade:
   • Validade: qualquer mensagem do buffer de envio é entregue ao buffer de
     recepção de seu
     destino, independente do tempo necessário
     para tal.

   • Integridade: a mensagem recebida é idêntica à enviada e nenhuma mensagem
     é entregue duas vezes.

• A tarefa para preservar a Integridade vem de duas premissas:
   • Qualquer protocolo que retransmita mensagens, mas não rejeite uma
     mensagem que entregue duas vezes.

   • Usuários mal-intencionados que podem injetar mensagens
     modificadas, reproduzir mensagens antigas ou falsificar mensagens.




Confiabilidade na
comunicação Um para Um
• Resiliência de Processos
– Replicação de processos em grupos
– Grupos Simples ou Hierárquicos
• Comunicação Confiável Cliente-Servidor
– Falhas de Comunicação
– Canal de Comunicação pode exibir falhas por queda, por omissão, arbitrarias
– TCP(ponto-a-ponto); RPC
• Comunicação Confiável de Grupo
– Como implementar entrega confiável de mensagens a todos os processos?
• Comprometimento Distribuído
– Envolve a realização de uma operação por cada membro de um grupo de
processos ou por absolutamente nenhum.


Estratégias de Tolerância
a Falhas
FIM

Más contenido relacionado

La actualidad más candente

Programação Concorrente - Introdução
Programação Concorrente - IntroduçãoProgramação Concorrente - Introdução
Programação Concorrente - IntroduçãoFabio Moura Pereira
 
Dispositivos Ativos e Passivos
Dispositivos Ativos e PassivosDispositivos Ativos e Passivos
Dispositivos Ativos e PassivosRikelmo19
 
Sistema Operativo Servidor
Sistema Operativo ServidorSistema Operativo Servidor
Sistema Operativo ServidorMiguel Marques
 
Módulo 3-Sistema Operativo Servidor - V3.pdf
Módulo 3-Sistema Operativo Servidor - V3.pdfMódulo 3-Sistema Operativo Servidor - V3.pdf
Módulo 3-Sistema Operativo Servidor - V3.pdfFChico2
 
Multimídia: Protocolos de transmissão de áudio e vídeo
Multimídia:  Protocolos de transmissão de áudio e vídeoMultimídia:  Protocolos de transmissão de áudio e vídeo
Multimídia: Protocolos de transmissão de áudio e vídeoFernando Costa
 
Aula 1: Virtualização
Aula 1: VirtualizaçãoAula 1: Virtualização
Aula 1: Virtualizaçãocamila_seixas
 
Classificação – sistemas operativos
Classificação – sistemas operativosClassificação – sistemas operativos
Classificação – sistemas operativosTROLITO LALALAL
 
Segurança no MySQL
Segurança no MySQLSegurança no MySQL
Segurança no MySQLMySQL Brasil
 
Teste de software - Processo de Verificação e Validação
Teste de software - Processo de Verificação e ValidaçãoTeste de software - Processo de Verificação e Validação
Teste de software - Processo de Verificação e ValidaçãoJoeldson Costa Damasceno
 
Visão Geral: Estruturas do Sistema Operacional
Visão Geral: Estruturas do Sistema OperacionalVisão Geral: Estruturas do Sistema Operacional
Visão Geral: Estruturas do Sistema OperacionalAlexandre Duarte
 
desafios na implementacao de sistemas distribuidos
desafios na implementacao de sistemas distribuidosdesafios na implementacao de sistemas distribuidos
desafios na implementacao de sistemas distribuidosHélio Jovo
 
Processos e threads
Processos e threadsProcessos e threads
Processos e threadsSilvino Neto
 
Apresentação Sistemas Distribuídos - Conceito
Apresentação Sistemas Distribuídos - ConceitoApresentação Sistemas Distribuídos - Conceito
Apresentação Sistemas Distribuídos - ConceitoThiago Marinho
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidosAsis Matos
 

La actualidad más candente (20)

Arp rarp
Arp rarpArp rarp
Arp rarp
 
Programação Concorrente - Introdução
Programação Concorrente - IntroduçãoProgramação Concorrente - Introdução
Programação Concorrente - Introdução
 
Dispositivos Ativos e Passivos
Dispositivos Ativos e PassivosDispositivos Ativos e Passivos
Dispositivos Ativos e Passivos
 
Sistema Operativo Servidor
Sistema Operativo ServidorSistema Operativo Servidor
Sistema Operativo Servidor
 
Módulo 3-Sistema Operativo Servidor - V3.pdf
Módulo 3-Sistema Operativo Servidor - V3.pdfMódulo 3-Sistema Operativo Servidor - V3.pdf
Módulo 3-Sistema Operativo Servidor - V3.pdf
 
Multimídia: Protocolos de transmissão de áudio e vídeo
Multimídia:  Protocolos de transmissão de áudio e vídeoMultimídia:  Protocolos de transmissão de áudio e vídeo
Multimídia: Protocolos de transmissão de áudio e vídeo
 
Aula 1: Virtualização
Aula 1: VirtualizaçãoAula 1: Virtualização
Aula 1: Virtualização
 
Classificação – sistemas operativos
Classificação – sistemas operativosClassificação – sistemas operativos
Classificação – sistemas operativos
 
Processos e threads cap 02 (i unidade)
Processos e threads   cap 02 (i unidade)Processos e threads   cap 02 (i unidade)
Processos e threads cap 02 (i unidade)
 
Segurança no MySQL
Segurança no MySQLSegurança no MySQL
Segurança no MySQL
 
Principais protocolos de rede
Principais protocolos de redePrincipais protocolos de rede
Principais protocolos de rede
 
Teste de software - Processo de Verificação e Validação
Teste de software - Processo de Verificação e ValidaçãoTeste de software - Processo de Verificação e Validação
Teste de software - Processo de Verificação e Validação
 
Visão Geral: Estruturas do Sistema Operacional
Visão Geral: Estruturas do Sistema OperacionalVisão Geral: Estruturas do Sistema Operacional
Visão Geral: Estruturas do Sistema Operacional
 
desafios na implementacao de sistemas distribuidos
desafios na implementacao de sistemas distribuidosdesafios na implementacao de sistemas distribuidos
desafios na implementacao de sistemas distribuidos
 
Processos e threads
Processos e threadsProcessos e threads
Processos e threads
 
Introducao as rede de computadores
Introducao as rede de computadoresIntroducao as rede de computadores
Introducao as rede de computadores
 
Apresentação Sistemas Distribuídos - Conceito
Apresentação Sistemas Distribuídos - ConceitoApresentação Sistemas Distribuídos - Conceito
Apresentação Sistemas Distribuídos - Conceito
 
Introdução à sistemas distribuídos
Introdução à sistemas distribuídosIntrodução à sistemas distribuídos
Introdução à sistemas distribuídos
 
Modelo osi
Modelo osiModelo osi
Modelo osi
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 

Destacado

Aula 2 introdução a sistemas distribuídos
Aula 2   introdução a sistemas distribuídosAula 2   introdução a sistemas distribuídos
Aula 2 introdução a sistemas distribuídosEduardo de Lucena Falcão
 
Arquitectura e modelos de sistemas distribuidos
Arquitectura e modelos de sistemas distribuidosArquitectura e modelos de sistemas distribuidos
Arquitectura e modelos de sistemas distribuidosPortal_do_Estudante_SD
 
Práticas e Modelos de Segurança
Práticas e Modelos de SegurançaPráticas e Modelos de Segurança
Práticas e Modelos de SegurançaDiego Souza
 
Dependabilidade e Segurança
Dependabilidade e SegurançaDependabilidade e Segurança
Dependabilidade e SegurançaRafael Barbolo
 
Redes de computadores volume 2
Redes de computadores   volume 2Redes de computadores   volume 2
Redes de computadores volume 2Marques Silva
 
ACII - SL07 - Introducao aos sistemas distribuidos
ACII - SL07 - Introducao aos sistemas distribuidosACII - SL07 - Introducao aos sistemas distribuidos
ACII - SL07 - Introducao aos sistemas distribuidosUFPB
 
Sistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redesSistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redesPortal_do_Estudante_SD
 
O trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicaçãoO trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicaçãoCentralInfo Kaspersky
 
79361331 barreiras-comunicacao
79361331 barreiras-comunicacao79361331 barreiras-comunicacao
79361331 barreiras-comunicacaoAnabela Silva
 
Barreiras á comunicação
Barreiras á comunicaçãoBarreiras á comunicação
Barreiras á comunicaçãoJoana Lima
 
Falhas na Comunicação
Falhas na ComunicaçãoFalhas na Comunicação
Falhas na ComunicaçãoKelly Ruas
 
Variedades linguísticas- exercício
Variedades linguísticas-  exercícioVariedades linguísticas-  exercício
Variedades linguísticas- exercícioCláudia Heloísa
 
Arquitetura cliente servidor
Arquitetura cliente servidorArquitetura cliente servidor
Arquitetura cliente servidorMarcia Abrahim
 

Destacado (17)

Aula 2 introdução a sistemas distribuídos
Aula 2   introdução a sistemas distribuídosAula 2   introdução a sistemas distribuídos
Aula 2 introdução a sistemas distribuídos
 
Arquitectura e modelos de sistemas distribuidos
Arquitectura e modelos de sistemas distribuidosArquitectura e modelos de sistemas distribuidos
Arquitectura e modelos de sistemas distribuidos
 
Práticas e Modelos de Segurança
Práticas e Modelos de SegurançaPráticas e Modelos de Segurança
Práticas e Modelos de Segurança
 
Dependabilidade e Segurança
Dependabilidade e SegurançaDependabilidade e Segurança
Dependabilidade e Segurança
 
Redes de computadores volume 2
Redes de computadores   volume 2Redes de computadores   volume 2
Redes de computadores volume 2
 
ACII - SL07 - Introducao aos sistemas distribuidos
ACII - SL07 - Introducao aos sistemas distribuidosACII - SL07 - Introducao aos sistemas distribuidos
ACII - SL07 - Introducao aos sistemas distribuidos
 
Sistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redesSistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redes
 
O trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicaçãoO trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicação
 
Segurança em sistemas distribuidos
Segurança em sistemas distribuidosSegurança em sistemas distribuidos
Segurança em sistemas distribuidos
 
79361331 barreiras-comunicacao
79361331 barreiras-comunicacao79361331 barreiras-comunicacao
79361331 barreiras-comunicacao
 
Comunicação
ComunicaçãoComunicação
Comunicação
 
Barreiras á comunicação
Barreiras á comunicaçãoBarreiras á comunicação
Barreiras á comunicação
 
Problemas de comunicação
Problemas de comunicaçãoProblemas de comunicação
Problemas de comunicação
 
Falhas na Comunicação
Falhas na ComunicaçãoFalhas na Comunicação
Falhas na Comunicação
 
Desafios da Comunicação
Desafios da ComunicaçãoDesafios da Comunicação
Desafios da Comunicação
 
Variedades linguísticas- exercício
Variedades linguísticas-  exercícioVariedades linguísticas-  exercício
Variedades linguísticas- exercício
 
Arquitetura cliente servidor
Arquitetura cliente servidorArquitetura cliente servidor
Arquitetura cliente servidor
 

Similar a Modelo de falhas

Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)Evandro Júnior
 
Sistemas Distribuídos
Sistemas DistribuídosSistemas Distribuídos
Sistemas DistribuídosRoberto Aragy
 
Tolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdfTolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdfHurgelNeto
 
Aula 03 qs - confiabilidade de sw
Aula 03   qs - confiabilidade de swAula 03   qs - confiabilidade de sw
Aula 03 qs - confiabilidade de swJunior Gomes
 
Sistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De DependabilidadeSistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De Dependabilidadechevreux
 
Sistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWSSistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWSJonas Silveira
 
2 Ads
2 Ads2 Ads
2 Adslcbj
 
Gerência de Processos: Processos
Gerência de Processos: ProcessosGerência de Processos: Processos
Gerência de Processos: ProcessosAlexandre Duarte
 
Categorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamentoCategorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamentoThaís Favore
 
Categorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo EscalonadorCategorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo EscalonadorSofia Trindade
 
Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4Edison Santos
 
Técnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web servicesTécnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web servicesJaguaraci Silva
 
Sistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de ProjetoSistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de ProjetoAdriano Teixeira de Souza
 
UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26Hélio Medeiros
 

Similar a Modelo de falhas (20)

Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)
 
Sistemas Distribuídos
Sistemas DistribuídosSistemas Distribuídos
Sistemas Distribuídos
 
Tolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdfTolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdf
 
Aula sd 2008_02aspectosprojectosds
Aula sd 2008_02aspectosprojectosdsAula sd 2008_02aspectosprojectosds
Aula sd 2008_02aspectosprojectosds
 
Aula 03 qs - confiabilidade de sw
Aula 03   qs - confiabilidade de swAula 03   qs - confiabilidade de sw
Aula 03 qs - confiabilidade de sw
 
Servidores de Aplicações
Servidores de AplicaçõesServidores de Aplicações
Servidores de Aplicações
 
Sistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De DependabilidadeSistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De Dependabilidade
 
SISTEMA SD
SISTEMA SDSISTEMA SD
SISTEMA SD
 
Circuit Breaker
Circuit BreakerCircuit Breaker
Circuit Breaker
 
Alta Disponibilidade
Alta Disponibilidade Alta Disponibilidade
Alta Disponibilidade
 
Sistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWSSistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWS
 
2 Ads
2 Ads2 Ads
2 Ads
 
Gerência de Processos: Processos
Gerência de Processos: ProcessosGerência de Processos: Processos
Gerência de Processos: Processos
 
Categorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamentoCategorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamento
 
Categorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo EscalonadorCategorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo Escalonador
 
Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4
 
Técnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web servicesTécnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web services
 
Sistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de ProjetoSistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de Projeto
 
UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26
 
05tolerancia
05tolerancia05tolerancia
05tolerancia
 

Más de Diogenes Freitas

Visitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentesVisitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentesDiogenes Freitas
 
Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...Diogenes Freitas
 
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...Diogenes Freitas
 
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...Diogenes Freitas
 
Paradigma Lógico e Funcional
Paradigma Lógico e FuncionalParadigma Lógico e Funcional
Paradigma Lógico e FuncionalDiogenes Freitas
 
Apresentacao banco de dados moveis
Apresentacao   banco de dados moveisApresentacao   banco de dados moveis
Apresentacao banco de dados moveisDiogenes Freitas
 
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de softwareUm estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de softwareDiogenes Freitas
 

Más de Diogenes Freitas (12)

Visitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentesVisitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentes
 
Reúso
ReúsoReúso
Reúso
 
Reconhecimento de digital
Reconhecimento de digitalReconhecimento de digital
Reconhecimento de digital
 
Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...
 
Processadores de rede (2)
Processadores de rede (2)Processadores de rede (2)
Processadores de rede (2)
 
Tokenring
TokenringTokenring
Tokenring
 
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
 
Open nebula
Open nebulaOpen nebula
Open nebula
 
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
 
Paradigma Lógico e Funcional
Paradigma Lógico e FuncionalParadigma Lógico e Funcional
Paradigma Lógico e Funcional
 
Apresentacao banco de dados moveis
Apresentacao   banco de dados moveisApresentacao   banco de dados moveis
Apresentacao banco de dados moveis
 
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de softwareUm estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de software
 

Modelo de falhas

  • 1. Modelo de falhas Sistemas Distribuídos 2011.2
  • 2. • Define e classifica as falhas, fornecendo uma base para a análise de seus efeitos em potencial e para projetar sistemas capazes de tolerar certos tipos de falhas e continuar funcionando Conceito
  • 3. • Defeito – Sistema não cumpre o que foi especificado • Erro – Estado do sistema causado por uma falha Conceitos Básicos
  • 4. • Estes atributos podem ocorrem tanto em Processos de sistema como em canais de comunicação Ocorrência de falhas
  • 5. • A tolerância a falhas é a propriedade de um sistema distribuído que lhe permite recuperar da existência de falhas, sem introduzir comportamentos incorretos. Um sistema deste tipo pode mascarar as falhas e continuar a operar, ou parar e voltar a operar mais tarde, de forma coerente, após reparação da falha. Definições
  • 6. • Disponibilidade - mede a fração de tempo em que um serviço está a operar corretamente, isto é, de acordo com a sua especificação. Para um sistema ser altamente disponível (highly available) deve combinar um reduzido número de falhas com um curto período de recuperação das falhas (durante o qual não está disponível). Definições
  • 7. • Confiabilidade - mede o tempo desde um instante inicial até à primeira falha, isto é, o tempo que um sistema funciona corretamente sem falhas. Um sistema que falha com grande frequência e recupere rapidamente tem baixa confiabilidade, mas alta disponibilidade. Definições
  • 8. • Pontualidade - Em sistemas de tempo real é a garantia de que o sistema é capaz de obedecer a constrangimentos temporais, isto é, a capacidade que o sistema tem de garantir limites para o tempo que as diferentes ações levam a executar. Definições
  • 9. • Falhas por omissão • De envio • De recebimento • Falhas arbitrárias • Falhas de tempo • Falhas de resposta • Valor • Transição de estado • Falhas por queda Classificação
  • 10. Falhas de omissão e arbitrárias
  • 12. • Transiente – Ocorre uma vez e depois desaparece – Se a operação for repetida, a falha não acontecera novamente • Intermitente – Ocorre e desaparece por “sua própria vontade”. – Difícil de diagnosticar; • Permanente – Continua a existir até que o componente faltoso seja substituído Tipos
  • 13. • Técnicas para mascarar falhas • Redundância de informação – Bits extras são adicionados para permitir recuperação de bits deteriorados • Redundância de tempo para falhas de omissão – Uma ação é realizada e, então, se for preciso, ela é executada novamente. • Redundância física – Componentes físicos replicados são usados Mascaramento de Falha por Redundância
  • 14. • O termo comunicação confiável é definido em termos de validade e integridade: • Validade: qualquer mensagem do buffer de envio é entregue ao buffer de recepção de seu destino, independente do tempo necessário para tal. • Integridade: a mensagem recebida é idêntica à enviada e nenhuma mensagem é entregue duas vezes. • A tarefa para preservar a Integridade vem de duas premissas: • Qualquer protocolo que retransmita mensagens, mas não rejeite uma mensagem que entregue duas vezes. • Usuários mal-intencionados que podem injetar mensagens modificadas, reproduzir mensagens antigas ou falsificar mensagens. Confiabilidade na comunicação Um para Um
  • 15. • Resiliência de Processos – Replicação de processos em grupos – Grupos Simples ou Hierárquicos • Comunicação Confiável Cliente-Servidor – Falhas de Comunicação – Canal de Comunicação pode exibir falhas por queda, por omissão, arbitrarias – TCP(ponto-a-ponto); RPC • Comunicação Confiável de Grupo – Como implementar entrega confiável de mensagens a todos os processos? • Comprometimento Distribuído – Envolve a realização de uma operação por cada membro de um grupo de processos ou por absolutamente nenhum. Estratégias de Tolerância a Falhas
  • 16. FIM