Este documento introduz os sistemas distribuídos, definindo-os como um conjunto de computadores independentes que aparecem para os usuários como um único sistema coerente. Explora as motivações, características e tipos de sistemas distribuídos, incluindo clusters, supercomputadores, grids, sistemas pervasivos e nuvem.
1. Introdução a Sistemas Distribuídos
Introdução a Sistemas
Distribuídos
Eduardo de Lucena Falcão
2. Motivação
●
Crescente dependência dos usuários aos sistemas:
– necessidade de partilhar dados e recursos entre utilizadores;
– porque os recursos estão naturalmente em máquinas diferentes.
● Demanda computacional se torna maior do que os avanços de software e
hardware combinados;
● Algumas características inexistentes em sistemas centralizados como:
– tolerância a falhas;
– capacidade de escalabilidade;
– separação física;
– vantagens financeiras.
3. O que são Sistemas Distribuídos?
● “Um sistema distribuído é um conjunto de
computadores independentes entre si que se
apresenta a seus usuários como um sistema
único e coerente.” Tanembaum, A.
● “Coleção de computadores autônomos
interligados através de uma rede de
computadores e equipados com software que
permita o compartilhamento dos recursos do
sistema: hardware, software e dados.”
Coulouris, G.
4. O que são Sistemas Distribuídos?
● “Você sabe que tem um sistema distribuído
quando a falha de um computador do
qual você nunca ouviu falar faz com que
você pare completamente de trabalhar.”
Lamport, L.
5. Avanços tecnológicos
● Invenção de redes de computadores de alta velocidade
(anos 70):
– Rede local (Local Area Network – LAN)
– Rede global (Wide Area Network – WAN)
● Desenvolvimento de microprocessadores potentes (anos
80)
6. Estado da Arte
● É relativamente fácil agrupar um grande número de
CPUs, conectando-as por uma rede de alta velocidade;
● O software para sistemas distribuídos é completamente
diferente do software para sistemas centralizados
– Grandes desafios no desenvolvimento de sistemas
distribuídos
7. Sistemas Distribuídos vs Redes
de Computadores
● Rede: um meio para interconectar computadores e trocar
mensagens através de protocolos bem definidos. Entidades da rede
são visíveis e endereçadas explicitamente.
● Sistema distribuído: a existência de múltiplos computadores
autônomos, de forma transparente.
● Muitos problemas (e.g., abertura, confiabilidade) são comuns a
ambos, mas tratados em diferentes níveis:
– As redes tratam no nível de pacotes, roteamento, etc., enquanto
os sistemas distribuídos tratam no nível das aplicações;
– Todo sistema distribuído depende dos serviços oferecidos por
uma ou mais redes de computadores.
10. Vantagens de Sistemas Distribuídos
● Melhor relação custo/benefício;
● Maior capacidade de processamento;
● Maior confiabilidade e disponibilidade;
● Crescimento gradativo de capacidade;
● Compartilhamento de recursos:
– Hardware, software e dados.
11. Desvantagens de Sistemas Distribuídos
● Desenvolvimento de software adequado;
● Falhas e saturação da rede de comunicação:
– Podem eliminar as vantagens destes sistemas;
● Segurança pode ser comprometida:
– Acesso a dados e recursos reservados.
12. Características Básicas de
Sistemas Distribuídos
● Compartilhamento de recursos
● Heterogeneidade
● Escalabilidade
● Transparência
● Concorrência
● Tolerância a falhas
● Segurança
13. Compartilhamento de Recursos
● Recurso:
– Termo abstrato e compreende tanto objetos de hardware, como
discos e impressoras, quanto entidades de software como
arquivos e banco de dados;
● Motivações:
– Economia: compartilhamento de impressoras,
supercomputadores, sistemas de armazenamento, etc...
– Colaboração e troca de informações: arquivos, correio
eletrônico, documentos, áudio e vídeo, teleconferência, etc...
14. Heterogeneidade
● Variedade e diferença em termos de:
– Hardware;
– Sistemas operacional;
– Rede;
– Linguagem de programação;
– Implementações de diferentes desenvolvedores.
● Exemplos de heterogeneidade na Internet:
– Diferentes implementações do mesmo conjunto de protocolos para diferentes tipos
de rede: IP, TCP, UDP, SMTP;
– Diferentes padrões de representação de dados: IDL, XML;
– Diferentes padrões de bibliotecas: POSIX, DLL;
– Diferentes padrões de invocação de serviços: COM, CORBA,RMI, SOAP;
– Diferentes plataformas de execução: JVM (Java), CLR (.NET).
15. Escalabilidade
● Capacidade do sistema permanecer operando de forma
efetiva mesmo diante de um aumento significativo do
número de usuários e/ou dos recursos disponíveis;
● Principais desafios:
– Controlar o custo dos recursos físicos;
– Controlar perdas de desempenho;
– Evitar “gargalos” de desempenho na rede ou nos
próprios servidores.
16. Escalabilidade
● Se uma quantidade maior de usuários ou recursos
devem ser considerados deve-se tomar cuidado com
serviços, dados centralizados:
● Eles se tornam gargalos, pontos únicos de falhas e
saturam a rede onde residem.
Conceito Exemplo
Serviços Centralizados Um único servidor para todos os
usuários
Dados Centralizados Uma única lista telefônica online
Algoritmos Centralizados Multiplicação de cadeias de
Matrizes de maneira sequencial
17. Escalabilidade: Algoritmos Distribuídos
● Algoritmos distribuídos possuem as seguintes diferenças
com relação aos centralizados:
– Nenhum nó possui informação completa do estado do
sistema;
– Cada nó toma decisões baseado somente em
informações locais;
– A falha de um nó não inviabiliza a execução do
algoritmo;
– Não se pressupõe a existência de um relógio global.
18. Escalabilidade: Algoritmos
Distribuídos
● Método de comunicação entre processos:
– Memória compartilhada;
– Mensagens ponto-a-ponto;
– Difusão de mensagens (broadcast);
– Chamadas remotas a procedimentos (RPC).
19. Tolerância a falhas
● Falhas são inevitáveis em sistemas computacionais:
– Resultados incorretos;
– Interrupção não planejada do serviço antes de sua
conclusão;
● Falhas em sistemas distribuídos são parciais;
● Técnicas de tratamento de falhas mais comuns:
– Detecção: bits de paridade, somas de verificação;
– Ocultamento: retransmissão de mensagens;
– Tolerância: informar o usuário do problema.
20. Transparência
● Abstração/Ocultação para os usuários e programadores
de aplicação:
– Sistema percebido como um “todo” coerente ao invés
de uma coleção de partes independentes;
● Uma medida de sucesso de um sistema distribuído é
dada pela sua transparência:
– Em que medida é indistinguível de um sistema
centralizado com a mesma funcionalidade?
21. Transparência
● Transparência de acesso:
– Permite o acesso a componentes remotos e locais
através das mesmas operações;
– Ex: Google Drive.
● Transparência de localização:
– Permite o acesso a componentes sem conhecimento da
sua localização física;
– Existência de um mecanismo que determina a localização
baseada em um nome;
– Ex: URL.
22. Transparência
● Transparência de concorrência:
– Permite a execução concorrente de múltipla operações sobre o
mesmo conjunto de recursos sem causar interferência entre elas;
– Ex: Impressoras compartilhadas, leilão virtual.
● Transparência de escala:
– Permite a expansão do sistema e de suas aplicações sem exigir
mudanças significativas na infraestrutura existente;
● O sistema não possui gargalos
● Transparência de mobilidade (migração):
– Permite a realocação de recursos e aplicações sem afetar o seu uso.
23. Transparência
● Transparência de Replicação:
– O usuário desconhece a existência de várias cópias
do recurso;
– Fundamental para desempenho e tolerância a falhas.
24. Transparência
● Transparência de falhas:
– A presença de falhas no sistema não é percebida
pelos usuários;
– Implica na ausência de um ponto único de falha.
25. Transparência
● Transparência de desempenho:
– Recurso adicionais são adicionados para suprir a
nova demanda;
– Serviços oferecidos pela Amazon (elasticidade).
26. Concorrência
● Suporte para múltiplos acessos simultâneos a um ou mais
recursos compartilhados:
– Possibilidade de inconsistências quando os recursos são
alterados
● Serviços devem garantir que as operações de acesso os
mantenham em um estado consistente
– Válido para servidores e objetos de aplicações
● Técnicas mais comuns:
– Sincronização de acesso (ex.: exclusão mútua distribuída)
– Protocolos de controle de concorrência (ex.: 2PC)
27. Segurança
● Proteção para recursos compartilhados:
– Confidencialidade (proteção contra usuários não autorizados):
● Ex.: Acesso a dados sobre salário, histórico médico;
– Integridade (proteção contra alteração e corrupção):
● Ex.: Alteração indevida de dados usados em transações bancárias;
– Disponibilidade (proteção contra interferência ao meio de acesso):
● Ex.: Queda ou sobrecarga do servidor ou do meio de comunicação;
● Principais mecanismos de segurança na Internet
– Firewall;
– Assinaturas digitais;
– Canais de seguros de comunicação.
28. Cuidado!
● Premissas falsas adotadas ao se desenvolve pela
primeira vez uma aplicação distribuída:
– Rede é confiável;
– Rede é segura
– Rede é homogênea;
– Topologia da rede não muda;
– Latência zero;
– Largura de banda é infinita.
30. Middleware
● Como suportar computadores e redes heterogêneos,
oferecendo uma visão de sistema único?
– Sistemas Distribuídos são organizados por meio de
uma camada de software.
31. Tipos de Sistemas Distribuídos
● Sistemas de Computação Distribuídos:
– Computação em Clusters;
– Supercomputadores;
– Computação em Grade (Grids);
– Computação em Nuvem (Cloud Computing);
● Sistemas de Informação Distribuídos;
● Sistemas Distribuídos Pervasivos.
32. Clusters
● Hardware consiste em um conjunto de estações de trabalho
ou PCs semelhantes;
● Conexão feita através de uma rede local;
● Em quase todos os casos, a computação de cluster é usada
para programação paralela na qual um único programa é
executado em paralelo.
34. Supercomputadores
● Clusters altamente “tunados” usando processadores de
prateleira combinados a conexões de rede especiais e
sistema operacional proprietário.
36. Grades Computacionais
● Computação em grade: muitos nós (clusters) de diversas
origens e com baixo acoplamento.
– Heterogêneos;
– Dispersos através de várias organizações;
● Recursos de diferentes organizações são reunidos
para permitir a colaboração de um grupo de
pessoas ou instituições.
38. Principais Grades Computacionais
● European Grid Initiative – EGI:
– 350 provedores de recursos em 50 países;
– ~ 400.000 núcleos;
– > 1.200.000 tarefas executadas por dia.
● LHC Computing Grid – LCG:
– 140 provedores de serviço em 35 países;
– > 200.000 núcleos.
● Open Science Grid – OSG:
– 80 provedores de recursos;
– ~70.000 núcleos.
● Extreme Science and Engineering Discovery Environment – XSEDE:
– Formada por centros de supercomputação nos EUA;
– Acima de 3 PF/s.
● Distributed European Infrastructure for Supercomputing Applications – DEISA:
– Formada por 11 supercomputadores na Europa;
– Acima de 2 PF/s.
39. Sistemas Pervasivos
● Uma nova geração de sistemas distribuídos estão emergindo:
sistemas de computação móvel e pervasivos;
– Instabilidade é o comportamento esperado destes sistemas;
– Heterogeneidade de rede e de dispositivos;
– Problemas de segurança;
– Dispositivos de computação móveis e embutidos:
● Pequenos;
● Alimentação por bateria;
● Têm como objetivo a mobilidade;
● Se utilizam de conexão sem fio.
40. Exemplos de Sistemas Pervasivos
● Sistema pervasivo de monitoramento de saúde, usando
(a) um hub local ou (b) uma conexão sem fio para
transmitir os dados coletados.
44. Computação em Nuvem
● Um (novo) paradigma da computação distribuída motivado pela:
– Economia de escala:
● O impacto combinado dessas economias de escala pode resultar em
economias em longo prazo de até 80% quando comparadas com
estruturas convencionais de hardware.
– Virtualização:
● Ao simular ambientes autônomos em uma mesma máquina física,
diminui-se a necessidade de hardware, de espaço físico e de
energia. Além disso, os servidores virtuais, por poderem ser
facilmente movidos entre máquinas físicas, favorecem a
manutenção.
– Recursos dinamicamente escaláveis;
– Oferta e demanda através da Internet.
45. Computação em Nuvem
● Principais Nuvens
– Industria: Google App Engine, Amazon, Windows
Azure, Salesforce.
– Academia: Magellan, FutureGrid.
– Middleware para nuvem: Nimbus, Eucalyptus,
OpenNebula.
46. Referências
● Slides do Professor Flávio R. C. Sousa. “Introdução a
Sistemas Distribuídos”. Sistemas Distribuídos.
Universidade Federal do Ceará.
● Slides do Professor Alexandre Nóbrega Duarte.
“Introdução aos Sistemas Distribuídos”. Computação
Intensiva em Dados. Universidade Federal da Paraíba.
● “Distributed Systems: Concepts and Design.” Third
Edition. Coulouris, G.; Dollimore, J.; Kindberg, T.