O documento discute sistemas de gerenciamento de redes. Ele aborda as dificuldades em isolar e diagnosticar problemas em redes, propondo a criação de um centro de operações de rede para monitorar a rede, identificar problemas e trabalhar em sua solução. Também discute a necessidade de ferramentas que apoiem o processo de diagnóstico, como um catálogo de problemas comuns.
1. Administração e Gerência
de Redes
Aula 2 – Sistema de Gerência de Redes
Professor: Paulo Cesar
E-mail: pccbranco@gmail.com
2. Situação Vigente
Manter uma rede funcional e operando, implica em lidar
com uma quantidade imensa e heterogênea de
equipamentos.
A sua indisponibilidade, mesmo que momentânea, pode ter
um efeito devastador.
As redes e a informação que elas permitem acessar
passaram a tornar-se imprescindíveis.
4. Isolando o Problema
Quem reportou ?
Onde esta conectado ?
Componentes intermediários ?
5. Isolamento e Teste dos
Problemas
O isolamento e teste dos problemas das redes
tornaram-se muito difíceis.
As causas principais devem-se :
– Aos muitos níveis de pessoal envolvido.
• técnicos de manutenção
• operadores e controladores de redes
• gerentes de sistemas de informações
• gerentes de comunicações.
6. Isolamento e Testes dos
Problemas
– Diversidade de formas de controle e
monitoração.
• produtos envolvidos na rede gradativamente mais
complexos.
• Ferramentas de controle de redes próprias ( cada
fornecedor) para monitorar seus produtos.
7. Buscando uma Solução
Implantando um “Centro de Operações de Rede”.
Em que, o operador e controlador da rede:
– monitore a rede e os sistemas que através
dela prestam serviços.
– mantenha-se ao par das suas condições
– trabalhe com vistas a efetuar o diagnóstico
sobre os problemas que surgem.
8. Rede Distribuída
Administração cooperativa da rede
– cada um é responsável por um segmento da
mesma (um sistema em particular ou uma sub-rede)
– precisam poder inspecionar os demais
segmentos para poder resolver problemas.
9. Dificuldades
Operadores não detém o conhecimento
necessário para efetuar o diagnóstico
apropriado, tornando o “processo de
diagnóstico difícil”
A necessidade de um ambiente que contenha
mecanismos que apoiem este processo de
diagnóstico.
Dificuldade de obtenção de informações
relevantes.
Excesso de informações básicas (contadores e
indicadores de status)
10. Causas das Dificuldades
Número crescente de equipamentos.
Muitos fornecedores com diferentes protocolos.
Muitos níveis de pessoal envolvido.
Diversas formas de controle e monitoração usadas nos
diversos equipamentos com ferramentas próprias.
Falta de acesso direto a todos os componentes da rede
para inspecionar e monitorar.
11. Identificando o Problema
Elementos críticos são inspecionados:
– ping (packet internet groper)
– traceroute ( linux ) / tracert ( Windows )
• Utilitário de rastreamento de rota usado para
determinar o caminho que um pacote ip foi obtido
para alcançar um destino
Escopo do problema precisa ser determinado:
– Equipamentos de rede
– Servidores
– Aplicações
12. Processo de Diagnóstico
Detecção de falhas percebidas pelo usuário ou por
sistema de monitoração.
Diagnóstico e manutenção de equipamentos e/ou
sistemas.
Reconfiguração da rede e/ou dos sistemas com
eventual aumento de capacidade
13. Primeiro Nível
Relato do problema !
– telefone
– email
– alarmes
Testes para determinação da causa !
Se solução imediata !
– Resposta ao usuário
– Registro para fins estatísticos
Problemas !
– Inexperiência
– Registro de Ocorrência de Problema
• parâmetros, dados sobre equipamentos envolvidos
14. Segundo Nível
envolve a atuação de programadores e analistas de suporte.
funcionamento dos sistemas e software básico
análise de tendências
correlação de sintomas
Para auxiliar neste nível do processo de diagnóstico é
necessário entre outras ferramentas, poder contar com a
possibilidade de aprender pelas experiências passadas
Para auxiliar neste nível do processo de diagnóstico é
necessário entre outras ferramentas, poder contar com a
possibilidade de aprender pelas experiências passadas
15. Segundo Nível
Mecanismo de pesquisa “full-text” sobre todos
os registros de problemas passados:
– sintomas e hipóteses de causas
– descrição de diagnósticos
– ações corretivas desencadeadas bem como
a indicação do que foi feito para corrigir o
problema
16. Exemplos de Problemas
taxa de erro alta
– trafego alto ??
interface up/down repetidamente
enlace down
– verificar se os modems envolvidos apresentam
histórico de congelamento
Taxa de repasse de um roteador diminui
– rotas descartadas ??
– memória esgotada ??
– tamanho da fila de pacotes esgotada ??
– tempo de retransmissão de transporte pequeno ??
17. Exemplos de Problemas
Aumento de pacotes com o CRC
incorreto
– Avisar o gerente da sub-rede e ativar a captura
de pacotes(RMON) para detectar a máquina
origem do problema
18. Catálogo de Problemas
É uma coletânea de problemas que podem ocorrer em um rede
rede, aplicando uma metodologia que deve ser seguida para
diagnosticar e sugerir hipóteses a serem testadas por camadas
( da física em direção à camada de aplicação ).
Um problema deve ter 05 elementos essenciais:
– Descrição : que sejam apresentandas as circunstâncias em
que o problema surge, de causas comuns e de forma que
entenda o problema. Por exemplo: Cabo rompido ou
danificado (física); Interface desabilitada ( enlace); rotas
estáticas mal configuradas ( rede); filtro IP barrando tráfego
DNS ( aplicação)
– Sintomas: informam o que os usuários podem perceber
como consequência da existência do problema. Ou seja, o
efeito negativo do problema para os usuários. Por exemplo:
a rede está lenta, um determinado serviço está indisponível.
19. Catálogo de Problemas
Um problema deve ter 05 elementos essenciais:
– Sinais : não são percebidos pelos usuários, pois eles
só podem ser obtidos com o auxílio de ferramentas
adequadas, como estações de gerência, analisadores
de protocolos,etc.
– Testes confirmatórios: são os passos que devem
ser seguidos para confirmar ou negar a existência do
problema de rede. Quando sinais diferenciados forem
encontrados não será necessária a realização de
testes adicionais.
– Sugestões de tratamento: são soluções eficientes
para o problema descrito. A solução não pode
acarretar novos problemas na rede.
20. Catálogo de Problemas
Por que um catálogo de problemas ?
– Estudos mostraram que um sintoma pode ser causado por
diversos problemas diferentes. E um problema poderia ser
referenciado em um determinado sintoma e repetidos em outros
sintomas. Não sendo viável misturar vários problemas desta
forma.
– Um catálogo por sinal também não se mostrou uma boa idéia.
Muitos sinais também se repetem em vários problemas
diferentes. Além disso, um único sinal pode não dizer muito sobre
o problema.
– Pela finalidade de um gerente de rede diante de uma notificação
de um problema, descobrir e solucionar o problema, não os
sintomas e sinais.
– Os sinais e sintomas são o meio, não o fim.
– Da forma como será organizado, novos problemas podem ser
inseridos e melhorados facilmente.
21. Exemplificando
Suponha seguinte que você tenha a seguinte
informação:
– Alguns usuários do Setor de Marketing ligaram para o
“help desk” reclamando que a rede não está funcionando
hã 15 minutos. Nem logon na rede eles conseguem fazer;
• Estas foram as informações repassadas pela
equipe de “help desk”
– Todos os equipamentos e interfaces monitorados pela
estação de gerência estão operando e não apresentam
limiares excedidos. Mas existem repetidores que ligam
máquinas clientes do Setor de Marketing à rede que não
estão sendo monitorados.
22. Exemplificando
Baseado nestas informações, consultamos o
índice de sintomas e sinais e desenvolvemos as
seguintes hipóteses:
– Cabo rompido ou danificado entre repetidores localizados no
Setor de Marketing
– Conector defeituoso ou mal instalado entre repetidores
localizados no Setor de Marketing
– Um ou mais repetidores defeituosos no Setor de Marketing
– Problemas com o serviço DHCP do Setor de Marketing
– Problemas com o serviço de nomes do Setor de Marketing
23. Metas do Gerenciamento
Controlar os recursos da organização
Acompanhar evolução da rede
Aprimorar o serviço
Balancear necessidades
Reduzir tempo de indisponibilidade
Controlar custos
24. Sistemas de
Gerenciamento de Rede
Controle da rede integrado
– Interface única e interativa
– Ergonomia
Equipamentos extras
– Aproveitar características dos equipamentos integrantes
da rede
– Minimizar necessidade de hardware adicional
Aplicações de gerenciamento
– manipular os dados passíveis de obtenção por meio de um
“Sistema de Gerenciamento da Rede”
28. MIB - Management Base
Information
Conjunto de objetos/variáveis que
modelam os recursos gerenciados
GGeerreennttee AAggeennttee
MIB
29. MIB
É um banco de dados usado para gerenciamento
de entidades em um rede de comunicação.
– Objeto gerenciado: representa o que está
sendo gerenciado
– Os objetos no MIB são definidos usando um
subconjunto da ASN.1 (Abstract Syntax
Notation One).
Especificação compilável
Objetos genéricos (padronizados)
Objetos específicos (definidos por fornecedores
de produtos)
30. Arquiteturas de Gerência
OSI
– Protocolo CMIP (camada de aplicação)
– Orientado a eventos
– Apoiado pelo pilha OSI completa
– Classes de objetos gerenciados
Internet
– Protocolo SNMP (aplicação sobre UDP)
– Orientado a pollings (varredura) / trapings
(notificações) forma de comunicação entre
gerentes/agentes
– Agentes simples em muitos equipamentos
– Categorias simplificadas de objetos gerenciados
31. Áreas Funcionais
Gerenciamento de falhas
Gerenciamento de configuração
Gerenciamento de performance
Gerenciamento de segurança
Gerenciamento de contabilização
32. Gerenciamento de Falhas
Determinar exatamente onde está localizado o
problema
Isolar o resto da rede do segmento com problemas
de modo que ela possa continuar funcionando
Reconfigurar ou modificar a rede de modo a
minimizar o impacto da operação sem o
componente com problemas
Consertar ou substituir o componente com
problemas para restaurar a rede a seu estado
normal
33. Gerenciamento de
Configuração
Dispositivos podem ser configurados para atuar de
diferentes maneiras, usando diferentes protocolos
Parâmetros de configuração precisam ser
inicializados e eventualmente alterados
Novos componentes podem ser adicionados e seu
registro precisa ser mantido atualizado
As ligações entre os componentes (físicas e
lógicas) necessitam ser mantidas atualizadas
34. Gerenciamento de
Performance
Monitorar e controlar
Estabelecer padrão de normalidade
Determinar limites de capacidade de
utilização
Perfil de tráfego
Gargalos
Tempo de resposta
Throughput
35. Gerenciamento de
Segurança
Monitorar e controlar o acesso aos
recursos da rede e às informações
Coletar, armazenar e examinar
registros de auditoria e logs de
segurança
Ativar e desativar procedimentos
de log
36. Gerenciamento de
Contabilização
Um usuário ou grupo de usuários pode estar
abusando de seus privilégios e sobrecarregando a
rede, em prejuízo dos demais
Usuários podem estar fazendo uso ineficiente da
rede e o gerente da rede pode auxiliar a alterar
procedimentos que melhorem a performance
A gerência da rede tem mais condições de planejar
o crescimento da rede se conhece a atividade dos
usuários com suficiente detalhamento
37. Arquitetura de
gerenciamento OSI
Processos aplicativos de
gerenciamento de sistemas
Processos aplicativos de
gerenciamento de sistemas
Management
Information
Management
Information
Base
Base
LME System Management
LME System Management
Application Entity
Application Entity
LME Camada de Apresentação
LME Camada de sessão
LME Camada de transporte
LME Camada de rede
LME Camada de enlace
LME Camada física
LME Camada de Apresentação
LME Camada de sessão
LME Camada de transporte
LME Camada de rede
LME Camada de enlace
LME Camada física
CMIP
38. CMISE
ACSE ROSE
CMISE-Common Management Information Service Elements
– Define o serviço e os procedimentos usados para a tranferência e provê
um meio de troca de informações para as operações de gerenciamento.
ACSE- Acess Control Service Element
– estabelecer e desfazer associações
ROSE- Remote Operations Service Element
– invocação de operação em um sistema remoto
– identificação da operação
• Código
• Argumentos
• respostas : resultado / rejeição / erro
39. Gerenciamento
TCP/IP
SNMP - Simple Network Management Protocol
– RFC1155 Structure and Identification of Management
Information for TCP/IP-based internets
– RFC 1156 - Management Information Base Network
Management of TCP/IP-based internets
– RFC 1157 - A Simple Network Management Protocol
– RFC 1213 - Management Information Base Network
Management of TCP/IP-based internets: MIB-II
RMON - Remote Network Monitoring
– RFC1271 e depois RFC 1757
40. Gerenciamento TCP/IP
Evolução do protocolo SNMP
– SNMPv2
• Corrigir algumas deficiências da versão anterior,
como: novas operações, comunicação entre
servidores, mais segurança
• RFC1442 Structure of Management Information for
Version 2 of SNMP
• RFC1448 Protocol Operations for Version 2 of SNMP
– SNMPv3
• Principal característica: Segurança
• No modelo administrativo: Gerẽncia de chaves,
relação de proxys, configuração remota através de
operadores SNMP
41. Protocolo SNMP
(Simple Network Management Protocolo) foi desenvolvido
para permitir que dispositivos de rede que utilizam o
protocolo IP possam ser gerenciados remotamente,
através de um conjunto de simples operações.
Usa o modelo gerente/agente onde um servidor com a
função de NMS ( Network Management System) comunica-se
com o agente de gerência de rede.
Estrutura de Informação de Gerência (SMI) - ASN.1
(Abstract Syntax Notation One) / Macro OBJECT-TYPE
Protocolo - ASN.1 / BER (Basic Enconding Rules) via UDP/IP
42. ASN.1
Linguagem formal para definição de sintaxe
de abstrata (ISO)
SNMP usa um subconjunto de tipos ASN.1,
bem como a macro OBJECT-TYPE para a
especificação da MIB
– Integer
– Octet String
– Display String
– Object Identifier
– Sequence
– Sequence of
43. BER
Regras que geram a sintaxe de
transferência
Tipos codificados em três campos:
rótulo, tipo e valor
ex.:
ex::= sequence {
nome OCTET STRING,
idade INTEGER
}
dados:
{ adao, 45 }
dados codificados: 30 07 02 04 dados codificados: 30 07 02 04 0044 AA DD AA OO 0022 0011 4455
44. Protocolo
PROTOCOLO
SNMP
GGeerreennttee AAggeennttee
GET
GET-NEXT
SET
GET-RESPONSE
TRAP
O protocolo SNMP é transportado O protocolo SNMP é transportado ppeelloo pprroottooccoolloo UUDDPP
46. TRAPS
Mensagens não solicitadas geradas
por um agente SNMP
TRAP
GGeerreennttee AAggeennttee
COLDSART
WARMSTART
LINK DOWN
LINK UP
FAILURE OF AUTHENTICATION
EXTERIOR GATEWAY PROTOCOL NEIGHBOR LOSS
ENTERPRISE-SPECIFIC
51. Gerência Pró-Ativa
Antecipar problemas que provocarão
determinado impacto na redes,
principalmente em seu desempenho.
Capacidade de evitar a ocorrência desses
problemas ou minimizar seu impacto
Elementos que contribuem para que a
gerência pró-ativa de redes de computadores
seja mais confiável
– sistemas especialistas
– monitores remotos
– agentes procuradores
– programas de simulação
52. Dificuldades
Dificuldade de obtenção de
informações relevantes
Excesso de informações básicas
(contadores e indicadores de status)
Interpretar e correlacionar os dados?
53. Agregando Inteligência à
Gerência Pró-ativa
Inferir a causa de um
problema a partir de
síndromes reconhecidas nos
dados obtidos da rede
Os dados podem ser
obtidos por monitoração ou
por captura remota
(agentes SNMP ou agentes
RMON)
Dado o estado de um
sistema, recomenda o que
fazer a seguir com base no
conhecimento acumulado
aplicável à esta situação
54. Agregando Inteligência à
Gerência Pró-ativa
Sistemas especialistas ou consultores
inteligentes
Capturar o conhecimento e a
experiência de um ou mais especialistas
Técnicas de representação do
conhecimento
Regras de produção
Se-Então
55. Sistemas especialistas aplicados
à gerência de redes
Orientados a diagnóstico
Usam:
– Regras de produção para representar o
conhecimento
– Método de inferência de encadeamento para
frente
– Padrão de comparação
Monitoração
Predição
Controle
56. Construção dos módulos
inteligentes
a)Que tipo de conhecimento é
envolvido?
b)Como pode o conhecimento ser
representado?
c)Quanto conhecimento é necessário?
d)Qual é exatamente o conhecimento
necessário?
57. Exemplo de regra: Nível de
broadcast
Se a taxa de broadcast num intervalo
de 1 hora é maior que 8% Então:
– verificar se o horário da ocorrência está dentro do
horário útil (7:00-22:00 horas), do contrário,
ignorar a ocorrência;
– identificar os hosts com os níveis mais altos de
broadcast (script broad_nivel.pl);
– nos hosts identificados, analisar a configuração do
software de comunicação, para saber quais são as
razões pelas quais esses hosts estão transmitindo
um número tão alto de pacotes broadcasts;
58. Exemplo de regra: Nível de
broadcast
– verificar máscara da rede. Uma máscara
errada pode provocar tormenta de pacotes
broadcast;
– verificar que na rede sendo monitorada não
estejam estações com versões do UNIX
incompatíveis
59. Descoberta de novos
problemas
Ler dados da rede sistematicamente e
comparar com limiares determinados
dinamicamente em função de parâmetros
definidos pelo gerente:
janela de amostragem
tolerância
Detecção de rajadas (problemas
relacionados com causa já registrada
anteriormente)
consulta à base de dados de problemas
60. Descoberta de novos
problemas
Determinar severidade do problema
componentes envolvidos
Invocar rotina de diagnóstico
Gerar registro de problema
61. Aplicações de gerenciamento
Tratamento inteligente dos dados
Detecção de rajadas
Gerência pró-ativa
Determinação dinâmica de limiares
Reconhecimento de padrões
Análise de tendências
Registro seletivo
Software de
terceiros
Desenvolvimento
próprio