Troubleshooting de
Redes
O Troubleshooting
de Redes é um conjunto de ações que
são orientadas à solução e resolução de problemas na infraestrutura das redes
dos sistemas.
O propósito é terminar com o problema, restaurar o bom
funcionamento da Rede, do Sistema ou Serviço afetado, e de preferência em tempo
útil, sem que haja problemas adicionais no decorrer desse processo.
Para fazermos Troubleshooting
eficaz, devemos ter ações de
definição, análise, diagnóstico e reparação. E fazendo tudo corretamente, devemos
chegar a um Troubleshooting mais
efetivo.
As recomendações para um Troubleshooting mais efetivo são:
-Todo o processo de Troubleshooting deve ser dividido
em 3 fases principais:
1. Problema
2. Diagnóstico
3. Solução
Cada uma destas etapas vai conter um conjunto de ações
específicas no tratamento ou na condução do suporte ao problema.
Problema - Podemos dizer que o objetivo é
definir esse problema. Tendo em conta que usa o modelo de TCP (Transmission Control
Protocol) IP, pode ser bastante complexo, pois na maior parte das vezes usam
tecnologias de configuração muito sofisticadas, com dificuldades e grandes complexidades.
A dinâmica vai envolver muitas possibilidades em cada
passo de formulação de problema. Muitas vezes acaba por ser impossível corrigir
um problema, sem causar outro problema, ou então resolver o problema em tempo
útil, sendo esta uma das grandes dificuldades.
A questão é ver qual é o problema, definir bem o
problema, se é IP, Cabo, Router, Suites, Placa, se é Ataque ter em atenção.
Definir o problema, e conduzir diagnósticos efetivos,
usando programas se necessários para isso.
Diagnóstico - Recolha de informações sobre o
que está a acontecer, análise das informações recolhidas, e eliminação de
hipóteses.
Solução - Vamos propor hipóteses, testá-las,
e tentar chegar à resolução do problema.
Como é que podemos prestar um serviço técnico de alto
nível, em uma empresa?
1. Conhecer muito bem o ambiente, onde
estamos a trabalhar.
2. Conhecer e dominar as tecnologias na
nossa infraestrutura.
3. Conhecer os padrões de configuração
utilizados pelas áreas de operações e de engenharia.
4. Dominar, conhecer, ter informação
sobre os estados operacionais que são desejados, para todas as áreas funcionais
na infraestrutura.
5. Dominar boas práticas de suporte a
problemas na rede.
6. Antecipar problemas com processos de
prevenção de falhas e de recuperação de desastres.
Estas são as seis fases de um suporte técnico de
elevado nível na estrutura da nossa empresa.
Podemos escolher a forma que vamos dar suporte em “troubleshooting”
de redes.
Análises:
·
Top Down (de
cima para baixo)
·
Bottom Up (de
baixo para cima)
·
Divide and
Conquer (dividir para conquistar)
·
Follow the Path (seguir o caminho)
·
Spot the Differences (encontrar a diferenças)
·
Move the Problem (mover o problema)
Top Down enquadra-se
no modelo de referência no Ozi. Temos que ver por camadas, exemplo, vamos ver
um problema, não conseguimos chegar ao nosso servidor web, o servidor a página
de internet, vamos realizar um teste à porta 80 ou à porta 443 do Servidor web,
e se abrir e conseguimos ligar, então sabemos que essa sub-rede está ok.
Confirmar se outros utilizadores
conseguem aceder ao servidor.
Se não conseguirem, o problema pode
ser o DNS.
Podem ser configurações do servidor
web, isto pode revelar que a camada de transporte está ok.
Pode ser a camada de rede que pode
estar para baixo da camada de transporte e a camada de rede estar avariada.
Se não funcionar a ligação a esse IP
e porta, e não há ligação com a porta TCP correspondente a essa aplicação, servidor
web é 80 ou 443, então devemos verificar se há ligação, conectividade em
relação ao ip da origem. Pingando, fazendo comandos como o Ping e Traceroute/Tracert
e validar se realmente há ligação.
Caso o ping não funcione pode ser
por exemplo a Firewall bloqueando as mensagens através do protocolo ICMP. Fazer
uma validação das rotas para funcionar, caso estejam rotas faltando, depois de
fazermos o nosso diagnóstico. Então, temos que ver as configurações do router,
se estiver bem definido, ver se está tudo a trabalhar. Isto é uma análise Top Down.
Bottom Up é o
contrário, começamos nos routers, e vamos até chegar às camadas do Ozi. Contrário
da análise do Top Down.
Divide and Conquer é o método mais rápido, e permite economizar tempo. Para iniciar podemos
fazer um Tracert, a partir da
sub-rede de origem, até ao endereço de IP do destino, e ver onde é que no Tracert
o processo de comunicação termina.
Se todos os Hop (saltos) forem
reportados pelo comando Tracert, então provavelmente não teremos problemas de
rede e o problema pode estar relacionado com Firewall, dispositivos de
segurança, balanceadores de carga, ou com o próprio servidor mal configurado.
Se o Tracert terminar em algum
destes Hop, então sabemos que da sub-rede de origem até aquele Hop, onde o Tracert
termina não há problemas, mas daí em diante haverá. Para isso podemos testar
com o comando com o Tracert, para perceber em que Hop estamos perdendo a
comunicação e ter a informação completa de onde a comunicação parou.
Usando o Tracert podemos fazer
vários testes e perceber o que temos disponível.
Abrindo a linha de comando, executar
“cmd” na caixa de pesquisa do Windows e abrir como Administrador.
Nessa linha de comando, vamos fazer
um Tracert ao Google:
C:\Windows\system32>Tracert www.google.com
Ao fazer um Tracert do Google, ele dá os Hop, todos os
saltos, estas linhas que aparecem.
Parte do domínio, identificando o IP
deste domínio, e vai fazer o tracert por etapas, e estas etapas vão permitir,
em cada um dos saltos, saber se há alguma falha de comunicação.
Estes são os caminhos por onde o computador
tem de passar até chegar ao site da Google. Se houvesse alguma quebra de rede,
pararia num determinado ponto, e não chegaria ao final. Como não houve nenhuma
quebra de rede o Tracert completou o comando.
Este comando tracert, pode ser usado
para Troubleshooting na abordagem de Divide and Conquer.
Se houver alguma falha então o Divide and Conquer é o método que permite fazer esse diagnóstico.
Como resolver uma situação de falha?
No caso de uma rede externa, não podemos resolver. Mas
podemos comunicar ao dono desse endereço para que ele resolva.
Se for numa rede interna, vamos ter a informação do IP
exato onde está o problema, vamos ter de procurar a máquina, Router, Switch ou
um Computador Servidor. Temos de ir à procura e resolver fazendo um diagnóstico
secundário.
Spot the
Differences. Quando nós
realizamos o Divide and Conquer, podemos combinar também com Follow the Path, Top Down, Bottom Up. Mas se tivermos alguma
dificuldade, funciona comparando diferenças entre os Protocolos NAT, Serviços,
e tentando perceber o que é que está a funcionar mal.
Move the Problem, move o problema do
lugar. Apesar de termos validado tudo e não conseguimos localizar o problema,
esgotamos praticamente as possibilidades. A questão é tentar mudar a ligação e perceber
se o problema é da estrutura física onde estamos. Trocando cabos, suites,
fibras, routers...o que for necessário para perceber uma avaria física.
Portanto, isto também faz parte das abordagens para
suporte a problemas em rede.
Devemos ter um método que seja seguro para trabalhar, um
método previamente preparado, não é preciso muita burocracia, mas um plano de
procedimentos que nos permitam ser organizados na abordagem ao problema.
Exemplo de procedimento:
1. Verificar Cabos
2. Verificar Routers
3. Verificar Suites
4. Verificar Servidores
5. Verificar Utilizadores
6. Verificar Protocolos
7. Verificar Portas
8. Verificar Endereços
9. Verificar Protocolo NAT
10. Teste com Ping
11. Teste com Tracert
12. Teste com IP config
Exemplos do Comando do “ipconfig”, informação de IP simples, incluindo o ipv6.
Depois podemos fazer o “ipconfig /all”, que é mais completo, além da indicação de IP,
mostra também os Mac Address, alguns Mac
Address de Placas, como o Physical Address, que é o endereço único da placa a
nível mundial, o ipv6, ipv4, máscara de sub rede, o DHCPv6, a informação de NetBIOS
se está ativo ou não, toda esta informação podemos obter com IP config /all.
Comando “ipconfig /displaydns”. Podemos
consultar tudo o que foi feito em termos DNS no computador.
Outros
Comandos:
Opções:
/?
Exibir esta mensagem de ajuda
/all Exibir
informações completas de configuração.
/release Libere
o endereço IPv4 do adaptador especificado.
/release6 Libere
o endereço IPv6 do adaptador especificado.
/renew Renove
o endereço IPv4 do adaptador especificado.
/renew6 Renove
o endereço IPv6 do adaptador especificado.
/flushdns Limpa
o cache do DNS Resolver.
/registerdns Atualiza
todas as concessões de DHCP e registra novamente os nomes DNS.
/displaydns Exiba
o conteúdo do cache do DNS Resolver.
/showclassid Exibe
todos os IDs de classe DHCP permitidos para o adaptador.
/setclassid Modifica
o ID da classe DHCP.
/showclassid6 Exibe
todos os IDs de classe DHCP IPv6 permitidos para o adaptador.
/setclassid6 Modifica
o ID de classe DHCP IPv6.
Usando estes comandos chegamos às respostas de muitos
problemas.
Comando “nslookup”
é uma ferramenta que serve para resolver problemas associados a DNS, e o nslookup
vai realizar consultas aos serviços e servidores da nossa rede, retomando
também os IPs de registro, sejam eles ipv4 ou ipv6 associados ao endereço,
neste caso a seguir temos o endereço do Google.
Temos o
endereço interno da rede e depois o endereço externo do google.pt V6 e V4. Com
o nslookup conseguimos consultar esses endereços.
“pathping”
é um comando de troubleshooting, podemos fazer esse comando também com o
Google.pt, ele vai mostrar portanto os saltos até chegar a www.google.pt. É
semelhante ao tracert, com mais algumas informações.
Usando novamente o nslookup, para obter aqui um
endereço de IP da Google, podemos abrir uma nova linha de comandos e fazer um comando
“ping” a esse endereço, e ver se o
computador está a comunicar perfeitamente com o endereço de domínio da Google (www.google.pt)
esse domínio DNS corresponde o IP 142.250.200.131.
E como podem
ver foram enviados quatro pacotes de dados, e recebidos quatro pacotes de dados,
com um Time To Live um TTL de 54 segundos, com um tempo de 98 a 34
milissegundos diminuindo a cada transmissão. Desses quatro pacotes enviados,
quatro recebidos, zero perdidos significa que há comunicação entre o computador
e o Servidor da Google.
O comando “arp
-a” vai mostrar as Interfaces e os IPs, que estão presentes na rede. O arp –a, vai verificar a vizinhança da
rede.
O comando “netstat”
vai dizer todas as ligações ativas e vai continuar a analisar essas ligações às
portas, e isso permite também fazer um “troubleshooting” do estado da rede.
Podemos usar o “netstat
-n”, vai fazer com que o comando ignore a resolução de nomes e apenas
mostre IPs. Mostra apenas IPs de origem e destino. Faz com que seja mais rápida
a análise, porque ele não vai fazer a resolução de nomes do DNS.
Com o “netstat
-b”, vai fazer com que exiba o nome dos executáveis que iniciaram a ligação,
e ele vai dar esses nomes.
Todos estes comandos, são troubleshooting de redes que
nos permitem fazer diagnósticos de forma manual, nos ajudando a descobrir
problemas. Utilizando esses comandos e metodologias, todas estas abordagens
estão incluídas nas 3 fases mais genéricas que são:
- Definir o problema
- Fazer o diagnóstico
- Chegar à solução do problema
Muitas vezes o problema pode ser físico, até problemas
elétricos, um problema de fora, que venha do nosso internet provider ou problemas
que tenhamos dentro. Estes comandos ajudam, pensar no problema também ajuda, e
esta é uma boa base, um ponto de partida para o troubleshooting de redes.
Comentários
Postar um comentário