Troubleshooting de Redes

Troubleshooting de Redes

O Troubleshooting de Redes é um conjunto de ações que são orientadas à solução e resolução de problemas na infraestrutura das redes dos sistemas.

O propósito é terminar com o problema, restaurar o bom funcionamento da Rede, do Sistema ou Serviço afetado, e de preferência em tempo útil, sem que haja problemas adicionais no decorrer desse processo.

Para fazermos Troubleshooting eficaz, devemos ter ações de definição, análise, diagnóstico e reparação. E fazendo tudo corretamente, devemos chegar a um Troubleshooting mais efetivo.

As recomendações para um Troubleshooting mais efetivo são:

-Todo o processo de Troubleshooting deve ser dividido em 3 fases principais:

1. Problema

2. Diagnóstico

3. Solução

Cada uma destas etapas vai conter um conjunto de ações específicas no tratamento ou na condução do suporte ao problema.

Problema - Podemos dizer que o objetivo é definir esse problema. Tendo em conta que usa o modelo de TCP (Transmission Control Protocol) IP, pode ser bastante complexo, pois na maior parte das vezes usam tecnologias de configuração muito sofisticadas, com dificuldades e grandes complexidades.

A dinâmica vai envolver muitas possibilidades em cada passo de formulação de problema. Muitas vezes acaba por ser impossível corrigir um problema, sem causar outro problema, ou então resolver o problema em tempo útil, sendo esta uma das grandes dificuldades.

A questão é ver qual é o problema, definir bem o problema, se é IP, Cabo, Router, Suites, Placa, se é Ataque ter em atenção.

Definir o problema, e conduzir diagnósticos efetivos, usando programas se necessários para isso.

Diagnóstico - Recolha de informações sobre o que está a acontecer, análise das informações recolhidas, e eliminação de hipóteses.

Solução - Vamos propor hipóteses, testá-las, e tentar chegar à resolução do problema.

Como é que podemos prestar um serviço técnico de alto nível, em uma empresa?

1. Conhecer muito bem o ambiente, onde estamos a trabalhar.

2. Conhecer e dominar as tecnologias na nossa infraestrutura.

3. Conhecer os padrões de configuração utilizados pelas áreas de operações e de engenharia.

4. Dominar, conhecer, ter informação sobre os estados operacionais que são desejados, para todas as áreas funcionais na infraestrutura.

5. Dominar boas práticas de suporte a problemas na rede.

6. Antecipar problemas com processos de prevenção de falhas e de recuperação de desastres.

Estas são as seis fases de um suporte técnico de elevado nível na estrutura da nossa empresa.

Podemos escolher a forma que vamos dar suporte em “troubleshooting” de redes.

Análises:

· Top Down (de cima para baixo)

· Bottom Up (de baixo para cima)

· Divide and Conquer (dividir para conquistar)

· Follow the Path (seguir o caminho)

· Spot the Differences (encontrar a diferenças)

· Move the Problem (mover o problema)

Top Down enquadra-se no modelo de referência no Ozi. Temos que ver por camadas, exemplo, vamos ver um problema, não conseguimos chegar ao nosso servidor web, o servidor a página de internet, vamos realizar um teste à porta 80 ou à porta 443 do Servidor web, e se abrir e conseguimos ligar, então sabemos que essa sub-rede está ok.

Confirmar se outros utilizadores conseguem aceder ao servidor.

Se não conseguirem, o problema pode ser o DNS.

Podem ser configurações do servidor web, isto pode revelar que a camada de transporte está ok.

Pode ser a camada de rede que pode estar para baixo da camada de transporte e a camada de rede estar avariada.

Se não funcionar a ligação a esse IP e porta, e não há ligação com a porta TCP correspondente a essa aplicação, servidor web é 80 ou 443, então devemos verificar se há ligação, conectividade em relação ao ip da origem. Pingando, fazendo comandos como o Ping e Traceroute/Tracert e validar se realmente há ligação.

Caso o ping não funcione pode ser por exemplo a Firewall bloqueando as mensagens através do protocolo ICMP. Fazer uma validação das rotas para funcionar, caso estejam rotas faltando, depois de fazermos o nosso diagnóstico. Então, temos que ver as configurações do router, se estiver bem definido, ver se está tudo a trabalhar. Isto é uma análise Top Down.

Bottom Up é o contrário, começamos nos routers, e vamos até chegar às camadas do Ozi. Contrário da análise do Top Down.

Divide and Conquer é o método mais rápido, e permite economizar tempo. Para iniciar podemos fazer um Tracert, a partir da sub-rede de origem, até ao endereço de IP do destino, e ver onde é que no Tracert o processo de comunicação termina.

Se todos os Hop (saltos) forem reportados pelo comando Tracert, então provavelmente não teremos problemas de rede e o problema pode estar relacionado com Firewall, dispositivos de segurança, balanceadores de carga, ou com o próprio servidor mal configurado.

Se o Tracert terminar em algum destes Hop, então sabemos que da sub-rede de origem até aquele Hop, onde o Tracert termina não há problemas, mas daí em diante haverá. Para isso podemos testar com o comando com o Tracert, para perceber em que Hop estamos perdendo a comunicação e ter a informação completa de onde a comunicação parou.

Usando o Tracert podemos fazer vários testes e perceber o que temos disponível.

Abrindo a linha de comando, executar “cmd” na caixa de pesquisa do Windows e abrir como Administrador.

Nessa linha de comando, vamos fazer um Tracert ao Google:

C:\Windows\system32>Tracert www.google.com

Ao fazer um Tracert do Google, ele dá os Hop, todos os saltos, estas linhas que aparecem.

Parte do domínio, identificando o IP deste domínio, e vai fazer o tracert por etapas, e estas etapas vão permitir, em cada um dos saltos, saber se há alguma falha de comunicação.

Estes são os caminhos por onde o computador tem de passar até chegar ao site da Google. Se houvesse alguma quebra de rede, pararia num determinado ponto, e não chegaria ao final. Como não houve nenhuma quebra de rede o Tracert completou o comando.

Este comando tracert, pode ser usado para Troubleshooting na abordagem de Divide and Conquer.

Se houver alguma falha então o Divide and Conquer é o método que permite fazer esse diagnóstico.

Como resolver uma situação de falha?

No caso de uma rede externa, não podemos resolver. Mas podemos comunicar ao dono desse endereço para que ele resolva.

Se for numa rede interna, vamos ter a informação do IP exato onde está o problema, vamos ter de procurar a máquina, Router, Switch ou um Computador Servidor. Temos de ir à procura e resolver fazendo um diagnóstico secundário.

Spot the Differences. Quando nós realizamos o Divide and Conquer, podemos combinar também com Follow the Path, Top Down, Bottom Up. Mas se tivermos alguma dificuldade, funciona comparando diferenças entre os Protocolos NAT, Serviços, e tentando perceber o que é que está a funcionar mal.

Move the Problem, move o problema do lugar. Apesar de termos validado tudo e não conseguimos localizar o problema, esgotamos praticamente as possibilidades. A questão é tentar mudar a ligação e perceber se o problema é da estrutura física onde estamos. Trocando cabos, suites, fibras, routers...o que for necessário para perceber uma avaria física.

Portanto, isto também faz parte das abordagens para suporte a problemas em rede.

Devemos ter um método que seja seguro para trabalhar, um método previamente preparado, não é preciso muita burocracia, mas um plano de procedimentos que nos permitam ser organizados na abordagem ao problema.

Exemplo de procedimento:

1. Verificar Cabos

2. Verificar Routers

3. Verificar Suites

4. Verificar Servidores

5. Verificar Utilizadores

6. Verificar Protocolos

7. Verificar Portas

8. Verificar Endereços

9. Verificar Protocolo NAT

10. Teste com Ping

11. Teste com Tracert

12. Teste com IP config

Exemplos do Comando do “ipconfig”, informação de IP simples, incluindo o ipv6.

Depois podemos fazer o “ipconfig /all”, que é mais completo, além da indicação de IP, mostra também os Mac Address, alguns Mac Address de Placas, como o Physical Address, que é o endereço único da placa a nível mundial, o ipv6, ipv4, máscara de sub rede, o DHCPv6, a informação de NetBIOS se está ativo ou não, toda esta informação podemos obter com IP config /all.

Comando “ipconfig /displaydns”. Podemos consultar tudo o que foi feito em termos DNS no computador.

Outros Comandos:

Opções:

/? Exibir esta mensagem de ajuda

/all Exibir informações completas de configuração.

/release Libere o endereço IPv4 do adaptador especificado.

/release6 Libere o endereço IPv6 do adaptador especificado.

/renew Renove o endereço IPv4 do adaptador especificado.

/renew6 Renove o endereço IPv6 do adaptador especificado.

/flushdns Limpa o cache do DNS Resolver.

/registerdns Atualiza todas as concessões de DHCP e registra novamente os nomes DNS.

/displaydns Exiba o conteúdo do cache do DNS Resolver.

/showclassid Exibe todos os IDs de classe DHCP permitidos para o adaptador.

/setclassid Modifica o ID da classe DHCP.

/showclassid6 Exibe todos os IDs de classe DHCP IPv6 permitidos para o adaptador.

/setclassid6 Modifica o ID de classe DHCP IPv6.

Usando estes comandos chegamos às respostas de muitos problemas.

Comando “nslookup” é uma ferramenta que serve para resolver problemas associados a DNS, e o nslookup vai realizar consultas aos serviços e servidores da nossa rede, retomando também os IPs de registro, sejam eles ipv4 ou ipv6 associados ao endereço, neste caso a seguir temos o endereço do Google.

Temos o endereço interno da rede e depois o endereço externo do google.pt V6 e V4. Com o nslookup conseguimos consultar esses endereços.

“pathping” é um comando de troubleshooting, podemos fazer esse comando também com o Google.pt, ele vai mostrar portanto os saltos até chegar a www.google.pt. É semelhante ao tracert, com mais algumas informações.

Usando novamente o nslookup, para obter aqui um endereço de IP da Google, podemos abrir uma nova linha de comandos e fazer um comando “ping” a esse endereço, e ver se o computador está a comunicar perfeitamente com o endereço de domínio da Google (www.google.pt) esse domínio DNS corresponde o IP 142.250.200.131.

E como podem ver foram enviados quatro pacotes de dados, e recebidos quatro pacotes de dados, com um Time To Live um TTL de 54 segundos, com um tempo de 98 a 34 milissegundos diminuindo a cada transmissão. Desses quatro pacotes enviados, quatro recebidos, zero perdidos significa que há comunicação entre o computador e o Servidor da Google.

O comando “arp -a” vai mostrar as Interfaces e os IPs, que estão presentes na rede. O arp –a, vai verificar a vizinhança da rede.

O comando “netstat” vai dizer todas as ligações ativas e vai continuar a analisar essas ligações às portas, e isso permite também fazer um “troubleshooting” do estado da rede.

Podemos usar o “netstat -n”, vai fazer com que o comando ignore a resolução de nomes e apenas mostre IPs. Mostra apenas IPs de origem e destino. Faz com que seja mais rápida a análise, porque ele não vai fazer a resolução de nomes do DNS.

Com o “netstat -b”, vai fazer com que exiba o nome dos executáveis que iniciaram a ligação, e ele vai dar esses nomes.

Todos estes comandos, são troubleshooting de redes que nos permitem fazer diagnósticos de forma manual, nos ajudando a descobrir problemas. Utilizando esses comandos e metodologias, todas estas abordagens estão incluídas nas 3 fases mais genéricas que são:

- Definir o problema

- Fazer o diagnóstico

- Chegar à solução do problema

Muitas vezes o problema pode ser físico, até problemas elétricos, um problema de fora, que venha do nosso internet provider ou problemas que tenhamos dentro. Estes comandos ajudam, pensar no problema também ajuda, e esta é uma boa base, um ponto de partida para o troubleshooting de redes.

Pesquisar este blog

PAULO DANIEL

Troubleshooting de Redes

Comentários

Postar um comentário

Postagens mais visitadas deste blog

Enigma - Prática de Leitura

Digitação das notas no violino

Configuração de Redes e Troubleshooting de Redes