Por Kong Yang – 13.12.2017
A solução de problemas é uma habilidade fundamental que todos os profissionais de TI devem dominar. Ela permite que os profissionais façam o drill down para descobrir a causa raiz de problemas que ocorrem em um ambiente de TI. No entanto, a solução de problemas em ambientes virtualizados costuma ser negligenciada devido a restrições de tempo. Os profissionais de TI são pagos para corrigir os problemas, e corrigi-los com rapidez.
Infelizmente, identificar a causa raiz dos problemas é quase sempre uma tarefa demorada. Tecnologias que incluem nuvem, virtualização, TI híbrida e infraestruturas hiperconvergentes transformaram totalmente a TI. Agora, solucionar problemas nesses sistemas distribuídos é uma tarefa mais importante e complexa do que nunca.
Em última instância, a identificação da causa raiz de um problema de TI está intimamente relacionada com a redução da área de superfície do raio de solução de problemas. Imagine um círculo com a causa raiz no centro. Para chegar nela, você precisa reduzir o raio de solução de problemas para eliminar falsos positivos e todas as outras questões, tudo isso enquanto integra e fornece seus serviços de aplicativo.
Tempo é um luxo que os profissionais de TI nem sempre têm, e a solução de problemas, especialmente em ambientes virtualizados, pode ser uma tarefa demorada nos diferentes limites e camadas de abstração. Como resultado, em vez da causa raiz, os profissionais de TI tendem a corrigir os sintomas de um problema maior.
Principais desafios da solução de problemas em ambientes virtualizados
Um grande desafio enfrentado pelos profissionais de TI que tentam solucionar problemas em ambientes virtualizados é que geralmente, quando algo ruim acontece, muitas pessoas querem dar opinião. A virtualização apresenta um cenário de solução de problemas complexo, pois a tecnologia abrange sistemas de redes, servidores físicos e abstrações derivadas, como políticas e constructos definidos por software. Todas as equipes responsáveis por essas áreas podem se envolver, o que geralmente complica o processo.
Além disso, a maioria das organizações precisa gerenciar a complexidade de ambientes híbridos de TI, nos quais provedores de nuvem também fazem parte dos serviços de TI. Quando usam provedores de serviços de nuvem, como o Microsoft Azure e o AWS, as empresas quase nunca têm visibilidade total além dos firewalls. Elas provavelmente têm visibilidade e controle dentro dos firewalls, mas além desse perímetro, a falta de controle e visibilidade dificulta muito a solução de problemas.
A solução de problemas em várias plataformas é um grande ponto problemático. À medida que diferentes partes dos ambientes de TI se tornam mais e mais distribuídas, complexas e baseadas em silos, torna-se exponencialmente difícil para os departamentos de TI penetrar nas camadas de uma pilha de aplicativos para descobrir o ponto único da verdade.
Outro grande desafio para a solução de problemas em ambientes virtualizados é identificar um ponto único da verdade com base nas diversas ferramentas de monitoramento usadas em toda a organização. Os profissionais de TI podem facilmente ser inundados por vários pontos de dados e alertas (ruídos), e o problema real (o sinal) pode ficar perdido na sobrecarga de informações.
Preparando-se para solucionar problemas em ambientes virtualizados na era da TI híbrida
É necessário adotar rapidamente novas técnicas e ideias para se preparar para a migração para a nuvem, e os fornecedores de monitoramento estão se adaptando a isso. Algumas soluções usam credenciais de faturamento para ajudar a garantir que você tenha precisão de inventário pronta para uso e, dessa forma, consiga ter visibilidade no local e fora do local. Os profissionais de TI também devem verificar se estão recebendo eventos de erro como parte da solução de problemas. As ferramentas que permitem agregar logs, principalmente ferramentas de criação de logs baseadas na nuvem como a Papertrail, são particularmente importantes para a depuração de cargas de trabalho virtuais.
Práticas recomendadas para a solução de problemas em ambientes virtualizados
Quando o assunto é solucionar problemas em ambientes virtualizados, existem três métodos principais. A primeira prática envolve o uso de alertas ativos e proativos para a obtenção de visibilidade e a criação de um parâmetro para o comportamento dos aplicativos. O uso de ferramentas de monitoramento tem como objetivo revelar rapidamente a verdade e categorizar os problemas para permitir a definição e a personalização dos limites do ambiente operacional. Isso resulta em mais sinais e menos ruídos de alerta.
A segunda prática se concentra em aproveitar bases de dados de conhecimento existentes e práticas recomendadas conhecidas para solucionar problemas de virtualização. Se você já passou por um problema e conseguiu resolvê-lo, transforme o protocolo em uma correção conhecida e estabelecida. Ou use uma ferramenta com um mecanismo de recomendações para suprir a falta de conhecimento no ambiente virtualizado.
Por fim, ao solucionar problemas em ambientes virtualizados, vários profissionais de TI encontram problemas inéditos que ainda não têm solução. É aqui que entra a terceira prática de usar os dados correlacionados de séries temporais dos principais indicadores de desempenho de todas as pilhas. Essa prática pode ajudar as equipes a se concentrar em suas respectivas áreas de conhecimento e permitir que todas as equipes cheguem a um acordo. Correlação de dados e colaboração são elementos muito importantes para a rápida solução de problemas de virtualização que são “novidade para você”.
Para solucionar problemas é preciso ter as ferramentas certas
Uma ferramenta abrangente de monitoramento e gerenciamento de TI que ofereça visibilidade em toda a pilha de aplicativos é essencial para capacitar esses métodos e permitir que os profissionais de TI solucionem problemas em ambientes virtualizados. Além disso, a ferramenta de monitoramento permite que os profissionais de TI coletem e correlacionem métricas cruciais, estabelece limites de alerta relevantes e ajuda a garantir que você compreenda melhor o ambiente e se familiarize com ele. Dessa forma, se algum problema ocorrer, a causa raiz poderá ser descoberta de modo efetivo e eficiente. O objetivo é minimizar o impacto sobre os usuários finais.
Para encerrar, ao usar uma boa ferramenta de monitoramento para implementar os três métodos de solução de problemas, você e suas equipes terão as informações necessárias para solucionar qualquer problema de virtualização em qualquer pilha, esteja ela no local ou na nuvem.