Situação (antes da nossa atuação)
A Tramontina está em processo de implantação do ERP SAP, o que demandou a construção de uma plataforma para realizar a integração entre os sistemas atuais e o novo ERP. Como, parte dessa construção a estruturação de observabilidade é fundamental para garantir os objetivos de negócio de diminuição do tempo de recuperação entre falhas e aumentar a confiabilidade das integrações.
Implicações
- Risco de Perda de Integrações: Sem uma visibilidade clara, havia um risco constante de perda de integrações entre os sistemas, o que poderia levar a falhas de comunicação críticas.
- Aumento do Tempo de Indisponibilidade: A ausência de ferramentas de diagnóstico rápido dificultava a resolução ágil de problemas, resultando em um tempo de recuperação entre falhas mais longo.
- Falta de Confiabilidade: A incerteza em relação ao estado das integrações reduzia a confiança nas operações e aumentava a possibilidade de interrupções inesperadas.
O que fizemos
Para abordar esses desafios, a EximiaCo implementou uma solução abrangente de observabilidade que incluiu:
- Implementação de Traces: Integrando ferramentas de tracing para monitorar o fluxo das integrações em tempo real, permitindo identificar rapidamente onde ocorrem falhas.
- Coleta de Logs: Estabelecendo um sistema centralizado de coleta e análise de logs, facilitando a detecção de anomalias e a resolução de problemas.
- Métricas e Monitoramento: Configurando dashboards e alertas para monitorar métricas críticas das integrações, proporcionando uma visão clara da saúde do sistema e antecipando possíveis falhas.
- Adoção de padrões de resiliência: Implementação de padrões de resiliência em todo o processo de integração para aumentar a confiabilidade e diminuir o tempo para se recuperar entre falhas.
Entregáveis
- Painéis de Monitoramento em Tempo Real: Dashboards personalizados que oferecem uma visão geral das integrações e alertam sobre quaisquer anomalias.
- Processos para Diagnósticos: Processos que ajudam na análise de falhas e no rastreamento de problemas específicos.
- Sistema de Alertas: Alertas configurados para notificar a equipe sobre qualquer degradação ou falha nas integrações, permitindo uma resposta rápida.
- Estratégias para resiliência: Estratégias de resiliência que mitigam a necessidade de intervenção manual em caso de falhas.
Feedbacks
Estamos em processo de coleta de feedbacks, dado que o projeto está em andamento. No entanto, as expectativas iniciais são positivas, com a equipe da Tramontina reconhecendo já uma maior visibilidade e controle sobre as integrações.