Cloudflare explica outage ocorrido dia 12

há 1 semana 3
ANUNCIE AQUI

A Cloudflare publicou que enfrentou, no dia 12 de setembro, uma falha de mais de uma hora causada por erro no código de seu painel de controle. O problema impactou não apenas a interface administrativa, mas também diversos serviços de API da empresa.

Leia também
VoidProxy impulsiona campanhas contra Microsoft e Google
Pacotes npm da CrowdStrike são infectados com malware Shai-Halud

A causa foi identificada no uso incorreto do hook useEffect do React, que ao ser configurado de forma inadequada, gerou ciclos repetidos durante o mesmo render. Esse comportamento resultou em uma sobrecarga de chamadas ao Tenant Service API, responsável pela autorização de requisições, provocando um efeito cascata e indisponibilidade em diferentes serviços.

A análise foi dificultada porque os sintomas apontavam para falha nas APIs, enquanto a origem estava no próprio painel. Além disso, o sistema de monitoramento não diferenciava requisições repetidas de novas, retardando a correlação do problema. Após o incidente, a empresa reforçou a capacidade do Tenant Service e implementou métricas adicionais para distinguir tentativas repetidas de novas chamadas, facilitando a detecção de anomalias.

A falha gerou debate na comunidade de desenvolvedores sobre o uso do useEffect. Parte defendeu sua importância para construção de interfaces complexas, enquanto outros ressaltaram o uso excessivo e muitas vezes desnecessário do recurso. O caso também chamou atenção para o paradoxo de uma empresa especialista em mitigação de DDoS sofrer interrupções por excesso de requisições internas.

A Cloudflare reconheceu a falha e prometeu aprimorar seus processos de teste para evitar incidentes semelhantes no futuro.

Ler artigo completo