Uma grande interrupção na Cloudflare na terça-feira, 28 de fevereiro de 2024, desativou ou retardou o acesso a uma ampla gama de sites e serviços populares, incluindo OpenAI, Spotify, X (antigo Twitter) e Grindr. O incidente, o pior da empresa desde 2019, destaca como um pequeno número de fornecedores de infraestrutura sustentam a Internet moderna – e como esse sistema permanece vulnerável.
O que aconteceu?
A interrupção começou por volta das 3h30 (horário do Pacífico) e durou mais de três horas, com recuperação total relatada no final do dia. O CEO da Cloudflare, Matthew Prince, confirmou que o problema não foi devido a um ataque cibernético, mas sim a uma falha interna de software. Especificamente, uma alteração no banco de dados gerou um arquivo de configuração incomumente grande que o sistema não conseguiu processar, causando falhas em cascata na rede.
A Cloudflare rapidamente identificou e reverteu para uma versão anterior do arquivo, restaurando o fluxo de tráfego às 6h30 (horário do Pacífico). Prince emitiu um pedido público de desculpas, reconhecendo a gravidade da perturbação. “Dada a importância da Cloudflare no ecossistema da Internet, qualquer interrupção de qualquer um dos nossos sistemas é inaceitável”, afirmou.
A escala do impacto
Aproximadamente 20% de todos os sites dependem dos serviços da Cloudflare, tornando a interrupção de grande alcance. Downdetector, um serviço de relatórios de interrupções (de propriedade da mesma empresa controladora da CNET), registrou mais de 2,1 milhões de relatórios durante o evento, sendo os EUA, Reino Unido, Japão e Alemanha os mais afetados.
Além do próprio Cloudflare, os usuários relataram problemas com X (320.549 relatórios), League of Legends (130.260 relatórios), OpenAI (81.077 relatórios), Spotify (93.377 relatórios) e Grindr (25.031 relatórios). A interrupção expôs o quanto muitos serviços digitais dependem de alguns atores-chave da infraestrutura.
Um problema recorrente?
A interrupção da Cloudflare segue incidentes semelhantes na Amazon Web Services (AWS) e no Microsoft Azure nos últimos meses. Estas falhas levantam questões sobre o risco de concentração na infra-estrutura moderna da Internet. O analista da Forrester Research, Brent Ellis, estima que a interrupção do Cloudflare por si só pode ter causado US$ 250 a US$ 300 milhões em perdas diretas e indiretas.
O incidente também sublinha a fragilidade da infraestrutura de inteligência artificial. A interrupção da OpenAI, uma plataforma líder de IA, destaca como até as tecnologias de ponta dependem de sistemas subjacentes estáveis. Como observou Sarah Kreps, da Universidade Cornell: “A questão expõe a realidade de que este investimento multibilionário, até mesmo de trilhões de dólares, em IA é tão confiável quanto sua infraestrutura de terceiros menos examinada”.
A dependência de serviços centralizados cria vulnerabilidades sistémicas. Interrupções como esta demonstram que mesmo as ferramentas digitais mais avançadas são suscetíveis a falhas se a base for instável.
A interrupção do Cloudflare serve como um forte lembrete de que a Internet, apesar de sua onipresença, continua sendo um sistema complexo e frágil. Embora a empresa tenha pedido desculpas e tomado medidas para evitar a recorrência, o incidente sublinha a necessidade de maior resiliência e diversificação em infraestruturas críticas.
































