Una grave interruzione di Cloudflare martedì 28 febbraio 2024 ha interrotto o rallentato l’accesso a un’ampia gamma di siti Web e servizi popolari, tra cui OpenAI, Spotify, X (ex Twitter) e Grindr. L’incidente, il peggiore verificatosi dall’azienda dal 2019, evidenzia come un piccolo numero di fornitori di infrastrutture sia alla base della moderna Internet e quanto questo sistema rimanga vulnerabile.
Quello che è successo?
L’interruzione è iniziata intorno alle 3:30 PT ed è durata più di tre ore, con un ripristino completo segnalato entro la fine della giornata. Il CEO di Cloudflare Matthew Prince ha confermato che il problema non era dovuto a un attacco informatico, ma piuttosto a un guasto interno del software. Nello specifico, una modifica al database ha generato un file di configurazione insolitamente grande che il sistema non è riuscito a elaborare, causando errori a catena nella rete.
Cloudflare ha rapidamente identificato e ripristinato una versione precedente del file, ripristinando il flusso del traffico entro le 6:30 PT. Prince ha rilasciato delle scuse pubbliche, riconoscendo la gravità del disagio. “Data l’importanza di Cloudflare nell’ecosistema Internet, qualsiasi interruzione di uno qualsiasi dei nostri sistemi è inaccettabile”, ha affermato.
La portata dell’impatto
Circa il 20% di tutti i siti web si affida ai servizi di Cloudflare, rendendo l’interruzione di vasta portata. Downdetector, un servizio per la segnalazione di interruzioni (di proprietà della stessa società madre di CNET), ha registrato oltre 2,1 milioni di segnalazioni durante l’evento, con i più colpiti Stati Uniti, Regno Unito, Giappone e Germania.
Oltre allo stesso Cloudflare, gli utenti hanno segnalato problemi con X (320.549 segnalazioni), League of Legends (130.260 segnalazioni), OpenAI (81.077 segnalazioni), Spotify (93.377 segnalazioni) e Grindr (25.031 segnalazioni). L’interruzione ha messo in luce quanto molti servizi digitali dipendano da alcuni attori chiave dell’infrastruttura.
Un problema ricorrente?
L’interruzione di Cloudflare segue incidenti simili avvenuti negli ultimi mesi su Amazon Web Services (AWS) e Microsoft Azure. Questi fallimenti sollevano interrogativi sul rischio di concentrazione nelle moderne infrastrutture Internet. L’analista di Forrester Research Brent Ellis stima che la sola interruzione di Cloudflare potrebbe aver causato perdite dirette e indirette tra i 250 e i 300 milioni di dollari.
L’incidente sottolinea anche la fragilità delle infrastrutture di intelligenza artificiale. L’interruzione di OpenAI, una delle principali piattaforme di intelligenza artificiale, evidenzia come anche le tecnologie all’avanguardia dipendano da sistemi sottostanti stabili. Come ha osservato Sarah Kreps della Cornell University, “La questione mette in luce la realtà che questo investimento multimiliardario, addirittura trilione di dollari, nell’intelligenza artificiale è affidabile tanto quanto la sua infrastruttura di terze parti meno esaminata”.
La dipendenza da servizi centralizzati crea vulnerabilità sistemiche. Interruzioni come questa dimostrano che anche gli strumenti digitali più avanzati sono soggetti a guasti se le fondamenta sono instabili.
L’interruzione di Cloudflare serve a ricordare duramente che Internet, nonostante la sua ubiquità, rimane un sistema complesso e fragile. Sebbene l’azienda si sia scusata e abbia adottato misure per prevenire il ripetersi, l’incidente sottolinea la necessità di maggiore resilienza e diversificazione delle infrastrutture critiche.































