Velký výpadek Cloudflare v úterý 28. února 2024 měl za následek výpadky nebo zpomalení přístupu k široké řadě oblíbených webů a služeb, včetně OpenAI, Spotify, X (dříve Twitter) a Grindr. Incident, nejzávažnější od roku 2019, ukazuje, jak málo poskytovatelů infrastruktury podporuje moderní internet a jak zranitelný tento systém zůstává.

Co se stalo?

Výpadek začal přibližně ve 3:30 PT a trval více než tři hodiny, přičemž úplné zotavení bylo potvrzeno do konce dne. CEO Cloudflare Matthew Prince potvrdil, že problém není způsoben kybernetickým útokem, ale spíše interní softwarovou chybou. Konkrétně změna v databázi vygenerovala neobvykle velký konfigurační soubor, který systém nebyl schopen zpracovat, což způsobilo kaskádové selhání v celé síti.

Cloudflare rychle identifikoval a vrátil se k předchozí verzi souboru a obnovil provoz do 6:30 pacifického času. Prince vydal veřejnou omluvu, v níž uznal závažnost provinění. „Vzhledem k důležitosti Cloudflare v internetovém ekosystému je jakékoli narušení jakéhokoli našeho systému nepřijatelné,“ řekl.

Rozsah dopadu

Přibližně 20 % všech webových stránek spoléhá na služby Cloudflare, díky čemuž je výpadek rozšířený. Downdetector, služba sledování výpadků (vlastněná stejnou mateřskou společností jako CNET), zaznamenala během incidentu více než 2,1 milionu hlášení, přičemž nejvíce byly zasaženy USA, Velká Británie, Japonsko a Německo.

Kromě samotného Cloudflare uživatelé hlásili problémy s X (320 549 zpráv), League of Legends (130 260 zpráv), OpenAI (81 077 zpráv), Spotify (93 377 zpráv) a Grindr (25 031 zpráv). Výpadek ukázal, jak silně je mnoho digitálních služeb závislých na několika klíčových hráčích v oblasti infrastruktury.

Opakuje se problém?

Výpadek Cloudflare následuje po podobných incidentech v Amazon Web Services (AWS) a Microsoft Azure v posledních měsících. Tato selhání zpochybňují riziko koncentrace v moderní internetové infrastruktuře. Analytik Forrester Research Brent Ellis odhaduje, že samotné selhání Cloudflare mohlo mít za následek přímé i nepřímé ztráty ve výši 250 až 300 milionů dolarů.

Incident také zdůrazňuje křehkost infrastruktury umělé inteligence. Selhání OpenAI, přední platformy umělé inteligence, ukazuje, že i pokročilé technologie závisí na stabilních základních systémech. Jak poznamenala Sarah Kreps z Cornell University: „Tento problém odhaluje realitu, že mnohamiliardové, ba dokonce bilionové investice do umělé inteligence jsou jen tak spolehlivé jako nejméně pečlivě prověřená infrastruktura třetích stran.“

Závislost na centralizovaných službách vytváří zranitelnost systému. Výpadky, jako je tento, ukazují, že i ty nejpokročilejší digitální nástroje jsou náchylné k selhání, pokud je základ nestabilní.

Výpadek Cloudflare slouží jako ostrá připomínka toho, že internet navzdory své všudypřítomnosti zůstává složitým a křehkým systémem. Přestože se společnost omluvila a podnikla kroky k zabránění opakování, incident zdůrazňuje potřebu zlepšit odolnost a diverzifikovat kritickou infrastrukturu.