Pemadaman besar-besaran di Cloudflare pada hari Selasa, 28 Februari 2024, menghentikan atau memperlambat akses ke berbagai situs web dan layanan populer, termasuk OpenAI, Spotify, X (sebelumnya Twitter), dan Grindr. Insiden ini, yang merupakan kejadian terburuk bagi perusahaan sejak tahun 2019, menyoroti betapa sedikitnya penyedia infrastruktur yang mendukung internet modern—dan betapa rentannya sistem tersebut.

Apa yang telah terjadi?

Pemadaman dimulai sekitar pukul 03.30 PT dan berlangsung selama lebih dari tiga jam, dengan pemulihan penuh dilaporkan pada penghujung hari. CEO Cloudflare Matthew Prince mengonfirmasi bahwa masalahnya bukan karena serangan siber, melainkan kegagalan perangkat lunak internal. Secara khusus, perubahan database menghasilkan file konfigurasi yang sangat besar sehingga sistem tidak dapat memprosesnya, sehingga menyebabkan kegagalan berjenjang di seluruh jaringan.

Cloudflare dengan cepat mengidentifikasi dan mengembalikan file ke versi sebelumnya, memulihkan arus lalu lintas pada pukul 06.30 PT. Prince mengeluarkan permintaan maaf publik, mengakui parahnya gangguan tersebut. “Mengingat pentingnya Cloudflare dalam ekosistem Internet, pemadaman apa pun pada sistem kami tidak dapat diterima,” katanya.

Skala Dampaknya

Sekitar 20% dari seluruh situs web bergantung pada layanan Cloudflare, sehingga pemadaman ini berdampak luas. Downdetector, sebuah layanan untuk melaporkan pemadaman listrik (dimiliki oleh perusahaan induk yang sama dengan CNET), mencatat lebih dari 2,1 juta laporan selama peristiwa tersebut, dengan Amerika Serikat, Inggris, Jepang, dan Jerman yang paling terkena dampaknya.

Selain Cloudflare sendiri, pengguna melaporkan masalah dengan X (320.549 laporan), League of Legends (130.260 laporan), OpenAI (81.077 laporan), Spotify (93.377 laporan) dan Grindr (25.031 laporan). Pemadaman ini menunjukkan betapa banyak layanan digital yang bergantung pada beberapa pemain infrastruktur utama.

Masalah Berulang?

Gangguan Cloudflare terjadi setelah insiden serupa di Amazon Web Services (AWS) dan Microsoft Azure dalam beberapa bulan terakhir. Kegagalan ini menimbulkan pertanyaan tentang risiko konsentrasi pada infrastruktur internet modern. Analis Forrester Research, Brent Ellis, memperkirakan pemadaman Cloudflare saja mungkin telah menyebabkan kerugian langsung dan tidak langsung sebesar $250 hingga $300 juta.

Insiden ini juga menggarisbawahi rapuhnya infrastruktur kecerdasan buatan. Gangguan terhadap OpenAI, platform AI terkemuka, menyoroti betapa teknologi mutakhir pun bergantung pada sistem dasar yang stabil. Sarah Kreps dari Cornell University menyatakan, “Masalah ini mengungkap kenyataan bahwa investasi AI yang bernilai miliaran, bahkan triliunan dolar, hanya dapat diandalkan jika dibandingkan dengan infrastruktur pihak ketiga yang paling sedikit diteliti.”

Ketergantungan pada layanan terpusat menciptakan kerentanan sistemik. Pemadaman listrik seperti ini menunjukkan bahwa alat digital tercanggih sekalipun pun rentan terhadap kegagalan jika fondasinya tidak stabil.

Pemadaman Cloudflare menjadi pengingat bahwa internet, meskipun ada di mana-mana, tetap merupakan sistem yang kompleks dan rapuh. Meskipun perusahaan telah meminta maaf dan mengambil langkah-langkah untuk mencegah terulangnya kejadian serupa, insiden ini menggarisbawahi perlunya ketahanan dan diversifikasi yang lebih besar pada infrastruktur penting.