Великий збій у роботі Cloudflare у вівторок, 28 лютого 2024 року, спричинив відключення або уповільнення доступу до широкого спектру популярних веб-сайтів та сервісів, включаючи OpenAI, Spotify, X (раніше Twitter) та Grindr. Цей інцидент, найсерйозніший для компанії з 2019 року, наголошує, як невелика кількість постачальників інфраструктури підтримують сучасний інтернет, і наскільки вразлива ця система залишається.
Що сталося?
Збій почався приблизно о 3:30 за тихоокеанським часом і тривав понад три години, повне відновлення було підтверджено до кінця дня. Генеральний директор Cloudflare Метью Прінс підтвердив, що проблема не пов’язана з кібератакою, а скоріше з внутрішньою програмною помилкою. Зокрема, зміна базі даних згенерувало надзвичайно великий конфігураційний файл, який система не змогла обробити, викликавши каскадні збої у всій мережі.
Cloudflare швидко виявив і повернувся до попередньої версії файлу, відновивши трафік до 6:30 за тихоокеанським часом. Прінс опублікував публічні вибачення, визнавши серйозність порушення. “Враховуючи важливість Cloudflare в інтернет-екосистемі, будь-який збій будь-якої з наших систем неприпустимий”, – заявив він.
Масштаб Впливи
Приблизно 20% всіх веб-сайтів покладаються на послуги Cloudflare, що робить масштабним масштабування. Downdetector, сервіс для відстеження збоїв (що належить тій же материнській компанії, що й CNET), зареєстрував понад 2,1 мільйона повідомлень під час інциденту, при цьому найбільше постраждали США, Великобританія, Японія та Німеччина.
Крім самої Cloudflare, користувачі повідомляли про проблеми з X (320 549 звітів), League of Legends (130 260 звітів), OpenAI (81 077 звітів), Spotify (93 377 звітів) та Grindr (25 031 звітів). Збій показав, наскільки багато цифрових сервісів залежать від декількох ключових гравців інфраструктури.
Проблема Повторюється?
Збій Cloudflare послідував за аналогічними інцидентами в Amazon Web Services (AWS) та Microsoft Azure в останні місяці. Ці збої ставлять під сумнів ризик концентрації в сучасній інтернет-інфраструктурі. Аналітик Forrester Research Брент Елліс оцінює, що лише збій Cloudflare міг призвести до прямих та непрямих втрат у розмірі 250–300 мільйонів доларів.
Інцидент також наголошує на крихкості інфраструктури штучного інтелекту. Збій OpenAI, яка веде платформи штучного інтелекту, показує, що навіть передові технології залежать від стабільних базових систем. Як зазначила Сара Крепс з Корнельського університету: «Ця проблема оголює реальність, що багатомільярдні, навіть трильйонні інвестиції в ІІ настільки ж надійні, наскільки найменш ретельно перевірена інфраструктура третіх сторін».
Залежність від централізованих сервісів створює системні вразливості. Збої, подібні до цього, демонструють, що навіть найпередовіші цифрові інструменти схильні до збоїв, якщо фундамент нестабільний.
Збій Cloudflare є суворим нагадуванням про те, що інтернет, незважаючи на його повсюдність, залишається складною і тендітною системою. Хоча компанія вибачилася і зробила кроки для запобігання повторенню, інцидент наголошує на необхідності підвищення стійкості та диверсифікації критичної інфраструктури.




























