Cloudflare пояснила причину збою, що тимчасово «поклав» половину інтернету
19-11-2025 12:21
Cloudflare опублікувала деталі масштабного збою, що стався 18 листопада 2025 року та вплинув на роботу значної частини інтернету, включно з ChatGPT, X та Downdetector. Компанія назвала інцидент «найгіршим від 2019 року» та пов’язала його з помилкою у системі Bot Management.
Проблема виникла через некоректне налаштування запиту у базі даних ClickHouse, яка генерує конфігураційний файл для моделі машинного навчання системи Bot Management, пише Межа.медіа.
Зміна в поведінці запиту спричинила появу великої кількості дублікатів даних. Це призвело до швидкого зростання конфігураційного файлу, який перевищив встановлені ліміти пам’яті.
Як наслідок, це вивело з ладу основну проксі-систему, яка обробляє трафік клієнтів, що залежить від модуля ботів. Клієнти, які використовували згенерований показник ботів у своїх правилах, почали блокувати реальний трафік, тоді як компанії, які не використовували цю функцію, залишалися онлайн.
У Cloudflare уточнили, що проблема не була пов’язана з DNS, атакою чи новими системами на базі генеративного ШІ – помилка виникла саме у внутрішній логіці оновлення конфігурації Bot Management.
Щоб запобігти подібним інцидентам, компанія оголосила чотири кроки:
- посилення обробки конфігураційних файлів так само як і користувацького введення;
- розширення кількості глобальних «kill switch» для функцій;
- запобігання ситуаціям, коли core dump або звіти про помилки можуть перевантажувати систему;
- перегляд усіх режимів відмови у ключових проксі-модулях.
За оцінками Cloudflare, приблизно 20% інтернету проходить через її мережу, тому будь-яка помилка у центральних модулях здатна спричинити глобальний вплив.
Проблема виникла через некоректне налаштування запиту у базі даних ClickHouse, яка генерує конфігураційний файл для моделі машинного навчання системи Bot Management, пише Межа.медіа.
Зміна в поведінці запиту спричинила появу великої кількості дублікатів даних. Це призвело до швидкого зростання конфігураційного файлу, який перевищив встановлені ліміти пам’яті.
Як наслідок, це вивело з ладу основну проксі-систему, яка обробляє трафік клієнтів, що залежить від модуля ботів. Клієнти, які використовували згенерований показник ботів у своїх правилах, почали блокувати реальний трафік, тоді як компанії, які не використовували цю функцію, залишалися онлайн.
У Cloudflare уточнили, що проблема не була пов’язана з DNS, атакою чи новими системами на базі генеративного ШІ – помилка виникла саме у внутрішній логіці оновлення конфігурації Bot Management.
Щоб запобігти подібним інцидентам, компанія оголосила чотири кроки:
- посилення обробки конфігураційних файлів так само як і користувацького введення;
- розширення кількості глобальних «kill switch» для функцій;
- запобігання ситуаціям, коли core dump або звіти про помилки можуть перевантажувати систему;
- перегляд усіх режимів відмови у ключових проксі-модулях.
За оцінками Cloudflare, приблизно 20% інтернету проходить через її мережу, тому будь-яка помилка у центральних модулях здатна спричинити глобальний вплив.
Источник:
Волинські Новини
