18 листопада користувачі інтернету з усього світу зіткнулися з несподіваною проблемою: тисячі сайтів перестали працювати через збій у роботі компанії Cloudflare.
Їх очільник Метью Прінс випустив заяву, в якій пояснив причини аварії, одразу зазначивши, що це не була кібератака. То що ж сталося у Cloudflare і які сайти від цього постраждали? Розберемося у цій статті.
Причини збою Cloudflare
Cloudflare зіткнулася з масштабним збоєм 18 листопада об 11:20. Оскільки компанія надає послуги з доставлення контенту та захисту тисячам сайтів, то це відчули у всьому світі.
У користувачів вибивало помилку 500 — internal server error, із зазначенням, що у браузера та хоста все добре, а у Cloudflare є певні проблеми.
Їх причиною були кілька обставин. У Cloudflare є система, яка аналізує всі запити й визначає, чи вони є справжніми, чи шкідливими.
Для роботи вона регулярно отримує спеціальний файл із «ознаками» — умовним списком параметрів, за якими система розпізнає ботів. Цей файл оновлюється автоматично кожні кілька хвилин.
18 листопада відбулася зміна у налаштуваннях доступу до бази даних ClickHouse. Після цього база почала повертати подвоєний список колонок, тобто дублікати. Через це система зібрала у два рази більший файл ознак, ніж зазвичай.
Проблема в тому, що сервери Cloudflare мають жорстку межу, скільки таких ознак вони можуть завантажити. Коли файл став удвічі більшим, програмний модуль, який обробляє весь трафік, просто не зміг його прочитати та «впав», що й викликало 5xx помилки.
До того ж цей завеликий файл автоматично розсилався у всі дата-центри Cloudflare і кожні 5 хвилин генерувалася нова версія.
Поки частина серверів отримувала «погані» файли, інші отримували «хороші», тому система то відновлювалася, то знову падала, що заважало швидко зрозуміти справжню причину.
О 14:24 Cloudflare вдалося зупинити генерацію некоректних файлів, повернути останню робочу версію та почати перезапуск сервісів. О 14:30 основний трафік відновився, а повне відновлення всіх систем завершилось о 17:06.
Компанія визнала інцидент найсерйознішим із 2019 року і вже працює над посиленням контролю конфігурацій, обмеженням впливу помилкових файлів та покращенням механізмів аварійного відключення.
Які сайти постраждали від збою?
Помилка у роботі Cloudflare дійсно зачепила користувачів у всьому світі. Зокрема спостерігалися проблеми в роботі таких популярних сервісів:
- Google,
- Microsoft,
- OpenAI,
- Facebook,
- PayPal,
- Telegram,
- Canva,
- X,
- Spotify,
- TikTok,
- WhatsApp,
- Pinterest,
- Uber,
- YouTube тощо.
Також від збою постраждала навіть платформа Downdetector, яка відстежує стан роботи вебсайтів та сервісів.
Крім того, через збій почалися проблеми в онлайн-іграх League of Legends та Valorant.
Серед українських сервісів відомо, що помилки виникали у «Київстар», Vodafone, Deepstate, Rozetka, DOU тощо.
Нагадаємо, нещодавно Cloudflare відбив рекордну DDoS-атаку потужністю 11,5 Tbps.