Хмара Microsoft Azure Платформа, її широко використовувані служби 365, Xbox і Minecraft почали зазнавати збоїв близько полудня за східним часом у середу, результатом, за словами Microsoft, була «ненавмисна зміна конфігурації». Інцидент, який став другим великим хмарним провайдером, який припинив роботу менш ніж за два тижні, підкреслює нестабільність Інтернету, побудованого на інфраструктурі, якою керують кілька технологічних гігантів.
Проблеми Microsoft виникли саме через вихідну мережу доставки контенту Azure і виникли лише за кілька годин до оголошення Microsoft про заплановані прибутки. Веб-сайт компанії, включаючи її сторінку зі зв’язків з інвесторами, також не працював у середу вдень, а сторінка статусу Azure, де Microsoft надає оновлення, також мала періодичні проблеми.
Microsoft пояснила в оновленні статусу в середу, що вона пройшла процес послідовного відкоту останніх версій свого середовища, поки не зможе точно визначити «останню відому хорошу» конфігурацію. О 15:01 за східним часом компанія заявила, що визначила цю стабільну конфігурацію та перемістила її вперед, і що «клієнти можуть почати бачити перші ознаки відновлення. Зараз ми відновлюємо вузли та маршрутизуємо трафік через здорові вузли».
Представник Microsoft сказав у своїй заяві: «Ми працюємо над вирішенням проблеми з Azure Front Door, яка впливає на доступність деяких служб. Клієнти повинні продовжувати перевіряти сповіщення про стан своїх служб». Компанія не відразу відповіла на запитання WIRED про характер зміни конфігурації, яка спричинила збій.
Крім того, що збій стався в день звітності Microsoft, він стався через дев’ять днів після того, як конкурент Azure Amazon Web Services зазнав масштабного збою, який вплинув на сайти та служби по всьому світу. Основні хмарні провайдери, яких часто називають «гіпермасштабувальниками», стандартизують і покращують основну безпеку та надійність для своїх клієнтів, але проблеми та збої можуть зробити їх єдиною точкою збою для великої кількості критичних цифрових послуг.
«Навіть сторінка статусу збою в роботі Azure не працює», — говорить Дейві Оттенхаймер, давній менеджер із безпеки та дотримання нормативних вимог і віце-президент компанії з інфраструктури даних Inrupt. «Ще одна помилка зміни конфігурації — зараз ми живемо в епоху порушень цілісності, як ніколи».
Azure заблокував клієнтам внесення змін у конфігурацію своїх екземплярів, поки він працював над вирішенням проблеми. Компанія заявила в оновленому статусі о 15:22 за східним часом, що очікує «повного пом’якшення» ситуації до 19:20 за східним часом.
«Організації можуть думати, що вони ізольовані від свого вибору хмарного постачальника, але ця залежність глибока», — каже Муніш Вальтер-Пурі, допоміжний викладач IANS Research і колишній директор відділу кіберризиків Університету Нью-Йорка. “Коли ключові гравці покладаються на інші гіпермасштабувальники, ризики зростають. Оскільки ШІ стає наступним рівнем критичної інфраструктури, ці збої демонструють крихкість нашої цифрової магістралі”.