Вчера вечером пользователи по всему миру столкнулись с проблемами при доступе к Spotify, Discord, Snapchat и даже сервисам самого Google. Виной всему оказался сбой в облачной платформе Google Cloud, который длился ровно три часа — с 21:49 по московскому времени 12 июня до 00:49 13 июня.
Google оперативно опубликовала предварительный отчёт, где объяснила причину проблемы. Оказалось, всё началось с неудачного автоматического обновления системы квот API. Это привело к лавине ошибок "503 Service Unavailable" по всему миру.
"Мы искренне сожалеем о возникших неудобствах, — заявили в компании. — В ближайшие дни опубликуем полный отчёт с деталями и мерами, которые примем, чтобы подобное не повторилось".
Инженеры Google смогли временно отключить проверку квот, что вернуло работоспособность большинству сервисов за два часа. Однако в регионе us-central1 (Центральная часть США) проблемы сохранялись дольше из-за перегруженной базы данных.
Компания пообещала три ключевых улучшения:
- Защиту системы управления API от повреждённых данных
- Более строгий контроль за глобальными обновлениями
- Улучшенное тестирование на случай подобных сбоев
Этот инцидент вновь показал, насколько хрупкой может быть современная интернет-инфраструктура, когда столько сервисов зависят от нескольких облачных платформ. Пользователи надеются, что Google выполнит свои обещания по улучшению системы.