Вчера вечером пользователи по всему миру столкнулись с проблемами при доступе к Spotify, Discord, Snapchat и даже сервисам самого Google. Виной всему оказался сбой в облачной платформе Google Cloud, который длился ровно три часа — с 21:49 по московскому времени 12 июня до 00:49 13 июня.

Google оперативно опубликовала предварительный отчёт, где объяснила причину проблемы. Оказалось, всё началось с неудачного автоматического обновления системы квот API. Это привело к лавине ошибок "503 Service Unavailable" по всему миру.

"Мы искренне сожалеем о возникших неудобствах, — заявили в компании. — В ближайшие дни опубликуем полный отчёт с деталями и мерами, которые примем, чтобы подобное не повторилось".

Инженеры Google смогли временно отключить проверку квот, что вернуло работоспособность большинству сервисов за два часа. Однако в регионе us-central1 (Центральная часть США) проблемы сохранялись дольше из-за перегруженной базы данных.

Компания пообещала три ключевых улучшения:

  1. Защиту системы управления API от повреждённых данных
  2. Более строгий контроль за глобальными обновлениями
  3. Улучшенное тестирование на случай подобных сбоев

Этот инцидент вновь показал, насколько хрупкой может быть современная интернет-инфраструктура, когда столько сервисов зависят от нескольких облачных платформ. Пользователи надеются, что Google выполнит свои обещания по улучшению системы.