на основании сообщений и запросов пользователей за последние сутки
Статистика сбоев Amazon Web Services
- через форму обратной связи или личный кабинет - https://aws.amazon.com.
- Проверить статус региона в сервисе AWS Health Dashboard
- Верифицировать настройки групп безопасности и сетевых ACL
- Проверить состояние Elastic IP адресов и их ассоциацию
- Убедиться в корректной работе Elastic Load Balancer
- Мониторить использование квот инстансов в регионе
- Проверить права доступа к бакетам и объектам через IAM policies
- Убедиться в отсутствии блокировок версионности объектов
- Проверить настройки шифрования данных при передаче и хранении
- Мониторить использование доступного пространства хранилища
- Верифицировать корректность настроек CORS для веб-приложений
- Проверить статус инстанса БД в консоли управления
- Убедиться в достаточном объеме выделенного хранилища
- Мониторить производительность через CloudWatch metrics
- Проверить актуальность резервных копий и snapshots
- Верифицировать настройки параметров безопасности групп БД
- Проверить статус таргет-групп и health checks
- Убедиться в корректности настроек listeners
- Мониторить количество активных соединений
- Проверить SSL сертификаты на актуальность
- Верифицировать соответствие capacity units текущей нагрузке
- Проверить логи выполнения через CloudWatch Logs
- Убедиться в достаточных правах выполнения IAM role
- Мониторить лимиты времени выполнения и памяти
- Проверить корректность конфигурации триггеров
- Верифицировать версии runtime окружений
- Проверить таблицы маршрутизации и NAT gateways
- Убедиться в доступности интернет-шлюзов
- Мониторить лимиты сетевых интерфейсов
- Проверить настройки DNS разрешения через Route 53
- Верифицировать корректность работы VPN соединений
- Проверить статус распределений и их конфигурацию
- Убедиться в актуальности SSL/TLS сертификатов
- Мониторить показатели кэширования и hit ratio
- Проверить корректность origin configured
- Верифицировать геораспределение edge locations
- Проверить доступность метрик и логов в реальном времени
- Убедиться в корректности настроек алертов и тревог
- Мониторить работоспособность агентов на инстансах
- Проверить интеграцию с другими сервисами мониторинга
- Верифицировать права доступа к метрикам и логам
Amazon Web Services