Автоматизация масштабирования для WebSocket-приложения
Вводные данные
Основные задачи
1. Балансировка нагрузки и общий URL
Требования к документации
- Приложение: Docker-контейнер
- Инфраструктура: Запускается на GPU-pods Runpod
- Тип соединения: WebSocket (WSS)
- Клиенты: Мобильные клиенты подключаются через WebSocket
Основные задачи
1. Балансировка нагрузки и общий URL
- Настроить балансировщик нагрузки для WebSocket, который будет направлять трафик на доступные серверы
- Обеспечить единый URL для подключения всех мобильных клиентов
- Настроить автоматическое масштабирование серверов при увеличении нагрузки или при падении серверов
- Обеспечить автоматическое переключение соединений на работающие серверы в случае сбоя
- Настроить мониторинг серверов
- Настроить уведомления (желательно через Uptimerobot) при сбоях
Требования к документации
- Архитектура решения
- Инструкция по развертыванию
- Описание механизмов масштабирования
- Полная конфигурация самого пода
- Минимальное количество работающих подов
- Максимальное количество работающих подов
- Остальные нужные конфигурации по вашему опыту и усмотрению :)