Решение капчи нейросетью
- Тип капч:
Капчи представляют собой текстовые изображения (пример капчи прилагается). - Формат хранения данных:
Имеется база данных MySQL, в которой сохранены порядка 2.9 миллионов капч и правильных ответов к ним. База данных должна быть использована для обучения модели - Технология:
- Предпочтительный язык программирования: Python.
- Ожидается, что решение будет основано на обучении нейронной сети с использованием предоставленного набора данных.
- Интеграция:
Разработанная система должна быть доступна через API.- Вход: изображение капчи (формат JPEG/PNG).
- Выход: текст, соответствующий капче.
API должно поддерживать до 20 одновременно обрабатываемых запросов (с возможностью масштабирования).
- Производительность:
- Необходимо обеспечить возможность работы в 20 потоков одновременно, с возможностью дальнейшего увеличения числа потоков.
- Система должна быть адаптируема для горизонтального масштабирования.
- Инфраструктура и развертывание:
- Решение должно быть развернуто в Docker-контейнере. Исполнитель должен предоставить готовый Dockerfile для сборки контейнера, а также инструкцию по развертыванию. Все необходимые зависимости и настройки должны быть включены в Dockerfile для упрощения установки и эксплуатации системы.
- Документация и тестирование:
- Исполнитель должен предоставить документацию по использованию и настройке системы.
- Необходимо провести тестирование модели на реальных данных и предоставить отчеты о точности и скорости работы.
- Точность (accuracy): доля верно распознанных капч (не менее 90%)
- Среднее время обработки капчи: время от передачи изображения до получения текста (не более 8 сек)
- Процент ошибок (ошибочно распознанные капчи).
Исполнитель может предложить улучшения в архитектуре или подходе к решению задачи, если они помогут повысить точность распознавания или улучшить производительность.