ИИ чат-бот Сбера освоил распознавание изображений

Нейросетевая модель GigaChat Pro получила значительное обновление, добавив возможность распознавания изображений. Теперь пользователи могут отправлять фотографии, чтобы получить полезную информацию о людях на фото, их одежде и советы по стилю.

Кроме того, GigaChat Pro научился распознавать как печатный, так и рукописный текст, включая формулы и графики. Студенты могут, например, загрузить изображение конспекта и получить его краткое содержание, ключевые темы и план для дальнейшей работы.

Для бизнес-клиентов функциональность доступна через API, позволяя модерировать отзывы, систематизировать контент и автоматизировать поддержку клиентов. Ретейлеры смогут загружать изображения товаров и получать продающие описания.

Также увеличен размер контекста моделей GigaChat Pro и GigaChat Lite — с 8 тыс. до 32 тыс. токенов. Теперь в один запрос можно загрузить текст, сопоставимый с 60 страницами A4, что позволяет поддерживать более длинные диалоги и реализовывать сложные сценарии.

Андрей Белевцев, старший вице-президент Сбербанка, подчеркнул, что мультимодальность является ключевым трендом в развитии генеративного искусственного интеллекта и открывает новые возможности для пользователей и бизнеса.

Читайте на 123ru.net