В «VK Видео» повышено качество субтитров благодаря новым ИИ-алгоритмам
Сервис «VK Видео» внедрил передовые алгоритмы искусственного интеллекта для автоматического распознавания речи и генерации субтитров в различных типах контента, таких как шоу, видеоролики и клипы. Это привело к улучшению точности расшифровки на 25%, а нейросети теперь способны обрабатывать не только тысячи новых слов, но и понимать мемы, специализированные термины, имена собственные и акронимы. Автоматизация создания субтитров осуществляется с помощью машинного обучения, которое обрабатывает текст, расставляет знаки препинания и синхронизирует субтитры с видео. Для обеспечения высокой точности аудиопоток анализируется поэтапно: сначала нейросеть удаляет посторонние шумы, затем распознает речь и преобразует её в текст. Затем вступают в работу модели для пунктуации и денормализации, преобразующие набор распознанных слов в читаемый текст, который ИИ синхронизирует с аудиодорожкой. Эти улучшения делают субтитры более четкими и удобными как в профессиональных роликах, так и в любительских видео. В ближайшем будущем ИИ будет способен разделять речь разных спикеров на отдельные реплики, что упростит восприятие субтитров. Популярность данной функции растет: за последний месяц доля пользователей, включающих субтитры в веб-версии, увеличилась на 28%, и теперь 11% всей аудитории «VK Видео» активно используют эту опцию. Источник: CNews