МОСКВА, 24 февраля, ФедералПресс. Специалисты «VK Видео» существенно увеличили количество видео с субтитрами и улучшили качество их обработки. Теперь просмотр видео стал более комфортным: речь диктора отображается в виде текстовых субтитров, которые оформлены как предложения с пунктуацией и заглавными буквами. При этом учитываются особенности разговорной, специализированной лексики и новых слов.
На главной странице пользователя 8 из 10 видео будут иметь новые субтитры. Автоматические субтитры в «VK Видео» создаются с помощью моделей машинного обучения. Аудиопоток из видео проходит через несколько этапов обработки. Сначала нейросеть удаляет посторонние шумы, выделяет речь и преобразует ее в слова. Затем другие модели преобразуют расшифровку в текст. Наконец, финальная модель синхронизирует полученный текст с аудиодорожкой.
Модель искусственного интеллекта допускает на 30 % меньше ошибок, чем аналогичные модели создания субтитров в других сервисах.
Технология работает как для профессиональных видео, так и для пользовательского контента. Она полезна для людей с нарушениями слуха и в ситуациях, когда нежелательно включать звук в видео.
Ранее сервис «VK Видео» обновил интерфейс приложения и веб-версии. Подробности – в материале «ФедералПресс».
Изображение сгенерировано нейросетью Kandinsky 3.1