ВАШИНГТОН, 16 мая, ФедералПресс. Google научила алгоритм прямому переводу устной речи, который не конвертирует слова в текст.
Компания Google создала алгоритм, который способен переводить устную речь, предварительно не превращая ее в текст. Это позволяет сохранить некоторые характеристики голоса даже после перевода.
Современные гаджеты уже давно способны переводить устную речь на другие языки. Однако это всегда делалось в три предсказуемых этапа. Сначала речь говорящего переводится в текст, затем этот текст переводится на другой язык распространенными программами, а затем – озвучивается. Главная проблема такого метода – невозможность сохранения пауз и интонации оригинальной речи, поскольку прямой связи между речью говорящего и ее аудиоверсией на другом языке не было.
Разработчики из Google под руководством Юнхуэя У создали алгоритм, переводящий речь с одного языка на другой без использования промежуточного перевода речи в текстовое представление. Для начальных испытаний были использованы два больших датасета, содержащих разговоры на английском и испанском языках и их расшифровки.
При обучении алгоритм научился предсказывать текстовые последовательности фонем на обоих языках. Это позволило программе переводить не отдельные слова, а целые связные предложения. Разработчики разместили примеры исходных аудиофайлов и их переводов, где отчасти сохранена интонация и паузы в речи.
Пока такой алгоритм переводит речь менее точно, чем это может сделать обычный текстовый переводчик. Разработки показали лишь первый пример полноценного перевода речи без ее промежуточной конвертации в текст. Ученые будут продолжать работу.
Ранее мы сообщали, что в Великобритании ученые смогли расшифровать манускрипт Войнича. Он оставался загадкой для исследователей более ста лет.
Фото: pxhere.com