ВАШИНГТОН, 21 февраля, ФедералПресс. Представители DeepSqeak создали систему обработки речи грызунов. Саму программу выложили в открытый доступ.
Ученые Вашингтонского университета под руководством Кевина Коффи создали алгоритм DeepSqeak, который может распознать звуки, издаваемые грызунами. Программа способна разделить речь на слоги и классифицировать их. В основе лежит технология сверточных нейросетей. Ученые разместили свою разработку в открытом доступе.
Для общения грызуны используют ультразвуковую вокализацию частотой от 20 килогерц. Ученые подразделяют звуки в зависимости от длины и частоты. К примеру, общение частотой около 50 килогерц связано с положительной эмоциональной окраской, а около 20 – с отрицательной. При этом коммуникационные особенности у крыс, мышей и других грызунов отличаются.
Сначала DeepSqeak создает из звукового файла сонограмму. В ней речь грызуна отделяется от посторонних шумов. После этого в интерфейсе в отдельных кластерах появляются все звуки, изданные грызуном.
Пока что в программе доступен переводчик с мышиного, который распознает пять различных видов звуков: на ней ученые исследовали и обучали нейросеть. Пользователь также может самостоятельно предоставить аудиозапись и разметить образцы звуков вручную. После этого программа сама классифицирует их, пишет N+1.
Ранее мы сообщали, что российские ученые обучили нейросеть находить метастазы рака в организме. Раньше врачам приходилось тратить до получаса на диагностику. Новая технология способна делать это за 10 секунд.
Фото: pixabay.com