Перейти к содержанию

«Вконтакте» открывает доступ к собственным технологиям распознавания речи сторонним разработчикам


Рекомендуемые сообщения

Теперь разработчики смогут бесплатно использовать в своих инди-проектах технологию «Вконтакте», которая считывает голос и переводит его в текст. Об этом рассказал технический директор «Вконтакте» Александр Тоболь. Технология распознавания речи, или ASR, Automatic Speech Recognition, внедряется в несколько кликов. Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений. Об этом сообщили представители VK.

Для распознавания можно выбрать одну из двух моделей. Нейтральная подойдет для разборчивой речи, как в телешоу или интервью, а спонтанная поможет, когда нужно обработать более обыденную речь со сленгом и ненормативной лексикой. Нейросети «Вконтакте» обрабатывают файлы за несколько секунд, умеют удалять из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».

Технологию можно попробовать через веб-интерфейс на специальной странице или интегрировать через публичный API «Вконтакте». На портале доступен широкий набор методов, с помощью которых можно создавать мини-приложения «Вконтакте» или использовать в сторонних проектах. Решение подойдет для стартапов, инди-проектов, личных pet-проектов для обучения и саморазвития.Версию с обработкой аудио до 100 минут в сутки можно применять для любых целей. А для безлимитного использования технологии можно отправить заявку на электронную почту.

Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
×
×
  • Создать...