Jump to content

Recommended Posts

Posted

В видеохостинге YouTube появилась новая опция, ориентированная на людей с нарушением слуха.
 
Ресурс научился распознавать окружающие звуки в видео и в автоматическом режиме начал подписывать их в роликах, пока речь идет только о трех звуковых эффектах - смех, аплодисменты и музыка.

Это небольшое, но значительное дополнение к функции автосубтитров для речи, запущенной YouTube еще в 2009 году. Разработчики признаются, что новая функция стала реальной благодаря машинному обучению. У YouTube появился алгоритм искусственного интеллекта для звуковых эффектов лишь после обработки тысяч часов видео.

При этом наиболее сложной задачей было «научить» видеохостинг различать те элементы, которые звучат синхронно, например, в случае, когда в унисон раздаются смех и рукоплескание.

В будущем компания хочет добавить поддержку и других звуков, например, видеохостинг сможет распознавать стук, звон и т.д. Но для этого искусственному интеллекту придётся научиться различать источники этих звуков.

Субтитры к видео появились на YouTube в сентябре 2006 года, а автоматически создаваемые субтитры — в ноябре 2009 года. Однако функция пока ещё далека от идеала — из-за таких нюансов как неправильное произношение, акценты, диалекты и фоновые шумы её приходится постоянно дорабатывать.

В начале текущего года компания Google объявила о том, что количество видеороликов с автоматическими субтитрами уже превысило 1 миллиард.

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Create New...