Поиск
Показаны результаты для тегов 'человеческим'.
Найдено: 2 результата
-
Специалисты китайской лаборатории Baidu Research, принадлежащей крупнейшему поисковому гиганту Поднебесной, создали алгоритм ИИ Deep Voice, способный преобразовывать текст в речь. Подобные проекты, существовавшие до этого, сталкивались с проблемой скорости синтеза звука, поэтому для генерации голоса предшественникам Deep Vice требовалось от нескольких минут до пары часов, чтобы корректно и максимально натуралистично воспроизвести текст человеческим голосом. Новая разработка китайских учёных основана на нейронных сетях и способна преобразовывать текст в голос в реальном времени. Deep Voice умеет имитировать тембр, интонацию голоса и акцент, делая их очень правдоподобными и почти неотличимыми от настоящих, при этом голос может быть мужским или женским. Разработчики уверены, что их технологию можно использовать в качестве цифровых помощников, применять для записи голосов в идеоиграх или же вовсе использовать для синхронного перевода фильмов по субтитрам. «Это настоящий прорыв с технической точки зрения, ведь мы смогли решить сложнейшую проблему, синтезировав живую речь со всеми ее особенностями», — говорит Лео Зу, один из авторов проекта.
-
- китайские
- разработчики
-
(и ещё 4 )
C тегом:
-
Специалисты поискового гиганта Google опубликовали статью, в которой рассказали о том, что создали генератор речи, способный говорить неотличимым от живого человека голосом. Разработка называется Tacotron 2 и умеет очень качественно преобразовывать текст в речь. Программа представляет собой две взаимосвязанные нейросети глубокого обучения. Первая нейросеть создаёт на основе текста спектрограмму и передаёт её второму алгоритму WaveNet, который её и озвучивает «голосом». Tacotron 2 знает множество нюансов, без труда справляется со сложными в произношении словами и, читая с листа, учитывает пунктуацию. Благодаря этому, например, она различает конец предложения и начало нового, выделяя их интонацией. Образцы работы приложения специалисты уже выложили на страничке, посвящённой разработке. Звучит это гораздо лучше, чем монотонные механические голоса современных программ озвучивания, поэтому, надо полагать, Google быстро найдёт разработке применение. WaveNet уже используется в Google Assistant, поэтому Tacotron 2 наверняка станет для неё отличным дополнением. На данном этапе разработки Tacotron 2 говорит только приятным женским голосом, но, вероятно, в будущем обзаведётся и мужским вариантом, а, учитывая её способность к обучению, возможно, научится и имитировать другие голоса.
-
- «заговорил»
-
(и ещё 2 )
C тегом: