Ippolitovich

Китайские разработчики научили ИИ говорить человеческим голосом

В теме 1 сообщение

Специалисты китайской лаборатории Baidu Research, принадлежащей крупнейшему поисковому гиганту Поднебесной, создали алгоритм ИИ Deep Voice, способный преобразовывать текст в речь. Подобные проекты, существовавшие до этого, сталкивались с проблемой скорости синтеза звука, поэтому для генерации голоса предшественникам Deep Vice требовалось от нескольких минут до пары часов, чтобы корректно и максимально натуралистично воспроизвести текст человеческим голосом. Новая разработка китайских учёных основана на нейронных сетях и способна преобразовывать текст в голос в реальном времени.

 

7.jpg


Deep Voice умеет имитировать тембр, интонацию голоса и акцент, делая их очень правдоподобными и почти неотличимыми от настоящих, при этом голос может быть мужским или женским. Разработчики уверены, что их технологию можно использовать в качестве цифровых помощников, применять для записи голосов в идеоиграх или же вовсе использовать для синхронного перевода фильмов по субтитрам.

«Это настоящий прорыв с технической точки зрения, ведь мы смогли решить сложнейшую проблему, синтезировав живую речь со всеми ее особенностями», — говорит Лео Зу, один из авторов проекта.

Поделиться сообщением


Ссылка на сообщение

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти

  • Похожий контент

    • От Ippolitovich
      Исследователи из Нанкинского университета (Китай) предложили новое объяснение загадочным быстрым радиоимпульсам (FRB), в рамках которых за несколько миллисекунд в космическое пространство выбрасывается огромное количество энергии. По мнению китайских ученых, это явление связано с образованием коры на «странных» звездах.
       


      Первый FRB-сигнал был обнаружен еще в 2001 году радиотелескопом в Австралии. Однако данные о нем были обработаны только к 2007 году. С тех пор астрономы смогли подтвердить несколько десятков таких сигналов, однако выяснить их истинную природу пока никто так и не смог. Появилось множество различных гипотез, пытающихся объяснить, откуда появляются эти быстрые радиовсплески. Однако сложность в их слежении (они длятся всего несколько миллисекунд) не позволяют ученым добиться каких-то более убедительных результатов. На этой волне даже появилось предположение, что это явление может быть связано с деятельностью инопланетных цивилизаций. Наукой эта гипотеза рассматривается наименее вероятной, но все же.
      Также вероятными источниками назывались либо слившиеся друг с другом нейтронные звезды, либо превращающиеся в черную дыру тяжелые пульсары (блицары). Некоторые исследователи критикуют эти гипотезы, поскольку иногда радиовсплески повторяются.
       

       
      Китайские астрофизики, в свою очередь, полагают, что источником быстрых всплесков становится особый тип нейтронных звезд — странные звезды. В недрах этих объектов образуется кварковый «суп», состоящий из трех разновидностей кварков, включая странные кварки. Эта материя находится в низком энергетическом состоянии, что делает ее стабильной. Согласно теоретической модели, в ней иногда образуется обычная адронная материя (состоящая из нейтронов), которая вытесняется из звезды и образует кору на ее поверхности. Кора со временем становится все тяжелее и в какой-то момент времени разрушается.
      Обнаженная кварковая звезда на короткое время становится источником электрон-позитронных пар и генерирует электромагнитное поле. Это, в свою очередь, приводит к ускорению электронов и позитронов до скоростей, близких к скорости света. При движении частицы испускают когерентное радиоизлучение, которое регистрируется как быстрый радиовсплеск. Затем адронная кора восстанавливается, и цикл повторяется заново. Период формирования коры может быть очень долгим, что объясняет единичные случаи радиовсплесков.
       

       
      Исследователи отмечают, что для подтверждения или опровержения этого предположения потребуется проведение дополнительных исследований. Кроме того, потребуется проверить, действительно ли коллапс звездной «корки» приводит к генерации электромагнитного поля, а не радиоволн.
      В настоящий момент любое излучение в диапазонах рентгеновских или гамма-волн будет слишком слабым для наблюдения с помощью современных детекторов. Поэтому, по мнению ученых, для будущих наблюдений за FRB-сигналами потребуется использование более чувствительных инструментов.
       

       
      Этими инструментами смогут стать, например, телескоп CHIME (Canadian Hydrogen Intensity Mapping Experiment), располагающийся в Британской Колумбии, или Square Kilometer Array («Антенная решетка площадью в квадратный километр»), строительство которой ведется в Южной Африке и Австралии.
      Эти устройства будут оптимизированы для радиоастрономии и смогут существенно больше рассказать об FRB-сигналах и других загадочных космических феноменах.
    • От Ippolitovich
      В 2008 году корпорация Apple открыла магазин приложений, доступный для владельцев iPhone и сторонних разработчиков. С тех пор компания много раз меняла правила работы программ и систему вознаграждения партнёров.
      Многие компании и частные предприниматели считают, что Apple несправедлива к тем, кто наполняет экосистему iOS новыми играми и программами. Администрация App Store может в несколько кнопок удалить прибыльное приложение, или вовсе заблокировать аккаунт разработчику, перекрыв для него основной источник дохода.
       


      Также Apple полностью диктует механизмы получения прибыли с приложений. Например, разработчик не может позволить клиентам пользоваться платной программой на протяжении ограниченного отрезка времени. Существует возможность на время открыть доступ к некоторым платным функциям, но клиент программы для этого должен быть бесплатным.
      35 разработчиков сформировали организацию The Developers Union (Союз разработчиков), которая требует от Apple ввести функцию пробного использования приложений.
       


      «Мы верим, что люди, которые создают качественное ПО, должны иметь возможность жить за счёт этого. Мы сформировали The Developers Union, чтобы отстаивать поддержку в App Store. Сейчас мы просим Apple ввести функцию пробных версий во всех приложениях к первому юбилею магазина в июле. После этого мы начнём бороться за более разумные проценты от доходов и изменения, поддерживаемые сообществом и помогающие разработчикам», — говорится в письме участников нового союза.
      На сайте группы работает форма регистрации, и, можно быть уверенным, что скоро к союзу присоединятся и другие участники.
    • От душман
      Специалисты Роскомнадзора и радиочастотной службы прошли учения по поиску источников помех и незаконно действующих РЭС. Учения проходили с 6 по 13 мая во время матчей на стадионах в Казани, Самаре, Нижнем Новгороде, Екатеринбурге, Волгограде, Калининграде, Санкт-Петербурге и Ростове-на-Дону.
       
      С помощью переносных РЭС создавалась имитация помехового воздействия. В задачу специалистов радиоконтроля входило выявление и определение места нарушения, а также прекращение работы РЭС совместно с представителями оргкомитета, говорится в сообщении Роскомнадзора.
       
      Были отработаны вводные по поиску источников помехового воздействия на базовые станции операторов мобильной связи и выявлению незаконно действующих РЭС, использующих технологию Wi-Fi.
      Также отработаны механизмы информационного взаимодействия между пунктами управления радиоконтролем на стадионах, оперативным центром управления радиочастотным спектром, ситуационными центрами филиалов радиочастотной службы и ситуационным центром Роскомнадзора.
       
      Ожидается, что проведенные учения наряду с отработкой радиоконтрольных мероприятий во время тестовых футбольных матчей позволят обеспечить качественное оказание услуг связи в ходе чемпионата мира по футболу, который стартует 14 июня.
    • От Ippolitovich
      Китайские власти в социальных сетях открыто заявили, что имеют возможность читать с телефонов подозреваемых удалённые сообщения из WeChat. Таким образом, подтвердилась многолетняя теория о том, что правительство может использовать мессенджер для слежки.
       


      Tencent, родительская компания WeChat, отрицает какие-либо правонарушения. «WeChat не хранит истории переписок — они хранятся только на телефонах и компьютерах пользователей», — написала она.
      Аналогичную позицию Tencent занимала и раньше. В январе бизнесмен из автомобильной индустрии Ли Шуфу (Li Shufu) заявил, что генеральный директор китайского гиганта «наверняка наблюдает за нашими действиями в WeChat каждый день». Tencent это отрицала — она сказала, что «WeChat не использует содержимое переписок для анализа больших данных» и «техническая модель WeChat не хранит и не анализирует переписки пользователей».
       


      Комиссия по проверке и контролю муниципального образования Чаоху, борющаяся с коррупцией, признала, что использовала возможность читать удалённые переписки в WeChat, чтобы узнать имена всех подозреваемых. Комиссия заявила, что каждый из них, будучи партийным чиновником, признался в нарушениях. Так организации удалось выдвинуть обвинения в общей сложности против 63 человек.
      К воскресенью публикация комиссии была удалена. Тем не менее, она вызвала бурные споры на тему защищённости данных жителей Китая среди пользователей различных интернет-площадок.
      В марте Министерство обороны Австралии запретило использовать WeChat в области военных действий, поскольку приложение не соответствует определённым стандартам. Впрочем, каким именно, не уточняется.
    • От Ippolitovich
      Нам уже известно, насколько жесткой является интернет-цензура в Китае. Кроме того, там работает система распознавания лиц вроде той, с помощью которой недавно поймали преступника в России. На этом китайцы не остановились, и теперь они отслеживают мозговые импульсы, чтобы понимать, какие эмоции испытывают сотрудники различных предприятий.
       

       
      Для чего китайцам следить за чужими эмоциями? Удивительно, но они используют результаты слежки для того, чтобы вовремя устраивать перерывы на работе, своевременно менять обязанности сотрудников и даже распределять выходные. Все это нужно для того, чтобы повысить эффективность предприятия. Одна китайская компания утверждает, что их прибыль выросла на 315 миллионов долларов после того, как они начали использование технологии.
      Слежение за мозговыми импульсами осуществляется при помощи датчиков, которые встроены в головные уборы, являющиеся частью рабочей униформы. Технология используется не только на предприятиях, связанных с производством, но и в военных структурах. Датчики и искусственный интеллект улавливают такие состояния, как ярость, беспокойство или печаль. Это помогает предотвратить различные инциденты на рабочем месте.
      Изначально проект был разработан в Университете Нинбо. Финансирование он получил от государства. Сегодня более десятка предприятий и военных структур используют технологию слежения за эмоциями, и по словам Чэна Цзинчжоу, чиновника, который курирует программу, нет никаких сомнений в ее положительном влиянии.
      Так уж вышло, что некоторые обязанности требуют высокой концентрации, и если управляющий на предприятии получает предупреждение о нежелательном эмоциональном состоянии сотрудника, этого сотрудника могут отправить на выходной или дать ему менее ответственную работу. К слову, другие датчики используются в униформе водителей высокоскоростных поездов. Датчик может даже будить водителя, если тот засыпает.
      Интересно, готовы ли мы к тому, чтобы работодатель или правительство отслеживали наши эмоции? Поговаривают, что в Китае работники негативно относились к устройствам, считая, что кто-то хочет прочитать их мысли, но затем все привыкли. Ведь в некоторых предприятиях технология слежения за эмоциями была введена еще в 2014 году.