Искусственный интеллект «заговорит по-человечески» благодаря китайским инженерам

Компания Baidu Research занимается большим количеством разработок. Одно из направлений — работа по совершенствованию работы искусственного интеллекта. Настоящим прорывом можно назвать ИИ Deep Voice, который благодаря новому алгоритму в считанные секунды воспроизводить в реальном времени человеческую речь.

Голос ИИ с «акцентом»

Искусственный интеллект "заговорит по-человечески" благодаря китайским инженерам

Ранее самые успешные подобные проекты тратили на подобную процедуру от нескольких минут до нескольких часов. При этом результат назвать идеальным было нельзя — сгенерированную речь легко было отличить от настоящей, человеческой. Deep Voice воспроизводить тексты максимально быстро и при этом результат более чем впечатляет — голос звучит натурально.

Использовать Deep Voice можно как цифрового помощника, для озвучивания субтитров к фильмам или начитки текстов для игр или передач. Самое интересно, что китайский ИИ способен воспроизводить как мужской, так и женский голоса.

По признанию разработчиков из Baidu Research создание Deep Voice стало возможным благодаря уже существующим разработкам в этом направлении. Основным же отличием уникального ИИ стало использование им нейронных сетей, которые в свою очередь опираются на набор максимально простых функций. Поэтому работает Deep Voice быстро, а голос можно настроить нужным образом. Так можно задать наличие акцента или индивидуального говора у ИИ.

Проект китайцев уже сейчас получил множество положительных отзывов, так что в ближайшее время мы, возможно, увидим первые фильмы, полностью озвученные искусственным интеллектом.