Компания Baidu Research занимается большим количеством разработок. Одно из направлений — работа по совершенствованию работы искусственного интеллекта. Настоящим прорывом можно назвать ИИ Deep Voice, который благодаря новому алгоритму в считанные секунды воспроизводить в реальном времени человеческую речь.
Голос ИИ с «акцентом»
Ранее самые успешные подобные проекты тратили на подобную процедуру от нескольких минут до нескольких часов. При этом результат назвать идеальным было нельзя — сгенерированную речь легко было отличить от настоящей, человеческой. Deep Voice воспроизводить тексты максимально быстро и при этом результат более чем впечатляет — голос звучит натурально.
Использовать Deep Voice можно как цифрового помощника, для озвучивания субтитров к фильмам или начитки текстов для игр или передач. Самое интересно, что китайский ИИ способен воспроизводить как мужской, так и женский голоса.
По признанию разработчиков из Baidu Research создание Deep Voice стало возможным благодаря уже существующим разработкам в этом направлении. Основным же отличием уникального ИИ стало использование им нейронных сетей, которые в свою очередь опираются на набор максимально простых функций. Поэтому работает Deep Voice быстро, а голос можно настроить нужным образом. Так можно задать наличие акцента или индивидуального говора у ИИ.
Проект китайцев уже сейчас получил множество положительных отзывов, так что в ближайшее время мы, возможно, увидим первые фильмы, полностью озвученные искусственным интеллектом.