Tacotron 2 — нейросеть от Google с самым человеческим голосом

Над новым звучанием нейросети разработчики Google трудились уже давно и стоит сказать, не зря — голос Tacotron 2 (а именно так назвали систему) отличить от человеческого практически нельзя.

Tacotron 2: многое преодолено, но есть над чем и работать!

Кроме того, что Tacotron 2 просто замечательно произносит имена людей и названия различных объектов, удалось ученым научить нейросеть учитывать и пунктуацию, и большинство особенностей произношения некоторых словосочетаний. Так система умеет определять слова, написанные с большой буквы, и успешно их выделять их произношением.

Но, как не скрывают создатели Tacotron 2, есть у нейросети некоторые проблемы, решить сейчас которые пока не получается. Так со сложным словами, например, названиями химических элементов, система справляется хуже. Но тут, в защиту нейросети нужно сказать, что далеко и не все люди справятся с произношением, например, карбозолгидрохлорид (ретинола ацетат).

 

Оценить качество звучания обновленной нейросети от Google можно на специальном сайте компании, где собраны множество вариантов фраз и предложений, сказанных Tacotron 2.


Если вам интересны новости медиа, игр, IT и Lifestyle так же сильно, как и нам, подписывайтесь на Telegram-каналVK или Дзен.