«Читай по губам» или новый алгоритм LipNe

deaf persons hand demonstrating over a white background

Несмотря на то, что в наше время компьютерных технологий создано не мало программ, позволяющих распознавать сказанное по одним лишь движениям губ, точность такой «расшифровки» не превышает 52%. Хотя так же стоит сказать, что даже у профессионального сурдопедагога точность распознавания тоже находится где-то в рамкам от 50 до 60%. То есть и человеческие возможности, и приспособления машины давали относительно не лучшие результаты. До не давнего времени.

Алгоритм, позволяющий «читать по губам» с точностью 93,4%

eileen-schubert116

Этой осенью настоящий прорыв в этой области совершили ученые Оксфордского университета, которые разработали новейший алгоритм распознавания речи – LipNe. Результат в 93,4% на сегодняшний день – не превзойден ни одной другой технологией. В чем же секрет столь большой эффективности LipNe?

Ученые, занимающиеся разработкой проекта, обратили внимание на то, что при восприятии фраз целиком, программе гораздо проще анализировать и распознавать речь, нежели в случаи анализа и расшифровки отдельно каждого слова в предложении. Как оказалось, и вероятность ошибки в этом случаи гораздо ниже. Поэтому заложив в алгоритм LipNe анализа целиком предложения ученые и смогли добиться столь высокой точности распознавания.

Как утверждают в Университете, подобный прорыв в данной области, позволит разработать наиболее совершенные приборы для людей с ослабленным слухом, которые помогут более свободно общаться с другими людьми.

На данный момент разработанный алгоритм LipNe работает только с английским языком, но в дальнейшем планируется проработка программы и дополненные ее другими языками.