Англичане создали программу, читающую по губам на 23 языках

Исследователи из Школы компьютерных наук при Университете Восточной Англии представили технологию, которая на основании визуального анализа мимики определяет язык, на котором говорит человек, а затем расшифровывает его речь.

Программа может идентифицировать наиболее распространенные языки, включая диалекты, и без труда поймет английский, французский, испанский, арабский, итальянский, китайский, русский...

Технология, финансирование разработки которой в размере 500 тыс. фунтов стерлингов осуществлялось британским Исследовательским советом инженерных и физических наук, создавалась в течение двух лет. Авторы ПО говорят, что им потребовалось забить в компьютер более 500 вариантов артикуляции для каждой языковой группы. В результате компьютер будет готов распознать речь человека даже с особенностями произношения некоторых звуков.

Сканирование речи основывается не только на интерпретации движения губ, но и на анализе движений языка и челюсти, что позволяет системе уловить нюансы того или иного языка. Кстати, одновременное восприятие движений губ, языка и подбородка помогает уловить невербальные сигналы говорящего, расшифровать не только слова, но и определить тон и манеру говорящего. Конечно, компьютер и прежде использовался учеными для чтения речи по губам, однако британская программа - первая, самостоятельно идентифицирующая язык, на котором говорят.

«Новая система - это настоящий прорыв в классе компьютерных анализаторов человеческой речи по визуальным признакам, - отмечает один из авторов проекта профессор Стефан Кокс. - Технология важна не только в практическом плане, но и с точки зрения науки. Так, компьютер уже сделал выводы о мимических различиях в речи разных народов. Например, французы чаще остальных округляют губы, а арабы выделяются выраженными движениями языка».

Источник: РосБизнесКонсалтинг