Исследователи из Школы компьютерных наук при Университете Восточной Англии представили технологию, которая на основании визуального анализа мимики определяет язык, на котором говорит человек, а затем расшифровывает его речь.
Программа может идентифицировать наиболее распространенные языки, включая диалекты, и без труда поймет английский, французский, испанский, арабский, итальянский, китайский, русский...
Технология, финансирование разработки которой в размере 500 тыс. фунтов стерлингов осуществлялось британским Исследовательским советом инженерных и физических наук, создавалась в течение двух лет. Авторы ПО говорят, что им потребовалось забить в компьютер более 500 вариантов артикуляции для каждой языковой группы. В результате компьютер будет готов распознать речь человека даже с особенностями произношения некоторых звуков.
Сканирование речи основывается не только на интерпретации движения губ, но и на анализе движений языка и челюсти, что позволяет системе уловить нюансы того или иного языка. Кстати, одновременное восприятие движений губ, языка и подбородка помогает уловить невербальные сигналы говорящего, расшифровать не только слова, но и определить тон и манеру говорящего. Конечно, компьютер и прежде использовался учеными для чтения речи по губам, однако британская программа - первая, самостоятельно идентифицирующая язык, на котором говорят.
«Новая система - это настоящий прорыв в классе компьютерных анализаторов человеческой речи по визуальным признакам, - отмечает один из авторов проекта профессор Стефан Кокс. - Технология важна не только в практическом плане, но и с точки зрения науки. Так, компьютер уже сделал выводы о мимических различиях в речи разных народов. Например, французы чаще остальных округляют губы, а арабы выделяются выраженными движениями языка».