Ученые поняли, как расшифровывать абракадабру

Программа ввода документов способна работать с тысячами электронных бумаг сразу

10 ноября 2013 в 21:18, просмотров: 3829

Облегчить способ компьютерной обработки документов, не имеющих единого образца заполнения, решили столичные программисты, специализирующиеся на разработке когнитивных технологий. Это первая в России программа, способная интеллектуально распознать и внести в базу данных информацию со сканируемых счетов-фактур, накладных и других отчетных документов.

Ученые поняли, как расшифровывать абракадабру
фото: PhotoXPress

Как сообщили «МК» в пресс-службе компании, обычно компьютер «не понимает», что написано на отсканированном документе, — машина принимала все изложенное за набор белых и черных точек. Новая же программа «осмысливает» полученную «бессмысленную» картинку. Она уверенно и с большой скоростью способна вычленять в документе, к примеру, название фирмы-поставщика, вида товара или его стоимость. Причем качество распознавания документа не зависит от того, каким образом тот был напечатан, в каком месте указана стоимость товара или поставлена подпись руководителя. Искусственный интеллект, созданный российскими разработчиками, действует по принципу человеческого. К примеру, он может даже выявлять разные варианты написания каждого из наименований. Например, «Батон нарез. упак.» может быть «Н. у. батон завод №2» или «Хлеб нар. уп.» и т.д. Таким образом, у одной и той же товарной позиции может быть такое количество вариантов написания, которое, по сути, способен выдумать человек, и все их расшифрует программа.

Необходимость ее создания возникла из-за большого количества документов, которые не приведены в России к единому образцу, как, например, это сделано с налоговыми декларациями. Поэтому их электронный ввод, систематизация и дальнейшая работа вызывают большие проблемы. Программа ввода документов способна работать с тысячами электронных бумаг сразу. В случае обнаружения особо сложных мест в деловой переписке (совершенно нелогичных ошибок) программа может сама пересылать их оператору для правки вручную, но при этом основная работа останавливаться не будет.



Партнеры