АТАПИ Софтвер - поставка и внедрение систем ввода данных, систем  документооборота, разработка OCR-приложений, приложений машинного зрения, оцифровка печатных материалов и архивных данных
Решения оптического распознавания и оптимизации документооборота

Новые бухгалтерские практики: из сканера в облако

Компания АТАПИ разработала модуль ввода данных для бухгалтерского сервиса, работающего на основе SaaS-модели, с использованием технологий ABBYY

В 2012 году наша компания выполнила проект для российской компании*, которая предоставляет полный цикл услуг по сопровождению деловых операций: сюда входит регистрация фирм, юридические услуги, аудиторское и бухгалтерское обслуживание, постановка процессов учёта, сертификация процедур менеджмента в компаниях по стандартам ISO и многое другое. Все эти услуги компания оказывает с использованием современных высокотехнологичных средств и инструментов автоматизации. В частности, бухгалтерские услуги предоставляются клиентам на основе «облачной» модели или модели SaaS (Software as a Service). При такой модели обслуживания клиент освобождён от необходимости разворачивать технологическую платформу для обработки и хранения документов на своих серверах – вместо этого он приобретает подписку (хостинг) на серверах компании. В рамках такой подписки клиент получает возможности производить все необходимые операции в своём личном кабинете на веб-портале компании, работая с ним через браузер.

Процедура загрузки первичных бухгалтерских документов на портал до недавнего времени была довольно трудоёмкой – загружая отсканированный документ, пользователь должен был вручную ввести значения ключевых полей для каждого из них, таких как дата, номер документа, контрагент 1, контрагент 2, общая сумма, и др. Конечно, это был далеко не оптимальный процесс, и компании начала поиск решения, которое помогло бы автоматизировать этот этап работы для пользователей. Решение должно было отвечать следующим требованиям:

  • поддерживать загрузку изображений в основных общепринятых графических форматах: TIFF (включая многостраничный), JPG, BMP
  • уметь распознавать текст, автоматически извлекать ключевые данные из полей (для документов нескольких типов)
  • уметь автоматически классифицировать документы по типам
  • поддерживать сохранение извлечённых из документов ключевых данных и результатов полнотекстового распознавания в форматах XML и PDF/A, соответственно
  • обеспечивать высокую скорость обработки данных
  • функционировать на серверах, обслуживающих портал компании, как служба Windows

Для этой задачи не подходила ни одна из существующих на рынке готовых систем, так как требовалось решение, которое могло бы быть встроено в платформу компании как модуль. Это могло быть только заказное решение на базе инструментария разработчика, которое предоставляло бы все необходимые функциональные возможности.

Компания обратилась к московской компании ABBYY – одному из мировых лидеров в области систем оптического распознавания и ввода данных. Компания ABBYY поручила проект нашей компании – партнёру с более чем десятилетней экспертизой в области заказных разработок на базе OCR-инструментариев. В этом проекте потребовалось использовать сразу два таких инструментария: ABBYY FineReader Engine для распознавания документов и ABBYY FlexiCapture Engine для извлечения ключевых данных из полей.

Специалисты АТАПИ Софтвер реализовали решение, которое отвечает всем описанным требованиям. На первом этапе проекта был реализован серверный компонент (сервис), который осуществляет следующие операции:

1. В фоновом режиме мониторит «горячую» папку, куда попадают отсканированные изображения документов, загруженные пользователем через личный кабинет

2. Обнаружив новые документы, запускает процесс обработки, который состоит из следующих этапов:

  • распознавание документа
  • классификация документов (определение принадлежности к одному из заданных типов)
  • применение соответствующего гибкого описания и извлечение ключевых данных; в случае если документ не принадлежит ни к одному из заданных типов, он отправляется на ручную обработку
  • сохранение исходных графических изображений и результатов полнотекстового распознавания в формате PDF/A, сохранение извлечённых ключевых данных в формате XML

3. Закончив обработку, помещает результаты в специальный каталог на сервере, откуда другие компоненты портала маршрутизируют их в личные кабинеты пользователей.

При помощи инструментария ABBYY FlexiCapture Engine были разработаны гибкие описания для двух типов документов, которые чаще всего обрабатывают пользователи портала: накладных ТОРГ-12 и счётов-фактур. Во второй очереди проекта планируется добавить поддержку ещё двух типов документов: актов приёмки выполненных работ и товарно-транспортных накладных 1-Т.

Чтобы обеспечить высокую скорость обработки документов, специалисты АТАПИ реализовали для серверного компонента возможность параллельного распознавания в несколько потоков. Это оказалось возможно благодаря встроенной в инструментарии ABBYY поддержке многоядерных процессоров.

Ожидается, что новая возможность – автоматическое заполнение карточки документа при помощи современных технологий ввода данных - обеспечит компании мощное конкурентное преимущество. Кроме того, новая функциональность позволит компании существенно повысить эффективность собственных бизнес-процессов – в частности, предоставляемых услуг по обработке клиентских бухгалтерских документов.

Продукты ABBYY

  • ABBYY FlexiCapture Engine 10
  • ABBYY FineReader Engine 10

Технологии и языки программирования

  • Microsoft .NET Framework 4.0
  • Microsoft Visual Studio 2010 (C#)

Поддерживаемые платформы

  • Windows Server © 2008 R2 (64-битная версия)

*Название компании-заказчика не разглашается по условиям соглашения о конфиденциальности.