АТАПИ Софтвер - поставка и внедрение систем ввода данных, систем  документооборота, разработка OCR-приложений, приложений машинного зрения, оцифровка печатных материалов и архивных данных
Решения оптического распознавания и оптимизации документооборота
Скачать в формате PDF

Оцифровка документов новосибирского городского архива

По заданию мэрии г. Новосибирска компания АТАПИ Софтвер поставила и настроила программный комплекс ABBYY FlexiCapture, рассчитанный на ввод 3 млн. страниц

Новосибирская мэрия известна своим высокотехнологичным подходом к решению самых разнообразных задач: от обеспечения собственных нужд муниципалитета до оказания услуг населению. На Всероссийском конкурсе «Электронный муниципалитет» высшими наградами были отмечены проекты мэрии «Система автоматизированного учета и безналичной оплаты проезда на общественном транспорте «Электронный проездной» («Транспортная карта») и «Система организации и автоматизации муниципального заказа».

Архивные данныеВ 2011 году Департамент связи и информатизации мэрии столкнулся с новой задачей: требовалось оцифровать документы, содержащиеся в новосибирском городском архиве (с 1920-х гг. до нашего времени) и относящихся к деятельности органов власти. На первом этапе проекта было решено обработать документы периода 2000-2010 гг., общий объем которых оценивался в 3 млн. страниц. В архиве документы хранятся подшитыми в так называемые архивные дела. Одно архивное дело — это около 250 страниц; в этом объёме умещается от 80 до 130 документов. Согласно распоряжению Росархива, каждый документ и его приложения требовалось сохранять в специализированной отраслевой системе «Архивный Фонд». Для этого по каждому документу нужно было заполнить информационную «карточку»: вручную ввести все данные документа в соответствующие поля карточки, включая название, которое иногда представляло собой несколько предложений, дату, номер документа и т.д., — затем сформировать PDF-версию отсканированного документа, содержащую все его страницы и страницы его приложений, и прикрепить этот файл к карточке. Процесс был очень медленным, трудоёмким, и не предоставлял никаких дополнительных средств проверки, что неизбежно должно было привести к большому числу ошибок.

ABBYY FCОценив объём и сложность задачи, мэрия сделала ставку на техническую модернизацию архива. Был приобретен мощный современный сканер, позволяющий сканировать сброшюрованные архивные документы. Но в процессе оставалось узкое место - ручной ввод данных. Cпециалисты Департамента связи и информатизации обратились в компанию АТАПИ Софтвер, которая в свое время помогла обеспечить ввод большого числа анкет в проекте «Транспортная карта». Инженеры АТАПИ обсудили поставленную задачу со специалистами компании ABBYY, одного из ведущих мировых поставщиков систем автоматизации бумажного документооборота. АТАПИ Софтвер имеет статус ABBYY Certified Reseller и связана с ABBYY многолетними партнерскими отношениями. Специалисты ABBYY и АТАПИ предложили мэрии автоматизировать процесс на базе специализированной системы ввода данных ABBYY Flexi Capture 10. Данная система широко распространена в России и за рубежом благодаря своей эффективности, гибкости и настраиваемости под любой клиентский бизнес-процесс и тип документов.

Пример документаПо итогам проведенного тендера, компания АТАПИ поставила мэрии систему ABBYY FlexiCapture в комплектации, рассчитанной на ввод 3 млн. страниц. Специалисты АТАПИ осуществили настройку комплекса: реализовали гибкие описания для обоих типов документов, встречающихся на первом этапе - постановлений и распоряжений. При помощи гибких описаний на изображении страницы по ряду внешних признаков ищутся заданные поля («Номер документа», «Дата», «Название» и другие), информация из которых должна быть распознана и автоматически занесена в карточку системы «Архивный Фонд». Затем специалисты АТАПИ настроили в системе ABBYY FlexiCapture профили обработки, при помощи которых был автоматизирован полный цикл прохождения документа.

Профили обработки в ABBYY FlexiCapture обеспечивают:

  • мониторинг «горячей папки», автоматическое поступление в обработку новых изображений
  • автоматическое разделение потока отсканированных страниц на документы и приложения к ним, идентификацию типа документа, нумерацию документов
  • применение соответствующего типу гибкого описания к нужной странице документа, распознавание и извлечение текста из значимых полей в соответствующие поля карточки «Архивного Фонда»
  • сохранение отсканированного документа и его приложений, а также результатов их полнотекстового распознавания в формате PDF с текстовым слоем, прикрепление этого файла к карточке документа
  • проверку полей документа на соответствие заданным правилам, форматирование даты и номера документа, подсветку неуверенно распознанных символов для проверки оператором Возврат документа оператору на проверку, экспорт документа в систему «Архивный Фонд» (после подтверждения)

Архивные данные

Теперь оператор только сканирует дело, проверяет карточки документов, автоматически заполненные системой (в ABBYY FlexiCapture реализован удобный интерфейс верификации), при необходимости исправляет ошибки и подтверждает экспорт документа в «Архивный Фонд». Автоматическая проверка формата данных позволяет свести к минимуму число ошибок ввода.

Благодаря возможности распределенной установки ABBYY FlexiCapture удалось оптимально решить вопросы безопасности и администрирования комплекса: сервера обработки и хранения данных развернуты на территории мэрии, в то время как сотрудники архива работают в системе удаленно со своих рабочих мест при помощи клиентских станций сканирования и верификации.

Отзыв заказчика:

Архивные данные'До внедрения ABBYY FlexiCapture обработка одного архивного дела занимала у нас не менее 8 часов, иногда несколько рабочих дней. После внедрения системы работа с аналогичным делом занимает от 1,5 до 3 часов, в зависимости от особенностей документов и сложности их структуры. То есть можно говорить об ускорении обработки минимум в 6 раз. Мы предполагаем, что с отладкой некоторых функций скорость обработки еще увеличится.'

Юрий Александрович Стрелков
Заместитель председателя комитета экспертизы,
контроля и архивной службы мэрии г. Новосибирска

Наши основные проекты в этой области

Ввод анкет заявителей для проекта "Транспортная карта" в г. Новосибирске

Оцифровка литературного канона для датской королевской библиотеки

Оцифровка двуязычных словарей для продукта ABBYY Lingvo