АТАПИ Софтвер - поставка и внедрение систем ввода данных, систем  документооборота, разработка OCR-приложений, приложений машинного зрения, оцифровка печатных материалов и архивных данных
Решения оптического распознавания и оптимизации документооборота

Оцифровка документов с применением труда операторов

Часто бывает так, что внедрять у себя систему распознавания документов не является эффективным решением. Например, представим себе, что вам необходимо перевести в цифровой формат несколько тысяч или десятков тысяч архивных документов, существующих только в бумажном виде – причём, эта работа носит разовый характер. Если вы хотите закончить этот проект в обозримые сроки, вам потребуется установить мощный сканер, а также приобрести и настроить соответствующим образом программный продукт, который обеспечит автоматизированную обработку вашего бумажного материала. Поставку и внедрение такой системы вы можете заказать у нас. Но, кроме этого, для работы комплекса потребуются дополнительные аппаратные возможности (сервер распознавания); а ещё вам будет необходимо нанять и обучить штат операторов ввода, взять на себя решение организационных вопросов, таких как настройка соответствующей инфраструктуры, организация процессов сканирования и верификации документов, контроля качества ввода и т.д. Всё это вместе потребует от организации определённого бюджета, который в масштабе разового проекта может просто не оправдать себя.

Не проще ли в этом случае поручить обработку ваших документов специализированному центру ввода данных?

Центр ввода данных АТАПИ: услуги, возможности и техническое оснащение

Наш центр предоставляет полный комплекс услуг по переводу бумажных документов в электронный вид: от сканирования до конвертации результатов в тот формат, которого требует ваша информационная или архивная система.

Наш офис оснащён современными сканерами, в том числе предназначенными для широкоформатных документов формата A3. У нас работают квалифицированные операторы оцифровки данных, которые зарекомендовали себя в проектах для целого ряда организаций, таких как научное издательство Шпрингер, Датская и Шведская Королевские библиотеки, Британская библиотека, университеты г. Орхуса (Дания), Иннсбрука (Австрия), государственный университет Аризоны (США) и в ряде крупных международных проектов по оцифровке исторических фондов, спонсированных Евросоюзом (IMPACT, METAe и др.). В Новосибирске мы приняли участие в проекте «Транспортная карта», в рамках которого наши операторы обработали за два месяца около 80 000 анкет; вся эта огромная работа была проделана силами всего двух человек.

У нас установлены последние версии программных продуктов ABBYY, которые позволяют распознавать все типы материалов – любые текстовые документы, книги, в том числе старинные, анкеты, заполненные бланки заявлений, тестов и опросов и многое другое. Мы знаем, как правильно настраивать эти продукты, чтобы свести к минимуму процент ручного труда - а, следовательно, и стоимость работ. Мы разработали и применяем большое количество шаблонов*, позволяющих распознавать в одном потоке различные типы стандартизованных документов: от приказов и постановлений до сложных отчётов. Если шаблон для какого-то типа документов отсутствует, мы можем в кратчайшие сроки разработать его силами наших программистов.

Когда шаблоны и стандартные решения не помогают

За годы работы мы приобрели опыт оцифровки самых разнообразных материалов, в том числе таких, которые считаются сложными для современных систем распознавания:

  • исторических документов, отпечатанных нестандартными шрифтами, в том числе, так называемой «готикой»
  • широкоформатных печатных материалов, в том числе периодики (включая историческую), технической документации, чертежей и т.д.
  • научных материалов с использованием формул, графиков, сложных таблиц, нестандартным форматированием и т.д.

Если требуется обработать не очень хорошо сохранившиеся материалы – например, выцветшие бумажные копии или «зашумлённые» (с большим количеством пиксельного «мусора») отсканированные изображения – наш отдел разработки может помочь программным способом улучшить качество таких изображений, применив к ним соответствующие фильтры и процедуры предварительной обработки. Такой подход позволяет улучшить качество автоматического распознавания и существенно снизить стоимость этапа ручной коррекции ввода операторами.

Если требуется только проиндексировать архивные документы по заголовкам и ключевым полям, такая задача тоже решаема на базе того технического инструментария, которым мы располагаем – и может быть решена в рамках гораздо более скромного бюджета, нежели оцифровка 100% текста. При этом результаты полнотекстового распознавания (без коррекции) всё равно будут доступны, обеспечивая возможность поиска по тексту документа.

Мы можем предоставить оцифрованные данные в любом из общепринятых форматов по удобному вам каналу связи или на выбранном вами носителе. Но можем выполнить и более специфические требования – например, разметить ваши данные XML-разметкой для последующей их публикации на онлайн-ресурсах.

Что мы предлагаем

Сотрудничество с центром ввода данных АТАПИ – это возможность для компаний поручить всю работу по оцифровке своих ценных данных: создание электронных (текстовых) версий архивов и печатных изданий, индексацию фондов хранилищ и т.д. – надёжному поставщику с более чем 10-летним опытом работы такого рода. Мы находимся в России и знаем специфику российского документооборота, но при этом имеем опыт работы для ведущих европейских библиотек и консорциумов.

При этом вам не потребуется приобретать программный продукт и внедрять его на вашей территории, не придётся нанимать и обучать операторов и организовывать их работу. Оцифровка ваших данных будет выполнена с максимальной возможной для вашего материала степенью автоматизации; в масштабе крупного проекта это может привести к значительному удешевлению работы.

При этом у вас появится возможность сократить время обработки запросов в архив, оптимизировать загрузку ваших кадровых ресурсов, и – кто знает – может быть, предоставить услугу онлайн-доступа к особым фондам по платной подписке. Мы выполним «сервисную» часть и дадим вам возможность сконцентрироваться на вашей основной деятельности.

*Под шаблонами документов понимаются их программные «описания», при помощи которых продукты ABBYY находят и извлекают ключевые данные.

Наши основные проекты в этой области

Оцифровка новосибирского городского архива

Оцифровка литературного канона для датской королевской библиотеки

Оцифровка двуязычных словарей для продукта ABBYY Lingvo

Ввод анкет заявителей для проекта "Транспортная карта" в г. Новосибирске