АТАПИ Софтвер - поставка и внедрение систем ввода данных, систем  документооборота, разработка OCR-приложений, приложений машинного зрения, оцифровка печатных материалов и архивных данных
Решения оптического распознавания и оптимизации документооборота

Скачать в PDF

FineClip 1.0: решение для оцифровки статей печатных изданий. Решение для пресс-клиппинга

FineClip - это программный продукт, позволяющий создавать цифровые копии статей газет и журналов в пригодном для поиска формате, сохраняя логическую структуру первоисточника.

Позволяет автоматизировать процесс поиска и оцифровки газетных и журнальных статей заданной тематики - пресс-клиппинг.

Разработан специально для медиа мониторинговых и информационных агентств, занимающихся пресс-клиппингом.

FineClip позволяет автоматически осуществлять:

  • разбивку страницы на блоки;
  • определение типов и распознавание блоков;
  • сегментацию страницы на статьи («склеивание» блоков в статьи).

FineClip автоматически распознает блоки 3-х типов: текст, таблица и рисунок.

Возможности FineClip по обработке статей

Каждая статья или блок могут быть в ручном режиме отредактированы оператором в процессе работы с FineClip.

Возможности редактирования: правка ошибок в распознанных блоках, изменение порядка блоков в статьях, перемещение блоков между статьями, создание новой статьи и блоков, добавление информации в блоки, изменение размеров блоков и пр.

После редактирования оператор добавляет к каждой статье метаданные (выходные данные, заголовок статьи и пр.).

Далее статья с метаданными может быть экспортирована в необходимый формат в зависимости от требований, предъявляемых к виду, структуре и полноте, представленной в нем информации.

Поиск и оцифровка статей по определенной оператором тематике

В случае необходимости оцифровки статей только определенной тематики, FineClip позволяет производить поиск статей, содержащих ключевые слова.

Для выполнения поиска оператор перед обработкой результата загружает текстовый файл, включающий в себя список ключевых слов. Затем результат автоматически анализируется и ключевые слова выделяются цветом. Далее оператор производит редактирование и экспорт статей, содержащих ключевые слова.

Дополнительно возможно создать хранилище статей, что позволит осуществлять:

  • полнотекстовый поиск по ключевому слову по всему хранилищу;
  • быстрый поиск статьи по заголовку/результату;
  • продвинутый семантический поиск (при помощи отдельно лицензируемой технологии ABBYY Compreno).

Наши основные проекты в этой области

Press Clipping Solution DALIAN 2.0 for PRNet (en)

Document Conversion Tool for Media Service Company (en)

A PDF Tools Suite for Media Monitoring Company (en)