Школа ИТ
 

Обзор подготовлен при поддержке Rover Computers

ABBYY

Пример современного решения: ABBYY FORM READER

Содержание:

  • Что дает использование ABBYY FormReader?
  • Примеры использования ABBYY FormReader
  • ABBYY FormReader — система ввода в компьютер данных из больших объемов форм, заполненных от руки с применением ICR (Intelligent Character Recognition).

    В самых разных областях бизнеса и государственного управления всё активнее применяются формы — документы, имеющие строго определенную структуру и используемые для массового сбора информации. Это и всевозможные опросы, и прием заявлений от клиентов, и проведение исследований, и многое другое. Организация работы с массовым потоком клиентов, так или иначе, чаще всего подразумевает применение форм — анкет, бланков, заявок, опросных листов и т.п. Формы печатаются, распространяются, заполняются, после чего возникает необходимость ввода данных из них в информационные компьютерные системы. Традиционный, всем известный способ их обработки — ручной. Он не слишком эффективен и предполагает большие затраты — на персонал, на оборудование рабочих мест и т.д. К тому же и его надежность тоже далеко не всегда на высоте — даже самые аккуратные люди могут ошибаться. Решение задачи обработки форм значительно упрощает применение автоматизированных систем.

    ABBYY FormReader предназначен для автоматического ввода информации в компьютер из форм. ABBYY FormReader может обрабатывать различные типы форм, и даже те, которые изначально не были предназначены для машинной обработки.

    Ввод данных с бумажных форм состоит из нескольких этапов:

    • пачка форм сканируется при помощи скоростного сканера (обычно с производительностью от 10 страниц в минуту),
    • подавляющее большинство символов автоматически распознается,
    • символы, относительно которых у системы распознавания сложилось несколько гипотез подаются на ручную проверку,
    • окончательно подтвержденные данные экспортируются в файл или базу данных.

    ABBYY FormReader распознает формы, заполненные от руки, на печатной машинке или принтере, а также пункты самых разных видов (квадраты, овалы, подчеркнутые или обведенные в круг и т.д.), и различные типы штрих-кодов. После распознавания ABBYY FormReader выделяет цветом все неуверенно распознанные символы и подает их на верификацию. Оператор тратит лишь секунды, проверяя отдельные символы, вместо того, чтобы тратить минуты на полный ввод всей формы. Кроме того, ABBYY FormReader автоматически проверяет корректность результатов распознавания по базам данных, словарям, с помощью перекрестных проверок полей, проверок сумм, форматов дат, и т.д.

    В комплект поставки входит Руководство по созданию машиночитаемых форм, которое призвано оказать существенную помощь всем тем, кому необходимо создавать формы. В Руководстве приводится подробная информация о том, каким требованиям должна соответствовать форма, чтобы её автоматизированная обработка стала возможной. Приводится описание различных видов форм, а также приводятся даются инструкции по созданию макета формы в MS Visio и MS Word.

    Благодаря различным методам удаления изображения самой формы ABBYY FormReader обрабатывает любые типы форм. Помимо традиционных цветных и растровых форм ABBYY FormReader может распознавать информацию и с черно-белых форм, с различными типами разметки полей: рамочки, гребенки и т.д.

    Использование системы ABBYY FormReader позволяет легко управлять процессом ввода, а также контролировать качество вводимых данных. При этом затраты на оборудование рабочего места оператора ввода носят разовый характер.

    Что дает использование ABBYY FormReader?

    Безошибочность вводимых данных

    ABBYY FormReader распознает печатные символы, метки (пункты) и штрих-коды практически безупречно. Уровень корректного распознавания рукописных символов, достигает по ряду проектов 98 % в зависимости от формы и качества заполнения.

    Автоматический контроль результатов распознавания с помощью перекрестных проверок, правил контроля сумм, сверок по словарям и базам данных обеспечивает полную достоверность и корректность информации, её соответствие заданному формату.

    Полностью исключаются «позиционные» ошибки, когда при ручном вводе оператор заносит например имя в поле «отчество».

    Универсальность

    Система позволяет легко настраиваться на новые формы. Шаблон (в соответствии с которым будет обрабатываться форма) для новой формы создается в редакторе шаблонов, изучение которого занимает несколько часов и не требует специальных навыков программирования. Используя ABBYY FormReader API можно расширить функциональность программы за счет подключения пользовательских правил проверки.

    Прогнозируемость производительности

    Использование ABBYY FormReader, установленного на один компьютер, позволяет вводить ежедневно от 500 до 1000 страниц в зависимости от сложности формы и аппаратной конфигурации. При росте объемов ввода на 1000 страниц в день достаточно лишь оборудовать одно дополнительное рабочее место продуктом ABBYY FormReader, что займет несоизмеримо меньше времени, чем прием на работу нескольких новых сотрудников.

    Масштабируемость

    Масштабируемость системы делает её пригодной для ввода любых объемов информации. Начиная от настольной системы для ввода сотен документов в день при помощи одного сканера и компьютера и заканчивая комплексами из десятков компьютеров для ввода сотен тысяч документов ежедневно.

    Эффективность

    Сложив высокую скорость работы системы ABBYY FormReader, отличное качество распознавания, автоматический контроль результатов, Вы получите по- настоящему эффективную систему автоматического ввода данных. Вне зависимости от объема данных система окупает себя достаточно быстро. Ведь Вам не придется нести расходы на организацию рабочих мест для штата, занятого ручным вводом: на зарплату операторов, на покупку компьютеров, мебели, на офисные помещения, на обучение персонала. ABBYY FormReader обеспечит Вашей компании быстрый возврат затрат на покупку и внедрение продукта

    Примеры использования ABBYY FormReader

    Госналогслужба

    «Боевое крещение» первая версия продукта по вводу форм прошла в проекте по вводу налоговых деклараций.

    Весной 1998 года перед Налоговой службой России остро встал вопрос эффективного ввода данных: в тот год было собрано 4 000 000 налоговых деклараций. Это 28 000 000 листов бумаги. Или 30 доверху загруженных пятитонных грузовиков. Как ввести такое количество документов в компьютер?

    До сих пор сотни инспекторов многие месяцы кропотливо выполняли черновую работу по перепечатке деклараций. Госналогслужба выбрала иной путь: менее дорогостоящий и во много раз более производительный. Осенью 1997 года была утверждена машиночитаемая форма налоговой декларации. Эксперты ABBYY принимали самое непосредственное участие в ее разработке. Летом 1998 года был сдан в эксплуатацию комплекс по вводу налоговых деклараций с производительностью до 100 000 листов в сутки.

    Именно применение технологий ABBYY позволило Госналогслужбе России стать одной из первых налоговых служб мира, приступивших к автоматизированному вводу рукописных налоговых деклараций.

    В настоящий момент ABBYY FormReader находит своё применение в самых разных областях государственного управления и бизнеса, являясь эффективной альтернативой утомительному и несовершенному ручному вводу данных. Вот только несколько примеров использования ABBYY FormReader для решения самых различных задач, как в государственных структурах, так и в частном бизнесе.


    ING БАНК (Евразия) Использует ABBYY FORM READER

    ING Банк (Евразия) уже давно использует для ввода платежных поручений и платежных требований программное обеспечение ABBYY FineReader Банк, разработанное компанией ABBYY Software House. Когда в банке начали внедрять систему эмиссии и обслуживания пластиковых карт, специалисты банка столкнулись с задачей ввода большого объема анкетных данных. Зная о возможности обработки форм с помощью технологий ABBYY, они приняли решение об использовании системы ABBYY FormReader при вводе анкет. Пользуясь рекомендациями ABBYY, специалисты IT департамента ING Банка самостоятельно разработали машиночитаемые формы заполняемых клиентами документов и настроили экспорт данных непосредственно в информационную систему. Благодаря высокой точности и скорости работы системы ABBYY FormReader, у банка появилась возможность сделать ввод данных быстрой и удобной процедурой.

    Реализация системы ввода позволила в короткий срок ввести несколько тысяч наборов анкет клиентов. Использование ABBYY FormReader предоставило возможность клиентам банка быстро получить необходимый им сервис, а самому ING Банку значительно снизить расходы, связанные с эмиссией карт, ведь для ввода данных были задействованы лишь сканер и пара сотрудников банка.

    В настоящее время специалисты ING Банка планируют использовать FormReader для автоматизации еще нескольких операционных процессов банка, связанных с обработкой форм.

    «ABBYY FormReader помогает нам не просто сэкономить время на обработку поступивших документов, но, что очень важно, благодаря FormReader мы смогли значительно оптимизировать процесс обслуживания клиентов, не привлекая для этого дополнительные ресурсы».

    Илья Мельников
    Начальник отдела Информационных Технологий ING Банка


    Компания ADIDAS использует ABBYY FORM READER в работе с дилерами

    «Adidas-Salomon», один из крупнейших мировых производителей спортивной одежды, обуви и различной экипировки, давно и прочно обосновался в России. Разветвленная торговая сеть компании включает множество партнеров по всей стране. Схема работы ООО «АДИДАС» с дилерами основывается на регулярных партнерских семинарах. Во время этих семинаров дилеры могут сделать заказ на продукцию компании, которая будет предлагаться через определенное время. Всем партнерам выдается многостраничный ассортиментный каталог, в котором необходимо отметить, что именно и в каком количестве они хотят заказать. Затем эта информация вносится в базу данных для дальнейшего планирования. Такая система работы с дилерами вызвана достаточно сложной схемой заказа товара у производителей, когда размещение товаров на фабриках для производства происходит почти за год.

    Пока количество дилеров «АДИДАС», желающих принять участие в семинаре, не превышало нескольких десятков, схема работала отлично. Но затем возникли проблемы. На обработку заказа одного дилера уходило до нескольких часов, а обработать заказы всех дилеров необходимо было в течение одного дня. Поэтому компании «АДИДАС» с увеличением количества дилеров либо пришлось бы привлекать дополнительный персонал для обработки заказов, либо менять в корне всю схему работы с партнерами. Оба варианта были крайне нежелательны.

    Выход из сложившейся ситуации был найден благодаря автоматизации обработки заказов дилеров с помощью системы распознавания форм ABBYY FormReader. Эта система предназначена для массового ввода форм, заполненных от руки. Сотрудники IT-отдела фирмы «АДИДАС», пользуясь прилагаемыми руководствами пользователя, практически самостоятельно настроили FormReader на специфику заполняемых форм. С использованием ABBYY FormReader обработка одного дилерского заказа стала занимать 7 — 10 минут, вместо 1,5 часов, то есть требуется почти в десять раз меньше времени! В результате, компания «АДИДАС» смогла избежать болезненных изменений в схеме работы с дилерами и сократить количество оборудования и людских ресурсов, привлекаемых для обеспечения партнерских семинаров.

    «ABBYY FormReader помог нам рационально организовать работу с партнерами. Благодаря этой системе мы не просто экономим время и ресурсы, но и, в первую очередь, можем грамотно построить наши отношения с дилерами, сделать их удобными как для нас, так и для наших партнеров.»

    Игорь Василенко, старший IT-менеджер, Adidas-Москва


    Центр тестирования Министерства Образования Российской Федерации использует ABBYY FORM READER при проведении централизованного тестирования выпускников средних школ

    Централизованное тестирование, проводимое Центром Тестирования, — ежегодная крупнейшая акция в Российском образовании. Результаты централизованного тестирования, указанные в сертификатах Центра, согласно приказу Министра общего и профессионального образования РФ, могут засчитываться в общеобразовательных учреждениях (школах, гимназиях, лицеях) как итоги выпускных экзаменов и в ВУЗах в качестве оценок вступительных испытаний. Участие школьников и вузов в указанной акции добровольное. Сертификат, выданный Центром тестирования, действует на всей территории России. Выпускник из любого региона страны может представить его в ВУЗ для участия в конкурсе. В 2001 году 371 ВУЗ России (из них 34 московских) засчитывал результаты централизованного тестирования в качестве оценок вступительных испытаний.

    Впервые централизованное тестирование было проведено в 1989 году. В нем приняло участие около 18 000 человек. В 2001 году в централизованном тестировании участвовали выпускники уже из 85 субъектов Федерации. Центром тестирования было обработано более 1 000 000 тестов в более чем 40 региональных представительствах Центра Тестирования.

    Долгое время результаты централизованного тестирования обрабатывались вручную. Но когда в 1997 году количество тестов перевалило за 100 тысяч, стало понятно, что процесс требует автоматизации. Тогда специалисты Центра Тестирования обратились в компанию ABBYY. Для обработки результатов была использована система автоматизированного ввода заполненных от руки форм ABBYY FormReader. Также компания ABBYY разработала новый машиночитаемый бланк ответов и провела консультирование по организации самого процесса тестирования.

    В 2001 году при обработке результатов тестирования использовалась уже обновленная версия системы ABBYY FormReader. Несмотря на увеличение год от года количества выпускников, желающих пройти тестирование, сотрудники Центра тестирования легко справляются с быстро растущим объемом работы благодаря системе компании ABBYY, которая позволяет своевременно и точно обрабатывать результаты.

    «Использование системы ABBYY FormReader позволило значительно сократить время на обработку результатов централизованного тестирования. Так, в 2001 году на автоматизированный ввод более чем миллиона бланков с ответами ушло 20 дней. На обработку этих же бланков вручную при том же штате людей нам потребовалось бы 13 с половиной месяцев. Благодаря системе ABBYY FormReader мы успеваем обработать результаты тестов огромного числа выпускников до начала вступительных экзаменов в ВУЗах. В противном случае наше тестирование вообще потеряло бы смысл» .

    В.А. Хлебников,
    директор Центра тестирования


    Федеральная служба Налоговой Полиции России использует ABBYY FORM READER для ввода финансово-хозяйственных документов

    Работа ФСНП России по поиску и выявлению правонарушений объективно требует ввода в базы данных большого объема документов финансово−хозяйственной отчетности.До последнего времени эта работа осуществлялась вручную и требовала вынужденного отвлечения квалифицированных специалистов на выполнение рутинных операций.

    В настоящее время после проведения опытно−конструкторской работы по созданию специализированного программно−технического комплекса автоматизированного (бесклавиатурного)ввода документов сложной структуры появились реальные возможности по существенному снижению остроты проблемы ввода и обработки больших объемов данных.

    Разработанный на основе технологии ABBYY FormReader программно−технический комплекс открывает принципиально новые возможности для федеральных органов налоговой полиции по вводу и обработке больших объемов документов, в том числе в ходе проведения документально−проверочных мероприятий

    В комплексе реализованы следующие основные функции:

    • Формирование архивов электронных образов документов с возможностью их последующей коллективной обработки.
    • Автоматическая сортировка входного пакета документов.
    • Настройка на 9 типов так называемых «гибких»форм,расположение полей на которых может меняться, в том числе следующих документов:приходно−кассовый ордер,платежное поручение,платежное требование,накладная,счет−фактура,грузовая таможенная декларация и т.д .
    • Настройка комплекса на новые шаблоны документов.
    • Произвольное задание состава полей («маски»)формализованных документов для наполнения баз данных.
    • Автоматический экспорт в различные базы данных вводимых документов.
    • Встроенные проверки вводимой информации по словарям и базам данных.
    • Масштабируемость комплекса с возможностью потокового ввода свыше 1000 документов ежедневно в зависимости от количества и характеристик сканеров и средств вычислительной техники.
    • Возможность сканирования и обработки документов по месту проведения документальной проверки с использованием ручного сканера и переносного компьютера.

    «Одной из актуальных проблем информационно-технологического обеспечения оперативно-служебной деятельности федеральных органов налоговой полиции является автоматизация ввода в электронные базы данных различных видов формализованных и неформализованных видов документов, в том числе первичных документов финансово -хозяйственной отчетности. По нашему мнению, разработанная компанией „Аби Софтвер Хаус“ технология ABBYY FormReader является эффективным ключом для решения этой сложной научно-технической проблемы».

    Треско Игорь Анатольевич,
    Заместитель начальника управления
    Главного информационно-технологического управления
    Федеральной службы налоговой полиции Российской Федерации,
    доктор технических наук, старший научный сотрудник

    Вернуться на главную страницу обзора

    Версия для печати

    Опубликовано в 2002 г.

    Toolbar | КПК-версия | Подписка на новости  | RSS