Учебник Организация работы с документами - Шмелев А.Г.

Название: Организация работы с документами - Шмелев А.Г.

Жанр: Менеджмент

Рейтинг:

Просмотров: 802

Постоянное увеличение количества информации, необходимой для принятия правильного управленческого решения, приводит к тому, что традиционные методы работы с документами становятся неэффективными. Так, по сведениям компании Delphi, 15% бумажных документов безвозвратно теряются и для их поиска сотрудники тратят до 30% своего рабочего времени. При переходе к электронным документам и автоматизации документооборота рост производительности сотрудников увеличивается на 25—50%, сокращается время обработки одного документа более чем на 75%, на 80% уменьшаются расходы на оплату площади для хранения документов (оценка Nortan Nolan Institute).

Тенденцию перехода от традиционных технологий организации документооборота к компьютерным отражают следующие цифры: соотношение количества бумажных и электронных документов через пять лет составит 50 на 50%, через десять лет — 30 на 70%; количество электронных документов удваивается за год, а бумажных документов растет только на 7% (данные компании XPLOR).

В конце 80-х - начале 90-х гг. появились и начали интенсивно развиваться ряд новых технологий, успешно используемых в современных системах автоматизации документооборота:

технологии обработки изображений документов (Imaging

System);

системы оптического распознавания символов (Optical Character

Recognition System, OCR);

системыуправления документами, СУД ( Document Management

System, DMS);

полнотекстовые базы данных (Full-Text System);

системы автоматизации деловых процедур, АДП (Work-Flow

System);

программное обеспечение для рабочих групп (Groupware).

Системы обработки изображений документов предназначены для ввода, обработки, хранения и поиска графических образов бумажных документов. Подобные системы целесообразно применять в организациях с большим объемом документооборота. Техническое обеспечение систем включает высокоскоростные сканеры, документ-ные контроллеры (выполняют быструю и высокоэффективную компрессию/декомпрессию документов и обеспечивают скоростную работу со сканерами и принтерами), библиотеки-автоматы на базе оптических накопителей с автоматической подачей дисков. Компьютерные образы документов находятся на сервере изображений и просматриваются на рабочих станциях-клиентах.

Системы обработки изображений осуществляют сканирование документов для записи на сервер, их классификацию по различным критериям, передачу изображений на рабочую станцию для просмотра, модификацию или печать. Подобные системы предусматривают также определение маршрута передачи изображений по сети, их рассылку по факсу или электронной почте, поиск изображений по отдельным элементам.

Так как файлы изображений достигают больших размеров, существуют различные варианты организации их хранения. В целях экономии памяти на запоминающем устройстве большинство систем сжимают изображения и создают специальный индекс изображений, где содержатся соответствующие значения атрибутов документов, например наименование, автор, тема.

В высокопроизводительных системах реализованы технологии, позволяющие увеличить скорость работы. Например, предварительная выборка и перенос изображений с медленных оптических носителей на более быстрые магнитные; адаптируемое кэширование, позволяющее хранить часто используемые изображения в памяти сервера; вывод на лазерный диск; групповое сканирование, обеспечивающее считывание нескольких страниц за одну операцию.

Многие системы обработки изображений включают программное обеспечение оптического распознавания символов (OCR).

Применение OCR позволяет решить проблему перевода бумажных документов в электронную форму в виде текстового файла. Системы OCR позволяют получать электронную копию документа с печатного листа либо копию документа, пришедшего по факсу. Существуют экспериментальные системы, позволяющие подобным образом обрабатывать также и рукописные материалы (Intelligent Character Recognition).

Кратко, функционирование системы OCR можно представить следующим образом. С помощью сканирующего устройства считывается изображение документа. В результате распознавания текста изображение документа отображается в файл, отформатированный как текстовый. Таким образом, бумажный документ, минуя низкопроизводительный и трудоемкий ручной ввод, автоматически преобразуется в электронную форму.

Выделяют два класса систем OCR - обучаемые и интеллектуальные. Принцип действия систем первого класса основан на поточечном сравнении оцифрованного символа с образцом из справочника. При совпадении образца и символа последний считается распознанным и добавляется в результирующий файл. При таком способе распознавания размеры образца и шрифта документа должны совпадать, т.е. в системе необходимо иметь маски для каждого размера каждого типа шрифта, поэтому подобная система более эффективна в случае однотипного и качественного текста. Во втором случае «маска» символа заменяется на его «образ», который может быть использован для любых размеров шрифтов.

Для повышения точности распознавания интеллектуальные системы могут выполнять ряд проверок результирующего текста, например осуществлять частотный анализ текста и сравнивать частоту появления данного символа в тексте с его частотой в языке оригинала, или обнаруживать неправильное сочетание символов исходя из правил орфографии.

В реальных системах OCR сочетаются различные распознавательные механизмы, что дает возможность обрабатывать любые шрифты и любые тексты.

На сегодняшний день известно несколько достаточно качественных программных продуктов по распознаванию текста, в том числе — две системы отечественных фирм, ориентированных прежде всего на распознавание русскоязычных текстов (FineReader и CuneiForm). Средняя скорость работы системы OCR на оборудовании средней мощности составляет примерно одну машинописную страницу в минуту. Качество распознавания - в среднем одна - две ошибки на 1000 знаков в тексте среднего качества.

Можно рекомендовать следующие критерии выбора системы OCR:

совместимость с существующим или приобретаемым программным и аппаратным обеспечением;

скорость сканирования и распознавания преобладающего в данной организации типа текста, например: факс — русский язык, ксерокопия различного качества, машинопись различного качества и др.;

| Оглавление|

Лучшие книги

ВВЕДЕНИЕ В КУЛЬТУРОЛОГИЮ

Гражданский процесс: Вопросы и ответы

ЗАПАДНОЕВРОПЕЙСКОЕ ИСКУССТВО от ДЖОТТО до РЕМБРАНДТА

Коммерческое право России

Коммуникации стратегического маркетинга

Консультации по английской грамматике: В помощь учителю иностранного языка.

Международные экономические отношения

Налоги и налоговая система России

Основы права

Теория государства и права

Все материалы на сайте представлены исключительно для ознакомления. Все права на книги остаются за авторами. Если вы являетесь автором той или иной книги и не хотите видеть её на сайте, то напишите нам и мы в кротчайшие строки удалим её.

Содержание