Опція «потокове сканування» для перекладу паперових документів в електронний вигляд

Попередня ◈ Наступна

Опція "Потокове сканування" компанії «Електронні Офісні Системи» допомагає легко і швидко перевести в електронний вигляд великий обсяг паперових документів. Ефективна організація потокового сканування дозволяє значно скоротити час масового переведення документів в електронний вигляд. Висока швидкість досягається завдяки автоматизації процесу сканування і застосування технології паралельних обчислень при розпізнаванні тексту. Опція "Потокове сканування" - це коробкове рішення. Продукт можна використовувати спільно з будь-якою системою електронного документообігу.

Документи завантажуються в сканер однієї пачкою. У процесі сканування кожен документ з неї автоматично ідентифікується по штрих-коду. Таким чином, всі операції, починаючи з завантаження документів в сканер, виконуються автоматично, без участі оператора. Штрих-код для документа може бути згенерований системою і роздрукований на документі або на окремому аркуші паперу. Якщо на сторінки документів вже нанесені штрих-коди стандартного формату, то вони також можуть бути використані для ідентифікації.

Розпізнавання тексту (OCR)

Розпізнавання відсканованого документа і його збереження в текстовому вигляді суттєво розширює можливості по його подальше обробці. Наприклад, стає доступним швидкий пошук за змістом документів. Механізм розпізнавання тексту в опції "Потокове сканування" базується на можливостях продукту ABBYY FineReader Engine, по праву вважається кращим рішенням для розпізнавання.

Сканування однією кнопкою

Система підтримує роботу з мережевим сканером - досить завантажити в нього документи і натиснути кнопку сканування на самому пристрої. Отримані результати будуть автоматично зберігатися і відправлятися на подальшу обробку. Таким чином, управління скануванням зводитися до натискання однієї кнопки. А значить, не потрібно ні спеціальних програм для управління сканером, ні окремого робочого місця для управління скануванням, завдяки чому досягається істотна економія часу.

Висока швидкість

При традиційному підході обробка тексту при розпізнаванні може займати досить багато часу. В опції «Потокове сканування» передбачена можливість паралельної обробки тексту на декількох серверах одночасно, що дозволяє отримати необхідну швидкість обробки.

Інтеграція з будь-якими системами

Процедура реєстрації сканованих документів практично не відрізняється від стандартної. Опція "Потокове сканування" запускається безпосередньо з використовуваної системи документообігу.

Проста система ліцензування

При покупці системи ліцензується тільки параметр «кількість оброблюваних сторінок в місяць». А додатково, для виконання завдань OCR-розпізнавання тексту, в комплект можуть бути включені ліцензії на використання одного або декількох екземплярів продукту ABBYY FineReader Engine.

Можливість ручного контролю

На етапі запуску системи в експлуатацію передбачена можливість вручну управляти роботою системи. Це дозволяє встановити найбільш підходящі параметри налаштувань і підібрати оптимальну якість сканованих документів.

Технічні вимоги і завантаження дистрибутива

Вимоги до потоковим сканерів:

Обов'язково - підтримка TWAIN-інтерфейсу;
Рекомендується - відсутність предзахвата другої сторінки.

Опція «потокове сканування» для перекладу паперових документів в електронний вигляд

Меню налаштувань опції "Потокове сканування". Передбачено створення декількох профілів для різних розмірів і розташування штрих-коду на документі. Збереження відсканованого образу можливо в будь-якому з поширених текстових або графічних форматів.

Опис технологічного процесу обробки документів

Принцип потокового сканування заснований на тому, що на документ при реєстрації наноситься штрих-код. Потім помічені штрих-кодом документи скануються і автоматично (по штрих-коду) зв'язуються з реєстраційною карткою відповідного документа. Якщо на скановані документи вже завдано штрих-код стандартного формату, то він також може бути використаний для ідентифікації. Структурна схема роботи системи представлена на малюнку.

Структурна схема роботи опції

У процесі сканування передбачені як опція збереження безпосередньо графічного образу документа, так і можливість подальшого розпізнавання і збереження в текстовому форматі. Це істотно полегшує подальшу роботу з документом і розширює можливості використання пошуку. Розпізнавання і переклад в текстовий формат реалізуються за допомогою ABBYY FineReader Engine.

Багатомовні документи.

Опція "Потокове сканування" дозволяє обробляти документи на всіх підтримуваних ABBYY FineReader мовами, включаючи українську, англійську, німецьку, французьку, іспанську, італійську, шведську, фінську, болгарську, угорську, словацьку, чеську, башкирський, белоукраінскій, казахський, український.

Інтеграція довільній СЕД з опцією

Інтеграція з опцією "Потокове сканування" передбачає реалізацію з боку довільної СЕД тільки двох функцій:

Формування та відправлення до опцію "Потокове сканування" заявки на сканування - cо боку СЕД передається запит, який містить вимоги на обробку документа. Опція реєструє заявку і повертає в СЕД її унікальний ідентифікатор. На даному етапі здійснюється зв'язка унікального ідентифікатора заявки на сканування з штрих-кодом, вже існуючому на документі, або знову згенерованих.

Виконання прийому і збереження підсумкових результатів, сформованих опцією "Потокове сканування" - при цьому зіставляються результатів виконання сканування з об'єктами СЕД. Причому дана дія, що здійснюється на основі унікального ідентифікатора заявки на сканування і може бути розширено будь-який бізнес - логікою СЕД.

Реєстрація та сканування документів

Реєстрація документа, тобто створення реєстраційної картки, виконується за звичайними правилами використовуваної системи електронного документообігу. Далі, при зверненні до опції "Потокове сканування". відбуваються реєстрація заявки на сканування, а також генерація штрих-коду і вказівку параметрів заявки (розташування штрих-коду, необхідні формати, необхідність розпізнавання). Після того як реєстраційна картка документа буде записана в базу даних, на його першу сторінку або на окремий аркуш паперу за допомогою принтера наноситься штрих-код. Він містить унікальний ідентифікаційний номер документа і встановлює правила його обробки. Друк отриманого зображення штрих-коду здійснюється засобами системи документообігу. Потім пакет зареєстрованих документів поміщається в лотки для паперу сканера, після чого їх обробка проводиться автоматично.

Застосування штрих-коду.

У процесі сканування, нанесений штрих-код використовується як ознака закінчення поточного документа і початку наступного, а що міститься в штрих-коді додаткова інформація застосовується для подальшої ідентифікації оброблюваного документа.

результати сканування

Графічні документи.

При збереженні графічного образу документів система забезпечує можливість конвертації зображень сканованих документів в наступні формати:

BMP (Windows or OS / 2 bitmap);

PNG (Portable Network Graphics);

TIFF (Tagged Image Format);

JPEG (Joint Photographic Experts Group);

PDF (Portable Document Format).

Для кожного з них передбачена можливість вказувати розміри зображення і додаткові атрибути (глибина кольору, тип стиснення і т.п.). Якщо розмір необхідного формату відрізняється від поточного графічного представлення, то конвертація може бути виконана з використанням заданих параметрів.

Текстові документи.

У разі застосування технології розпізнавання тексту, передбачена можливість збереження в більшості найбільш поширених форматах файлів *:

Текстовий файл (.txt);

Rich Text Format (.rtf);

PDF (Portable Document Format).

Для кожного з них передбачена можливість вказувати додаткові атрибути (розмір сторінки, кодування і т.п.). При записуванні у вигляді PDF-файлу можлива як запис у вигляді зображення, так і у вигляді розпізнаного тексту.

Таким чином, опція "Потокове сканування" реалізує ефективну технологію перетворення паперових документів в електронний вигляд і дозволяє в стислі терміни здійснити перехід до роботи з їх електронними образами. Продумані налаштування, гнучкі механізми управління і докладна документація для розробників роблять роботу з системою зручною та результативною.

* Список підтримуваних текстових форматів залежить від можливостей використовуваної системи розпізнавання і може змінюватися.

Схожі статті

Як боротися з конфліктами в організації і чи варто це робити

Попередня ◈ Наступна