Як відредагувати відсканований документ в адобі Програми редагування сканованих документів. Хитрості роботи з PDF-форматом

Якщо Ви обрали швидкий шлях написання теоретичного розділу, про який ми говорили в параграфі 2.1., найімовірніше Вам не обійтися без сканування документів. В іншому випадку, цей пункт можете пропустити та починати конспектувати матеріали, знайдені в бібліотеці .

Перед початком сканування потрібно визначитися, що саме Ви хочете використовувати під час написання роботи. А для цього потрібно спочатку переглянути літературу і виділити олівцем потрібні моменти.

Коли я вперше сканував статтю з журналу для своєї першої курсової, для мене це заняття було неймовірно складним. В результаті кількох годин роботи зі сканером і FineReader'ом у мене на виході вийшла маячня, яка не піддається редагуванню. У результаті довелося все набирати руками. Щоб у Вас не трапилося подібного, розглянемо докладніше все технічні моментисканування.

Для сканування нам, звичайно ж, буде потрібно сканер. Його не обов'язково купувати. Можна, наприклад, на якийсь час взяти на якийсь час у товариша. Я використовую сканер CanoScan Lide 60. Це хоч і не сама Нова модельАле мені дуже подобається цей компактний, швидкий і зручний в роботі "девайс". Якщо Ви взяли на час сканер, щоб він працював потрібно спочатку встановити програму-драйвер. Драйвера та посібник зі встановлення завжди можна знайти на настановному диску, який додається до пристрою чи завантажити на сайті у виробника. Після інсталяції драйвера підключіть сканер до комп'ютера за допомогою з'єднувального шнура. Тепер можна вже безпосередньо розпочати сканування.

Але спочатку трохи теорії. Ви повинні знати, що процес сканування складається з двох етапів:

1. Безпосереднє сканування документа. На цьому етапі сканер як би фотографує поверхню документа, що сканується, і зберігає отримане зображення на комп'ютер у вигляді звичайного файла.jpg .gif або в іншому форматі;

2. Розпізнавання документа. Це процес перетворення тексту із зображення зробленого сканером у звичайний тест, який потім можна зберегти у Word та редагувати. Розпізнавання здійснюється без участі сканера за допомогою спеціальної програми (найпопулярніша Adobe FineReader). Таким чином, Ви можете спочатку відсканувати кілька аркушів тексту та зберегти їх у вигляді зображення і лише потім перетворювати на текст.

Тож почнемо етап перший – сканування:

– запускаємо драйвер сканера: Пуск – Усі програми – Canon – ScanGear(Назву драйвера я вказую для свого сканера). З'явиться вікно драйвера:

– відкриваємо кришку сканера і кладемо книгу, журнал або їх копію текстом донизу, якомога рівніше по відношенню до країв робочої поверхні сканера:

Тут дуже важливо зробити так, щоб кришка сканера якомога щільніше притискала документ, що сканується, не допускаючи попадання зовнішнього освітлення не робочу поверхню сканера, яка стикається з документом;

- Виконаємо необхідні установки в драйвері сканера. Насамперед потрібно встановити дозвіл, у якому буде відскановано документ. Роздільна здатність – це показник, який визначає рівень деталізації об'єкта при скануванні та визначається в точках на дюйм (dpi, або т/д). Чим більша роздільна здатність, тим якісніше виходить зображення. Але при скануванні текстових документівнемає сенсу встановлювати максимальний дозвіл, оскільки користь від цього буде нуль. Крім того, сканування з великою роздільною здатністю займає більше часу. Я рекомендую встановлювати роздільну здатність в межах 400-500 т/д (dpi). При такому налаштуванні зображення виходять досить якісними для хорошого розпізнавання, а сам процес сканування не займає багато часу. Пропоную подивитися на скріншот установок мого принтера:

Для початку потрібно перейти в "Розширений режим".Джерелом завжди буде "Планшет"(Планшетний сканер). Кольоровий режим краще встановити "Чорно-білий"адже для сканування тексту нам кольори не потрібні, а це зменшить розмір зображень на виході. Дозвіл, як я вже сказав, слід встановити 400 т/д. Вихідний розмір зображення – обов'язково "А4". Тепер можна сміливо натискати на кнопку "Сканувати". Мій сканер влаштований таким чином, що спочатку запам'ятовує відскановані зображення в внутрішньої пам'яті, і лише при закритті вікна драйвера пропонує зберегти їх на комп'ютер. Мені залишається лише вказати місце, куди буде збережено результати роботи.

У вас мають бути файли такого типу:

При збільшенні такого зображення має бути чітко видно текст.

Другий етап – розпізнанняотриманих зображень та їх перетворення на текст. Як я вже казав, для цього знадобиться спеціальна програма – FineReader. Завантажте програму за цим посиланням (32Мб). Пароль до архіву – сайт. Запропонована версія не вимагає установки (portable). У папці з програмою буде багато різних файлів, але Вам потрібен лише один – FineReader.exe. Подвійний клік на цьому файлі запустить програму на комп'ютері.

Ця версія програми досить стара. Усі скріншоти нижче я робив, використовуючи саме її. Якщо ця версія FineReaderу вас не запускається - виберіть нову.

Вікно FineReaderмає такий вигляд:

Після встановлення мови, на якій надруковано відскановані документи, можна починати розпізнавання. Якщо в тексті є відразу дві мови (наприклад, російська та англійська) установку зробіть відповідно.

Щоб розпочати розпізнавання, натисніть на стрілку праворуч від першої кнопки Сканувати- а потім - Відкрити зображення:

Відкриється вікно вибору зображень. Відкрийте папку, в яку Ви зберегли відскановані зображення, натисніть CTRL+A(англійська) на клавіатурі та натисніть на кнопку Відкрити.

Після цього зліва у вікні FineReader'аз'являться ескізи доданих файлів, центром – на Наразівиділений ескіз у збільшеному вигляді, знизу – ще більше збільшення, а праворуч результат розпізнавання:

Для прикладу я взяв лише два зображення. На скріншоті вище виділено перший із них, його зараз і розпізнаємо. Як бачите, зображення відскановано вертикально, щоб розпізнати текст знімок, потрібно спочатку розгорнути на 90 градусів. Для цього скористаємося кнопками та . Наступним кроком потрібно вказати програмі, яку саме частину зображення потрібно розпізнати, а також задати тип даних, які мають вийти на вихід текст, таблиця або зображення. І тому існують кнопки, соответственно: . Наприклад, якщо потрібно відзначити текстовий блок, натискаємо лівою кнопкою на , після цього натискаємо лівою кнопкою мишки в лівому верхньому куті текстового блоку і утримуючи ліву кнопку, перетягуємо у правий нижній кут. Наприклад, я повністю підготував до розпізнавання одне зображення:

Як бачите, все текстові блокиу прикладі вище виділено зеленим, а малюнки – червоним. Таблиці готуються до розпізнавання аналогічно. Для цього призначена кнопка . Щоб перейти до наступного знімка, клацніть лівою кнопкою миші на його ескізі зліва. Таким чином, готуються до розпізнавання всі отримані в результаті сканування зображення. Після завершення підготовки зображень слід виділити їх усі. Для цього клацніть лівою кнопкою в порожньому місці на панелі ескізів (вона називається Пакет) та натисніть Ctrl+A(англійський) на клавіатурі. Далі клацніть на кнопку і зачекайте поки FineReaderперетворює зображення на текст. Після цього можна зберігати отриманий текст у Word за допомогою кнопки після натискання на яку відкриється вікно . У ньому необхідно вибрати формат для збереження – Microsoft Word, а також поставити позначку, щоб збереглися всі сторінки:

Після натискання кнопки ОКпрограма створить документ Wordі вставить у нього текст із розпізнаних сторінок у порядку, де вони перебувають у панелі ескізів (Пакет). Отриманий документ одразу ж збережіть у папку в файлової структуридипломної роботи та можете приступати до редагування. Як це робиться, описано в моєму безкоштовному курсі.

І останній момент. Якщо Ви сканували газету або журнал, текст там часто дається у вигляді колонок (як у прикладі вище). Ці колонки у Ворді потрібно перетворити на одну. Виділіть текст у вигляді колонок та виконайте команду: Формат – Колонки – Одна – ОК. Лише після цього можна ставити Книжкову орієнтаціюПараметри сторінки, відступи полів, шрифт і т.д.

Як відсканувати документ та розпізнати його в MS Word

Сканер - пристрій, що розпізнає об'єкти, зображення або документи і записує їх візуальний образ графічний файл, який можна по-різному редагувати. З якою метою зазвичай проводиться дана операція? Як редагувати відсканований документ?

Під словом «редагування» слід у цьому випадку розуміти:

Редагування як модифікація зображення

Як ми зазначили вище, сканер, обробляючи документ або інший об'єкт, згодом створює на основі його образу статичну картинку у вигляді окремого графічного файлу - наприклад, формат Jpeg. Потреби в її редагуванні найчастіше такі:

поверхневе коригування (зміна розміру, відображення, поворот на задану кількість градусів, налаштування колірного балансу);
редагування елементів зображення (зміна їх зовнішнього вигляду, видалення, додавання нових).

Поверхне коригування зображення, отриманого зі сканера, може здійснюватися за допомогою найдоступніших видів ПЗ, які встановлені в Windows за промовчанням. Якою програмою редагувати відсканований документ найпростіше? Ймовірно, це буде Paint. Важливі опції редагування файлу знаходяться в меню програми, а також панелі інструментів її інтерфейсу.

Запустити Paint дуже легко: слід натиснути (у Windows до версії 7 включно) "Пуск", далі - "Всі програми" - "Стандартні" - Paint. Потім за допомогою інтерфейсу даного ПЗ відкриваємо потрібний файлта вносимо до нього необхідні коригування.

Більш складна процедура – редагування елементів зображення – може передбачати найширший спектр можливих операцій: від нанесення невеликої ретуші або букв на картинку до її злиття з іншим графічним файлом у вигляді колажу. Залежно від складності відповідної процедури необхідно буде задіяти той чи інший вид ПЗ.

Якщо операції із зображенням прості (наприклад, справа обмежується нанесенням літер на нього), можна використовувати той же Paint. У панелі інструментів цієї програми, яка знаходиться в її інтерфейсі ліворуч, потрібно вибрати "Текст". За допомогою на зображення наносяться друковані літери.

Редагування текстів та інших об'єктів форматування на зображенні

Як редагувати відскановані документи за допомогою зазначених програм? Дані рішення функціонують так: вони обробляють зображення, розпізнають текст та інші об'єкти форматування, присутні на ньому, а потім заносять їх в окремий файл, який, у свою чергу, можна відкривати за допомогою текстових редакторів - Word, OpenOffice та їх аналогів - і вільно редагувати.

Згодом можна розмістити змінений текст (таблиці, списки) на тому ж сканованому зображенні, з якого він був розпізнаний у вихідному вигляді. Для того, щоб здійснити цю процедуру, необхідно відкрити відповідний графічний файл у програмі для редагування – наприклад, Paint, в одному вікні, в іншому – розпізнаний та відредагований текст (таблиці, списки). Зробивши друге вікно активним, потрібно виконати скріншот тексту (знімок поточного зображення на екрані монітора) за допомогою клавіші Print Screen Sysrq, після – вставити його в Paint (за допомогою поєднання Ctrl та V), а потім – розмістити на відсканованому зображенні так, як потрібно .

Така потреба може виникнути, наприклад, у дизайнера обкладинки журналу, якому потрібно відредагувати розміщений на ній текст, і якщо у нього з якихось причин немає вихідного файлу. Він може розпізнати потрібні абзаци з паперової сторінки видання, внести до них правки, а потім знову розмістити їх, вже в зміненому вигляді, на відсканованому зображенні сторінки.

Дуже часто трапляється так, що потрібно відредагувати текст, який міститься лише у паперовому варіанті. Для розпізнавання та редагування на даний момент є чимало програм, які відрізняються не лише якістю результатів, а й розширеним функціоналом. Fine Reader є одним з найкращих існуючих програм для виконання цих цілей.

Вам знадобиться

- текстовий редактор;
- Програма Fine Reader.

Інструкція

Завантажте та встановіть програму розпізнавання відсканованого тексту, наприклад Fine Reader. Ознайомтеся з функціоналом програми – багато сучасних версій підтримують інтеграцію відсканованого тексту прямо у Word, якщо така функція є у вашій копії програми, виконайте операцію, пропустивши наступні пункти.

Якщо у вас старі версії програми, відскануйте потрібний для редагування документ за допомогою стандартної програмикопіювального обладнання, яким ви зазвичай користуєтеся, і збережіть його у форматі.jpg на вашому комп'ютері.

Клацніть один раз правою кнопкою миші по збереженому зображенню, виберіть пункт «Відкрити за допомогою…» і в списку програм виберіть недавно встановлений вами Fine Reader. Якщо потрібно, позначте прапорцем пункт «Використовувати всіх даних для файлів цього типу. Також ви можете просто відсканувати зображення за допомогою вже відкритої програми, обравши пункт “Scan and Read”, зображення з пристрою імпортується прямо в робочу область. Для цього заздалегідь в установках вкажіть параметри роботи сканера в режимі Fine Reader.

У вікні програми виберіть пункт «Розпізнати текст». Зачекайте, доки програма виконає читання документа. Якщо результати операції не відповідатимуть вашим вимогам, змініть налаштування сканування та розпізнавання та повторіть процедуру заново.

Збережіть документ, що вийшов, у будь-якому форматі, який підтримується програмою Microsoft Office Word. Закрийте Fine Reader, перейдіть до папки, до яких було збережено ваш документ.

Відкрийте файл за допомогою MS Office Word або будь-якого іншого текстового редактора, у якому вам зручно працювати. Виконайте потрібні зміниу файлі, збережіть результати.

Порада додана 23 червня 2011 Порада 2: Як виправити документ Часто, коли документ уже підписано, необхідно виправити прикру помилку або поставити пропущену літеру. Це необхідно зробити для того, щоб не зіпсувати думки про себе для тих, кому надсилається відсканована копія документа. У випадку, якщо документ необхідно надіслати в друкованому вигляді, виправлення неможливі, але якщо вам належить надіслати його копію, ви завжди можете виправити похибки в тексті.

Інструкція

Найчастіше, коли документ вже підписано, необхідно виправити прикру помилку або поставити пропущену літеру. Це необхідно зробити для того, щоб не зіпсувати думки про себе для тих, кому надсилається відсканована копія документа. У випадку, якщо документ необхідно надіслати в друкованому вигляді, виправлення неможливі, але якщо вам належить надіслати його копію, ви завжди можете виправити похибки в тексті.

Відкрийте аркуш, який потрібно виправити, у редакторі Paint. У випадку, якщо папір вийшов не білим, а трохи темним, використовуйте редактор Microsoft для того, щоб висвітлити фон, після чого відкрийте його в Paint.

Дислокуйте місце друкарської помилки або пропущеного символу. За допомогою гумки зітріть непотрібну букву. Слідкуйте за тим, щоб білий слід, який залишається після гумки, не виділявся на тлі загального тла.

Використовуйте інструмент копіювання. За допомогою цього інструмента обведіть ту літеру, яку потрібно поставити на місце стертою. Скопіюйте її і обережно вставте в те місце, яке ви зачистили гумкою. Слідкуйте за тим, щоб висота літери була на тому ж рівні, що й висота довколишніх, а відстань до інших літер була рівною.

Повторюйте попередній крок, доки не досягнете повного коригування бажаного фрагмента тексту. Після цього перевірте, щоб колір літер, які ви вставили, збігався із кольором інших, які ви не чіпали. Якщо ви сканували у гарному дозволі, проблем із цим бути не повинно. Зменшіть документ у два-три рази та збережіть як файл.jpg.

Щоб максимально приховати сліди коригування, використовуйте JPGtoPDF converter. Сконвертуйте зображення у PDF файл і надсилайте відправнику.

Як виправити документ - версія для друку Програма для оптичного розпізнаваннятекстів. ABBYY FineReader вміє розпізнавати текст із відсканованих паперових документів, PDF-файлів, а також документів, знятих цифровим фотоапаратом. Розпізнані програмою текстові документи можна надалі редагувати, використовуючи програми Microsoft Office. Якщо потрібно, то при розпізнаванні тексту буде збережено всю структуру оформлення документів. FineReader працює з усіма популярними моделями сучасних сканерівта багатофункціональних пристроїв (МФУ). Якщо користувачеві потрібно відсканувати та розпізнати велику кількість сторінок тексту, то у програмі передбачено спеціальний режимдля роботи з автоматичними сканерами (сканер із автоподатчиком паперу). Програма може розпізнавати текст у файлах наступного формату: PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG, DjVu, при необхідності буде проведена обробка цифрових зображень для підвищення якості оптичного розпізнавання тексту (зображення можна обрізати, очистити від непотрібних елементів , усунути неточності, спотворення рядків, здійснити поворот або дзеркальне відображення).

Програма є комплексним додатком для роботи з текстовими документами. Її головне призначення – оптичне розпізнавання символів. Автор програми - російська кампанія ABBYY Software (світовий лідер у галузі систем розпізнавання). Додаток здійснює швидкий і точний переведення відсканованих документів у формат, що редагується, зі збереженням всіх оригінальних деталей джерела. FineReader вміє розпізнавати PDF файли, цифрові фотографіїта паперові документи. Програма точно відтворює вигляд оригінального джерела, підтримуючи розпізнавання тексту 186 мовами і здійснює прямий експорт до програм Microsoft Office.

За допомогою програми вирішуються такі завдання, як: створення та редагування електронних документівна основі паперових джерел, переклад у редагований формат документів слабкої якості, обробка документів зі складною структурою змісту, що включають таблиці, ілюстрації, схеми тощо, пошук та редагування тексту в будь-яких форматах. На думку більшості фахівців, програма є найкращою у своїй галузі.

Якщо говорити про практику використання цієї програми в Рунеті, то багатьом користувачам давно відома ця програма Файн Рідер (російський переклад назви), основне призначення якої – виконання так званого оптичного розпізнавання тексту. Якщо простіше – за допомогою цієї програми будь-який надрукований на папері текст може бути перетворений на один із електронних форматів. остання версіяпрограми відрізняється не тільки оновленим і зручнішим інтерфейсом, але й покращеною функціональністю.

Фактично всі основні дії можуть бути виконані за допомогою одного клацання миші, яким вибирається одна з пропонованих при запуску програми дій. Серед них – можливість сканування документів у формат.doc, конвертація фотографій, сканування в Excel, збереження зображень та їх сканування, розпізнавання зображень та ін. знаходяться тепер на бічній панелі.

Щоб не утруднити користувача, всі файли, які він відкриває, розпізнаються автоматично. За потреби, досвідчений користувачможе виконати глибокі налаштуванняфункціоналу FineReader. А робота із зображеннями значно спростилася завдяки новому діалогу. Використання програми дозволяє розпізнавати документи, складені з використанням більш ніж однієї мови, перетворювати PDF-файли, розпізнавати штрих-коди і вести морфологічний пошук. І хоча це далеко не повний перелік його можливостей, тільки це може спонукати багатьох користувачів встановити у себе на постійній основі Файн Рідер і використовувати його в міру необхідності.

І підводячи межу під вищесказаним, можна коротко так позначити функціональні можливості: ця програма використовується для оптичного розпізнавання різних текстових документів. При розпізнаванні тексту, програма зберігає вихідне форматування та оформлення документа (кольоровий текст, текст на тлі картинок, різні зображення шрифтів, обтікання картинок текстом, таблиці і т.д.). FineReader вміє працювати з відсканованими паперовими документами (підтримується робота практично з усіма популярними моделями сканерів та багатофункціональних пристроїв), з документами, знятими цифровими фотоапаратами, розпізнає текст та графіку з PDF файлів. А також експортує результати оптичного розпізнавання текстів до популярних офісних програм: Word, Excel, PowerPoint, Lotus Word Pro, Corel WordPerfect, OpenOffice. Розпізнаний текст можна зберегти у різних форматах: PDF, PDF/A, DOCX, XLSX, RTF, DOC, XLS, CSV, TXT, HTML, Unicode TXT, Word ML, LIT, DBF.