Як розпізнати файл pdf

Як розпізнати файл pdf

У pdf-форматі зазвичай розміщуються електронні книги, інструкції та інші документи. Деякі з них захищені від копіювання, тобто інформація в них міститься у вигляді картинки і «витягнути» з неї текст можна тільки шляхом розпізнавання.

Вам знадобиться

- Abbyy FineReader;
- Abbyy Screenshot Reader.

Інструкція

  1. Скачайте і встановіть на комп’ютер програму Abbyy FineReader, для цього перейдіть на офіційний сайт програми http://www.abbyy.ua/download/, виберіть потрібний продукт і клацніть по посиланню «Скачати». Дана програма призначена для сканування паперових документів, але ви можете з її допомогою розпізнати файл у форматі Pdf. Для цього запустіть програму, далі виберіть меню «Файл» — «Відкрити». Оберіть з комп’ютера файл, який необхідно розпізнати.
  2. Встановіть налаштування розпізнавання: мова (можливий вибір кілька мов, наприклад, коли текст російською мовою, але в ньому зустрічаються слова англійською мовою); поділ тексту на блоки (текстові блоки, зображення), дозвіл. Виділіть потрібний фрагмент тексту, клацніть правою кнопкою миші і виберіть тип блоку (текст, картинка або таблиця).
  3. Далі клацніть «Розпізнати». Після цього ви можете зберегти отриманий текст за допомогою копіювання в документ Word. Розпізнавання pdf-файлу можна виконати як посторінково, так і для всього документа відразу.
  4. Встановіть програму Abbyy Screenshot Reader. Після цього в треї з’явиться значок програми. Цей додаток дозволяє розпізнати текст з pdf-документа, відкритого на екрані. Це стосується також будь-яких зображень, і всього, що взагалі відображається на моніторі.
  5. Відкрийте документ, клацніть по значку програми, виберіть тип джерела (зображення, текст) і тип даних, які необхідно отримати. Ви можете вибрати текст, таблицю або зображення. Наприклад, якщо необхідно розпізнати табличні дані, виберіть напрям «Текст» — «Таблиця».
  6. Далі на екрані з’явиться курсор у вигляді хрестика, виділіть потрібну інформацію. Після розпізнавання з’явиться таблиця MS Excel зі вставленою інформацією з документа. Щоб розбити отриманий текст по стовпцях таблиці використовуйте меню «Сервіс» — «Розділити за стовпцями», виберіть роздільник (пробіл або табуляція) і клацніть «ОК».