Як з pdf витягти текст


 

Формат pdf дозволяє зберігати завантажені на комп’ютер документи, книги, реферати в їх первісному вигляді. Вони відкриваються за допомогою спеціальної програми Adobe Reader. Для вилучення тексту з pdf можна скористатися кількома способами.



Вам знадобиться

— текст у форматі pdf;
- Програма для читання pdf-файлів (Adobe Reader);
- Встановлена ​​OCR-програма;
- Програма-конвертер pdf-файлів;
- Інтернет.

Інструкція

  1. Дізнайтеся версію встановленої на вашому комп’ютері програми Adobe Reader. Для цього виберіть на робочому столі ярлик з назвою програми, клацніть правою кнопкою миші, в виплив меню виберіть пункт «Властивості» (варто самим останнім). У віконці навпроти іконки програми буде стояти назва Adobe Reader, а після нього йде цифра. Вона уособлює собою версію (наприклад, Adobe Reader 9). Найостанніші версії — 9 і 10.
  2. Відкрийте необхідний для вилучення текст у форматі pdf. Якщо у вас на комп’ютері встановлена ​​одна з останніх версій програми Adobe Reader, то там є функція «Зберегти як текст» / Save as text. Виберіть дану команду, і текст документа стане доступним для редагування.
  3. Також для вилучення абзацу тексту існує інструмент «Виділення» / Text select. Скористайтеся ним при роботі з необхідним для коригування фрагментом тексту. Розтягніть прямокутник на весь необхідний вам уривок. Використовуйте праву кнопку миші, щоб скопіювати виділений ділянку. Він збережеться в буфері обміну. Відкрийте використовуваний вами редактор текстів. Вставте копіювати текст. Відредагуйте його на ваш розсуд.
  4. Бувають ситуації, коли текст захищений від копіювання та виправлень. В даному випадку використовуйте спеціальні програми для розпізнавання тексту. Це може бути як одна з OCR-програми (наприклад, OmniPage або ABBYY FineReader); програма-конвертер (ABBYY PDF Transformer і пр.)
  5. Самий елементарний спосіб конвертувати файл у форматі pdf для виправлення — онлайн-ресурси. Наприклад,