Як вирізати текст з djvu


 

Книги у форматі djvu зустрічаються в електронних бібліотеках досить часто. Як правило, вони займають невеликий об’єм, в них збережені шрифти та ілюстрації оригіналу. Головним недоліком цього формату є той, що текст сторінки копіюється в буфер як зображення. Для того, щоб його редагувати, необхідно використовувати інші додатки.



Вам знадобиться

— комп’ютер з програмами Djvu OCR, Djvu Solo, Djvu Viewer;
- ABBYY FineReader:
- Adobe Photoshop.

Інструкція

  1. Скопіювати окрему сторінку з книги у форматі djvu дозволяє практично будь-яка програма, яка читає файли даного виду. Всі вони мають схожий інтерфейс і приблизно однакові функції. Зайдіть у верхнє меню і знайдіть вкладку Selection. Там ви побачите рядок Select Region. Виберіть її.
        
  2. Знайдіть потрібну сторінку Це можна зробити у віконці верхнього меню. Якщо сторінка знаходиться недалеко від початку або кінця книги, можна скористатися стрілками. Виділіть на ній потрібний фрагмент за допомогою рамки, яка з’явилася перед вами. Клацніть правою клавішею миші. Перед вами з’явиться випадаюче меню, яке пропонує або зберегти сторінку, або скопіювати. Виберіть друге.
        
  3. Відкрийте Adobe Photoshop або, наприклад, просмотровщик зображень, що має функцію створення нового файлу. Створіть файл і вставте в нього те, що у вас в буфері. Збережіть зображення як jpg або tiff. При необхідності обробіть його. У форматі djvu нерідко зберігають дуже старі книги, з незвичайними і не завжди чіткими шрифтами. Крім того, там зберігаються всі позначки, які були в оригіналі. Вони можуть перешкодити розпізнанню тексту. Приберіть зайвий сміття. Переведіть зображення в чорно-біле і встановіть баланс яскравості і контрастності. В деяких випадках потрібно збільшити дозвіл одночасно з розмірами.
        
  4. Відкрийте зображення в ABBYY FineReader. Чим пізніша версія цієї програми у вас коштує — тим краще. Знайдіть функцію «Розпізнати». Коли програма це зробить, збережіть файл у потрібному вам форматі — наприклад, в doc.
        
  5. Програма Djvu OCR дозволяє розділити на сторінки відразу всю книгу. Відкрийте програму і виберіть у меню опцію Djvu Decoder. Перед вами з’явиться віконце. Знайдіть функцію Djvu File List. Натисніть кнопку Add. Вкажіть, де знаходиться книга в даному форматі, яку ви хочете перетворити. Виберіть пункт Output Directory. Знайдіть кнопку Browse. Виберіть папку для збережених сторінок. Назва папки напишіть латиницею. Натисніть Process.
        
  6. Запустіть ABBYY FineReader. Можна відкрити як одну сторінку, так і все відразу — це значно скоротить час. Натисніть кнопку «Розпізнати». Збережіть сторінки окремими файлами або виділіть всі і зробіть з них один документ.