Як розпізнати сканований текст

Як розпізнати сканований текст

При роботі з документами нерідко необхідно перевести в надрукований лист у формат документа MS Word для подальшого редагування та підвищення зручності використання. Для цього після сканування тексту необхідно його розпізнати. Існує безліч програм для розпізнавання. Для того щоб домогтися максимального результату, недостатньо просто запустити документ на розпізнавання і збереження файлу, який вийшов на виході.

Інструкція

  1. У першу чергу, подбайте про те, щоб відсканований варіант документа був максимальної чіткості, без зайвих помарок, розмитостей і засвічених ділянок тексту. У разі необхідності відскануйте текст ще раз.
  2. Запустіть програму розпізнавання тексту. Програмою, що забезпечує найкращі результати в цій області, є ABBYY FineReader. Скачайте і встановіть останню версію цього розпізнавача, після чого запустіть її.
  3. За допомогою меню «Файл», додайте відскановані листи до списку розпізнавання. Для полегшення роботи бажано не розпізнавати їх по одному, а запустити відразу все. Майте на увазі, що програми розпізнавання можуть розпізнавати одночасно до десяти тисяч сторінок і не більше. Дочекайтеся завершення аналізу і розпізнавання тексту.
  4. Після того як програма завантажить ваші файли, виставте мову розпізнавання. Відразу після цього переходьте до виділення областей для розпізнавання. Для цього видалите всі області, автоматично виділені програмою, і виділіть їх вручну. Дайте полю властивість «текст» або «картинка», залежно від того, чим воно є.
  5. Запустіть процес розпізнавання. Після завершення виберіть формат, в якому ви будете зберігати і вид форматування, яке хочете дотриматися при збереженні.