Як визначити кодування

Як визначити кодування

Іноді потрібний файл або веб-сторінка не відкривається, а при її відображенні видно тільки незрозумілі символи. Бувають випадки, коли текстовий редактор або браузер не може визначити необхідне кодування. У такому випадку її доводиться підбирати самому за допомогою додаткових утиліт.

Вам знадобиться

Текстовий редактор, який працює з великим числом кодувань, або програма-декодер.

Інструкція

  1. Якщо файл некоректно відкрився в одному редакторі, це зовсім не означає, що він має неправильну кодування. Варто спробувати відкрити той же файл в іншій програмі. Однією з утиліт, які в більшості випадків точно визначають необхідний набір символів, є безкоштовний редактор Notepad + +.
  2. Якщо відкрити файл все-таки не вдається, то можна скористатися онлайн сервісами для визначення кодування, яких в інтернеті є безліч.
  3. Також існують програми, які здатні розшифровувати російські тексти в різних кодуваннях. Безсумнівно, лідером є додаток «Штірліц» для Windows. Воно знає практично все кодові листи і знає безліч методів транслітерації. Більше того ця програма здатна проводити операції трансформації тексту з вихідного формату в будь-який інший.
  4. У Linux, щоб відкрити будь-який файл, що містить незнайому кодування, можна скористатися деякими консольними командами перетворення або готовими програмами. Під QT існує додаток QTexTransformer, яке допоможе визначити назву кодування і провести відповідні перетворення.

    Під Linux існує безліч лінгвістичних модулів, написаних на мові Perl. Наприклад, Lingua DetectCharset або DetectCyrillic (для визначення кириличних символів). Добре відображає файли Windows програма mousepad. Для конвертації також можна скористатися консольною командою «econv путь_до_файла», яка самостійно визначить поточну кодування і перетворює її до поточної локалі.

Корисні поради

Добре з вибором потрібної кодування справляється текстовий процесор Word. Навіть якщо файл не відкрився в інших редакторах, в ньому спрацює функція «Автовибір».