Schimbarea codificării unui fișier text de la cp1251 la - utf8

Dacă, atunci când deschideți un fișier text, sunt afișate Crocodile, acest lucru indică faptul că acest fișier a fost creat în codificare greșită. În cazul meu, acest fișier a fost creat în Windows în codificarea "unică" CP1251 și a fost necesar să se deschidă în Ubuntu cu codificarea "corectă" UTF8.







Pentru a modifica codificarea fișierului de testare de la CP1251 la codarea UTF8, avem nevoie de pachetul enca. Toate cele descrise mai jos vor fi furnizate pentru distribuția Ubuntu, dar algoritmul acțiunilor va funcționa și în alte distribuții.

Modificarea codificării unui fișier text de la CP1251 la UTF8:





  1. Instalați pachetul necesar:

sudo apt-get instalați enca

  • Convertiți un fișier în codificarea localizării distribuției, determinată automat:

    În locul numelui fișierului, ar trebui găsită calea completă la fișierul din codificarea CP1251, de exemplu: enconv /home/koder/1.txt

    Dacă există mai multe dintre aceste fișiere, comanda arată oarecum diferită:

    găsi path_to_directory -name "* .txt" -exec enconv <> \;

    Pentru exemplul nostru, acesta ar trebui să fie: find / home / koder / -name "* .txt" | enconv

    Totuși, va fi mai clar IMHO + Mi sa spus că metoda dvs. pentru multe fișiere nu a funcționat ...

    $ găsi path_to_directory -name "* .txt" -exec enconv <> \;

    A fost corectată. Nu era nevoie să convertiți un număr mare de fișiere

    Ajută-mă să descifrez: Shidi! Chg ... rRsit? "X4







    Trimiteți-le prietenilor: