Victor al Galațiunii

În primăvara acestui an, Microsoft a lansat o altă versiune localizată a produsului Office 97. Odată cu trecerea la noua versiune, au existat probleme cu utilizarea vechilor fonturi TrueType moștenite de la Windows 3.x. Și mulți au pus aceeași întrebare: Microsoft nu a observat un astfel de defect evident, care nu trebuie să meargă departe, se află la suprafață. Acest articol clarifică situația cu utilizarea fonturilor True Type în Microsoft Office 97.







Dacă înțelegeți în detaliu, atunci nu există erori în lucrarea din Microsoft Office 97. Totul funcționează exact așa cum a fost intenționat. Avem de-a face cu unul dintre acele câteva cazuri în care Microsoft a abandonat vechea abordare dogmatică în numele unei noi soluții promițătoare, cu prețul pierderii compatibilității.

Istoricul tabelelor de coduri

Primele calculatoare personale au apărut cu mai mult de un sfert de secol în urmă și au fost orientate spre ieșirea textului de informații. Se știe că pentru reprezentarea simbolurilor s-au folosit echivalentele lor numerice - codurile de caractere. La început, a fost utilizată o codificare pe 7 biți, care ar putea reprezenta 128 de caractere. În același timp, a fost elaborat standardul ASCII - un singur tabel pentru corespondența dintre codurile și simbolurile în sine. Mai târziu a fost extins la 8 biți (256 de caractere) și a atins acest formular aproape până în ziua de azi. În acest caz, prima jumătate (0-127 caractere) sunt întotdeauna aceleași, standardul ASCII corespunzător, în timp ce cealaltă jumătate a tabelului (simboluri) a variat în funcție situat între 128-255 de țara în care a fost utilizată. Există variante de a doua jumătate a caracterelor europene, grecești și altele. Există o duzină de variante rusești (ovskih toate GOST dureros familiar“, alternativă, KOI-8, etc.), în care același cod (de exemplu, 192) poate corespund unei multitudini de trăsături de caractere diferite, în funcție de tabelul de codare utilizat. Din acest motiv, pentru fiecare tabel de coduri, au creat propriile fonturi, afișând corect caracterele în strictă conformitate cu codurile acestora. Textul introdus în codarea KOI-8 nu poate fi citit când se utilizează un font destinat unei codări DOS alternative. Acest lucru este cunoscut aproape tuturor și se manifestă în special într-o problemă separată - utilizarea fontului rus în e-mail-uri.

Odată cu dezvoltarea industriei de calculatoare și cu lansarea produselor software dincolo de limitele utilizării numai a limbii engleze, a devenit necesară eliminarea confuziei în reprezentarea simbolurilor. Acest lucru a fost determinat de dezvoltarea rapidă a internetului. Au fost propuse numeroase soluții pentru a rezolva această problemă. Una dintre ele a primit recunoașterea în masă - standardul Unicode. Acest standard specifică codificarea caracterelor nu cu un octet (256 de caractere), ci cu două, ceea ce face posibilă reprezentarea simultană a până la 65536 de caractere. Acest standard specifică aranjamentul strict al simbolurilor folosite în țările lumii în tabelul de codificare. Așa cum vă puteți aștepta, primele 128 de caractere au rămas la fel ca în ASCII - numere, semne de punctuație, litera alfabetului latin. Pentru literele ruse alocate un loc cu coduri hexazecimal de la 401h la 458h. Există, de asemenea, locuri pentru semne grecești, arabe, japoneze și tibetane.

Standardul Unicode a fost susținut de Microsoft cu lansarea Windows 95. Fonturile Arial furnizate în compoziția sa. Curier Nou. Times New Roman nu conține mai mult de 256 de caractere, la fel ca în vechile fonturi, dar aproximativ 700. Desigur, nu toate caracterele Unicode sunt implementate în aceste fonturi. În versiunile paneuropene și ruse, aceste fonturi conțin simboluri ale țărilor europene (inclusiv alfabetul chirilic).







În Windows 3.x pentru folosirea simultană a caracterelor rusești și, de exemplu, specifice germanilor sau francezilor, au fost utilizate două fonturi diferite - una pentru chirilică, una pentru personaje germane sau franceze. Deseori aceste fonturi au fost dezvoltate de diferiți producători și diferă ușor în proiectarea lor. Toată lumea știe cazul când scrieți în titlul articolului "a-radiation" și folosiți fontul Symbol pentru simbolul grec a (alfa). Într-un moment în care totul este scris în setul academic. În acest caz, "alfa" va arăta ca o cioară albă pe fondul altor simboluri. Și nu se poate face nimic despre asta, nu există alt font decât Simbolul.

Caracteristici ale utilizării Unicode

Odată cu lansarea Windows 95, situația sa schimbat ușor în bine. acum în fonturile Unicode furnizate, de exemplu, în compoziția cu Windows 95, există simbolurile grecești și chirilice de care avem nevoie. Prin urmare, întregul cuvânt va arăta exact. Cu toate acestea, vechile programe nu au știut cum să lucreze cu caractere cu codificare dublu-octet. Pentru a evita această dificultate, au fost introduse în sistem fonturi "virtuale", cum ar fi Arial CE. Arial Cyr. Arial greacă, etc. De fapt, aceste fonturi nu sunt chiar acolo, toate sunt preluate din același Arial și sunt specificate în fișierul WIN. INI aproximativ după cum urmează:

Courier New Cyr, 204 = Courier New, 204

Courier New CE, 238 = Curier nou, 238

Times New Roman Cyr, 204 = Times New Roman, 204

Times New Roman CE, 238 = Times New Roman, 238

Aici numerele 204 și 238 nu denotă decât un tabel de coduri. 204 este layout-ul tastaturii chirilic, 238 este Central European, etc. Astfel, pentru programele Arial Cyr - un font care conține 256 de caractere, în a doua jumătate din care sunt litere rusești. În Arial CE pe acest loc există simboluri europene cum ar fi à (A cu un tilde) sau # 275; (e cu un prim).

Cu toate acestea, utilizarea acestei opțiuni nu este încă foarte convenabilă - pentru a trece la masa greacă trebuie să alegeți un font diferit. Dacă este necesar, modificați fontul Arial Times New Roman va trebui să prinde textul integral Arial CE și schimbați Times New Roman CE, și Arial Cyr, la rândul său, la Cyr Times New Roman, etc.

In dezvoltarea de Office 97, Microsoft a mers un pic alt mod, la jumătatea drumului la care a fost WordPad din Windows 95. Acum, toate personajele, fie ele greacă sau chirilice, sunt considerate ca fiind un singur tip și pagina de cod de selectare corespunzătoare are loc în funcție de limba în care atunci când tastați aceste caractere. Dacă treceți la aspectul rusesc, atunci când scrieți, puteți vedea litere rusești (Unicode 401h-458h). Atunci când introduceți în textul francez aceleași caractere vor apărea automat franceză (Unicode 0C0h-0FFh). Este mult mai convenabil și mai rapid.

În același timp, pentru a schimba fontul, este suficient să selectați tot textul și în loc de Arial să atribuiți Times New Roman. Și toate scrisorile, și rusii, și grecii, și francezii vor rămâne ei înșiși într-un font nou, tk. Acum, toate caracterele din Office 97 sunt codate cu 2 octeți simultan în codificarea Unicode. spre deosebire de versiunile anterioare ale Microsoft Office. Cel mai probabil, acesta a fost principalul motiv pentru care Microsoft a schimbat antetul fișierelor. DOC. făcându-le complet incompatibile cu versiunile anterioare. Și ce ați putea vedea prin deschiderea unui document Word 97, de exemplu, în Word 6.

soluţii

Opțiunea 1. Soluția cea mai simplă și cea mai onestă pare să fie utilizarea fonturilor Unicode. Cu toate acestea, în timp ce companiile naționale implicate în dezvoltarea de fonturi nu vor lansa versiuni noi ale fonturilor, această opțiune este greu acceptată. Deși astăzi multe companii străine, de exemplu, AG Group, au început să producă fonturi Unicode și, prin urmare, să conțină chirilic. Unele dintre aceste fonturi sunt livrate împreună cu CorelDraw în secțiunea "Fonturi Windows 95".

Opțiunea 3. Este de a "înșela" Office 97 și de a le împinge scrisori rusești sub masca de European. Pentru a face acest lucru în Windows 95 pentru a elimina rusă și, în cazul în care există și altele, cum ar fi ucraineană, Belarus, etc .. Tastatură. Apoi trebuie să puneți tastatura europeană, de exemplu, franceză, germană etc. În același timp, trebuie să vă schimbați aspectul în limba rusă, ucraineană etc. (Modul „Settings | Control Panel“, „tastatură“ tab-ul „Properties“ vă permite să modificați aspectul caracterelor disponibile de la tastatură). Astfel, atunci când tastarea pe un aspect de tastatură franceză, cu limba rusă Word 97 va genera coduri de caractere în intervalul de până la 255, care nu va depăși limitele caracterelor disponibile într-un TimesET tip de font. Pragmatica, etc. Aspectul negativ al acestui lucru, desigur, este excluderea posibilității de a lucra cu fonturile Unicode. Deși pentru a lucra cu ei, dacă este necesar, puteți pleca și tastatura nativă rusă. În plus, atunci când este setat la un „fpantsuzsko-engleză“ tastatură Word 97 vor fi alocate în mod automat limba franceză tastarea unui cuvânt care nu va folosi modul de verificare ortografică automată (spellchecker).

Din pozițiile descrise, decizia făcută de Microsoft este de înțeles. După apariția unui număr suficient de fonturi Unicode pentru a lucra cu texte în diferite limbi va deveni mult mai ușor decât acum.







Articole similare

Trimiteți-le prietenilor: