Cum pot obține rapid toate literele din alfabetul rus sau englez

După cum vedeți foaia obișnuită plină cu valori, nu există nicio eroare în planul de sintaxă, dar există un minus, toate valorile au fost introduse manual. Pe de o parte, valorile nu de mult, doar 26, este, în principiu, este posibil și să introduceți, dar în cazul în care, de exemplu, trebuie să adăugați una mai multe din aceeași foaie, care va conține toate literele alfabetului rus sau doar două liste de ambele alfabete în litere mici, ca fiind apoi , de asemenea, toate mâinile pentru a intra? Desigur, puteți găsi și copia o listă de valori gata făcute și nu trebuie să introduceți nimic manual, dar există încă o cale, voi spune despre acest lucru în acest articol.







Cum să obțineți toate literele alfabetului englez

În primul rând, ne amintim că există un astfel de lucru ca Unicode. Unicode este un standard de codare a caracterelor care vă permite să reprezentați semnele aproape tuturor limbilor scrise Wikipedia. În prezent sunt rezervate 1.112.064 poziții de caractere, din care în prezent sunt utilizate peste 100 000. Spațiul de cod Unicode este împărțit în 17 planuri. Suntem interesați de un plan zero (bază multilingvă) având un interval de la U + 0000 până la U + FFFF. Planul zero, conține simboluri, scripturi adesea folosite și este, de asemenea, rupt în anumite zone (intervale).







Toate domeniile din noi, desigur, nu sunt interesate, vom lucra doar cu anumite valori. Și astfel, de exemplu, în programul nostru, avem nevoie pentru a obține toate literele alfabetului englezesc de la A la Z. Trebuie doar să explice că Unicode nu conține litere ale alfabetului englez, în același mod ca și scrisoarea nu conține alfabetul germană, rusă. Și toate pentru că, deși noi spunem, de exemplu, litere ale alfabetului englez, de fapt, toate literele germană, italiană, franceză și de limba engleză este format din 26 de litere ale alfabetului. Prin urmare, trebuie să căutăm zona alocată alfabetului latin.

Gama principală, alocată sub alfabetul latin de la U + 0020 până la U + 007F (Main Latin), unde U Unicode, urmată de patru numere hexazecimale. Desigur, nu avem nevoie de toată această zonă, pentru că, în afară de scrisori, există și multe alte semne și numere în ea, care nu ne interesează încă.

Rezultatele sunt aceleași.

Regiunea selectată sub scriptul latin ocupă intervalul de la \ u0020 la \ u007F (\ x20 - \ x7F). Această gamă de bază, care, pe lângă litere, conține și numere și simboluri (%, $, #), avem nevoie de un segment care să conțină numai litere ale alfabetului latin. Vreau doar să spun că literele sunt reprezentate ca și litere mari, adică toate literele de la A la Z sunt mari, și cu litere mici, când toate literele de la a la z sunt mici.

Recrutem o echipă pentru organizarea și desfășurarea de seminarii web.

Zona alocată literelor mari: de la \ x41 la \ x5A







Articole similare

Trimiteți-le prietenilor: