Alfabet, identificatori, cuvinte cheie și constante c

În text, în orice limbă naturală, există patru elemente de bază: simboluri, cuvinte, fraze și propoziții. Elementele similare conțin un limbaj algoritmic, doar cuvintele sunt numite lexeme (construcții elementare), combinațiile de cuvinte sunt expresii, iar propozițiile sunt numite operatori. Lexemurile sunt formate din simboluri, expresii din lexeme și simboluri și operatori din simboluri, expresii și lexeme. Această intrare discută alfabetul limbajului de programare C ++ și al lexemelor sale.







Alphabet C ++

Alfabetul C ++ include:

  • litere latine literare mari și mici și un subliniere;
  • Cifre arabe de la 0 la 9;
  • semne speciale:. <>. | [] () + - /% *. \ '. <=>. #
-; ^
  • Caractere spațiale: spațiu, caractere tab, caractere noi.

Din simbolurile alfabetului se formează următoarele lexeme:

  • ID-uri;
  • cuvinte cheie (rezervate);
  • semne de operațiuni;
  • constante;
  • Separatoare (paranteze, intervale, virgule, spații albe).

Limitele tokenilor sunt definite de alte lexeme, cum ar fi delimitatorii sau semnele de operare.

identificatorii

Un identificator este numele unui obiect software. Identificatorul poate folosi litere latine, numere și un subliniere. Literele majuscule și litere mici sunt diferite, de exemplu, sysop, SySoP și SYSOP - trei nume diferite. Primul caracter al identificatorului poate fi o literă sau o subliniere, dar nu o cifră. Spațiile din nume nu sunt permise.

ar trebui să dea obiectele nume semnificative pentru a îmbunătăți lizibilitatea. Există un acord cu privire la regulile de creare a numelor numite notația din Ungaria (după cum a sugerat angajat ei Microsoft naționalitate maghiară), în care fiecare cuvânt constituie un identificator începe cu o literă de capital, și în primul rând a pus prefixul corespunzător tipului de magnitudine, de exemplu, iMaxLength, IpfnSetFirstDialog.
O altă tradiție este separarea cuvintelor care alcătuiesc numele cu subliniere: maxjength, number_of_galosh.

  • identificatorul nu trebuie să coincidă cu cuvintele cheie și cu numele obiectelor standard de limbă folosite;
  • Nu se recomandă să se inițieze identificatori cu caracter de subliniere, deoarece pot coincide cu numele funcțiilor sau variabilelor sistemului și, în plus, reduc mobilitatea programului;
  • identificatorii utilizați pentru a defini variabilele externe sunt constrânși de linker (folosind diferite linkere sau versiuni linker impune cerințe diferite asupra denumirilor variabilelor externe).






Cuvinte cheie

Cuvintele cheie sunt identificatori rezervați care au o semnificație specială pentru compilator. Ele pot fi folosite numai în sensul în care sunt definite. O listă de cuvinte cheie C ++ este prezentată în tabelul de mai jos.

Lista de cuvinte cheie C ++

Semne de operațiuni

Un simbol de operație este unul sau mai multe caractere care definesc o acțiune asupra operanzilor. În interiorul semnei operației, spațiile nu sunt permise. Operațiile sunt împărțite în unari, binari și ternari prin numărul de operanzi care participă la ele. Operatorii sunt afișați într-o notă separată - C ++

Același semn poate fi interpretat în moduri diferite, în funcție de context. Toate semnele de funcționare cu excepția [], () și. sunt token-uri separate.

Cele mai multe operații standard pot fi redefinite (supraîncărcate).

Constantele se numesc cantități imuabile. Există constante întregi, reale, caracter și șir. Compilatorul, alocând o constantă ca un token, îl atribuie uneia dintre tipuri prin aspectul său (puteți specifica singur formatul constantei).

Formatele constantelor corespunzătoare fiecărui tip sunt date în tabelul de mai jos.

Zecimal: o secvență de cifre zecimale, pornind de la zero, cu excepția cazului în care este un număr zero

Octal: zero, dincolo de care

urmat de cifre octale

Hexadecimal: 0x sau 0X,

urmat de hexazecimal

O secvență de caractere încadrată în ghilimele

"Aici a fost Vasia", "\ t3 punctul r = \ 0xF5 \ n"

Nu uitați că fiecare tip de date are o serie de valori admise.

Dacă este necesar pentru a genera o întreagă sau negativă constantă reală, constanta este plasată în fața operațiunii semn inversare unară (-), de exemplu, -218, -022, -0h3C, -4.8, -0.1e4.

constantă reală în notație științifică este reprezentată ca o mantisă și ordine. Mantisa este înregistrat pe partea stângă a semnului exponent (E sau e), ordinea - dreptul semnului. o valoare constantă definită ca mantisa produs și ridicat în modul indicat în gradul de 10. De remarcat că decalajele nu sunt permise într-un număr, și pentru separarea partea întreagă a fracțiunii este utilizată nu virgulă și perioada.

Toți literalii de șir sunt tratați de compilator ca obiecte diferite.

Conțintele de coarde, separate în program doar prin caracterele spațiului alb, sunt combinate într-o singură dată când sunt compilate. O constantă string constantă poate fi plasată pe mai multe linii, folosind o caracteristică de transport, urmată de o rupere de linie. Aceste caractere sunt ignorate de compilator, iar următoarea linie este percepută ca o continuare a celei anterioare. De exemplu, un șir

"Nimeni nu este fericit cu lui \
aspect, dar toată lumea este fericit \
mintea ta "

este complet echivalent cu șirul

"Nimeni nu este mulțumit de apariția lui, dar toți sunt mulțumiți de mintea lui"

La sfârșitul fiecărui șir literal, compilatorul adaugă un caracter nul reprezentat de secvența de evacuare \ 0.
Prin urmare, lungimea șirului este întotdeauna mai mult decât numărul de caractere din înregistrarea sa. Astfel, un șir gol. are o lungime de 1 octet.

Rețineți diferența dintre un șir de caractere unic, cum ar fi "A" și caracterul constant "A".

O constantă de caractere goală nu este validă.

Bazat pe cartea "Programarea într-un limbaj de nivel înalt C \ C ++", Pavlovskaya Т.А.

Navigare după înregistrări







Articole similare

Trimiteți-le prietenilor: