Ghidul lui Mysql Professional

Rețineți că în sindicatele ucs2_roman_ci și utf8_roman_ci I și J sunt considerate echivalente, ca și perechea U și V.

Sindicatele ucs2_hungarian_ci și utf8_hungarian_ci au fost adăugate în MySQL 5.1.5.







MySQL îmbină utf8_unicode_ci în conformitate cu algoritmul de colocare Unicode (UCA) descris mai sus. Sindicatul utilizează versiunea 4.0.0 a tastelor de greutate UCA. Următoarea discuție folosește utf8_unicode_ci, dar acest lucru este valabil și pentru ucs2_unicode_ci.

În prezent, utf8_unicode_ci are doar un sprijin parțial pentru algoritmul de colocare Unicode. Unele caractere nu sunt încă furnizate. De asemenea, nu combină pe deplin etichetele. Acest lucru afectează în primul rând vietnameze și unele limbi mai puțin populare în Rusia, cum ar fi Udmurt, Tatar, Bashkir și Mari.

Proprietatea mai veche în utf8_unicode_ci: aceasta acceptă extensii, adică atunci când un caracter este comparat ca fiind egal cu combinațiile altor caractere. De exemplu, în limba germană și în alte limbi ├I este egală cu ss.

utf8_general_ci O conexiune care nu acceptă extensii. Acest lucru poate face doar comparații unu-la-unu între simboluri. Aceasta înseamnă că comparațiile pentru utf8_general_ci sunt mai rapide, dar puțin mai puțin corecte decât comparațiile utf8_unicode_ci.







De exemplu, următoarele ecuații sunt valide în utf8_general_ci și utf8_unicode_ci:

Diferența dintre uniuni: aceasta este valabilă pentru utf8_general_ci:

Deși acest lucru este valabil pentru utf8_unicode_ci:

MySQL implementează legături specifice limbajului pentru setul de caractere utf8 numai dacă comanda cu utf8_unicode_ci nu funcționează bine pentru limbă. De exemplu, utf8_unicode_ci funcționează bine pentru germană și franceză, deci nu este nevoie să creați conexiuni speciale utf8 pentru aceste două limbi.

utf8_general_ci este, de asemenea, satisfăcătoare pentru germană și franceză, cu excepția faptului că ├I este egal, dar ss. Dacă acest lucru este acceptabil pentru programul dvs. de aplicație, utilizați utf8_general_ci, deoarece este mai rapid. În caz contrar, utilizați utf8_unicode_ci, deoarece acest lucru este mai precis.

utf8_swedish_ci, ca și alte utilități specifice utf8, este derivat din utf8_unicode_ci cu reguli de limbă suplimentare. De exemplu, în limba suedeză, următoarele legături de stocare care nu se aplică pentru limba germană sau franceză:

Asociațiile utf8_spanish_ci și utf8_spanish2_ci corespund spaniolului modern și tradițional, respectiv. În ambele uniuni ├▒ (n-tilde) există un simbol separat între n și o. În plus, pentru un spaniol tridionic ch, un singur caracter între c și d și un singur caracter între l și m

seturi de caractere din Europa de Vest acoperă cele mai multe limbi din Europa de Vest, cum ar fi franceză, spaniolă, catalană, bască, portugheză, italiană, albaneză, olandeză, germană, daneză, suedeză, norvegiană, finlandeză, Faroeză, islandeză, irlandeză, scoțiană și engleză.

Ascii se alătură (US ASCII):

ascii_general_ci (valoarea implicită)

Asociații cp850 (DOS vest-european):

cp850_general_ci (valoarea implicită)







Trimiteți-le prietenilor: