Traducerea automată este

Forme de interacțiune pe calculator și calculator în traducere automată

Traducere automată

În locul "mașinii" se utilizează uneori cuvântul automat. care nu afectează semnificația. Cu toate acestea, termenul de traducere automată are un înțeles complet diferit - prin aceasta, programul ajută pur și simplu o persoană să traducă texte.







Traducerea automată implică astfel de forme de interacțiune:

  • Traducere parțial automatizată: de exemplu, folosind un traducător uman ca dicționare de calculator.
  • Sistem cu diviziune a muncii: computerul este instruit pentru a traduce doar fraze specificate în mod rigid structura (dar face, astfel încât nu au nevoie să-l corecteze), și toate nu a reușit să îndeplinească schema dă o persoană.

În terminologia vorbită în limba engleză, termenii englezi sunt de asemenea diferiți. traducere automată, MT (traducere automată complet) și engleză. asistată de mașină sau engleză. traducere asistată de mașină (MAT) (automatizată); Dacă este necesar să se desemneze ambele, scrieți M (A) T.

Există două abordări fundamentale diferite ale construirii algoritmilor de traducere automată: bazate pe reguli și statistice sau bazate pe date statistice. Prima abordare este utilizată de majoritatea dezvoltatorilor convenționale și sistemele de traducere automată (în rusă, PROMPT SYSTRAN Franța, Linguatec în Germania etc.). [1] Al doilea tip se referă serviciu popular Google Translate [2]. precum și un nou serviciu de la ABBYY [3]

Traducere automată statistică

Traducerea mașinilor statistice este un fel de traducere automată a textului, pe baza comparării volumelor mari de perechi de limbi. Perechile de limbă - textele care conțin propoziții într-o singură limbă și propozițiile lor corespunzătoare pe a doua pot fi fie variante de scriere a două propoziții de către o persoană care este vorbitor nativ de două limbi, fie printr-un set de propoziții și traducerile efectuate de o persoană. Astfel, traducerea automată statistică are proprietatea "auto-învățării". Cele mai multe perechi de limbi sunt disponibile și cu cât mai exact corespund una cu cealaltă, cu atât este mai bine rezultatul traducerii mașinilor statistice. Termenul "traducere automată statistică" înseamnă o abordare generală a soluției problemei traducerii, care se bazează pe căutarea traducerii celei mai probabile a unei propoziții utilizând datele obținute dintr-un set de texte bilingv. Ca exemplu de set de texte bilingve, se pot numi rapoarte parlamentare, care sunt minute ale dezbaterilor în parlament. Rapoartele parlamentare bilingve sunt publicate în Canada, Hong Kong și în alte țări; documentele oficiale ale Comunității Economice Europene sunt publicate în 11 limbi; iar Organizația Națiunilor Unite publică documente în mai multe limbi. După cum sa dovedit, aceste materiale sunt resurse neprețuite pentru traducerea mașinilor statistice.

Istoria traducerii mașinilor







Ideea utilizării unui calculator pentru traducere a fost exprimată în 1947 în Statele Unite. imediat după apariția primului computer. Prima demonstrație publică a traducerii mașinilor (așa-numitul experiment Georgetown) a avut loc în 1954. În ciuda primitivității acestui sistem (un dicționar de 250 de cuvinte, o gramatică de 6 reguli, traducerea câtorva fraze simple), acest experiment a primit un răspuns amplu: studiile au început în Anglia. Bulgaria. GDR. Italia. China. Franța. Germania de Vest. Japonia și alte țări; în același an 1954 și în URSS.

La mijlocul anilor 1960, în Statele Unite au fost furnizate două sisteme de traducere ruso-engleză pentru uz practic:

  • MARK (în Departamentul de Tehnologie Externă a Forțelor Aeriene ale SUA);
  • GAT (dezvoltat de Universitatea Georgetown, a fost utilizat în Laboratorul Național de Energie Atomică din Oak Ridge și în centrul Euratom al Ispra, Italia).

Cu toate acestea, comisia ALPAC creată pentru a evalua astfel de sisteme a ajuns la concluzia că, din cauza calității scăzute a textelor traduse prin mașină, această activitate în SUA este neprofitabilă. Deși comisia a recomandat continuarea și aprofundarea evoluțiilor teoretice, în ansamblu, concluziile sale au condus la o creștere a pesimismului. reducerea finanțării, de multe ori până la încetarea completă a lucrărilor pe această temă.

Cu toate acestea, în mai multe țări, cercetarea a continuat, ceea ce a fost facilitat de progresul continuu al tehnologiei informatice. Un factor deosebit de important a fost apariția computerelor mini- și personale. și cu ele din ce în ce mai complexe dicționare, căutare, etc sisteme, orientate să lucreze cu date de limbaj natural. A existat o nevoie tot mai mare de traducere ca atare, având în vedere legăturile internaționale în creștere. Toate acestea au dus la o nouă creștere în acest domeniu, care a început aproximativ de la mijlocul anilor '70. În anii 1980, a fost timpul pentru o utilizare practică la scară largă a sistemelor de traducere, o piață pentru dezvoltarea comercială pe această temă dezvoltată.

Cu toate acestea, visurile, cu care omenirea în urmă cu o jumătate de secol a preluat sarcina de traducere automată, rămân în mare parte vise: traducerea de înaltă calitate a textelor de teme largi este încă imposibilă. Cu toate acestea, este incontestabil să se accelereze activitatea unui interpret atunci când se utilizează sisteme de traducere automată: în conformitate cu estimările de la sfârșitul anilor 1980, de până la cinci ori.

În prezent, există multe proiecte comerciale de traducere automată. Unul dintre pionierii în domeniul traducerilor mecanice a fost compania Systran. În Rusia, o mare contribuție la dezvoltarea traducerii mașinilor a fost făcută de un grup condus de prof. RG Piotrovsky (Universitatea Pedagogică de Stat din Rusia, numită după AI Herzen, Sankt-Petersburg).

Calitatea traducerii

Poate că această secțiune conține un studiu original.

Adăugați referințe la surse, altfel pot fi șterse.
Informații suplimentare se găsesc pe pagina de discuții.

Cel mai adesea, o astfel de glumă, datorită faptului că programul nu recunoaște contextul fraze și termeni se traduce cuvânt cu cuvânt, la fel fără a distinge numele proprii de cuvinte comune. Același traducător promt transformă „Lev Tolstoi“, în «Lion Gros» ( «Lev Tolstoi»), «sutien-KET notație» în „Nota Kate sutien», «algebra Lie» - în „Algebra Lie», «vectorul excentricitate» - în "vectorul originalității", "Shawnee Smith" în "Shawnee Smith Indian" și așa mai departe. Google Translator. dimpotrivă, cuvântul "orez" adesea lua numele Secretarului de Stat al Statelor Unite.

notițe

  1. ↑ Traducere automată: reguli împotriva statisticilor
  2. ↑ Google Translate
  3. ↑ Noua abordare ABBYY pentru traducerea textelor
  4. ↑ Totuși, acest lucru nu este adevărat: Polyglossum (sic) este un dicționar electronic [1]. program de aceeași clasă ca Lingvo. nu pot traduce independent. În timp ce a existat în versiuni pentru DOS și Windows 3.x, și, în al doilea rând Lingvo și calitatea Contextul vocabularului general, are un volum record de dicționare de specialitate. În plus, unele erori de traducere produc fals - după traducerea mașinii textul a fost editat manual [2]. „Un exemplu minunat al textului, obținut ar fi cu ajutorul vocabularului medicale și biologice, ca urmare a transferului de gestionare a conducătorului auto mouse-ului, numit“ șoareci Drover „... Eu nu cred în puritatea experimentului: sigur nu au existat modificări la textul mâna omului.“
  5. ↑ Pisica noastră a dat naștere la trei pisoi - două alburi și un afro-american






Articole similare

Trimiteți-le prietenilor: