Revizuirea serviciilor online pentru recunoașterea optică a textelor

Există sisteme OCR de încredere și de calitate disponibile online?

Pentru a edita informațiile primite de la scaner, este necesar să se aplice tehnologia, numită OCR, care în decodare și în limba rusă înseamnă "recunoașterea optică a caracterelor". Ne-am întrebat dacă sunt disponibile sisteme on-line de încredere și de calitate OCR.







În domeniul recunoașterii optice a textului, din păcate, nu au existat revoluții în ultimii cinci ani, deși s-au produs unele schimbări. De exemplu, echilibrul dintre sistemele de recunoaștere desktop și utilizarea serviciilor web sa schimbat semnificativ. Nu se poate spune că piața OCR a devenit online, însă schimbarea conceptului de utilizare a unui computer, răspândirea tehnologiei mobile, Internetul, serviciile cloud dictează situațiile în care utilizatorul se confruntă cu faptul că nu există un computer staționar la îndemână.

Dar în caz de urgență poți să faci o fotografie și să încerci să "hrănești" o fotografie la unul dintre serviciile online OCR. Cel mai probabil, în timp, această cale va deveni mai populară, deci am decis să mergem la studiul spațiilor online în căutarea unui serviciu bun pentru recunoașterea textului scanat.

Nu ne-am stabilit sarcina de a găsi gratuit un serviciu gratuit, sugerând că pur și simplu nu ar fi așa. Cu toate acestea, s-au găsit resurse necomerciale de acest tip. Există, de asemenea, condiții gratuite, în care puteți recunoaște mai multe pagini "pe test". În orice caz, serviciul trebuie să susțină limba rusă și să nu necesite nicio instalare pe computer: uneori, este imposibil doar pe mașinile de birou.

Calitatea ultimului fișier a fost rea atât în ​​rezoluție, claritate, cât și în geometrie a imaginii, dar cea mai apropiată de condițiile de teren. Fotografiile au fost preluate din paginile obișnuite ale cărții, din raportul de afaceri și conțineau în plus față de text o masă simplă. Era cu un set complet de date atât de realist încât subiecții trebuiau să fie trimiși.

Primul care a început a fost Google cu documentele lor (docs.google.com). Nu toată lumea știe că, în plus față de colaborarea cu materialele, serviciul vă permite să recunoașteți un document încărcat ca imagine sau PDF. Nu este necesară nicio acțiune specială, totul se dovedește automat. Cu toate acestea, dimensiunea fișierului este limitată la 2 MB, astfel încât scanarea completă a paginii de carte nu a putut fi trimisă. Prin reducerea dimensiunii, am reușit să "scoatem" textul editat.

Revizuirea serviciilor online pentru recunoașterea optică a textelor

"Google Docs" a recunoscut cu ușurință pagina de întoarcere și sa confruntat cu textul. Calitatea lucrărilor nu poate fi estimată la mai mult de 4 puncte din 5, deoarece nu a existat un singur paragraf fără eroare. Cu toate acestea, este încă un ordin de mărime mai rapid și mai ușor decât tastarea textului de la zero.

Cu fișiere sursă complexe, lucrurile s-au agravat: calitatea recunoașterii a scăzut la "trei" pe o scară de cinci puncte și nu a existat nici o recunoaștere a formatării complexe și a tabelelor. Cu toate acestea, un rezultat satisfăcător a fost stabilit și resursa merită să fie preluată ca o modalitate eficientă de a obține un text dintr-un PDF sau o imagine.

Trecem la favoritul evident al testelor noastre. Abbyy a oferit de câțiva ani puterea completă a mecanismului său OCR prin intermediul serviciului web (finereader.abbyyonline.com). Diferențe față de versiunea desktop, desigur, sunt disponibile. În primul rând - în numărul de limbi acceptate ("doar" 49 față de aproape 200 în versiunea profesională a FineReader), precum și în absența oricăror opțiuni suplimentare pentru procesarea textului după recunoaștere.

Revizuirea serviciilor online pentru recunoașterea optică a textelor

Formatul de intrare poate fi aproape orice format grafic popular sau PDF fără o parolă, iar ieșirea - DOC, XLS, ODT, TXT și PDF. Puteți încărca documente de până la 30 MB.

Pentru a utiliza serviciul miracol, cu toate acestea, va trebui să plătiți. Capacitatea de scanare este cumpărată pe pagină, iar pentru 100 de pagini va trebui să plătiți 7 dolari. Cu toate acestea, calitatea merită - curățați 5 din 5!

În coada noastră avem un serviciu străin și un test despre cum se descurcă cu limba rusă. OCRonline (www.ocronline.com) lucrează cu 14 dintre cele mai populare limbi europene. Serviciul este oferit nu este gratuit, dar înregistrarea se plătește cinci liber „test“ pagina și, în plus, în fiecare luni soldul este alimentată în mod gratuit pentru majoritatea celor cinci pagini. Pachetele suplimentare pot fi achiziționate la un preț de 8 USD pe 100 de pagini și mai ieftine dacă sunt comandate în vrac.







Revizuirea serviciilor online pentru recunoașterea optică a textelor

Procesul de recunoaștere nu este foarte remarcabil. La ieșire, veți avea text în formatul DOC, TXT, PDF sau RTF. Dar rezultatele s-au dovedit curioase. Imaginile de înaltă calitate de la aparatul de fotografiat și de la un scanner de înaltă rezoluție au fost recunoscute perfect, de fapt, fără o singură greșeală. Un solid cinci! Cu o imagine de slabă calitate, serviciul a reușit, de asemenea, să se înveselească, chiar și masa nu a plecat nicăieri! Dar au existat destule bloturi, deci este imposibil să se facă o astfel de identificare excelentă. Dar 4 din 5 este un indicator foarte bun. Este necesar să luați această resursă pentru o notă pentru sarcini urgente.

Revizuirea serviciilor online pentru recunoașterea optică a textelor

Probele au arătat că acest serviciu este foarte sensibil la calitatea originalului. Imaginea de pe scaner în plin rezoluție a permis obținerea unui text foarte bun, aproape fără erori. Dar lucrul cu un cod sursă complex nu a reușit. Calitatea textului lasă mult de dorit, iar corectarea greșelilor în ea poate fi mai dificilă decât să introduceți singur textul.

Revizuirea serviciilor online pentru recunoașterea optică a textelor

Vom spune imediat că victoriile nu s-au dovedit. Nu acordați atenție designului deliberat de simplu al site-ului, pentru că nu suntem în spatele acestei situații. Dimensiunea maximă a fișierului încărcat este de numai 2 MB - nu este suficientă. Să presupunem că sunt acceptate formatele de bază (dar numai prima pagină este recunoscută în format PDF), iar limbile sunt destul de impresionante, însă numai textul fără formatare este afișat. În plus, pentru a descărca fiecare fișier trebuie să introduceți scrisori de la CAPTCHA.

Revizuirea serviciilor online pentru recunoașterea optică a textelor

O limită gratuită de 5 MB de imagini încărcate pe zi este disponibilă. Dacă aveți nevoie de mai mult, puteți deschide accesul pentru o zi cu SMS plătit la un preț declarat de aproximativ 20 de ruble.

Resursa New OCR (www.newocr.com) promite aplicarea în totalitate a tehnologiei OCR în documentele noastre scanate. Și trebuie să spun, cu o bună funcționalitate - în ceea ce privește capacitățile sale, acest serviciu este foarte bun. Judeca pentru tine: 58 de limbi, doi algoritmi OCR diferiti de a alege, download nelimitat fara a fi nevoie sa te inregistrezi gratuit (!), Toate formatele populare, inclusiv documentele cu mai multe pagini, chiar si fisierele arhivate.

Revizuirea serviciilor online pentru recunoașterea optică a textelor

Și cum rămâne calitatea OCR în sine? Cu materiale inițiale calitative, OCR a consultat bine. Erori sunt minime, și doar o oarecare confuzie cu formatarea vă forțează să puneți un minus la cele cinci meritate. Puteți încerca să îmbunătățiți rezultatul selectând între două mecanisme de recunoaștere.

Din motive de exhaustivitate, să menționăm încă un site. El nu promite nimic suprasolicitat, dar este liber și are o interfață frumoasă, după cum puteți vedea pentru dvs., prin vizionarea site-ului www.sciweavers.org/free-online-ocr. Suportă 33 de limbi și toate formatele grafice populare pentru fișierul sursă. Calitatea recunoașterii nu poate fi numită restante, dar într-o fotografie bună textul este determinat cu un minim de erori și aproape că nu necesită corecție. Cu imagini proaste ale necazurilor și din setul de simboluri care rezultă fără sens. Dar gratuit - de această dată, și este însoțită de o grămadă de alte servicii utile pentru a rezolva sarcinile zilnice de conversie a datelor digitale - acestea sunt două.

Revizuirea serviciilor online pentru recunoașterea optică a textelor

Evaluarea "citirii"

După cunoașterea tuturor acestor sisteme, puteți trage unele concluzii. În primul rând - și aceasta este o veste bună! - serviciile online pentru recunoașterea textului sunt și funcționează bine. Mulți sunt chiar liberi, ceea ce, mărturisesc, a fost o surpriză plăcută.

Unele servicii totuși s-au confruntat cu cazuri "dificile", astfel încât să le punem cu încredere în conducerea revizuirii. Mai întâi de toate, acesta este FineReader Online. Dintre recunoașterii online gratuite, noul OCR sa dovedit mai bun decât alții. Prin urmare, pentru aceste două servicii am acordat simbolul "recomandă Hard'n'Soft".

Recunoașteți și traduceți!

În lumea deschisă de astăzi, se întâmplă adesea că trebuie să înțelegeți urgent ceea ce se spune pe o foaie de hârtie sau într-un document PDF. Problema este că poate fi într-o limbă străină. Deci, în câteva resurse OCR trebuie să găsești un translator online.

Considerat în recenzia noastră, un site OCR nou, imediat după recunoaștere, sugerează transferarea documentului în Google Translate (translate.google.com). Acesta este unul dintre cei mai renumiți traducători online, care operează zeci de perechi de limbi, în timp ce are o interfață simplă și nu conține restricții stricte asupra lungimii textului tradus, astfel încât documentul scanat va fi citit imediat.

Din traducerea automată a miracolelor în termeni de excelență nu trebuie să așteptați, totuși calitatea traducerilor Traducerea Google este considerată bună și, de obicei, acest site este folosit mai întâi.

O soluție alternativă este serviciul online www.trans-late.ru al companiei naționale PROMT. Dar există o limită de 3 mii de caractere pentru un transfer unic. Deci rândul cărții trebuia tradus în două etape.

Folosind aceste sau alte servicii de traducere on-line după recunoașterea optică, problema perceperii conținutului unui material într-o limbă necunoscută ar trebui pur și simplu să nu mai aibă loc. Încă să uniți toate cele mai bune realizări, da într-o interfață, da gratuit.

Revizuirea serviciilor online pentru recunoașterea optică a textelor







Trimiteți-le prietenilor: