Cum se detectează și se recunoaște textul dintr-o imagine

Politica de confidențialitate

Această politică de confidențialitate a informațiilor cu caracter personal (în continuare - Politica) se aplică tuturor informațiilor pe care site-ul (se poate obține în timp ce folosește Acordul utilizatorului site-ului pentru furnizarea de informații cu caracter personal conferit în conformitate cu această politică în cadrul relațiilor cu una dintre părți. , de intrare, se aplică tuturor persoanelor.

Utilizarea Site-ului înseamnă consimțământul necondiționat al utilizatorului cu privire la această Politică și termenii de procesare a informațiilor sale personale specificate în aceasta; În caz de dezacord cu aceste condiții, utilizatorul trebuie să se abțină de la utilizarea Serviciilor.

1. Informațiile personale ale utilizatorilor pe care Site-ul le primește și le procesează

1.1. În cadrul acestei politici, "informații cu caracter personal" înseamnă:

1.1.1. Informații personale pe care utilizatorul le furnizează despre completarea formularelor de feedback, inclusiv a informațiilor personale ale utilizatorului. Informațiile necesare pentru furnizarea serviciilor (servicii de randare) sunt marcate într-un mod special. Alte informații sunt furnizate de utilizator la discreția sa.

1.3. În general, site-ul nu verifică autenticitatea informațiilor personale furnizate de utilizatori și nu exercită controlul asupra capacității lor juridice. Cu toate acestea, site-ul presupune că utilizatorul oferă informații personale fiabile și suficiente cu privire la problemele oferite în formularul de înregistrare și păstrează aceste informații la zi.

2. Obiectivele colectării și procesării informațiilor personale ale utilizatorilor

2.1. Site-ul colectează și stochează numai acele date personale care sunt necesare pentru furnizarea și furnizarea de servicii (executarea contractelor și a contractelor cu utilizatorul). 2.2. Informații personale ale utilizatorului Site-ul poate fi utilizat în următoarele scopuri:

2.2.1. Identificarea părților în conformitate cu acordurile și contractele cu site-ul

2.2.2. Furnizarea de servicii personalizate utilizatorului;

2.2.3. Comunicarea cu utilizatorul, inclusiv trimiterea de notificări, solicitări și informații privind utilizarea serviciilor, furnizarea de servicii, precum și prelucrarea cererilor și aplicațiilor de la utilizator;

2.2.4. Îmbunătățirea calității, ușurința în utilizare, dezvoltarea serviciilor;

2.2.6. Efectuarea de studii statistice și alte studii bazate pe date impersonale.

3. Condiții pentru prelucrarea informațiilor personale ale utilizatorului și transferarea acestuia către terți

3.1. Site-ul stochează informațiile personale ale utilizatorilor în conformitate cu reglementările interne ale serviciilor specifice.

3.2. În ceea ce privește informațiile personale ale utilizatorului, rămâne confidențialitatea acestuia, cu excepția cazurilor de furnizare voluntară de către utilizator a informațiilor despre el însuși pentru accesul general la un număr nelimitat de persoane. Atunci când utilizează Servicii separate, utilizatorul este de acord că o anumită parte a informațiilor sale personale devine accesibilă publicului.

3.3. Site-ul are dreptul de a transfera informațiile personale ale utilizatorilor către terți în următoarele cazuri:

3.3.1. Utilizatorul și-a exprimat consimțământul față de astfel de acțiuni;

3.3.2. Transferul este necesar ca parte a utilizării de către un anumit serviciu a unui anumit serviciu sau pentru furnizarea serviciului utilizatorului; 3.3.3. Transferul este prevăzut de legislația rusă sau de alte reglementări aplicabile în cadrul procedurii stabilite prin lege;

3.3.4. Acest transfer are loc în cadrul unei vânzări sau de alt tip de transfer de afaceri (în totalitate sau parțial), în timp ce la dobânditorul își asumă toate obligațiile pentru a se conforma cu termenii acestei politici cu privire la informațiile primite de acesta;

3.3.5. Pentru a asigura posibilitatea de a proteja drepturile și interesele legitime ale Site-ului sau ale terților în cazurile în care utilizatorul încalcă site-ul Acordului privind serviciile de utilizator.

3.4. La prelucrarea datelor personale ale utilizatorilor, site-ul este guvernat de Legea federală a Federației Ruse "Cu privire la datele cu caracter personal".

4. Modificarea de către utilizator a informațiilor personale 4.1. Utilizatorul poate oricând să schimbe (actualizeze, completeze) informațiile personale furnizate de el sau de partea sa, precum și parametrii confidențialității acestuia.

5. Măsurile luate pentru a proteja informațiile personale ale utilizatorilor site-ului trebuie să ia măsurile organizatorice și tehnice necesare și suficiente pentru a proteja informațiile personale ale utilizatorului împotriva accesului neautorizat sau accidentale, distrugerea, modificarea, blocarea, copierea, distribuirea, precum și alte acțiuni ilegale ale unor terțe părți cu ea .

6. Schimbarea politicii de confidențialitate. Legea aplicabilă

6.2. La această politică și la relația dintre utilizator și site. apărute în legătură cu aplicarea Politicii de confidențialitate, se aplică legea Federației Ruse.

Cum se detectează și se recunoaște textul dintr-o imagine

Segmentarea textului dintr-o scenă nestructurată ajută foarte mult la rezolvarea unor sarcini suplimentare, cum ar fi recunoașterea optică a caracterelor (OCR). Recunoașterea automată a textului în acest exemplu detectează un număr mare de regiuni în care textul poate fi conținut și elimină treptat acele zone în care există o mare probabilitate de lipsă de text.

Identificați zonele imaginii în care există text folosind MSER

Folosind funcția detectMSERFeatures, găsim imaginile și graficul tuturor regiunilor. Rețineți că funcția evidențiază, de asemenea, multe domenii non-text:

Ștergeți zonele fără text

Funcția MSER vizează recunoașterea zonelor de text, însă în timpul activității sale detectează și multe alte regiuni non-textuale. Putem ocoli toate domeniile selectate pentru a elimina regiunile inutile, non-textuale. Pentru a filtra zonele fără text, puteți utiliza proprietățile geometrice ale textului. De asemenea, putem utiliza abordarea de învățare a mașinilor pentru a pregăti clasificatorii text și non-text. Ca regulă, o combinație a acestor două abordări oferă rezultate mai bune. În acest exemplu, vom folosi o abordare simplă pentru filtrarea regiunilor non-text pe baza proprietăților geometrice.

Există mai multe proprietăți geometrice care sunt necesare pentru recunoașterea zonelor de text și nontext:

Utilizăm funcția regionprops pentru a măsura aceste proprietăți și apoi vom începe să ștergem regiunile care nu ne sunt potrivite:

Eliminarea regiunilor non-text pe baza lățimii contururilor

O altă metodă obișnuită folosită pentru a recunoaște textul este lățimea cursei. Lățimea cursei este măsura lățimii curbelor și liniilor care alcătuiesc caracterul imaginii. Regiunile care conțin text, de regulă, au o mică răspândire în lățimea stroke, iar regiunile non-text au mai multe variații.

Pentru a înțelege cum se modifică lățimea cursei pentru a elimina regiunile non-text, trebuie să estimați lățimea cursei tuturor zonelor detectate de funcția MSER. Putem face acest lucru prin calcularea distanței și a funcționării binare a subțierelor:

Imaginile de mai sus sunt afișate. deoarece lățimea accidentului vascular cerebral are schimbări foarte ușoare pentru cea mai mare parte a regiunii. Aceasta înseamnă că regiunea are șanse mai mari de a fi o zonă de text, deoarece liniile și curbele care conturează regiunea au o lățime similară.

Pentru a utiliza metoda de modificare a lățimii cursei, este necesar să introduceți o valoare de prag, care se modifică în întreaga regiune după cum urmează:

Apoi, se poate aplica un prag pentru a elimina regiunile non-text. Rețineți că acest prag poate necesita particularizarea pentru imaginile cu diferite stiluri de fonturi.

Procedura de mai sus trebuie efectuată separat pentru fiecare zonă detectată de MSER. Următoarele pentru buclă procesează toate regiunile și apoi afișează rezultatele eliminării zonelor non-text prin modificarea lățimii cursei.

Combinând zonele rezultate pentru rezultatul final al detectării textului

În acest moment, toate rezultatele detectării constau în caractere separate de text. Pentru a utiliza aceste rezultate pentru activități de recunoaștere, simbolurile de text separate trebuie combinate în cuvinte sau șiruri. Aceasta vă permite să recunoașteți cuvintele din imagine care conțin informații mai importante decât literele individuale.

Pentru a combina regiunile separate în cuvinte sau linii de text, trebuie mai întâi să găsiți text din regiunile învecinate și apoi să formați un cadru în jurul acestor regiuni. Pentru a găsi regiuni învecinate, trebuie să extindeți cadrele calculate anterior de regionprops.

Acum, cadrele care se suprapun pot fi combinate pentru a forma o cutie de legare în jurul cuvintelor individuale sau liniilor de text. Pentru a face acest lucru, calculați factorul de suprapunere între toate perechile casetei de legare. Aceasta determină distanța dintre toate perechile de regiuni de text, astfel încât să puteți găsi grupuri din regiunile învecinate care au coeficienți de suprapunere non-zero. După o pereche de suprapuneri folosind graficul, coeficienții sunt calculați pentru a găsi toate regiunile de text "conectate" cu coeficienți de suprapunere non-zero.

Vom folosi funcția bboxOverlapRatio pentru a calcula factorii de suprapunere perechi pentru toate cadrele extinse și apoi utilizați graficul pentru a găsi toate regiunile conectate.

Ieșirea conncomp este un index al regiunilor care conțin text care este marcat de granițe. Folosind acești indicatori, putem combina mai multe cadre vecine într-un singur cadru prin calcularea blocurilor minime și maxime ale blocurilor individuale de constrângere care alcătuiesc fiecare componentă de conectivitate.

În cele din urmă, înainte de a afișa rezultatele finale ale detectării, trebuie să scăpați de textul detectat prost.

Recunoașteți textul utilizând OCR

După ce ați găsit zonele de text, utilizați funcția ocr pentru a recunoaște textul în fiecare cadru. Rețineți că fără a căuta în zona de text, multă zgomot va fi prezent la ieșirea din ocr.

Astfel, am reușit să recunoaștem textul din imagine.