Răspunsuri la întrebările cititorilor, prosound

Răspunsuri la întrebările cititorului ProSound.iXBT.com

Alexey Lukin, dezvoltator șef al algoritmilor iZotope RX

Reamintim că am creat un subiect special în cadrul conferinței. unde cineva ar putea pune întrebarea lui Alexei. Suntem foarte mulțumiți de faptul că cititorii noștri au răspuns la acest apel și a început o discuție foarte utilă și substanțială. Cu această ocazie, am adăugat câteva întrebări editoriale.







Răspunsuri la întrebările cititorilor, prosound

În cazul în care dezvoltatorii își iau ideile, dacă nu secrete? Doriți feedback de la utilizatori?
Idei pentru dezvoltatorii iZotope provin din diferite surse. Aceasta este comunicarea cu utilizatorii la expoziții și lucrul cu testeri beta, recenzii ale produselor noi de la concurenți și idei proprii. De obicei în idei nu există lipsă. Este mult mai dificil - cu resurse pentru implementarea și planificarea lor: ce trebuie făcut mai întâi și la ce să plece mai târziu. În dezvoltarea RX 3, la cererea utilizatorilor, au fost adăugate caracteristici precum inversarea selecției, alocarea manuală a armonicilor prin numere și statisticile nivelurilor de semnal. De asemenea, am avut multe cereri pentru un denoiser pentru dialoguri cu o bună automatizare. Ca rezultat, sa dovedit a fi Dialogul Denoiser.

Are RX 3 avantajul utilizării arhitecturii pe 64 de biți a celor mai recente procesoare?
RX este disponibil atât în ​​versiunile pe 32 de biți, cât și pe cele pe 64 de biți. Nu există o diferență deosebită de viteză între cele două. Principalul avantaj al versiunii pe 64 de biți este posibilitatea utilizării mai multor memorii RAM. Cu procesarea simultană a mai multor fișiere, cantitatea necesară de memorie crește proporțional cu numărul de fișiere. În plus, alegerea versiunii poate fi afectată de dorința de a descărca plug-in-uri terță parte: o aplicație RX pe 32 de biți încarcă numai plug-in-uri pe 32 de biți și plug-in-uri pe 64 de biți numai pe 64 de biți.

Cât de rapid este efectul intensiv în comparație cu RX 2?
Cea mai mare parte a prelucrării în RX 3 este mai rapidă decât în ​​RX 2. Mai ales diferența este evidentă în aplicație: procesarea fișierelor lungi din acesta este paralealizată mai eficient între miezurile procesoarelor. Accelerația este de obicei de 1,5-2 ori, dar depinde foarte mult de algoritmul și procesorul particular.

Există o instrucțiune despre toate instrumentele din pachetul iZotope RX în limba rusă? Dacă nu, va fi?
Nu există instrucțiuni oficiale în limba rusă. Din păcate, manualele de produs iZotope din limba engleză nu sunt încă traduse în alte limbi. IZotope intenționează să creeze versiuni localizate ale produselor, dar dacă există suficientă putere pentru aceasta - o mare întrebare. La urma urmei, traducerea în litere a sutelor de pagini de text tehnic nu este o sarcină ușoară. Voi adăuga că manualele nu sunt scrise de mine, altfel versiunea rusă, desigur, a fost.
Pentru unele programe iZotope, puteți găsi traduceri neoficiale efectuate de utilizatori. Am văzut traducerea manualului "Masterat cu iZotope Ozone" de la Oleg Ershov. Recent, Oleg mi-a arătat și traducerea aproape finalizată a "Audio Repair with RX 3" - un ghid pentru restaurare. Acesta acoperă majoritatea caracteristicilor RX.

Fac în mod regulat editări spectrale. Îmi pasă de artefactele care rămân atunci când taie o parte a spectrului cu un defect. Cum se minimizează acestea?
În RX, există multe modalități de a elimina artefactele. Primul sfat este să selectați cu atenție partea dorită (mai precis, inutilă) a spectrului. Dacă clicurile scurte ocupă întreg spectrul, ele sunt alocate pe banda larga a undelor oscilograme, adică doar în timp. Dacă unele sunete ocupă doar o parte a intervalului de frecvență, utilizați spectrograma și alocarea de timp și frecvență ("dreptunghi"). Pentru tonurile individuale și armonicile lor, puteți folosi mai multe instrumente subtile: o baghetă magică etc.

Când se face selecția, trebuie să selectați modulul corect și modul de procesare. Alegerea modulului potrivit în RX este un subiect separat, iar pentru cititorii interesați am pregătit o diagramă (click pentru mărire). Voi da sfaturi despre editarea spectrală.

Dacă obiectul care urmează să fie șters este un scurt-click, în câteva milisecunde, acesta poate fi eliminat prin interpolare manuală în modulul decaler. Dacă clicul este mai lung, rezultatele de calitate pot fi obținute de obicei în modulul Spectral Repair. Dacă clicul are o lungime de ordinul 10 ms, atunci este recomandat ca numărul de benzi (Numerele de benzi) din modul să fie selectat mic. Acest lucru va îmbunătăți precizia procesării în timp. Dacă obiectul selectat este mai lung (30-50 ms sau mai mult), atunci numărul de benzi poate fi lăsat în mod implicit - aceasta va permite o analiză mai precisă a componentelor semnalului tonului.

Răspunsuri la întrebările cititorilor, prosound

Secvență recomandată de operații la restaurarea unui semnal în iZotope RX

La deschiderea modulului Spectral Repair, prima întrebare este dacă să selectați modul de funcționare. Există patru moduri: Atenuare, Înlocuire, Pattern și Parțial + Zgomot.

  • Modul de atenuare (Attenuate) reduce amplitudinea fragmentului selectat astfel încât să se îmbine cu mediul. Mediul poate fi selectat ca orizontal (orizontal), vertical (vertical) și chiar bidimensional (2D), adică verticale și orizontale simultan. Dacă evenimentul selectat este scurt și în bandă largă (adică selecția este predominant verticală), interpolarea orizontală este de obicei aleasă. Și invers: pentru selecții orizontale lungi, este selectată interpolarea verticală. Modul de atenuare este bun dacă interferența nu blochează complet semnalul util, iar interferența nu trebuie eliminată complet, dar este suficient să se reducă amplitudinea acestuia până când acesta fuzionează cu fundalul.
  • Modul Înlocuire elimină conținutul selecției și încearcă să sintetizeze semnalul pentru ao înlocui. Aceasta folosește tipul de interpolare "orizontală": evenimentele din stânga și din dreapta selecției sunt conectate între ele. Modul de substituire este util atunci când porțiunea de semnal este complet stricată și este mai bine să o sintetizeze din nou.
  • Modul Pattern încearcă să înlocuiască un alt fragment al semnalului cu caracteristici de mediu similare în locul selecției. Dacă există repetiții în înregistrare (de exemplu, o buclă de percuție), este adesea mai bine să încercați să găsiți o porțiune similară a semnalului intact, mai degrabă decât sinteza și să o copiați. Modul șablon facilitează găsirea unui fragment similar.
  • Modul de "armonici + zgomot" (parțial + zgomot) este similar cu modul de substituire (înlocuire), dar utilizează un algoritm de sinteză mai complex. Este potrivit pentru cazurile în care partea stângă și cea dreaptă ale selecției nu sunt conectate orizontal: de exemplu, dacă pitchul instrumentului sa schimbat sau există vibrato. Modul "armonice + zgomot" încearcă să conecteze armonicile la stânga și la dreapta selecției, luând în considerare schimbarea înălțimii lor și posibilul vibrato.






În toate modurile instrumentului de reparare spectrală, există ajustări pentru reglarea zonei de mediu, adică semnal, pe care algoritmul o folosește pentru sinteză. Zona înconjurătoare este prezentată pe spectrograme cu paranteze punctate. Atunci când se interpolează un fragment, este de dorit ca semnalul din zona înconjurătoare să corespundă bine semnalului care trebuie să fie obținut în cadrul selecției.

De exemplu, în cazul în care scânteia unui șir de chitară este suprimată, atunci următoarea coardă a chitării se duce adesea în zona înconjurătoare, care merge imediat după scânteie. Pentru a împiedica acest lucru, puteți folosi butonul Înainte / după greutate pentru a muta zona înconjurătoare spre stânga, în principal la scânteie. Apoi, interpolare se va baza pe materialul coardei anterior.

Dacă nu puteți obține rezultatul perfect cu editarea spectrală, încercați să schimbați forma selecției sau să acționați pe părți, aplicând diferite setări diferitelor fragmente de sunet.

Care sunt avantajele iZotope RX3 înainte de alte instrumente de editare spectrală? Ce este recomandat să încercați mai întâi?
Cred că principalul avantaj este flexibilitatea setărilor: 4 moduri diferite de interpolare, ajustând dimensiunea zonei înconjurătoare. De asemenea, puteți nota o mulțime de instrumente pentru selectarea domeniilor din spectru: perie, lasso, baghetă magică. În versiunea RX 3, se adaugă un instrument pentru selectarea manuală a armonicilor prin numerele lor, iar precizia baghetei magice este îmbunătățită. În cele din urmă, spectrograma din RX este cea mai convenabilă dintre toate cele pe care le-am văzut. Reglează automat dimensiunea FFT în timpul funcționării pentru a afișa detaliile maxime.

Există o rezervă tehnologică pentru metodele matematice utilizate în iZotope RX?
Încercăm să implementăm algoritmi cu o calitate aproape de maxim. Când algoritmul este lent, permitem utilizatorului să selecteze un nivel de calitate. Prin urmare, nu este rezerva tehnologică, în înțelegerea mea. Cu toate acestea, lucrăm întotdeauna la îmbunătățirea algoritmilor cu idei noi. Și în acest sens - căile de dezvoltare sunt departe de a fi epuizate.

Nu este planificată înlocuirea FFT de scurtă durată și a metodelor medii laborioase asociate cu o metodă mai complicată de descompunere în funcții separate care ar da o distribuție mai uniformă a elementelor la scară logaritmică? De ce nu puteți introduce un FFT logaritmic?
Până în prezent, nu avem nici un scop să renunțăm la FFT obișnuit. Faptul este că iZotope are algoritmi de a folosi FFT în mai multe moduri, permițând, dacă este necesar, aproximarea rezoluției logaritmice în frecvență. Aceasta este așa numita multirezoluție (FFT). Acestea permit nu numai obținerea unei distribuții a frecvenței aproape de logaritmă, ci și ajustarea rețelei de frecvență la caracteristicile semnalului. FFT tradițional cu distribuție liniară de frecvență este utilizat în aceste algoritmi ca un bloc compozit. Datorită acestui fapt, este posibil să se obțină un raport bun calitate-performanță.

Utilizarea unor extensii speciale cu o rețea logaritmică de frecvențe va încetini considerabil calculele, dar, cred, nu va da un câștig automat în calitate. Mai interesant pentru mine este tema extensiilor adaptive, care ajustează forma funcțiilor de bază la singularitățile formei de undă.

AMD a anunțat SDK, unde există o prelucrare a sunetului - TrueAudio. În această privință, problema planurilor tale. Eu personal am încă o atitudine sceptică. Dar oamenii spun că totul este bine gândit și este posibil să procesați sunetul aproape în timp real fără întârziere.
Întârzierea procesării sunetului nu este neapărat legată de lipsa puterii de procesare. În multe cazuri, provine din necesitatea de a privi în timp. De exemplu, limitatorul ar trebui să coboare câștigul înainte de apariția vârfului. Fie egalizatorul de fază liniară trebuie să includă întârzierea necesară pentru acest tip de filtrare.

Programele IZotope folosesc bibliotecile Intel IPP pe PC și vDSP pe Mac pentru a optimiza calculele. Ele au o gamă largă de funcții și nu sunt legate de un anumit tip de fier, șofer sau sistem de operare. Uneori, scriem fragmente de coduri mici în asamblare în asamblare sau inline (intinsics).

De asemenea, în versiunea RX 3, procesoarele multi-core au devenit mai utilizate pe scară largă pentru calcularea paralelizării.

Există un mecanism în RX care determină întârzierea și schimbarea de fază a unui semnal între două piste audio înregistrate simultan de la o sursă (de exemplu, două microfoane din poziții diferite).
Da, instrumentul se numește corecție Azimut și este localizat în modulul Channel Ops. Nu funcționează cu fișiere individuale, ci cu canalele stângi și drepte ale fișierului stereo: acesta egalizează întârzierea canalului din dreapta față de canalul din stânga cu o precizie de ordinul a 1/100 din eșantion. Instrumentul funcționează bine dacă canalele sunt deja aliniate aproximativ unul cu celălalt, iar formele de undă din canalele din stânga și din dreapta sunt aproape. Pentru a le aplica unei perechi de piese diferite, trebuie să creați un fișier stereo, unde o piesă va fi în canalul drept, iar cealaltă în canalul din stânga.

Este posibil să se automatizeze detectarea și suprimarea impurităților cu frecvență redusă, cum ar fi 50 Hz, fundalul (și armonicele acestuia) și vuietul?
Fundalul cu frecvență joasă poate fi determinat utilizând butonul Aflați din modulul Hum. Setează automat frecvența dorită a filtrelor de crestătură. De asemenea, puteți utiliza denoiserul, inclusiv în modul Adaptive, atunci când proprietățile fundalului se modifică în timp. Automatizarea mai completă acum este aproape imposibilă: pentru rezultate optime, trebuie să arătați manual programul exact ce trebuie să ștergeți.

Vreau să menționez că, în ciuda numelui modulului Hum Removal, în multe cazuri, cu suprimarea zgomotului și a fundalului, modulul denozerului funcționează mai bine. Acest lucru se datorează faptului că Hum Removal este doar un set de filtre notch care suprimă anumite frecvențe de fundal și un semnal util. Deoarece filtrele sunt ascuțite, atunci când ajung la frecvența lor de un semnal util, ei vor auzi în mod semnificativ și distorsionează semnalul. Prin urmare, atunci când fundalul se intersectează puternic în frecvențe cu un semnal util sau conține o mulțime de armonici, se recomandă utilizarea unui denoiser. Diferența dintre denozer este că distinge semnalul și fundalul nu numai în frecvență, cum ar fi Hum Removal, dar și în ceea ce privește nivelul. Semnalul la frecvențe apropiate, dar care depășește nivelul de fundal, nu va fi distorsionat.

Este posibil să se detecteze inconsistența ritmului (viteza de rotație a plăcii) în pistă și să se corecteze?
Nu, corectarea automată a wowflutter-ului în RX este acum imposibilă. Aceasta este una din direcțiile de dezvoltare ulterioară. Cu toate acestea, în RX 3 Advanced, puteți să trageți manual o curbă de schimbare a vitezei și să o aplicați (modul TimePitch, fila Pitch Contour).

În cea de-a doua versiune a RX, încărcați pluginul Gain, scanează melodia - și veți vedea nivelul în plug-in relativ la 0 dB! În a treia versiune doar un cursor. De ce ați pierdut o astfel de funcționalitate necesară a pluginului Gain?
Sa decis să spargem această funcție în două părți:
1. Fila Normalize din modulul Gain - pentru normalizare,
2. Fereastra Statisticii undelor (Alt + D) - pentru măsurarea nivelului.

Îi mulțumim lui Alexey Lukin pentru timpul petrecut și pentru răspunsuri interesante!

Răspunsuri la întrebările cititorilor, prosound







Articole similare

Trimiteți-le prietenilor: