Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
1. Spektrálne odčítanie: Toto je relatívne jednoduchá technika. Analyzuje frekvenčné spektrum hlukového zvukového signálu a odhaduje šumové spektrum z období, kde je prítomný iba hluk (napr. Mlčanie v reči). Potom odpočíta odhadované šumové spektrum od hlučného rečového spektra. Trpí však artefaktmi ako „hudobný hluk“ (zvyškový hluk, ktorý znie ako hudobné tóny), pretože dokonale odhaduje hluk.
2. Filtrovanie Wiener: Toto je sofistikovanejší prístup, ktorý využíva štatistické spracovanie signálu. Odhaduje výkonovú spektrálnu hustotu reči a hluku a potom použije filter na optimálne potlačenie šumu pri zachovaní reči. Je to lepšie ako spektrálne odčítanie, ale stále čelí výzvam s nestacionárnym šumom (hluk, ktorý sa v priebehu času mení).
3. Lúč: Táto technika používa viacero mikrofónov na priestorovo odfiltrovanie hluku. Strategickým umiestnením mikrofónov a spracovaním ich signálov sa môže sústrediť na zvuk pochádzajúci z konkrétneho smeru (napríklad ústa reproduktora) a zároveň zoslabuje hluk z iných smerov. Toto je obzvlášť efektívne v hlučných prostrediach so smerovými zdrojmi hluku.
4. Prístupy hlbokého učenia: Nedávny pokrok v hlbokom učení spôsobil revolúciu v zručnosti hlasu. Neurónové siete, najmä opakujúce sa neurónové siete (RNN) a konvolučné neurónové siete (CNNS), sú trénované na veľkých súboroch hlučnosti a čistej reči. Tieto siete sa učia zložité vzťahy medzi hlučným zvukom a čistou rečou, čo im umožňuje efektívne oddeliť reč od hluku s výrazne lepším výkonom ako tradičné metódy. Príklady zahŕňajú:
* Vylepšenie reči pomocou hlbokých neurónových sietí: Tieto modely sa priamo učia mapovanie od hlučnej reči až po čistú reč.
* Oddelenie zdroja pomocou hlbokého učenia: Cieľom týchto modelov je oddeliť viac zdrojov (reč a hluk) od zmiešaného zvukového signálu. Toto je užitočné najmä v scenároch s viacerými prekrývajúcimi sa reproduktormi alebo zdrojmi hluku.
V praxi veľa systémov kombinuje viac techník. Napríklad systém môže použiť lúčové tvorby na spočiatku zníženie hluku, po ktorom nasleduje hlboký model učenia na ďalšie vylepšenie rečového signálu a odstránenie zvyškového šumu.
Účinnosť zručnosti hlasu závisí od niekoľkých faktorov vrátane:
* Typ a charakteristiky hluku: Neustále sa odstraňuje stabilný hum na pozadí ako impulzívne zvuky (napríklad rany alebo kliknutia).
* pomer signálu k šumu (SNR): Vyšší SNR (silnejšia reč v porovnaní s hlukom) vo všeobecnosti vedie k lepšiemu zrušenie.
* Kvalita mikrofónov a hardvér spracovania: Lepšie mikrofóny a výkonnejšie možnosti spracovania umožňujú presnejšiu analýzu a filtrovanie.
Stručne povedané, zrušenie hlasu je zložité pole, ktoré využíva rôzne techniky, čoraz viac sa spolieha na výkonné modely hlbokého učenia, izolovať a zlepšovať signály reči v hlučných prostrediach.