U tu grupu možemo ubrojiti i sustave za prijenos govornog signala putem Internet a (engl.
U tu grupu možemo ubrojiti i sustave za prijenos govornog signala putem Internet a (engl.
Sažetak: Cilj projekta je osmisliti i implementirati sustav za automatsko generiranje pokreta lica iz govornog signala u stvarnom vremenu.
Kod gestikulacije lica iz govora potrebno je naći korelaciju između govornog signala i pojave pokreta lica kako bi se moglo animirati cijelo lice samo iz zvuka.
Računalni postupci sinteze govora povijesno su proizašli: iz artikulacijskog modela koji opisuje funkcioniranje govornih organa; iz rezonantnog modela koji analizira glavna rezonantna obilježja govornog signala (formante) i iz konkatenacijskog pristupa pri kojem je model zamijenjen dijelovima govora, odnosno segmentima govora.
Taj postupak poravnavanja spektra se provodi filtracijom ulaznog govornog signala filtrom za pred-naglašavanje (engl. preemphasis filter).
Postupak određivanja koeficijenata prediktora provodi se nad vremenskim segmentom govornog signala konačnog trajanja.
Filtri za uklanjanje periodičnosti pri kodiranju govornog signala
Potrebno je istražiti mogućnost poboljšanja Vocoder tehnike kodiranja govornog signala korištenjem složenijeg modela pobudnog signala.
Algoritme za obradu govornog signala potrebno je realizirati u programskom paketu Matlab.
Sa stanovišta primjene u obradi govora, pojam linearne predikcije se odnosi na niz praktično ekvivalentnih formulacija problema modeliranja govornog signala.
Naravno, zbog vremenske promjenjivosti spektralnih svojstava govornog signala, taj raspon mora biti konačan.
Postoje dva osnovna pristupa odabiru ovog raspona i kao što će biti prikazano u narednim poglavljima, dva postupka linearne predikcije će se razlikovati samo po tome kako je odabran taj raspon, odnosno na koji način se provodi izdvajanje segmenta s n (m) iz govornog signala s (n).
U okviru diplomskog rada je potrebno proučiti kodere govornog signala koji su temeljeni na interpolaciji karakterističnih valnih oblika decimiranih glotalnih pulseva (engl. prototype waveform interpolation).
Potrebno je razviti programe za analizu govornog signala koji će formirati valnu plohu u fazno/vremenskoj domeni.
Razviti i odgovarajuće postupke za sintezu govornog signala na osnovi kvantiziranih parametara.
Obzirom da je R (0) jednak energiji izdvojenog segmenta govornog signala, V (i) definira koliko je puta energija predikcijske pogreške manja od ulazne energije signala.
Glava tema narednih poglavlja bit će kako na osnovu snimljenih uzoraka govornog signala odrediti koeficijente " dobrih " prediktora koji " minimiziraju " predikcijsku pogrešku, te kako tako dobivene koeficijente prediktora dovesti u vezu s parametrima digitalnog modela vokalnog trakta predloženog u poglavljima 7 i 8.
Interesantno je proučiti učinkovitost postupka linearne predikcije govornog signala i prije njegove formalne definicije.
Na slici 9.2 1 a) prikazan je kratki odsječak valnog oblika govornog signala s (n), za glas ' u ' otipkan s frekvencijom f s = 8 kHz.
Potrebno je istražiti mogućnosti kodiranja govornog signala korištenjem postupaka linearne predikcije uz uvažavanje subjektivnog kriterija izobličenja.
Opisati pojavu slušnog maskiranja i diskutirati kako se navedena pojava može iskoristiti u svrhu boljeg kodiranja govornog signala (maji broj bita za prijenos uz istu kvalitetu reproduciranog signala).
Algoritme za obradu govornog signala potrebno je realizirati u programskom paketu Matlab, te istražiti ovisnost subjektivne i objektivne kvalitete o parametrima analize.
Svojstva sustava potrebno je demonstrirati na kodiranju vektora frekvencijskih linija u svrhu učinkovite kvantizacije spektralne ovojnice govornog signala.
U poglavlju 8.5 uveden je potpuni digitalni model formiranja govornog signala, s blok shemom prikazanom na slici 8.5 1.
DWS-4026 posebno je dizajniran i optimiziran za bežični prijenos govornog signala unutar mreže putem Auto-Voice VLAN.
Svaki konjugirano kompleksni par polova određuje jednu rezonantnu karakteristiku, koja se poklapa s jednim od formanata govornog signala.
Radi bolje ilustracije činjenice da ltp dio kepstra jednoznačno opisuje sporo promjenljivu spektralnu ovojnicu govornog signala, na slici 10.4 13 prikazan je prirodni logaritam modula DFT-a signala sa slike 10.4 4, zajedno s DFT-om ltp dijela kepstra.
To su razlozi zbog kojih se kompleksni kepstar rijetko koristi, pa se većina postupaka numeričke homomorfne analize govornog signala ograničava na običan kepstar c p (n) prikazan na slici 10.4 6.
Ako se analiza provede na osnovu uzoraka govornog signala između dva glotalna pulsa, tj. unutar jedne periode osnovne frekvencije (npr. korištenjem analize sinkrone s osnovnom frekvencijom glasnica), tada se već i sa širinama N reda veličine 2 p mogu ostvariti zadovoljavajući rezultati.
Jedna od osnovnih pretpostavki vezana uz obradu govornog signala je da se govor može prikazati kao izlaz iz linearnog, vremenski promjenljivog sustava čija se svojstva sporo mijenjaju s vremenom.
Jezikoslovac je web odrednica na kojoj ćemo pokušati u skorije vrijeme objediniti sve varijante i baze koje su trenutno dostupne za hrvatski jezik, kao i što veći broj primjera za iste. Pratite nas i šaljite prijedloge, kako bismo postali centralno mjesto razmjene znanja.
Srdačan pozdrav!
All Rights Reserved © Jezikoslovac.com