Dupa cum am aratat în modelul de producere a vorbirii, semnalul vocal reprezinta convolutia în timp a semnalului excitatie produs de vibratia corzilor vocale si raspunsul în timp al filtrului reprezentat de tractul vocal. Astfel supus analizei vom avea un semnal convolvat. Separarea celor doua semnale precum si analiza parametrilor în domeniul temporal este imposibila. Prin urmare problema care se pune este trecerea semnalului în alt domeniu în care componentele se combina liniar, caz în care separarea ar fi simpla.
Un astfel de domeniu este domeniu frecventa. Trecerea din domeniu temporal în domeniul frecventa se face cu ajutorul transformatei Fourier. În urma unei transformari liniare a unui semnal combinat liniar se obtine tot o combintie liniara. În consecinta daca un semnal este obtinut prin combinatia liniara a doua semnale de frecvente diferite, în domeniu frecventa combinând liniar componentele, vom obtine semnalul ca o combinatie liniara a componentelor spectrale.
Pentru a demonstra faptul ca cele doua componente sunt usor de separat în domeniul frecventa vom lua un exemplu în care un semnal de joasa frecventa x(n) este perturbat de zgomotul de inalta frecventa w(n) . y(n) = x(n) + w(n). Aplicând trasformata Fourier în domeniul frecventa vom avea câte o componenta separata la frecventa celor doua semnale. Prin eliminare frecventelor nedorite si transformarea inversa înnapoi în domeniul timp se obtine semnalul curatat de zgomot. [Bek 2002]
În cazul semnalului vocal componentele nu sunt combinate liniar. Astfel pentru a separa liniar componentele trebuie trecut si semnalul vocal într-un domeniu, unde componentele se combina liniar.
Fie s(n), semnalul vocal obtinut prin convolutia excitatiei corzilor vocale e(n) si a raspunsului la impuls al functiei de transfer a tractului vocal
.
(3.5.1)
Aplicând asupra acestei egalitati transformata Fourier convolutia devine înmultire, si prin urmare vom avea:
(3.5.2)
Pentru o combinare liniara avem nevoie de adunare, trecerea din multiplicativ în aditiv se face prin logaritmare si prin urmare vom avea:
(3.5.3)
Am ajuns într-un domeniu în care componentele sunt combinate liniar. De acum încolo vom considera
ca semnal. Pentru a putea trece într-un domeniu în care componentele
sunt usor de separat, putem aplica iarasi transformata Fourier, trecând în domeniu “frecventa”.
(3.5.4)
Functia
fiind o functie reala para, relatia (3.5.4) este echivalenta cu:
(3.5.5)
deoarece
![]()
![]()
unde
![]()
Relatia (3.5.4) reprezinta transformata Fourier directa iar relatia (3.5.5) cea inversa. Aplicînd amândoua relatiile, se obtine ca rezultat semnalul de start. Prin aceasta metoda se obtine “spectrul” “semnalului”. Folosim ghilimelele, pentru ca “semnalul” reprezinta în realitate un spectru iar “spectrul” reprezinta un alt domeniu (nedefinit deocamdata).
În cazul în care din domeniu spectral se alege aplicarearan transformarii Fourier directe, domeniul în care se ajunge nu are semnificatie fizica. Daca se alege transformarea Fourier inversa, se ajunge într-un domeniu temporal. Acest domeniu temporal nu mai este identic cu domeniul temporal de unde am pornit, de aceea notiunile utilizate pentru caracterizare se modifica (notiuni de natura spectrala într-un domeniu temporal). Astfel, noul domeniu va avea denumirea de domeniu cepstral .
Denumirile din noul domeniu se determina prin corespondenta cu domeniul spectral, însa inversând literele din prima silaba. Deci se definesc urmatoarele denumiri: spectrum
cepstrum , frecventa
cvefrenta , armonica
ramonica , filtrare
liftrare . În acest domeniu cepstral, componentele combinative ale semnalului original pot fi separate prin metode simple cum ar fi liftrarea.
Schema bloc al întregului proces este prezentata în figura urmatoare:

Fig. 3.7 Schema bloc de determinare a cepstrului
Spectrul semnalului vocal este compus prin multiplicare dintr-o anvelopa de variatie lenta si pulsuri, o componenta cu variatie rapida. Spectrul logaritmic are forma asemanatoare, însa el reprezinta combinatia liniara a celor doua componente. În cepstrum (spectrul spectrului) se pot vedea separate cele doua componente, una de joasa cvefrenta, rezultata din componenta lent variabila a anvelopei, si componenta de cvefrenta înalta, rezultata din componenta rapid variabila a spectrului. Distanta în cvefrenta dintre doua impulsuri, sau distanta de la origine la primul impuls, se poate interpreta ca si perioada acestor impulsuri, deci se poate obtine frecventa fundamentala de rezonanta a corzilor vocale. Aceasta metoda este folosita pentru determinarea frecventei fundamentale si pentru determinarea caracterului vocalic sau nevocalic al cadrului de semnal analizat. [Bek 2002]
(3.5.6)

Fig. 3.8 Modul de determinare al cepstrului [Balázs 1998]
Bineînteles, aceasta metoda poate fi aplicata pentru determinarea frecventei fundamentale, numai în cazul în care cele doua componente combinatorice sunt destul de distantate între ele. În cazul semnalelor de origine vocalica (vocale), metoda se justifica, însa în cazul sunetelor nevocalice (consoane), metoda este inadecvata pentru ca impulsurile, daca exista, se confunda cu zgomotul cepstral de înalta cvefrenta.
Pe baza semnalului cepstral, se pot obtine, independent, spectrumul de variatie lenta sau cel de variatie rapida, prin operatia de liftrare si transformarea în domeniul frecventa. De exemplu, daca se doreste anvelopa spectrala, se elimina din relatia (3.5.6)
, si se aplica transformata Fourier directa.