Primele rezultate asupra carora ma voi opri sunt cele obtinute în urma operatiilor elementare din cadrul modulului de unelte de prelucrare
Fie forma de unda urmatoare, corespunzatoare cuvântului “duminica”.

Fig 7.1 Forma de unda corespunzatoare rostirii cuvântului duminica.
Asupra acestui semnal vom aplica urmatorul lant de prelucrari:
1. Segmentarea în frame-uri de 128 de esantioane cu o suprapunere de 75%.
2. Aplicarea unei ferestre Hamming.
3. Eliminarea componentei DC.
4. Detectarea semnalului vocal.
5. Netezirea semnalului, prin reducerea frecventelor înalte fiecare punct fiind media a 5 puncte consecutive precedente.
Rezultatul aplicarii acestei operatii este reprezentat în urmatoarea figura:

Fig 7.2 Semnalul obtinut în urma aplicarii unui lant de operatii.
Dupa cum se poate vedea si din figura, semnalul rezultat este ideal în vederea prelucrarilor de orice tip ce se aplica la un semnal vocal acesta fiind bine izolat si netezit.
In exemplul anterior izolarea semnalului vocal s-a realizat cu succes. Totusi exista anumite situatii cand izolarea bazata pe numarul de treceri prin zero si energie nu este posibila, performantele algoritmului fiind scazute. In acest caz se aplica algoritmul bazat pe spectrul de frecvente al semnalului. În figurile urmatoare sunt prezentate rezultatele izolarii vocale folosind algoritmul bazat pe NTZ si energie si respectiv folosind spectrul de frecvente.

Fig 7.3 Semnalul sursa continând un sunet parazit greu de delimitat de vorbire

Fig 7.4 Rezultatul izolarii vorbirii folosind algoritmul NTZ-Energie

Fig 7.5 Rezultatul izolarii vorbirii folosind spectrul de frecvente.
Dupa cum se vede izolarea vorbirii prin folosirea celui de al doilea algoritm este una excelent realizata.
Pe lânga vizualizarea formei de unda programul pune la dispozitia utilizatorului si grafice reprezentând numarul de treceri prin zero, energia semnalului sau spectrul de frecvente. Din primele doua grafice se observa de ce a fost imposibila izolarea vorbirii prin algoritmul NTZ-Energie în cazul semnalului din Fig 7.3.

Fig 7.6 Graficul trecerilor prin zero pentru semnalul din Fig 7.3

Fig 7.7 Graficul Energiei semnalului din Fig 7.3

Fig. 7.8 Spectrul de frecvente pentru semnalul din Fig 7.3
O alta componenta importanta a sistemului este reprezentata de modulul de calculare a diferentelelor între seturi de coeficienti sau între doua spectre de frecvente.
În cazul calcularii distantelor între coeficientii LPC sau cepstrali, dupa cum aratam anterior rezultatul operatiei da asemanarea între doua cuvinte.
În lipsa unui algoritm foarte eleborat putem spune ca deocamdata sistemul este unul mono-utilizator, recunoasterea facându-se pentru un sigur vorbitor. În acest caz recunoasterea cuvintelor ajunge la o performanata undeva în jur de 80%. Evident ca în aceste operatii de comparare este esential modul de calculare a coeficientilor precum si operatiile anterioare efectuate asupra semnalului sonor. Lantul de operatii care a dus la aceste performante este descris in continuare:
1. Aplicarea unuei ferestre Hamming asupra semnalului.
2. Eliminarea componentei DC.
3. Localizarea vorbirii folosind variatia NTZ-Energie
4. Netezirea semnalului, fiecare punct fiind calculat ca media a 5 puncte consecutive anterioare.
5. Calcularea a 15 coeficienti LPC/cepstrali
Rezultate mai bune s-au obtinut în cadrul algoritmului de recunoastere a vorbitorului. Pentru o buna functionare a programului este important ca rostirile cuvintelor sa fie asemanatoare în toate cazurile. Pasii algoritmului folosit sunt prezentati în continuare:
1. Aplicarea unuei ferestre Hamming asupra semnalului.
2. Eliminarea componentei DC.
3. Localizarea vorbirii folosind variatia NTZ-Energie
4. Calcularea spectrului de frecvente, numarul de elemente din spectru fiind de 2 10 =1024
5. Pentru calcularea distantei între spectre folosindu-se frecventa fundamentala plus înca 3 formanti.
Procentajul de recunoastere a sistemului în aceste conditii este în jur de 90%.
Daca ar fi sa vorbim despre performantele sistemului din punct de vedere al vitezei de executie atunci o caracterizare obiectiva ar suna “acceptabile” sau chiar “bune”. Ca un exemplu si o justificare pentru aceasta afirmatie sta urmatorul experiment: Pentru calcularea vitezei de lucru a aplicatiei s-a creat o lista cu toate operatiile din fereastra Tools, inclusiv cele în care se salveaza seturile de coeficienti calculati în cadrul fisierelor cu format special, si apoi s-a executat aceasta lista pe un semnal sonor la 8000 samples per sec, continând 10000 de esantioane. Durata totala a executiei tuturor operatiilor a variat de la 3368ms pe un sistem la 300MHz la 1062ms pe un sistem la 1600MHz. Si este evident ca din acest interval, un interval semnificativ de timp l-au reprezentat operatiunile de transmitere a parametrilor de la modulul de unelte spre clasa de operatii precum si scrierea rezultatelor operatiilor în fisiere.
Punctele slabe ale aplicatiei vin din cauza vitezei scazute de afisare si rectualizare a interfetei grafice mai ales în ce priveste afisarea spectrului în domeniul frecventa.