La segmentazione e l'etichettatura del segnale vocale, sono considerate come le procedure con cui particolari etichette di qualsivoiglia livello, fonemico, fonetico o acustico vengono attribuite alla forma d'onda. L'allineamento temporale di una trascrizione con la corrispondente forma d'onda tende ovviamente a stabilire una corrispondenza diretta fra la trascrizione stessa e importanti variazioni acustiche del segnale. Tradizionalmente queste operazioni vengono eseguite "manualrnente" da esperti fonetisti. Nonostante la sempre maggiore affidabilità dei sistemi di visualizzazione della forma d'onda, dell'energia, della curva della frequenza fondamentale e dello spettrogramma del segnale vocale, ormai perfezionatissirni e quasi sempre associati a precisi e complessi sistemi d'ascolto, nell'operato degli esperti the operano la segmentazione sono sempre riscontrabili delle divergenze pin o mono significative. L'insierne delle etichette da utilizzare a la strategia di segmentazione sono due "variabili" estrernamente discusse e sulle quail non si registra un accordo assoluto.
Con il presente lavoro si a cercato di uniformare la strategia di segmentazione e si sono verificati statisticamente i risultati della segmentazione dello stesso materiale vocale di riferimento da parte di più esperti. La determinazione statistica del livello di deviazione delle decisioni umane nel processo di segmentazione servirà come unità di paragone nell'esaminare successivamente gli errori compiuti sullo stesso materiale vocale da parte di diversi algoritmi automatici di segmentazione, al fine di valutarne it rispettivo grado di affidabilità.
Caratterizzazione Statistica della Segmentazione Manuale del Segnale Vocale
Tipo Pubblicazione:
Contributo in atti di convegno
Publisher:
Esagrafica, Roma, ITA
Source:
XIX Convegno Annuale Associazione Italiana di Acustica (AIA), pp. 375–381, Napoli, Italia, 10-12 April, 1991
Date:
1991
Resource Identifier:
http://www.cnr.it/prodotto/i/241821
Language:
Ita