Viene descritto un sistema per il riconoscimento automatico di sequenze di cifre connesse, indipendente dal parlante, realizzato per l'italiano. Per lo sviluppo e l'implementazione del sistema, è stato utilizzato l'ambiente software denominato CSLU-Toolkit, mentre l'addestramento e la verifica sono stati resi possibili mediante l'utilizzazione dei corpora denominati SPK e PANDA. Il sistema si basa su un'architettura "ibrida" realizzata mediante catene di Markov nascoste e reti neurali artificiali. Una rete neurale multistrato è stata addestrata sulle probabilità di ogni frame di appartenere ad una determinata categoria fonetica. Questa rete è stata poi utilizzata per stimare la probabilità di emissione dei singoli stati di apposite catene di Markov
associate alle varie categorie fonetiche e, successivamente, è stato applicato l'algoritmo 'forward-backward' per stimare nuovi valori target da utilizzare come nuovi pattern di addestramento per la rete neurale.
Un sistema ibrido (NN/HMM) per il riconoscimento di sequenze di cifre connesse in italiano
Tipo Pubblicazione:
Contributo in atti di convegno
Source:
XXVII Convegno Nazionale Associazione Italiana di Acustica, pp. 206–209, Genova, Italia, 26-28 May 1999
Date:
1999
Resource Identifier:
http://www.cnr.it/prodotto/i/241038
http://www2.pd.istc.cnr.it/Papers/PieroCosi/cp-AIA99-1.pdf
Language:
Ita