Viene descritta una applicazione per la sintesi vocale dell'italiano. È progettata per implementare la parte di elaborazione del segnale di un sistema TTS, ovvero quella che si occupa di creare un file audio (.wav) a partire da un file fonetico (.pho) relativo alla frase da pronunciare.
A tale scopo viene utilizzato un database di difoni pre-registrati, dalla cui concatenazione si ottiene l'output audio. Le operazioni sui difoni vengono effettuate secondo tecniche sinusoidali (più precisamente tecniche SMS, Spectral Modeling Synthesis).
Il database di difoni è quello usato da MBROLA, applicazione di sintesi vocale nel dominio temporale. Tale programma è stato usato in alcuni test di confronto.
È stato utilizzato lo Spectral Modeling Synthesis (SMS) come modello spettrale per l'elaborazioni del segnale, ed in particolare il framework CLAM per l'implementazione software.
Sintesi Vocale Concatenativa per litaliano Tramite Modello Sinusoidale
Publication type:
Contributo in atti di convegno
Publisher:
EDK Editore, Torriana, ITA
Source:
AISV 2005 - 2° Convegno Nazionale AISV - "Analisi prosodica - teorie, modelli e sistemi di annotazione", pp. 113 (CD Rom 761)–113 (CD Rom 772), Fisciano, Salerno, Italy, Novembre 30 - December 2, 2005
Date:
2006
Resource Identifier:
http://www.cnr.it/prodotto/i/139811
http://www.aisv.it/AISV2005/default.htm
urn:isbn:88-95112-21-0
Language:
Ita
Eng