Si presenta un nuovo motore di sintesi audio che si occupa di eseguire le operazioni di
Digital Signal Processing (DSP)
di un sistema di Text-To-Speech
basato su concatenazione
di difoni. L'input fone
tico (una sequenza di fonemi con
lunghezze e valori di intonazione
prodotta da FESTIVAL a partire da testo sc
ritto) viene convertito nel segnale audio.
Il lavoro descritto vuole essere un'alternativa a MBROLA e fa uso della
rappresentazione SMS ("Spectral Modeling Synthesis"), implementata dal framework
CLAM (C++ Library for Audio and Music).
Il programma verrà pubblicato con licenza open source (GPL), e funzionerà su qualsiasi
piattaforma che disponga di gcc e CLAM (per esempio i sistemi Windows, Linux e Mac
OS X).
Tipo Pubblicazione:
Contributo in atti di convegno
Publisher:
EDK Editore, Torriana, ITA
Source:
AISV 2006, III Convegno Nazionale Associazione Italiana di Scienze della Voce, pp. 65 (CD 347)–65 (CD 352), Pantè di Povo - TRENTO, 2006
Date:
2006
Resource Identifier:
http://www.cnr.it/prodotto/i/93569
http://aisv2006.fbk.eu/
urn:isbn:978-88-95112-69-5
Language:
Eng