SMS-FESTIVAL: un nuovo ambiente di lavoro per la sintesi vocale da testo scritto | Istituto di Scienze e Tecnologie della Cognizione

Si presenta un nuovo motore di sintesi audio che si occupa di eseguire le operazioni di
Digital Signal Processing (DSP)
di un sistema di Text-To-Speech
basato su concatenazione
di difoni. L'input fone
tico (una sequenza di fonemi con
lunghezze e valori di intonazione
prodotta da FESTIVAL a partire da testo sc
ritto) viene convertito nel segnale audio.
Il lavoro descritto vuole essere un'alternativa a MBROLA e fa uso della
rappresentazione SMS ("Spectral Modeling Synthesis"), implementata dal framework
CLAM (C++ Library for Audio and Music).
Il programma verrà pubblicato con licenza open source (GPL), e funzionerà su qualsiasi
piattaforma che disponga di gcc e CLAM (per esempio i sistemi Windows, Linux e Mac
OS X).

Tipo Pubblicazione:

Contributo in atti di convegno

Author or Creator:

Sommavilla G.

Cosi P.

Drioli C.

Paci G.

Publisher:

EDK Editore, Torriana, ITA

Source:

AISV 2006, III Convegno Nazionale Associazione Italiana di Scienze della Voce, pp. 65 (CD 347)–65 (CD 352), Pantè di Povo - TRENTO, 2006

Date:

2006

Resource Identifier:

http://www.cnr.it/prodotto/i/93569

http://aisv2006.fbk.eu/

urn:isbn:978-88-95112-69-5

Language:

Eng