Progetto Speaking Web

Speaking Web è un innovativo progetto di ricerca eseguito dalla società Rigel Engineering S.r.l. e relativo allo sviluppo di una soluzione software per l’impiego avanzato della sintesi vocale sul Web.

Il progetto prevede lo studio, la progettazione e lo sviluppo di un insieme di prototipi componenti la soluzione innovativa Speaking Web, che attraverso le successive fasi di reingegnerizzazione e commercializzazione del prodotto, verrà immessa sul mercato.

Il progetto Speaking Web è stato realizzato grazie al cofinanziamento della Regione Toscana, nell’ambito della Misura 1.8 del DOCUP Obiettivo 2, anni 2000-2006, fondi strutturali della Comunità Europea.

logospeakingweb-gr


La soluzione Speaking Web è composta da tre moduli software, che si integrano tra loro:

  • Speaking Web Plug-in Pro: modulo software che si integra nei comuni web browser per estenderne le funzionalità, offrendo sintesi vocale di alta qualità
  • Speaking Web Studio: uno strumento di sviluppo (authoring) di “pagine parlanti”, dedicato ai gestori, editori o sviluppatori di siti web, che permette l’inserimento dei contributi vocali nelle pagine web in modo grafico e visuale, che offre una serie di funzionalità dalla anteprima audio del testo inserito, alla gestione dei profili utente;
  • Speaking Web Facile: una libreria Javascript per la gestione dei profili utente vocali, che consente una migliore adattabilità della soluzione Speakin Web alle esigenze del singolo utente, che può quindi definire un proprio profilo con le caratteristiche della voce preferite, e definire il livello di dettaglio con cui le informazioni vengono “lette” dalla voce sintetica.

Il progetto ha avuto come punto di partenza la precedente esperienza della nostra società con il prodotto MyVoice® Net, che è stato quindi totalmente ripensato e ridisegnato, implementando una serie di significativi miglioramenti che hanno prodotto un radicale rinnovamento, sia del prodotto che delle modalità con cui questo viene impiegato ed integrato nei servizi web, e che derivano dalla volontà di far evolvere in modo significativo l’attuale soluzione, in un ottica fortemente centrata sul cliente e sull’utente finale.

Le attività di sviluppo del progetto sono state focalizzate sull’incremento della qualità complessiva dei componenti della soluzione (ad esempio attraverso il miglioramento della qualità della voce sintetica e dell’usabilità del prodotto), che comporterà di conseguenza una migliore percezione da parte dell’utente dei benefici e dei vantaggi ottenibili, sia in termini di accessibilità che in termini di usabilità del servizio web, del sito o del portale.

L’innovazione

La realizzazione della nuova soluzione Speaking Web comporta un approccio multidisciplinare che contempla i seguenti aspetti di ricerca e sviluppo:

  • Metodologie per l’impiego della voce sul web per la realizzazione di applicazioni di web multimodale;
  • Accessibilità ed usabilità del web;
  • Integrazione di tecnologie di sintesi vocale (TTS, Text-to-speech);
  • Gestione a basso livello del driver audio su piattaforma Windows e Mac.

Alcuni degli aspetti di ricerca e sviluppo che affrontati nel progetto Speaking Web, trovano riscontro nelle attività di ricerca internazionale e rientrano nelle priorità definite a livello comunitario, nell’ambito del sesto programma quadro (2002-2006).

La tematica prioritaria IST (Information Society Technology), ad esempio, prevede le seguenti aree tematiche di ricerca, attinenti al presente progetto:

  • e-Inclusion (IST-2002-2.3.2.10);
  • Cross-media content for leisure and entertainment (IST-2002-2.3.2.7);
  • Applications and services for the mobile user and worker (IST-2002-2.3.2.6).

Vantaggi e benefici

I risultati tecnologici e industriali ottenuti dal progetto sono estremamente positivi e promettenti, come dimostrato dai prototipi realizzati e dai test di verifica e validazione su questi effettuati. In particolare, si è riusciti ad integrare nella soluzione Speaking Web, al livello prototipale, sotto forma di plug-in per i browser più diffusi, una tecnologia di sintesi vocale dalla qualità molto elevata, che produce una resa molto naturale e confortevole nell’ascolto.

I principali vantaggi e benefici ottenuti dal progetto possono essere sintetizzati in:

  • sintesi di alta qualità: consente la realizzazione di applicazioni web che richiedono una elevata qualità della resa audio della sintesi vocale, migliorando la user experience el’impatto emozionale sull’utente (branding, marketing);
  • web multimodale: possibilità di fruizione del web attraverso modi e canali alternativi ai tradizionali (testo e immagini, presentazione visiva), attraverso una terza dimensione, la voce, che completa l’esperienza sul web sia dell’utente finale che dell’utilizzatore di applicazioni di business;
  • profili vocali utente: Possibilità di adattare le modalità di ascolto dei supporti vocali alle specifiche esigenze e preferenze del singolo utente; (tramite il canale vocale si possono dare molti dettagli, una breve descrizione oppure minimi suggerimenti);
  • elevata accessibilità: i servizi ed i contenuti web abilitati con la sintesi vocale risultano chiaramente più accessibili, in quanto il canale vocale integrato nella navigazione web rappresenta un modo di fruizione equivalente ed alternativo al testo scritto;
  • facile integrazione: l’impiego nei portali e servizi web esistenti è significativamente semplificato dall’utilizzo della libreria javascript e dallo strumento Speaking Web Studio; i costi totali per gestione della soluzione Speaking Web sono quindi contenuti e non presentano significativi scostamenti rispetto ai costi di gestione di un servizio web tradizionale;
  • supporto multilingua: la tecnologia supporta le principali lingue europee ed alcune lingue extra-europee.