Paolo Guccini | Pubblicazioni

Tecnologie semplici per una funzione utile

Come è possibile parlare ad un microfono e vedere comparire sul video del computer le parole che sono state pronunciate? Basta un computer, una scheda sonora e un microfono nonché un programma specifico per il riconoscimento vocale.
Ogni persona che parla genera con la propria voce delle onde sonore che il microfono è in grado di convertire in impulsi elettrici che in via alla scheda sonora: questa li campiona trasformandoli in una sequenza di zero e di uno. Il programma la confronta con tutte le sequenze di fonemi che ha precedentemente memorizzato e, quando la trova quella corrispondente, prende la sillaba a essa associata. Questa fase è quella più delicata in quanto Io stesso fonema può essere pronunciato in più vari modi: lento, veloce, con timbro molto alto o basso, eccetera, li programma deve quindi elaborare la sequenza ricevuta per interpretarla correttamente. Ricorrendo ad un dizionario elettronico, è in grado di determinare l’inizio e la fine delle parole.
I PROGRAMMI DISPONIBILI
Programmi di riconoscimento vocale per l’italiano ne esistono pochissimi. Inoltre spesso possono gestire un limitato numero di vocaboli in quanto sono destinati a settori specifici come quello medico. Fra quelli in grado di gestire il "parlato continuo" è senz’altro da citare "Naturally Speaking". La sua installazione è semplicissima però impone un addestramento di circa mezz’ora che, se eseguito con scrupolo, permette al software avere delle ottime prestazioni nella fase di riconoscimento. Sul lato dell’hardware, anche se un Pentium 120 e 40Mb di Ram sono sufficienti per lavorare senza problemi, è più adatto un PC a 1660200 MHz. Il programma viene prodotto dalla società americana Dragon System (www.dragonsys.com) ed è distribuito in Italia da Archimede Srl (www.krenet.it/assindpg/archimede/noframe/index1.htm) (tel. 075/59 96912). L’altro programma da ricordare è realizzato da IBM e si chiama "ViaVoice" (www.ibm.com/is/voicetype) l’installazione richiede un po’ di attenzione e l’addestramento dura solo qualche minuto. Il processore dovrebbe essere almeno un Pentium 166 con più di 32 Mb di Ram.
LA RICERCA SU INTERNET
Col termine "Tecnologie vocali" si fa riferimento al riconoscimento elettronico della voce umana per la sua conversione in parole. Su tali argo menti sono presenti numerose informazioni su Internet e si possono cercare con le chiavi "riconoscimento vocale", "speech recognition" o "voice type".
È da segnalare la società italiana Cselt che apparteneva al gruppo Stet/Telecom (voce.cselt.it): nel suo sito si trovano varie informazioni a riguardo di questa tecnologia (voce.cselt.it/ufa/lndex.html). Si segnalano le pagine www.tiack.net/users/asrnews/otherlinks.html che contiene un indice di altre pagine e www.cs.cmu.edu/~wanggang/speechreoog.html.

Tratto da:
Paolo Guccini
Computer Valley
(allegato del quotidiano La Repubblica)
26 febbraio 1998

Il testo e' stato acquisito tramite OCR dalla rivista su cui e' stato pubblicato e velocemente ricontrollato.
Le segnalazioni di errori saranno molto gradite e si possono fare alla pagina Contatti.