domenica 17 aprile 2011

Cos'è il TAL?


Uno dei settori di maggiore interesse, dove l'innovazione tecnologica può dare realmente un notevole contributo è rappresentato dal TAL (Trattamento Automatico della Lingua) ed in effetti già la Pubblica Amministrazione sta sperimentando diverse applicazioni: l’estrazione di "conoscenza" dei testi dai documenti (MEF) e la gestione della Biblioteca multimediale (CFS); Ontologia - il Thesaurus di Eurovoc (in sperimentazione al CdS), l’operatore virtuale (i Carabinieri), l’utilizzo di un motore di ricerca semantico sia per l’analisi del rischio ICQ (in realizzazione al MPAF) sia per i portali dell’INAIL e dell’INPS (in studio). Ma che si intende per TAL? Con il termine TAL (Trattamento Automatico della Lingua), o TL (Tecnologie Linguistiche, in inglese HLT - Human Language Technologies) vengono designate quelle discipline che si occupano di modelli, metodi, tecnologie, sistemi, applicazioni relativi all’elaborazione automatica della lingua, sia parlata sia scritta. Il TAL comprende dunque sia lo “Speech Processing” (SP) o elaborazione del parlato sia il “Natural Language Processing” (NLP) o elaborazione del testo e si pone obiettivi strettamente connessi, quali l’interazione vocale uomo-computer e la comprensione del linguaggio umano per servizi come traduzione automatica e il reperimento di informazioni. La prima area (SP) è volta a riprodurre la capacità umana di comunicare attraverso la parola e comprende la codifica del segnale vocale, il cui obiettivo è la riduzione della quantità di informazione da trasmettere o memorizzare, la sintesi da testo, ovvero la realizzazione della macchina in grado di leggere un testo qualsiasi, il riconoscimento del parlato, ovvero la macchina in grado di scrivere e, infine, il riconoscimento del parlante. La seconda area (NLP) tende a riprodurre la capacità umana di comprendere il linguaggio e prevede, dal punto di vista dei componenti e metodi utilizzati, analizzatori sintattici e semantici, basati su moduli algoritmici o statistici, modelli di rappresentazione della conoscenza, basati su dizionari o enciclopedie, metodologie di apprendimento automatico, e tecniche di annotazione e classificazione quale punto di partenza per il reperimento dell’informazione, mentre, dal punto di vista delle applicazioni, oltre alla traduzione automatica, che riveste importanza particolare nell’Europa dalle molte lingue, comprende i temi della gestione del dialogo, della produzione di sommari, dei motori di ricerca in rete, della gestione della conoscenza.