Академический Документы
Профессиональный Документы
Культура Документы
Mizi,
1
INDICE
Premessa …………………………………………….……5
Introduzione……………………………………………………….7
1.1 Approccio alla traduzione automatica………………………………10
Note e Riferimenti Bibliografici. Capitolo primo …………………….12
LA TRADUZIONE AUTOMATICA
Introduzione ………………………………………………………13
2.1. Eurotra project………………………………………………………...17
2.2. Modelli di traduzione automatica…………………………………….19
Note al capitolo secondo………………………………………………….22
2
Note al capitolo terzo ……………………………………………………...32
GOOGLE
Introduzione ………………………………………………………..33
4.1. Storia di un imperio…………………………………………………….34
4.2. Google Translate……...………………………………………………..35
4.3. Google Translator Toolkit…………………………………………......37
4.4. Funzioni e caratteristiche del traduttore online………………………38
4.5. Client for Google Translate…………………………………………....41
4.6. Google Toolbar…………………………………………………….….42
4.7. Novità per la traduzione automatica …………………………………43
4.8. Traduzione speech to speech………………………………………….45
Note al capitolo quarto …………………………………………..47
Introduzione ………………………………………………………..49
5.1. Tecnologia e ricerca ………………………………………………….49
5.1.1Come funziona Mastor IBM?..............................................................51
Note al capitolo quinto ……………………………………….…..53
HILBERT ENGINE
Introduzione ………………………………………………………54
6.1. L’invenzione…………………………………………………..55
6.2. Sviluppo ……………………………………………………...56
6.3. Prospettive nel futuro della traduzione ……………………...57
Note al capitolo sesto ……………………………………………..58
3
Conclusione Finale………………………………………...59
Bibliografia…...…………………………………………….61
4
Premessa,
interlocutori che – pur parlando lingue diverse - riescono a capirsi in tempo reale
suddiviso in sette capitoli che trattano la traduzione automatica dal novecento fino
ad oggi offrendo anche informazioni sulle scoperte di frontiera nel settore. Il primo
capitolo si apre con una breve introduzione storica per poi avvicinarsi alla nascita
un reale strumento di collaborazione tra gli stati dell’Unione Europea, ideato per la
creazione di una memoria traduttiva gigantesca con cui tradurre efficacemente atti e
documenti ufficiali. Nello stesso capitolo parliamo anche di vari tentativi di creare
processo traduttivo .
5
umano per velocizzare il proprio lavoro. Vedremo esempi di come rintracciare,
glossari e macchine “traduttrici”. Il quarto capitolo, che dà anche il nome alla tesi,
testo con Google Translator appare la traduzione nella lingua del nostro browser,
con la possibilità di scegliere tra più di novanta lingue. Nello stesso capitolo
un traduttore universale.
Engine” - mai tradotta in italiano finora. Si tratta di un lavoro che discute l’uso di
sue applicazioni nel campo della traduzione possono essere decisive nella creazione
6
di una “macchina traduttrice” che in un futuro prossimo riuscirà a sostituire almeno
7
CAPITOLO 1
“Tradurre è oggi una costante della nostra vita, un’operazione cui molti di noi, spinti da
storia della traduzione dalle origini fino alla seconda metà del XX secolo, quando
veniva usata inizialmente nei rapporti politici e negli scambi commerciali. I greci
culturale per le lingue degli altri, definiti generalmente con la parola barbaroi
(barbare). Sono presenti nella storia della traduzione alcuni termini che esprimono
scritta come metafero (da cui il termine latino transferre), metafrazo ( tradurre,
collocano le riflessioni più antiche a noi note sul tradurre: il “De optimo genere
oratorum” di Marco Tullio Cicerone, sorta di manifesto che celebra la forma della
8
libera traduzione. Cicerone delinea un profilo dell’oratore perfetto, che riesce con
2005). Sempre lui afferma di aver tradotto i due più importanti oratori (Demostene
(chi traduce alla lettera) dall’orator (chi traduce come oratore/autore). Una
quella tra i due principali metodi di lavoro, letterale, che procede “non verbum de
verbo, sed sensum exprimere de sensu3”, e quella libera, che si propone di rendere
“Ho tradotto da oratore, non già da interprete di un testo con le espressioni stesse del
pensiero, con gli stessi modi di rendere questo, con un lessico appropriato all’indole della
nostra lingua. In essi non ho creduto di rendere parola con parola, ma ho mantenuto ogni
carattere e ogni efficacia espressiva delle parole stesse” (Cicerone, De optimo genere
oratorum)5
L’intento di Cicerone è quindi quello di dare vita ad una traduzione che “non
significato da una lingua all’altra”, ossia la traduzione letterale, parola per parola, è
un’idea ingenua: “non basta sostituire le parole greche con altre di altre lingue,
9
anche se queste hanno una vasta notorietà6”. Heidegger afferma che la traduzione
letterale non consente la vera fedeltà all’originale, pur dando questa impressione:
“il fatto che una traduzione sia semplicemente letterale non significa per ciò stesso
che sia anche più fedele a ciò che è detto. Una traduzione è fedele solo se le parole
traduzione non è “un’ottusa fedeltà” è solo “la capacità di tradursi nel tradurre, una
sentire una lingua: “dobbiamo piuttosto lasciare che le stesse parole greche ci
dicano ciò che esse nominano e trasferire la nostra capacità di ascoltare nell’ambito
che aprono nuovi orizzonti nel futuro di questo mestiere cosi antico. Come
10
tempo impensabili, ma in cui nonostante tutto il muro linguistico resta ancora
uomini di lingue e culture diverse. Ma per quanto tempo rimarrà in piedi ancora
E’ nel novecento che si parla per la prima volta di “scienza della traduzione”,
nella storia delle teorie traduttive. Il panorama nel mondo della traduzione cambia
elettronici e per le nascenti teorie linguistiche portava tali studiosi a pensare che il
traguardo di una sostituzione dei traduttori umani con i computer non fosse né
11
Note al capitolo primo.
1
JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del
linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin
2
BERTAZZOLI, RAFFAELLA, La traduzione: teorie e metodi, Carocci, 2006
3
SAN GEROLAMO, Liber de optimo genere interpretandi, Epistola 57 a
Pammacchio, (390 ca.), in TTS, pp.63-71. “Nelle mie traduzioni dal greco in latino
non miro a rendere parola per parola, ma a riprodurre integralmente il senso
dell’originale (non verbum de verbo, sed sensum exprimere de sensu). E di questo
mio metodo ho a maestro Cicerone”.
4,5
MARCO TULLIO CICERONE, De optimo genere oratorum, in S. NERGAARD,
La teoria della traduzione nella storia, Bompiani, Milano 1993. G. TISSONI, Tutte
le opere di Cicerone, vol. 17, Mondadori, Milano 1973, pp. 33-35
6
M. HEIDEGGER, Che cosa significa pensare?, a cura di U. Ugazio e G. Vattimo,
Sugar, Milano 1979,
7
M. HEIDEGGER, Sentieri interrotti, trad. it. di P. Chiodi, La Nuova Italia, Firenze
1968, p. 300
8
M. HEIDEGGER, Che cosa significa pensare ?, cit., p. 151.
9
Ermeneutica, tradizione e traduzione in HEIDEGGER , a cura di Francesco
Cardone, fonte www.filosofico.net
10
M. HEIDEGGER, Che cosa significa pensare? cit., p. 151.
11
JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del
linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin
12
12
ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
CAPITOLO 2
LA TRADUZIONE AUTOMATICA
I primi brevetti relativi al campo della traduzione automatica risalgono alla metà
degli anni ’30 del secolo scorso, con Georges Artsrouni che propose un semplice
cifrati. Negli anni successivi, molte università negli Stati Uniti hanno cominciato
una seria ricerca nel campo. Il 7 gennaio 1954 a New York presso la sede di IBM
13
tuttavia, non era altro che un giocattolo che conosceva appena 250 parole,
soprattutto nel campo della chimica, e riusciva tradurre con cura solo quarantanove
convinse l'opinione pubblica del fatto che l’avvento della traduzione automatica
solo negli Stati Uniti ma in tutto il mondo13. Durante questo periodo, furono
United States Air Force utilizzò così un sistema prodotto da IBM e dalla
University.
Un duro colpo viene dato alla ricerca in questo settore nel 1966, con la
scienziati convocato nel 1964 – è stato richiesto dal governo degli Stati Uniti, e
automatica era più costosa, meno accurata e più lenta in confronto alla traduzione
14
all'inglese. Importanti progressi si sono verificati durante il 1980. Le esigenze
viceversa).
Nel 1980 avviene una vera ripresa della ricerca e della produzione di
15
per la pubblicazione, le rimanenti vengono utilizzate come “traduzioni
indicative”.16
L'inizio degli anni ‘90 ha visto un’evoluzione vitale nella traduzione automatica
“lingua” non è più percepita come un’entità statica disciplinata da regole fisse, ma
evolvendo nel tempo e adattandosi alla realtà sociale e culturale. In tutto questo
portato alla creazione di programmi di traduzione online (fra i primi, Altavista), che
offrono servizi gratuiti di posta elettronica veloce, pagine web nella lingua
l’arrivo del nuovo secolo i programmi informatici creati per svolgere compiti
una piccola percentuale del mercato. All'inizio degli anni ‘90 il mercato della
16
Tabella.1. Il mercato della traduzione nel 1990
Si può notare che solo sei milioni di pagine sono state tradotte attraverso la
offre soprattutto un mezzo per risparmiare tempo (a scapito della qualità), piuttosto
2.1 Eurotra Project. Portiamo avanti la nostra ricerca con Eurotra, un ambizioso
dalla fine degli anni ‘70 fino al 1994. Una vasta rete europea di linguisti e
automatica (MT) per le lingue ufficiali della Comunità Europea, all’inizio sette e
poi nove. Tuttavia, col passare del tempo, le attese si attenuarono; "Fully Automatic
High Quality Translation", la traduzione automatica di alta qualità, non era più un
17
Il progetto fu altamente motivato da uno dei principi fondamentali dell'Unione
qualsiasi documento creato all’interno dell’UE, fatto che garantiva una maggiore
discorso e ogni verbale delle riunioni interne. Tutti questi fattori hanno fatto dalla
traduzione un elemento dal peso drammatico nel bilancio contabile dell’U.E. Per
erano più gruppi distribuiti in tutti i paesi membri, organizzati piuttosto secondo la
lingua che seguendo i confini nazionali (per esempio, i gruppi di Leuven e Utrecht
nella pubblicazione “The Mythical Man-Month” e cioè “più il numero dei gruppi
comunicazione, piuttosto che per la ricerca effettiva di per sé”. Eurotra, infatti, non
18
è mai riuscito a offrire al mercato un prodotto finito e funzionante, cioè un sistema
di lavoro MT. Nonostante ciò, ha avuto un impatto di vasta portata a lungo termine
sulle industrie nascenti negli stati membri europei, in particolare nei paesi del sud
opera su diversi livelli: livello semantico (in cui bisogna innanzitutto comprendere
capire le parole in una frase) e livello pragmatico (che richiede una comprensione
19
conoscenza del campo “oggetto” che è generale, (entrambe aiutano a comprendere
dei fenomeni che stanno alla base del lavoro di un traduttore umano, sarebbe
difficile pretendere che una macchina possa produrre un testo di arrivo della stessa
perfetto; in secondo luogo, la fase di revisione, variando dalla semplice rilettura del
che MT mira a eseguire la prima tappa di questo processo in modo automatico, cosi
che il traduttore umano può procedere direttamente con la seconda fase che
questi seguono sistemi di modelli linguistici più complessi come quelli di seconda
20
L’intero ciclo comprende l’immissione del testo di partenza (input), l’elaborazione
Negli anni ’90 si diffonde un nuovo modello basato su “banche dati testuali
Alcuni ricercatori dell’IBM hanno concepito metodi per allineare i corpora paralleli
(raccolte di testi in formato elettronico) per poi calcolare la probabilità con cui a
ciascuna frase o parola in una lingua corrisponde una frase o parola di un'altra
dal principio dei corpora paralleli conosciuto come “traduzione automatica basata
21
hanno contribuito alla nascita di una nuova generazione di strumenti informatici
11,12
Traduzione propria da “Concise history of the language sciences: from the
http://www.consorzionettuno.it
22
19
Traduzioni proprie da MAEGAARD, B, 1989. Perspectives in artificial
24
ZANETTIN, FEDERICO. (2001) “Informatica e traduzione”. In Monacelli,
23
CAPITOLO 3.
programmi per il computer in grado di tradurre una grande varietà di testi da una
perfetta, visto che non esistono “macchine traduttrici” che al semplice tocco di
alcuni tasti riescano a capire qualsiasi testo, in qualsiasi lingua naturale, per poi
produrre una traduzione perfetta in qualsiasi altra lingua senza l'intervento umano.
che in qualche modo elaborano il linguaggio umano, tra cui: elaboratori di testi,
24
sistemi progettati appositamente per l'ambito traduttivo: da quelli che pretendono di
per le attività svolte tradizionalmente, quali vari tipi di analisi sul testo di partenza
automatica (MT, Machine Translation), anche nella sua varietà assistita (HAMT,
quella che è più propriamente detta MAHT (Machine Aided Human Translation)26.
25
3.1 Strumenti CAT/TM. Oggi, i più diffusi sistemi per la traduzione assistita
TM” viene spesso usato, in modo impreciso, con il termine “strumento CAT”27.
in cui i testi di partenza in una certa lingua e i corrispondenti testi di arrivo in una o
testo nella lingua di partenza, sia il corrispondente testo nella lingua di arrivo.
26
L'allineamento consiste nella segmentazione dei testi di partenza e di arrivo,
definizione delle corrispondenze tra i segmenti nelle due lingue (con interventi
(cfr. Brace 1995, Dennet 1995, Heyn 1998). Il traduttore può accettare la
presente nei glossari disponibili, sarà quindi possibile verificare il modo in cui è
testo della lingua sorgente in segmenti (tag) che saranno tradotti in altrettanti tag
nella lingua target. È il programma più utilizzato nelle grandi software houses.29
27
Wordfast invece, pur essendo per certi versi abbastanza simile a Trados, non è un
software vero e proprio essendo un CAT tool, ossia uno strumento di traduzione
utilizzato tali risorse, sotto forma di dizionari e glossari cartacei. Con l'avvento
della rivoluzione informatica, i primi ad essere creati sono stati gli strumenti per la
presenti sia nel testo da tradurre, sia nel glossario o nei glossari associati al
termini nella traduzione; tutti mettono a disposizione metodi rapidi per la loro
28
selezione e inserimento nel testo, riducendo i tempi di digitazione e le possibilità di
chiamato MultiTerm. Nelle versioni più recenti è stato introdotto MultiTerm IX,
uno strumento che rende possibili più operazioni, come l'inserimento interattivo di
non aveva la facilità d'uso tra i suoi punti di forza. I punti di forza di MultiTerm
testo ricercato. In questo modo il traduttore visiona tutte le varianti in cui una
traducenti al nuovo contesto. Possiamo affermare che i corpora paralleli non sono
altro che memorie di traduzione “ovvero insiemi di testi in due lingue in cui
ciascun testo è una traduzione di un testo nell’altra lingua30”. Solo che una memoria
29
traduttiva rappresenta un tipo particolare di corpus elettronico31 in quanto di solito
qualità richiesta non sia troppo elevata; ad esempio: e-mail in arrivo, sessioni di
chat, pagine web o testi, quando dobbiamo avere “un’idea complessiva” di cosa è
stato scritto nel documento originale in una lingua che non siamo in grado di
soluzione per tutte le esigenze di traduzione. Alcune aziende che producono tali
che si possono utilizzare per costruire una versione multilingue dei propri
contesto in cui le parole sono inserite, e producono risultati che, come abbiamo già
due criteri: in base alla situazione ( più o meno favorevole al loro utilizzo) e in base
agli utenti a cui sono destinati. Nel 1992 è stata proposta dall’associazione per lo
30
sviluppo dell’industria elettronica giapponese una serie di parametri per la
valutazione delle metodologie e dei criteri della traduzione automatica che sotto
31
Note al capitolo terzo
25
LAGOUDAKI, E (2006), Translation Memory systems: Enlightening users'
perspective. Imperial College of London, online su http://transnotes.blogspot.com
26,27
MUZZI, A , 2000-2010, Translation & localization services for the Italian
language, online su http://www.amtrad.it
28
Software Professionali ,online su http://www.navigaweb.it
29
OSIMO, BRUNO, 2005. Traduzione e nuove tecnologie. Informatica e Internet
per traduttori. Guida pratica con glossario, Milano, Hoepli. “Raccolta di testi,
enunciati scritti e/o orali, che possono caratterizzarsi per la lingua in cui sono
codificati, per il periodo in cui sono stati prodotti o anche per l’ambito settoriale a
cui fanno riferimento”.
30
ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
31
raccolte di testi costruite per fini linguistici che possono essere creati anche su
carta oppure oralmente , ma i corpora moderni sono tutti elettronici. Mirko
Tavosanis, 2008, Linguistica dei corpora.
32,33
Traduzione automatica e traduzione gratuita, 2009. www.traduzione-
localizzazione.com
32
34
ZANETTIN, FEDERICO (2001) “Informatica e traduzione”. In Monacelli,
Claudia (ed.) Traduzione, revisione e localizzazione nel terzo millennio: da e verso
l'inglese. Milano: Franco Angeli, 19-45.
CAPITOLO 4
Dando uno sguardo al sito ufficiale di Google, che propone anche una breve storia
del motore di ricerca, scopriamo che “Google”35 è un gioco di parole che richiama
la parola “Googol”: una parola che fu inventata da Milton Sirotta, nipote del
zeri. Un googol è un numero molto grande. L'uso che Google fa del termine riflette
geniale di due giovani laureati statunitensi, debutta online nel 1999 ed è oggi il
motore di ricerca più popolare. I creatori di Google sono Larry Page e Sergey Brin.
struttura dei link del World Wide Web in particolare. Stabiliscono che mediante
quasi dieci anni numerosi ambiti tra i quali la search (ricerca online), la pubblicità
4.1 Breve storia di un imperio. Dal 1999 a oggi Google ha ottenuto importanti
grande internet service provider del mondo che conta oggi trentaquattro milioni di
clienti e dieci milioni di visitatori quotidiani, aveva firmato un accordo che lo lega
primissimi risultati delle ricerche. A giugno 2000 Google annuncia di aver censito
oltre un miliardo di pagine web di cui 560 milioni acquisite per intero e 500 milioni
segnalate solo in base al loro indirizzo web ma non ancora analizzate nel dettaglio.
A maggio 2001 Google riporta in vita gli archivi dei newsgroup che furono di
ricerca interna nei siti come ad esempio per Red Hat (azienda specializzata sul
sistema operativo Linux), e in una seconda fase li ha forniti a tutti gli utenti grazie
in tutto il mondo39”. Nel 2004 Sergey Brin, uno dei fondatori di Google, sottopose
automatico che l'azienda stessa aveva creato. Il testo in sé diceva che Google era un
risultato: “Le scarpe di pesce crudo a fette che la cosa desidera. Google è proprio
un bel cipollotto!”40 Brin disse allora che tutto sommato Google poteva fare di
meglio. Sei anni dopo, il servizio gratuito di traduzione online Google Translate
funzionava per cinquantadue lingue, più di qualsiasi altro omologo ed è stato usato
35
Oggi la rete di dati che ha messo insieme per la ricerca online, se valutata nel suo
insieme, può essere considerata la memoria più grande del mondo. Ora Google sta
usando la stessa forza per ottenere il massimo anche nel campo delle tecnologie per
la traduzione automatica. “La traduzione automatica è uno dei migliori esempi per
executive della Casa Editrice O'Reilly Media. “Non viene presa troppo sul serio,
automatica è una delle sfide più difficili nell'intelligenza artificiale. Per adesso i
sistemi di traduzione automatica sono ben lontani dall’essere perfetti. Gli esperti
sostengono che per un computer è ancora troppo difficile dividere in parti una frase
immediate per milioni di persone. “Se ti basta una traduzione per sommi capi, è ciò
che fa per te” dice Philip Resnik, esperto di traduzione automatica e professore
“Chiunque potrà comunicare con chiunque altro”, afferma Och, scienziato tedesco
36
“Più testi si lavorano, più precisi diventano i modelli”, afferma Och. Lo sforzo è
valso la candela. Un anno dopo, Google ha vinto un concorso voluto dal Governo
riconoscere in modo più preciso l'inglese parlato. Neanche un anno dopo, Google
Goggles che analizza le foto dal cellulare e le confronta con un database che
Google deve ancora migliorare, ma dice pure che la cosa procede molto
4.3 Google Translator Toolkit. Google lancia sul mercato il 5 settembre del
2009 il Google traduttore Toolkit, un potente editore di facile uso che permette ai
37
esempio, se un lettore di lingua araba vuole tradurre un articolo di Wikipedia
lingue, in altre parole oltre il 98% della popolazione di Internet nel mondo.
anche testi più o meno complessi in diverse lingue, a partire dalla lingua da cui si
desidera tradurre.
38
È diviso in tre parti: la prima propone all'utente di effettuare una ricerca sul Web
partendo da una keyword nella propria lingua, onde trovare risultati su Google nella
lingua desiderata in cui detta keyword verrà tradotta, come si può osservare
testo deve essere tradotto). Come si può osservare nell’immagine seguente: Fig.5
39
Fig.5. Google Translate
in cui si vuole tradurre questa pagina. In tutti e tre i casi, il risultato delle traduzioni
può apparire approssimativo, ma c’è da considerare una cosa: più il testo è accurato
40
4.5 Client for Google Traslate. Parliamo ancora di traduzioni indicando un
senza aprire Internet Explorer o altri browser. Come già riferito prima, Google
lingua a un'altra. Esso si usa su internet, direttamente cliccando gli strumenti delle
lingue dalla pagina di partenza di Google oppure usando altri siti web che sfruttano il
efficace che permette di usare il servizio online Google Translate da desktop, senza
usati. Questo programma desktop si chiama Client for Google Translate, e sfrutta il
41
Alcune impostazioni si devono configurare subito dopo l'installazione, in
particolar modo la lingua in cui si desidera tradurre, perché il testo deve essere
lingua di ciò che è scritto nella prima finestra e che l'utente vuole tradurre. Il testo
può essere selezionato con il mouse e una piccola icona G apparirà accanto. Se
traduzione, diventa utile nel caso in cui il servizio di traduzione rileva la lingua
finestre di altri programmi aperti previa impostazione. Di default esso s’installa con
l'opzione “avvio con Windows” in modo che si avvia da solo quando si accende il
programma software adatto per sistemi operativi come Windows Xp, Vista e
Windows Seven43.
4.6 Google Toolbar. Google Toolbar è uno strumento che s’integra direttamente
nel browser Internet Explorer (esiste anche una versione per Firefox) e che
42
toolbar stessa, appare un elenco con le ricerche più frequenti effettuate con Google,
altri motori di ricerca. Google Toolbar offre anche uno strumento utile per le
Toolbar. Si possono anche tradurre singole parole che si trovano in una pagina web
parole” dal menu “Traduci”, basta collocare il cursore del mouse su una parola
passo avanti per infrangere il muro linguistico – culturale, facilitando ancora di più
tratta di un servizio, inserito nei cellulari dotati di sistema operativo Android, che
43
lingua straniera; per farlo, basta fotografare il testo e istantaneamente sullo schermo
istantaneo. Ora la novità sta proprio nel supporto multilingua con relativa
traduzione, per adesso disponibile solo con il sistema operativo Android 1.6 e
quelli che non potendo stare di fronte a un computer, hanno bisogno d’informazioni
44
Fig.9. Google Goggles.
traduce documenti o pagine web in ben cinquantadue lingue, e di Google Voice che
conta già 1,4 milioni di utenti, la società di Mountain View sta lavorando a un
interprete universale da installare nel giro di due, tre anni negli smartphone, e che
consentirà a due persone che non parlano la stessa lingua di comunicare via
speech-to-speech nel giro di pochi anni” – ha detto al Sunday Times Franz Och,
responsabile dei servizi di traduzione di Google – anche se, per farlo funzionare
45
dell’esperto, mentre i traduttori automatici di testo hanno fatto passi da gigante
accurato quanto più sarà usato e, quindi, più dati inseriranno, migliore sarà la
46
Note al capitolo quarto.
34
KOLLER, DAVID, Gennaio 2004. Origin of the name, “Google”. Stanford
University. Fonte online www.searchenginehistory.com
35
ROBERTO, CURCI, 2007. Risorse per Webdesigner e Webcoders. Fonte online
www.robertocurci.net
36
New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online
www.tg3.rai.it
37
Inktomi Corporation - società della California che ha fornito il software per i
fornitori di servizi Internet. È stata fondata nel 1996 dal professor Eric Brewer e dal
dottorando Paul Gauthier. Fonte online www.business.com
38
Profilo aziendale consultabile online su http://www.google.com/corporate/.
39
New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online
www.tg3.rai.it
40
L'azienda di Tim O’Reilly è ritenuta da molti la migliore casa editrice di
Informatica al mondo, e tanti sono i programmatori che considerano un libro
O'Reilly il libro definitivo su un certo argomento. Fonte online http://oreilly.com/
41
Franz Josef Och lavora con Google dal 2004 come ricercatore scientifico, capo
gruppo della squadra di traduzione automatica. Fonte online
www.research.google.com
42
GAVEZ, M e BHANSALI, SANJAY, 2009. Tradurre il mondo
dell’informazione con Google Translator Toolkit. Fonte online
www.googleblog.blogspot.com
43
Client for Google Translate –Free Translator. Fonte online su
www.translateclient.com41 44Google Goggles – Fonte online
www.whatisgooglegoggles.com
45
The Sunday Times ,February 7, 2010. Google leaps language barrier with
translator phone, a cura di Chris Gourlay. Fonte online www.timesonline.co.uk
47
CAPITOLO 5
SPEECH TO SPEECH TRANSLATION
modo in cui le persone di tutto il mondo, che parlano lingue diverse, riescono a
ricercatrice Yuging Gao. Sempre lei afferma che la parte più importante della
ricerca con un compito cosi innovativo sta nell’affrontare sfide nuove. “È molto
48
avviato nel 2001 come un progetto di ricerca avanzato della IBM ed è stato
con un vocabolario di grandi dimensioni (più di 30.000 parole per ogni lingua)
adatto a vari settori: viaggi, diagnosi medica di emergenza, protezione delle forze
anche per palmare PDA, con un minimo degrado delle prestazioni. Entrambe le
agosto del 2004 a DARPA che dopo una valutazione complessa l’ha dichiarato
una svolta nella traduzione del linguaggio parlato per la sua capacità di analizzare
49
integrare una serie di tecnologie complesse - Automatic Speech Recognition (ASR),
che mature, tanto meno quando vengono usate insieme. Attualmente, l'unico
discorso bidirezionale48.
articola in tre momenti successivi: Mastor memorizza una frase pronunciata da uno
degli interlocutori e la converte in testo scritto, quindi esegue una traduzione di tale
frase nella lingua del secondo interlocutore e finalmente riferisce la frase tradotta
l’uso di frasi già memorizzate e non deve identificare ogni parola pronunciata, ma è
origine in un set d’idee concettuali e ripropone gli stessi concetti nella lingua
richiesta. Se, per esempio, tale frase esprime una richiesta di aiuto di carattere
medico, essa sarà tradotta sempre con un’unica frase predefinita che ne conservi il
significato, senza ricorrere ad una traduzione letterale delle singole parole che la
50
compongono. In tal modo, si potrà evitare l’utilizzo di corposi database, necessari
per la traduzione, e rendere più agevole l’introduzione della nuova tecnologia IBM
troppo presto per prevedere quando tale tecnologia potrà essere inclusa nei primi
dispositivi hardware50.
51
Note al capitolo quinto
46,47,48
traduzione propria dall’intervista rilasciata da Yuqing Gao, 2009, Speech-to-
49
Mastor: il traduttore simultaneo che non fa la traduzione letterale delle parole ma
50
traduzione propria dall’articolo Mastor, 2007, online su www.IBM.com
52
CAPITOLO 6
HILBERT ENGINE
una grande azienda di consulenza che dopo molti mesi di analisi trae la conclusione
che ci sarebbero voluti mesi di “run-time” per pulire questi dati. Bjorn Gruenwald,
53
l'inventore del Motore Hilbert, ha avuto l'opportunità di rivedere il problema ed ha
tabella in file di singole parole e tradurre tutti i dati di queste file in numeri. Così
una banca di dati sarà completamente trasformata in una matrice di dati numerici in
testata con successo, con grandi vantaggi in termini di tempo di ricerca e di accesso
ai dati.
54
Dopo questo successo iniziale, Hilbert Engine è stato applicato per la gestione di
script e alla progettazione dello spazio Hilbert. Per esempio presupponiamo che
nome uguale a “Washington”, con capelli castani e occhi blu, che vivono in
“Philadelphia” e hanno tra i 30 e i 50 anni. Si deve specificare che questi dati non
sono stati indicizzati per campi singoli, come nome, colore dei capelli o degli
occhi, città o età. Con la tecnologia attuale sarebbe quasi impossibile ottenere le
Hilbert. Questa velocità incredibile non è limitata ai dati basilari (come un Address
55
Fig.12. La tecnologia vettoriale
in cui il muro linguistico che separa nazionalità e culture lontane sarà abbattuto
lingue di comunicare via telefono, internet e appositi dispositivi ognuno nella sua
semplice clic testi scritti in tutte le lingue del mondo, eliminando cosi per sempre
56
Note al capitolo sesto.
51
Traduzione propria dalla pubblicazione “Perspective on Performance in Business
57
Conclusione finale
Uno degli aspetti più esaltanti del lavoro nel campo della traduzione
automatica – e dunque anche della ricerca che è stata alla base di questo lavoro di
tesi – è quello di poter prefigurare una situazione in cui il mitico muro linguistico
inizia a sciogliersi, dando luogo a una comunicazione completa tra esseri umani
parlanti lingue diverse. A testimoniare il fatto che questa possibilità inizia a non
sembrare più solo un’ipotesi irrealistica, sono i più importanti strumenti informatici
anche una parte pratico-applicativa, sotto forma di riferimenti utili per rintracciare e
utilizzare in modo giusto alcuni fra i più potenti strumenti informatici per la
le due tabelle sotto riportate: nella prima possiamo osservare il mercato della
58
traduzione negli anni novanta invece la seconda rappresenta la traduzione
automatica oggi.
Come possiamo osservare, rispetto a vent’anni prima, nel 2010 il mercato della
59
espansione che il settore ha conosciuto negli ultimi vent’anni e formulare ipotesi
Bibliografia
60
BOWKER, L.; Computer-Aided Translation Technology. A practical
introduction. University of Ottawa Press, Ottawa 2002.
HAROLD L. SOMERS: "New Paradigms" in MT: The state of play now that
the dust has settled. In ESSLLI '98 Machine Translation Workshop
JACOBSON, Note per una didattica sulla storia della traduzione. Aspetti del
linguaggio e della traduzione, trad. it. di R. Bianchi e C. Béguin Garzanti,
Milano 2004
61
SAN GEROLAMO, Liber de optimo genere interpretandi, Epistola 57 a
Pammacchio, (390 ca.), in TTS, pp.63-71.
Concise history of the language sciences: from the Sumerians to the cognitivists.
Edited by E.F.K.Koerner and R.E.Asher. Oxford: Pergamon Press, 1995. 431-445,
online su: www.hutchinsweb.me.uk/history.htm
62
MAEGAARD, B, 1989. Perspectives in artificial intelligence vol. 2: machine
translation, NLP, databases and computer-aided instruction. Source
http://portal.acm.org/citation.cfm?id=65688
New York Times del 9 marzo 2010, a cura di Miguel Helft. Fonte online
www.tg3.rai.it
The Sunday Times, February 7, 2010. Google leaps language barrier with
translator phone, a cura di Chris Gourlay. Fonte online www.timesonline.co.uk
63