Terminologia e dintorni

Terminologia e dintorni

pubblicato in Benvenuti, Ferri del Mestiere

da il 6 dicembre 2012

Oggi proponiamo l’interessante e dettagliato contributo di Stefano KaliFire, pubblicato sulle pagine del sito Tra di noi, blog dei liberi professionisti traduttori, in merito alla gestione delle risorse terminologiche:

“Tutti abbiamo il nostro tesoretto terminologico: risorse online tra i segnalibri del browser o semplici elenchi in formato PDF, DOC o Excel che abbiamo raccolto nel corso degli anni e salvato sul nostro disco rigido.

E quando dobbiamo consultarlo, seguiamo tutti più o meno la stessa procedura: andiamo a visitare il sito online oppure apriamo il caveau in cui si trovano i file e iniziamo la nostra caccia al tesoro quotidiana! Alcuni di noi, più esperti, usano sofisticati programmi come IntelliWebSearch o Archivarius 3000 che permettono ricerche ancora più veloci.

Un giorno però mi sono chiesto: perché perdere tutto questo tempo per cercare sempre le stesse cose? Non esiste un metodo più pratico? Uno è certamente quello di riunire tutto questo bengodi terminologico in un unico mega-glossario da attivare poi nel nostro CAT-tool preferito, eventualmente in aggiunta a quello del cliente. Con un simile glossario, infatti, i termini ci verranno proposti automaticamente mentre traduciamo e non dobbiamo ogni volta andare a cercarceli, né con le chiavi, né con altri programmi.

Anche se la procedura spiegata in questo articolo si riferisce a Trados Studio 2011 con MultiTerm, è valida (con le necessarie variazioni) anche per altri CAT-tool.

Siete pronti?

Iniziamo con i requisiti che deve soddisfare una risorsa per poter far parte del nostro mega-glossario. Prima di tutto deve essere una risorsa di qualità, proveniente da una fonte affidabile e contenente la terminologia che ci capita di usare spesso (indipendentemente dal cliente). Apro una piccola parentesi: sono sicuro che ciascuno di noi sia in grado di valutare da solo se un glossario è valido o meno. Ricordiamoci solo che qualsiasi risorsa (anche la più affidabile) va sempre trattata con le pinze e valutata bene prima di essere usata. Chiusa parentesi.

La risorsa deve inoltre rispondere a determinati requisiti formali. Considerando il fatto che il formato di partenza per poter importare un glossario in quasi tutti i CAT è sempre Excel (file XLS, CSV, TXT), i candidati ideali sono:

  • File XLS/XLSX (TS2011 e Déjà Vu X2) con voci suddivise in varie colonne: questo è il formato che richiede meno tempo, perché basta ripulirlo e importarlo.
  • File TXT (WordFast e Déjà Vu X2) o CSV (memoQ) con voci separate da tabulatore, virgola, punto e virgola, ecc.: anche questi file richiedono poco tempo, perché si importano direttamente o si gestiscono comodamente in Excel.
  • File DOC e PDF con voci contenute in una tabella: questi file devono prima essere trasferiti manualmente in Excel.
  • Risorse online con voci incolonnate in una tabella HTML: in questo caso occorre fare un copia&incolla delle voci in Excel (può richiedere più tempo se le tabelle sono suddivise su più pagine).
  • Risorse online/offline affidabili ma impossibili da trasferire automaticamente, ad es. perché ogni voce ha una sua pagina: questo è il formato che richiede più tempo, perché dobbiamo fare un copia&incolla manuale delle singole voci in Excel.

 
Nei primi 3 gruppi rientrano i già citati elenchi che abbiamo sul nostro disco rigido e che ci capita di consultare spesso, nonché altre risorse esterne disponibili in uno di questi formati (vedere l’elenco più in basso). I file DOC non dovrebbero creare problemi particolari, mentre per i file PDF esistono programmi di conversione (ad es. Solid Converter® PDF) dotati di una funzione speciale per estrarre i dati contenuti nelle tabelle in un file Excel:

Funzione di Solid Converter® PDF per estrarre tabelle PDF in Excel
(Funzione di Solid Converter® PDF per estrarre tabelle PDF in Excel)

Nel penultimo gruppo rientrano ad es. risorse tipo questa:

Risorsa online con termini incolonnati
(Risorsa online con termini incolonnati)

… che, con pochi clic, possono essere importate in un file Excel:

Trasferimento dei dati in Excel
Trasferimento dei dati in Excel

Qui in realtà ci va qualche clic in più: nella colonna dell’italiano abbiamo infatti tutte le voci che iniziano con la maiuscola e alcune hanno degli asterischi alla fine. Copiamo allora la colonna dell’italiano e la incolliamo in un file Word, selezioniamo tutto il testo, premiamo una o più volte la combinazione di tasti Shift+F3 per mettere tutte le iniziali minuscole, poi cancelliamo tutti gli asterischi con il comando Replace, controlliamo che sia tutto a posto e reimportiamo la colonna in Excel. Anche il genere tra parentesi nelle voci source può essere facilmente eliminato in Word, sempre con il comando Replace.

Nell’ultimo gruppo rientrano invece risorse come questa:

Questo glossario deve essere trasferito manualmente in Excel
(Questo glossario deve essere trasferito manualmente in Excel)

Questo è il tipico esempio di glossario che non può essere importato automaticamente, ma la cui affidabilità, completezza o importanza per il nostro lavoro giustificano un copia&incolla manuale di ogni singola voce. Lo so: lavoro lungo e noioso, ma che vale senz’altro la pena e, una volta finito, durerà per sempre. Ad esempio, per trasferire in un file Excel il glossario della World Road Association di circa 1500 voci – incluse tutte le descrizioni – ho impiegato 3 x 4 ore. Operazioni come queste possono essere fatte un po’ alla volta, nei momenti in cui abbiamo meno da fare del solito.

Un’altra questione importante che dobbiamo risolvere prima di iniziare è la struttura che dovrà avere il nostro mega-glossario. In base ad essa, infatti, dovremo strutturare il file Excel ogni volta che importeremo nuove risorse. Quando ho creato il mio, ho optato per una struttura chiara e semplice:

La struttura delle colonne deve essere identica a quella del glossario
(La struttura delle colonne deve essere identica a quella del glossario)

Anche il mio glossario MultiTerm è strutturato nello stesso modo: ci sono i due campi delle lingue GERMAN e ITALIAN, due campi per eventuali descrizioni (che ho chiamato Definition e Definizione) e i due campi Fonte/Quelle:


(Struttura del glossario in MultiTerm)

Per glossari di questo tipo, contenenti terminologia mista proveniente da più parti, avere il campo della fonte sempre compilato è molto utile, così quando ci viene suggerito un termine in TS2011 vediamo subito anche da dove arriva:

Fonte sempre bene in vista in TS2011
(Fonte sempre bene in vista in TS2011)

Per MultiTerm, l’ordine dei campi nel file Excel è indifferente e non sempre devono esserci tutti. L’importante è che i nomi delle colonne corrispondano esattamente ai nomi dei campi nel glossario (maiuscole/minuscole). Ecco come si presenta un file Excel nella sua configurazione minima di 3 colonne (target-source-fonte):

File Excel con il numero minimo di colonne
(File Excel con il numero minimo di colonne)

Una volta creato il glossario con la struttura desiderata e capito cosa può essere importato e cosa no, possiamo partire, magari iniziando proprio dai file che abbiamo sul nostro disco rigido e che consultiamo più frequentemente.

Se vi manca l’ultima parte, cioè l’importazione del file Excel nel glossario MultiTerm, vi rimando a questa mia nota pubblica di Facebook che spiega passo passo la procedura.

Consiglio vivamente di fare sempre una copia di backup del mega-glossario prima di importare una nuova serie di dati: questo ci consentirà di correre ai ripari se la procedura di importazione è stata incompleta, perché ci siamo dimenticati qualcosa o si sono verificati altri problemi.

Il mega-glossario MultiTerm che ho creato per me contiene al momento più di 88.000 voci, provenienti dalle seguenti risorse esterne (per lo più multilingue) e da altri glossari de-it personali con terminologia convalidata dal cliente:

Risorse in formato MultiTerm 2011

  • Glossario Microsoft (lingue europee) in formato MultiTerm 2011 su translationzone.com (necessaria la registrazione). Sfogliare le pagine di OpenExchange per altri glossari Microsoft in altre lingue. Sul sito Microsoft si trovano in quasi 100 lingue, ma richiedono più tempo perché in formato TBX e ogni lingua sempre in coppia con l’inglese (MULTILINGUE, informatica, ~20000 voci)

Risorse in formato Excel

  • EuroVoc: thesaurus multilingue dell’Unione europea (MULTILINGUE, terminologia dei settori d’attività dell’UE, con attenzione particolare per l’attività parlamentare, ~7000 voci)
  • Glossario ECHA (MULTILINGUE, chimica, ~1000 voci)
  • TESE – Thesaurus of Education Systems in Europe (MULTILINGUE, educazione, ~1500 voci)
  • Vocabolario comune appalti pubblici (CPV) adottato dal regolamento (CE) n° 213/2008 (MULTILINGUE, ~9500 voci)
  • Sicurezza dei documenti PRADO (versione Excel) (MULTILINGUE, ~300 voci)
  • Glossapedia, la raccolta dei glossari del Dipartimento Lingue – Fondazione Scuole Civiche Milano (principalmente IT-DE-EN-FR-ES, argomenti vari)

Risorse in formato DOC/PDF

  • Abbreviazioni ufficiali civili usate in Svizzera (DE-IT-FR, Svizzera, ~1500 voci)
  • Nomi ufficiali dei tribunali tedeschi (MULTILINGUE, 17 voci)
  • Dictionnaire d’Acoustique – Société Suisse d’Acoustique (SGA-SSA) (DE-FR-IT-EN, audio Svizzera, ~500 voci)
  • Moduli di stato civile (DE-IT-FR, Svizzera, 79 voci)
  • Nomi ufficiali delle professioni svizzere (DE-IT-FR, lavoro, ~12500 voci)
  • Textile terminology (IT-DE-EN-FR-PT-ES, tessile, ~4500 voci)
  • APPENDIX II MedDRA (v12.0): Terminology to be used in Section 4.8 “Undesirable effects” of SmPC (MULTILINGUE, medicina, 32 voci)
  • Turismo (IT-DE, turismo, ~600 voci)

Risorse online allineate

  • Classification of goods and services according to the NICE Agreement 1979 (MULTILINGUE, ~6000 voci)
  • Frasi R & frasi S ufficiali (MULTILINGUE, ~300 voci) (su Wikipedia si trovano in varie lingue)
  • Glossario dell’Istituto Europeo di Pubblica Amministrazione (EIPA) (EN-FR-DE-EL-IT-ES, lavoro, ~450 voci)
  • Glossario XILOGLOS: fare clic sul primo pulsante Cerca per visualizzare l’elenco di tutti i termini (IT-EN-FR-DE, tecnologia del legno, ~1500 voci)

Risorse da importare manualmente

  • Climate Change: Key Terms in 23 languages – European Union 05.2011 (MULTILINGUE, clima, solo 24 voci ma molto attuali)
  • Financial Crisis: Key Terms in 23 languages European Union, 2012 (MULTILINGUE, finanza, solo 41 voci ma attualissime)
  • EESC Glossario di edilizia sostenibile (MULTILINGUE, edilizia, ~300 voci)
  • Glosario de términos relativos a la igualdad entre hombres y mujeres, Comisión Europea (MULTILINGUE, pari opportunità, ~120 voci)
  • PIARC Multilingual Terminology Database of the World Road Association (MULTILINGUE, strade-traffico-circolazione, ~1500 voci)

Ricordo infine che ulteriori risorse per altre combinazioni linguistiche sono disponibili sul blog di Traduttore Cerca Aiuto. Se conoscete altre risorse online degne di essere segnalate, vi invito a farlo commentando questo post. Grazie!”

Tag: ,

Nessun commento su ' Terminologia e dintorni '

Lascia un commento