Welcome to TechNet Blogs Sign in | Join | Help

Terminologia etc.

Blog sulla terminologia nei prodotti Microsoft e altre considerazioni linguistiche.
Barack Obama, il correttore ortografico e l'effetto Cupertino

Il team Office Natural Language di Microsoft sviluppa gli strumenti di correzione (proofing tool) per i prodotti Microsoft. L'ultimo post del loro blog segnala due articoli nel Seattle Times di ieri che parlano del lavoro del team.

Jobs with real authority: working on Microsoft's spell-checker parte da una notizia che aveva avuto un certo rilievo negli Stati Uniti, e cioè che fino all'inizio dell'anno scorso il correttore ortografico di Office non riconosceva il nome proprio Obama e lo sostituiva con... Osama! Il problema è stato risolto, basta aver scaricato gli aggiornamenti per Office.

Ovviamente erano stati in molti quelli a cui non era parso vero poter parlare della cosa, però va considerato che Barack Obama era praticamente uno sconosciuto fino a due anni fa, a differenza del famigerato Osama. error di battitura Nella valutazione di cosa includere nei dizionari dei correttori ortografici viene infatti analizzata la frequenza di determinate parole nella lingua e l'evenienza che termini insoliti ma omografi di comuni errori di ortografia possano impedire di correggere questi ultimi, ignorandoli. È un fenomeno molto più accentuato in inglese, ad es. calender è un termine esistente che però è statisticamente molto meno probabile dell'errore di ortografia *calender per calendar, quindi è stata fatta la scelta di non includerlo nel dizionario del correttore. Ulteriori dettagli su come vengono selezionate le parole da aggiungere ai dizionari dei correttori in How Microsoft's spell-check gatekeepers select words to add.

I correttori ortografici usano degli algoritmi per identificare la correzione più probabile di un errore di ortografia o di battitura; in particolare viene calcolata la edit distance, ovvero la "distanza" che separa l'errore dalla forma corretta, espressa in numero di caratteri da modificare, spostare, aggiungere o eliminare. Ad es., se scrivo *infromazione, la distanza di modifica da informazione è 1. Per chi è interessato a ulteriori dettagli sul concetto di edit distance, Thierry Fontanelle ne parla in Language Log.

Se in Office è stata attivata l'opzione di correzione automatica, il tipo di errore, la "distanza di modifica" e l'indice di probabilità di una particolare correzione rispetto ad altre possibili determinano se il correttore evidenzierà l'errore con la linea ondulata rossa e presenterà una serie di alternative, oppure se procederà con la sostituzione automatica della parola. È il motivo per cui chi ha un cognome insolito ma simile a una parola comune può trovarselo modificato automaticamente (la soluzione però è semplice: basta aggiungere la parola al dizionario personalizzato oppure disattivare la correzione automatica).

L'articolo fa anche un accenno al cosiddetto effetto Cupertino, termine coniato anni fa da alcuni traduttori della Commissione Europea quando si sono accorti che il termine inglese cooperation (variante di co-operation) non veniva riconosciuto e veniva automaticamente sostituito dal nome proprio Cupertino, che il correttore riteneva molto più probabile. Anche questo problema è stato risolto, ma è rimasto il termine effetto Cupertino: è descritto in dettaglio da Ben Zimmer nell'OUP blog, con un riferimento all'articolo in cui è apparso inizialmente.
...

PS Visto che ho parlato di errori di battitura, sicuramente me ne sarà sfuggito qualcuno: "chi punta il dito sugli errori di ortografia o grammatica, ne farà pure lui", è la Muphry's law (via Freakonomics)!

Materiale instabile sulle strade irlandesi

In questi giorni sono a Dublino per riunioni con colleghi di altre sedi. La zona dove si trova Microsoft è irriconoscibile rispetto a quando lavoravo qui negli anni '90. È il tipico "una volta qui era tutta campagna", con palazzi modernissimi di parecchi piani, traffico in abbondanza e cantieri ovunque, aperti anche di notte.

cartello loose chippingsUna cosa però non è cambiata: da queste parti prima o poi ci si imbatte nel cartello Loose chippings. Non ho mai capito perché non preferiscano un segnale stradale con un'immagine, come il nostro (a destra). È come se in Italia optassimo per la scritta Materiale instabile sulla strada (denominazione del Codice della strada).

Ieri ho avuto la prova che la comprensibilità del cartello irlandese non è scontata. Passandoci davanti, una collega americana si è domandata cosa volesse dire e mi sono trovata nell'insolita situazione di spiegarglielo io. Ho poi scoperto che si tratta di una delle differenze terminologiche che vengono chiarite agli americani in visita in Irlanda, ad es. qui.

Così l'ho fotografato per parlarne: mi sembra un buon esempio di terminologia inglese non "globalizzata". 

E poi sono sicura che a mia mamma farà piacere rivederlo .

mega- e giga-

Ho sentito un ragazzino che diceva alla madre:

"Ma dove sono le patatine? Non ne avevi comprato un gigapacco?"

Devo aggiornarmi: nel linguaggio comune, al di fuori dell'ambito tecnico, ero rimasta al prefissoide mega. Ma neanche i vari dizionari italiani sembrano essersi accorti del nuovo uso di giga.

In ogni caso mi piace molto quando la lingua viene arricchita da termini o riferimenti al linguaggio tecnico o scientifico, se facilmente comprensibili. Immagino che giga- abbia buone probabilità di successo, anche perché ha la stessa etimologia di gigante.

DNA Il mio esempio preferito di riferimenti scientifici entrati nel linguaggio comune è sicuramente l'espressione averlo nel DNA (ad es. "lo sport ce l'ha nel DNA"), versione aggiornata del più tradizionale averlo nel sangue e dal significato trasparente, visto che ormai chiunque abbia fatto la scuola dell'obbligo dovrebbe sapere cos'è il DNA. Quasi incredibile pensare che fino a poco più di 50 anni fa se ne ignorava l'esistenza!

       

   

Emotion trigger

Come dicevo ieri, sono a Copenaghen alla conferenza TKE 2008. Molti gli interventi interessanti.

Durante la presentazione di uno studio per analizzare automaticamente le componenti emotive di un testo* è stato introdotto il concetto di emotion trigger.

Un testo scritto può essere interpretato emotivamente in base a diversi elementi che contraddistinguono il "mondo" del lettore: il termine emotion trigger è usato per definire le parole o i concetti che portano a un'interpretazione emotiva di un testo perché correlati a bisogni o motivazioni dell'essere umano o, con riferimento al lettore del testo, perché legati ai fattori locali, temporali, culturali, sociali, educativi che lo caratterizzano o eventuali aspetti mediatici che lo influenzano (altro termine interessante per riassumere questi elementi: bag of knowledge). Esempi di emotion trigger possono essere democrazia, famiglia, creativi, 11 settembre, ecc.

Un database lessicale che raccolga gli emotion trigger legati a culture specifiche consentirebbe di sviluppare metodi per identificare e classificare automaticamente la valenza emotiva di un testo su potenziali lettori. Le implicazioni pratiche potrebbero essere molteplici, ad esempio l'analisi di un testo e relative traduzioni per valutare se l'impatto emotivo nelle varie lingue possa essere equivalente.

Mi fermo perché sta per ricominciare il workshop....

 

* An Incremental Multilingual Approach to Forming a Culture Dependent Emotion Triggers Lexical Database, intervento di Alexandra Balahur dell'Università di Alicante a TKE 2008. Per chi fosse interessato, online è disponibile un articolo della stessa autrice con contenuto simile, Applying a Culture Dependent Emotion Triggers Database for Text Valence and Emotion Classification (con dettagli su emotion trigger e bag of knowledge).

Copenaghen - TKE 2008

In questi giorni sono a Copenaghen per una conferenza, la 8th International Conference on Terminology and Knowledge Engineering, sulla gestione di ontologie e risorse lessicali.

Sono qui con i colleghi che hanno organizzato il workshop di domani, Development of Enterprise-level Ontology and Lexical Resource Solutions.

Le giornate (e le serate!) sono davvero molto piene...

Nyhavn

Retronimi (e televisione)

Le rétronyme, kézako ?, un post del mio collega francese Laurent Vacca, fa riferimento al termine inglese retronym: di solito indica un neologismo sintattico creato a partire da un termine già esistente ma non più adeguato a definire un concetto che nel frattempo si è evoluto o specializzato.

L'esempio tipico è quello di televisione in bianco e nero da televisione:

La tv una volta era in bianco e nero e se si usava semplicemente il termine televisione non ci si poteva che riferire alla tv in bianco e nero. Con l'avvento del colore, il termine televisione è ora più comunemente usato per indicare la tv a colori ed ecco che quindi tv in bianco e nero è un retronimo.

Questo e altri esempi nel blog Salvalingua, uno dei pochi che ne parla in italiano e che ci informa che il termine retronimo è stato introdotto solo recentemente anche qui dal linguista Tullio De Mauro.

In inglese il termine retronym ha acquisito una certa diffusione grazie al New York Times (articoli qui e qui). Per un elenco di retronimi inglesi, Wikipedia; la voce è consultabile anche in vari dizionari, ad es. il Webster. In italiano retronimo non è ancora documentato nei dizionari online. il TV o la TV?!?Quando lo sarà, per rimanere in tema di televisione, tra gli esempi immagino ci saranno televisione terrestre e televisione analogica. Televisore, invece, in futuro indicherà presumibilmente solo i modelli a schermo piatto, infatti si stanno diffondendo i retronimi televisore tradizionale e televisore convenzionale (o, come si sente nelle pubblicità, forse dovrei cominciare a dire il TV, maschile. Mah!).  

     

Fritto misto di ferragosto

Cose varie che mi è capitato di leggere, alcune recenti, altre molto meno.

In italiano

[terminologia]  Irresistibili le definizioni di surripedia, ieri in tema felino:

Mentecatto sost.s.m. gatto bugiardo (e pazzo).
Bugigattolo sost.s.m. gatto bugiardo (e piccolo).
Gateau sost.s.m. gatto al forno ripieno di patate.
Streptomiceto  sost.s.m. gatto europeo di piccola taglia e fianchi slanciati.

[finlandese]  Tutti gli italiani ormai sanno come si dice guarda il mare in finlandese (katso merta). Altre curiosità del finlandese qui (p. 6 e 7). Manca però una forma dialettale che ho scoperto condividendo un ufficio con collega finlandese: da qualche parte in Finlandia una frase che suona più o meno come pussa via dovrebbe voler dire "baciami ancora". Lingua romantica...   
    ..

In inglese

Short Short Stories [letture estive veloci]  I racconti brevissimi di Dave Eggers, scritti qualche anno fa e ancora accessibili nel sito di The Guardian. Forse Dave Eggers non convince tutti, ma sa decisamente scrivere. A chi piace leggere in versione originale consiglio il racconto After I Was Thrown in the River and Before I Drowned (in Speaking with the Angel) che qualcuno ha caricato qui: l'avevo sentito leggere a una radio inglese ed ero rimasta così affascinata dal suono delle parole che ogni tanto lo riprendo in mano semplicemente per il piacere di "risentirlo".

[traduzione] Elenco di 85 blog di/per traduttori in There is something about translation (al momento con indirizzi ma senza collegamenti ipertestuali).

[terminologia]  In inglese è stato coniato il neologismo frolleague: una persona che non è proprio un amico (friend) ma più di un collega (colleague). Un articolo di The Guardian di oggi ne parla perché LinkedIn ha sconsigliato i propri utenti di mischiare contatti professionali e "sociali" in quanto potrebbe avere conseguenze sulla loro reputazione professionale. L'Oxford English Dictionary starebbe considerando di aggiungere il termine al proprio dizionario.

[inglese]  Mi piace molto Separated by a common language, il blog di una linguista sulle differenze terminologiche e culturali tra inglese britannico e inglese americano, ad es. sull'uso dei complimenti. Il post di oggi è sui nomi delle verdure.

[differenze culturali]  Rimanendo in tema di cibo, per chi è a dieta e cerca un sistema per ridurre il proprio appetito: il filmato sulla preparazione della pizza coreana!  
....

Buon ferragosto a tutti!

vorrei essere qui, lontano dalla Pianura Padana...

Italiano idiomatico da spiaggia

piraña (non lesso)Ancora per la serie silly week, forse in questo periodo qualche prestante connazionale ci ha provato con una turista inglese e si è sentito apostrofare con "occhi da pesce lesso"?

Se la risposta è affermativa, la spiegazione potrebbe essere il corso di italiano online della BBC e in particolare la sezione Girl meets boy dove vengono elencate alcune espressioni idiomatiche italiane per potenziali approcci con l'altro sesso.

Per descrivere un ragazzo poco attraente viene insegnato il termine ciospo (forse le inglesi che imparano l'italiano vanno sulle spiagge romagnole?), invece per parlare di musica non gradita (qui) vengono suggerite le espressioni sembra un gatto strangolato oppure fa venire il latte alle ginocchia: da immaginare pronunciate con forte accento inglese mentre si balla in discoteca. 

Il fenomeno però è reciproco e anche noi impariamo espressioni idiomatiche inglesi che vengono raramente usate dai madrelingua. Ricordo ancora la mia prima vacanza studio in Inghilterra: avevo provato a sfoggiare il famigerato it's raining cats and dogs ma anziché ammirazione per il mio vocabolario avevo suscitato una risata seguita da You mean "it's pissing down"?! 

OK? OK!

OK è la parola più riconoscibile in tutto il mondo e probabilmente l'anglismo più diffuso in italiano.

OK È anche una delle stringhe più comuni nelle interfacce del software, dove appare come nome di pulsante.

In caso di eventuali cruciverba multilingue con contenuto informatico (!?), potrebbe essere utile sapere (!?) che OK rimane in inglese nei prodotti Microsoft localizzati nella maggior parte delle lingue europee con alfabeto latino*.

Altre lingue invece traducono: 

basco: Ados
catalano: D’acord
croato: U redu
islandese:   Í lagi
lettone: Labi
lituano: Gerai
sloveno: V redu
spagnolo: Aceptar
turco: Tamam

* OK appare nel software localizzato in ceco, danese, estone, finlandese, francese, irlandese, italiano, maltese, norvegese, olandese, polacco, portoghese (anche nella variante parlata in Brasile), romancio, romeno, slovacco, svedese, tedesco, ungherese.

Anche in lingue con alfabeti diversi da quello latino, come ad esempio greco, russo e giapponese, viene usato OK.

Fonte: stringhe dei prodotti Microsoft, consultabili nel Portale linguistico Microsoft.

Cuntinuar lectura...

cartello a Müstair L'Engadina è una regione bellissima e per me ha la curiosità aggiuntiva del romancio: ogni volta che sono da quelle parti mi ritrovo a leggere i cartelli, attratta dalle comuni radici latine ma soprattutto dall'ortografia e da quella che immagino possa essere la pronuncia delle parole.

Per la terminologia informatica invece potrei provare a consultare il database terminologico Microsoft perché esiste una versione di Office in romancio per la quale sono stati creati o definiti ex novo circa 2000 termini in questa lingua (comunicato stampa qui).

Alcuni esempi di stringhe di Excel:

romancio inglese italiano
Quest element da controlla po vegnir utilisà mo entant ch'il fegl da lavur è visualisà en ina fanestra separada. Vulais Vus avrir ina fanestra per il fegl da lavur? That control can only be used while the worksheet is displayed in a separate window. Do you want to open a window for the worksheet? Il controllo può essere utilizzato solo mentre il foglio è aperto in una finestra separata. Aprire una finestra per il foglio di lavoro?
Per avrir ina fanestra separada, en la quala Vus pudais modifitgar il fegl da lavur ed utilisar l'element da controlla, cliccar sin Gea. Cur che Vus avais terminà quest operaziun, cliccai sin Memorisar ed alura sin Exit en il menu Datoteca per returnar a la fanestra originara. Click Yes to open a separate window in which you can edit the worksheet and use the control. When you are finished, click Save and then click Exit on the File menu to return to the original window. Fare clic su Sì per aprire una finestra separata in cui modificare il foglio di lavoro e utilizzare il controllo. Al termine, scegliere Salva, quindi scegliere Esci per visualizzare la finestra iniziale.
rumantsch ladino
Vocali, vocali, vocali

È la settimana di Ferragosto (ma io lavoro) e così in pausa pranzo ho pensato di ritagliarmi una silly week, dedicata a chi ha spento il computer e se ne sta sotto l'ombrellone, magari a leggersi le notizie della Settimana Enigmistica.vocali

Da A Collection of Word Oddities and Trivia, alcune curiosità con le vocali:

aiuole questa la conosciamo tutti: la parola più breve con le 5 vocali
euforia altra parola breve con tutte le vocali
autoriparazione ancora un'altra parola con tutte le vocali, ma più lunga
autorimessa escludendo la prima a, le altre vocali sono in ordine alfabetico ma al contrario
santabarbara  parola che contiene solo a, ben 5, come allampanata e assatanata
effervescentemente 7 e, con 6 invece eccellentemente e precedentemente
indivisibili 6 i e per esagerare si può arrivare a 8 con indivisibilissimi
contropropongono 6 o
urubù 5 3 u   (non sapevo che l'urubù è un tipo di avvoltoio)
cuoiaio 6 vocali in fila
aiei i ea eio aoa i e eio e aigoa da verificare, ma a quanto pare in dialetto spezzino questa sequenza di vocali significa "ieri c'era olio, oggi c'è olio e acqua"

[Aggiornamento: ho corretto il numero di vocali in urubù (ooops!) e ringrazio .mau. per le altre segnalazioni, qui sotto nei commenti] 

In tema, appena letti su TumblrValigia e decisamente più attuali:

  • Sport monovocalici: Polo, Kayak (in inglese anche swimming e diving)
  • Sport palindromi: Kayak
  • Sport bifronti: Arco
  • Cambio di vocale: Volteggio
Piante di edifici in Visio

Microsoft Office Visio consente di creare vari tipi di diagrammi per rappresentare piante di terreni, edifici e strutture correlate.

Ci siamo resi conto che alcuni termini utilizzati per descrivere le opzioni disponibili non sono stati tradotti in maniera coerente all'interno del prodotto e ci piacerebbe sentire il punto di vista di chi conosce e usa queste funzionalità per migliorare e standardizzare la terminologia italiana.

opzioni di Visio

In inglese building plan è il termine sovraordinato generale che descrive la categoria di diagrammi per rappresentare graficamente edifici e costruzioni; in italiano è tradotto con pianta di edificio. Comprende varie sottocategorie, tra cui quelle elencate in questa tabella:

Termine inglese Utilizzo del diagramma Traduzione in Visio
Floor plan Per rappresentare il layout di singole stanze o interi piani di edifici; include muri, strutture portanti e simboli elettrici. Esempio qui.
piantina (generico) ma anche progettazione spazi (incongruenza con la traduzione di floor plan) e [piantina di] edifici commerciali
Home plan Per rappresentare il layout di una casa nuova o in fase di ristrutturazione e/o l'arredamento. Esempio qui. pianta/piantina di abitazione ma anche edifici residenziali
HVAC plan Per rappresentare gli impianti di riscaldamento (Heating), Ventilazione (Ventilation) e (And) Condizionamento (Cooling). Esempio qui. pianta RVAC 
site plan Per rappresentare aree esterne a un edificio, spazi verdi, parcheggi ecc. 
Esempi qui e qui.
pianta esterni ma anche piano del sito
space plan Per rappresentare le "risorse" (mobili, apparecchiature, ecc.) all'interno di un edificio. Esempio qui. progettazione spazi ma anche [modello/progettazione] interni

Questi termini sono stati inclusi nel progetto Microsoft Terminology Community Forum per Windows Vista e Office 2007, dove possono essere votati e commentati e dove può essere proposta una traduzione alternativa.

Ambiguità dell'inglese: Round Robin

Segnalo da un post del blog del Mestiere di scrivere:

Giancarlo Livraghi ha aggiornato e pubblicato in pdf il suo testo Ambiguità di alcune parole inglesi (sottotitolo: Trecentottanta esempi di errori di traduzione, difficoltà, incomprensioni, sciocchezze e bizzarrie).

Ci sono tanti esempi non solo interessanti ma anche curiosi.

C'è anche un riferimento a Round Robin che mi ha ricordato un episodio per me divertente. Una collega americana aveva organizzato un evento a cui avrebbero partecipato persone di varie nazionalità. Il programma specificava

We will break for lunch, then spend the afternoon in a Round Robin format.

Per coincidenza abbiamo una collega che si chiama proprio Robin. Una persona invitata all'evento ci aveva domandato perplessa che tipo di interazione avrebbe dovuto avere con Robin quel pomeriggio...

Il mistero è stato subito risolto: Round Robin indica un sistema, di solito in gare sportive, in cui ogni partecipante incontra tutti gli altri partecipanti, a rotazione.

L'ignara Robin non era coinvolta.

Riconoscimento vocale e curiosità... umane

Ho finito di leggere un po' di numeri di The New Yorker che mi ha passato una mia amica. Interessante l'articolo Hello, Hal, una panoramica dell'evoluzione di sintesi vocale e riconoscimento vocale dai primi esperimenti ai giorni nostri, delle difficoltà in questo campo e delle applicazioni pratiche più recenti.

Molte informazioni sono note e facilmente reperibili (cfr. le voci Sintesi vocale e Riconoscimento vocale in Wikipedia) ma alcuni dettagli sono curiosi, specialmente quelli usati per illustrare come alcune capacità del cervello umano siano praticamente impossibili da riprodurre artificialmente. Due esempi:

  • imageIn una conversazione telefonica, siamo in grado di percepire se l'interlocutore stia sorridendo, e di che tipo di sorriso si tratti, grazie alla capacità dell'orecchio umano di riconoscere le variazioni di suono causate dalle diverse espressioni facciali: proprio per questo agli operatori di call center verrebbe detto di sorridere sempre e comunque. Vedere anche Smile - and the world can hear you.
        
  • Il nostro udito è così sofisticato che, a quanto pare, basta il suono per farci capire se del liquido che viene versato è caldo o freddo.

Per chi è interessato all'articolo, direi che si può iniziare a leggere da pagina 2.
...

Windows Vista include la funzionalità di sintesi e riconoscimento vocale per inglese (USA e GB), tedesco, francese, spagnolo, giapponese e cinese (Cina e Taiwan). Non so quando sarà disponibile per l'italiano, quindi non chiedetemelo! Informazioni in inglese qui.

Incongruenze del Bancomat

Nel centro direzionale dove lavoro è stato sostituito il Bancomat. Il nuovo modello ha un'interfaccia coloratissima corredata da fastidiosi segnali sonori. Lo confesso: ogni volta che lo uso entro in modalità deformazione professionale.

In una delle prime schermate appare questa istruzione:

Premi il tasto CONFERMA per proseguire.

Sullo schermo, però, non c'è nessun tasto CONFERMA. Allora uno guarda tra i pulsanti a lato, e poi sul tastierino, ma neanche lì c'è.

dettaglio di BancomatUn attimo di perplessità, poi uno prova con il tasto ESEGUI e la transazione può proseguire.

Però... anche se in definitiva sono bastati pochi secondi e la seconda volta non ci si casca più, rimane una sensazione sgradevole, quella di avere a che fare con un prodotto realizzato con poca attenzione a chi lo deve utilizzare.

È un esempio banale e che forse dà fastidio solo a me, ma non ho potuto evitare un'ovvia considerazione: se ci sono altri momenti di esitazione e si sommano i secondi, ma soprattutto se l'ignaro utente non ha familiarità con la tecnologia e non si rende conto che CONFERMA ed ESEGUI sono solo due etichette diverse per lo stesso concetto, ecco che ne risentono la curva di apprendimento e l'usabilità.
...

More Posts Next page »
Page view tracker