Usare UTF-8 con Gentoo

2.25 2007-04-17 Codifiche di caratteri

Che cos'=C3=A8 la codifica dei caratteri?

I computer non comprendono il testo da soli. Perci=C3=B2 ogni carattere =C3= =A8 rappresentato da un numero. Tradizionalmente, i set di numeri usati per rappresentare alfabeti e simboli (conosciuti come sistemi di codifica o "character sets") erano limitati nella loro dimensione a causa dei limiti hardware dei computer.

Storia delle codifiche di caratteri

Il pi=C3=B9 comune (o almeno il pi=C3=B9 largamente accettato) set di carat= teri =C3=A8 il codice ASCII (American Standard Code for Information Interchange). M= olti ritengono che ASCII sia lo standard software che abbia goduto di maggior successo in assoluto. Il moderno ASCII fu standardizzato nel 1986 (ANSI X3.= 4, RFC 20, ISO/IEC 646:1991, ECMA-6) dall'American National Standards Institut= e.

Il codice ASCII =C3=A8 a 7 bit, ovvero utilizza sequenze di bit rappresenta= bili con sette cifre binarie, che corrispondono all'intervallo da 0 a 127 in numeri decimali. Essi includono 32 caratteri di controllo non visibili, da 0 a 31,= con il carattere di controllo finale, DEL o "delete", al 127. I caratteri da 32= a 126 sono visibili: spazi, punteggiatura, lettere e numeri.

L'ottavo bit nel codice ASCII era usato in origine come parit=C3=A0 per il = controllo degli errori. Quando tale funzione non =C3=A8 desiderata, esso viene lascia= to a 0. Questo significa che nel codice ASCII ogni carattere =C3=A8 rappresentato d= a un singolo byte.

Sebbene ASCII fosse sufficiente per comunicare in inglese moderno, per altre lingue europee che utilizzano caratteri accentati, le cose non erano cos=C3= =AC semplici. Per venire incontro a queste esigenze furono sviluppati gli stand= ard ISO 8859. Essi erano compatibili a ritroso con ASCII, ma anzich=C3=A9 lasci= are l'ottavo bit inutilizzato, lo usavano per consentire la codifica di altri 1= 27 caratteri. Ma i limiti di ISO 8859 vennero presto alla luce, ed infatti attualmente ci sono 15 varianti di questo standard (da 8859-1 fino a 8859-1= 5). =46uori dall'intervallo di bytes compatibile con ASCII, c'=C3=A8 spesso con= flitto tra le lettere rappresentate da ogni byte. A complicare ulteriormente l'interoperabilt=C3=A0 tra le codifiche di caratteri, Windows-1252 =C3=A8 u= tilizzato in alcune versioni di Microsoft Windows per le lingue dell'Europa Occidentale.= Esso =C3=A8 un superset di ISO 8859-1, ma differisce da questo standard in diver= si punti. Ad ogni modo, tutti questi set mantengono la compatibilit=C3=A0 con ASCII.

Il necessario sviluppo di codifiche single-byte completamente differenti, p= er gli alfabeti non latini, come EUC (Extended Unix Coding), che =C3=A8 utiliz= zato per il giapponese e per il coreano (ed in misura minore per il cinese), cre=C3= =B2 una confusione ancor maggiore, mentre sistemi operativi diversi continuavano ad utilizzare set di caratteri diversi per le stesse lingue, ad esempio Shift-= JIS e ISO-2022-JP. Gli utenti che avessero voluto visualizzare caratteri cirillici dovevano scegliere tra la codifica KOI8-R per il russo e il bulgaro, la KOI= 8-U per l'ucraino, e gli altri set cirillici, come lo sfortunato ISO 8859-5 e il comune Windows-1251. Tutti questi set di caratteri fecero venire meno quasi totalmente la compatibilit=C3=A0 con ASCII (tuttavia le codifiche KOI8 mett= ono i caratteri cirillici nell'ordine latino, cosicch=C3=A9 togliendo l'ottavo bi= t, il testo pu=C3=B2 ancora essere decifrato in un terminale ASCII attraverso una translitterazione case-reversed.)

Questo ha portato confusione, oltre che una quasi totale incapacit=C3=A0 di comunicazione tra le lingue, soprattutto se utilizzano alfabeti diversi. A questo punto entra in scena Unicode.

Che cos'=C3=A8 Unicode?

Unicode supera il tradizionale limite del byte singolo che affligge i set di caratteri. Utilizza 17 "piani" di 65.536 unit=C3=A0 di codice, per rapprese= ntare un massimo di 1.114.112 caratteri. Poich=C3=A9 il primo piano, detto anche "Ba= sic Multilingual Plane" o BMP, contiene praticamente tutto ci=C3=B2 che serve i= n genere a un utente, molti ritengono erroneamente che Unicode sia un character set a = 16 bit.

Unicode =C3=A8 stato mappato in molti modi diversi, ma i due pi=C3=B9 comun= i sono UTF (Unicode Transformation Format) e UCS (Universal Character Set). Un numero dopo UTF indica il numero di bit in una unit=C3=A0, mentre = il numero dopo UCS indica il numero di byte. UTF-8 =C3=A8 diventato il pi=C3=B9 diffu= so mezzo di interscambio di testo Unicode, grazie alla sua natura pulita a 8 bit, ed = =C3=A8 proprio questo infatti l'oggetto di questo documento.

UTF-8

UTF-8 =C3=A8 una codifica di caratteri a lunghezza variabile, cio=C3=A8 uti= lizza da 1 a 4 bytes per simbolo. Cos=C3=AC il primo byte UTF-8 =C3=A8 usato per codificar= e l'ASCII, dando a questo set di caratteri la piena compatibilit=C3=A0 a ritroso con A= SCII. In UTF-8 ASCII e i caratteri latini sono intercambiabili con un piccolo aumento nella dimensione dei dati, perch=C3=A9 solo il primo bit viene utilizzato. = Gli utenti di alfabeti orientali, ad esempio i giapponesi, ai quali =C3=A8 stato asseg= nato un intervallo di byte pi=C3=B9 elevato, sono scontenti, poich=C3=A9 questo cau= sa un 50% di ridondanza nei loro dati.

Cosa pu=C3=B2 fare UTF-8 per l'utente

UTF-8 consente di lavorare in un ambiente multilingue rispettoso degli stan= dard e internazionalmente accettato, con una ridondanza di dati relativamente ba= ssa. UTF-8 =C3=A8 il modo migliore per trasmettere testo non ASCII via Internet,= Email, IRC e praticamente qualunque altro mezzo. Nonostante ci=C3=B2 molte persone considerano l'uso di UTF-8 nelle comunicazioni online un abuso. =C3=88 semp= re meglio conoscere l'opinione verso UTF-8 di uno specifico canale, mailing list o gr= uppo Usenet prima di usare caratteri UTF-8 non-ASCII.

Utilizzare UTF-8 con Gentoo Linux

Trovare o creare una localizzazione UTF-8

Adesso che sono stati compresi i principi che stanno dietro a Unicode, si = =C3=A8 pronti ad utilizzare UTF-8 nel proprio sistema.

Il requisito preliminare per poter utilizzare UTF-8 =C3=A8 avere installata= una versione di glibc che abbia il supporto per la propria lingua. Per ottenere questo si utilizza il file /etc/locale.gen. Non =C3=A8 tra gli= scopi di questo documento spiegare il funzionamento di tale file. Inoltre una spiega= zione dettagliata si trova nella Guida alla localizz= azione di Gentoo Linux.

=46atto ci=C3=B2 bisogna vedere se =C3=A8 gi=C3=A0 disponibile una localizz= azione UTF-8 per la propria lingua, e se non lo =C3=A8 bisogna crearne una.

(Sostituire "it_IT" con le impostazioni locali desiderate)
# locale -a | grep 'it_IT'
it_IT
it_IT.UTF-8

Dell'output della riga di comando bisogna individuare il risultato con un suffisso .UTF-8. Se non c'=C3=A8 alcun risultato con un suffisso sim= ile, bisogna creare una localizzazione compatibile UTF-8.

Eseguire il seguente codice solo se non si ha una localizzazione UTF-8 disponibile per la propria lingua.

(Sostituire "it_IT" con le impostazioni locali desiderate)
# localedef -i it_IT -f UTF-8 it_IT.UTF-8

Un altro modo per includere una localizzazione UTF-8 =C3=A8 aggiungerla al = file /etc/locale.gen e generare le localizzazioni necessarie con il comando locale-gen.

it_IT.UTF-8 UTF-8

Impostare la localizzazione

C'=C3=A8 una variabile d'ambiente che deve essere impostata per poter utili= zzare la propria nuova localizzazione UTF-8: LANG (si pu=C3=B2 anche scavalca= re questa variabile con l'impostazione di LC_ALL). Ci sono diversi modi per impostarla; alcune persone preferiscono avere un ambiente UTF-8 solo per un determinato utente, e in questo caso le variabili vanno impostate in ~/.profile (se si utilizza /bin/sh), oppure in ~/.bash_profile o ~/.bashrc (se si utilizza /bin/bash).

Altri preferiscono impostare la localizzazione globalmente. Si raccomanda in modo particolare questa opzione se /etc/init.d/xdm =C3=A8 in u= so, in quanto questo init script avvia il display manager e il desktop prima che i suddetti file di avvio della shell siano esaminati, e quindi quando le vari= abili non sono ancora nell'ambiente.

Si pu=C3=B2 impostare la localizzazione globalmente utilizzando /etc/env.d/02locale. Il file dovrebbe apparire simile a quanto segue:

(Come sempre, sostituire "it_IT.UTF-8" con la propria localizzazio=
ne)
LANG=3D"it_IT.UTF-8"

Si pu=C3=B2 anche mettere LC_ALL al posto di LANG. Questo imp= osta la propria localizzazione per tutte le categorie, inclusi valori numerici o di valuta. In pochi sistemi, pu=C3=B2 causare problemi. Comunque, la maggior p= arte degli utenti saranno in grado di usare LC_ALL senza problemi. Per maggiori informazioni sulle categorie coinvolte usando LC_ALL, si prega di le= ggere la pagina di localizzazione GNU (in inglese, ndt).

=46atto ci=C3=B2 l'ambiente deve essere aggiornato affinch=C3=A9 la modific= a sia operativa.

# env-update
>>> Regenerating /etc/ld.so.cache...
 * Caching service dependencies ...
# source /etc/profile

A questo punto, eseguire locale senza argomenti per vedere se nel pr= oprio ambiente sono impostate le variabili corrette:

# locale
LANG=3D
LC_CTYPE=3D"it_IT.UTF-8"
LC_NUMERIC=3D"it_IT.UTF-8"
LC_TIME=3D"it_IT.UTF-8"
LC_COLLATE=3D"it_IT.UTF-8"
LC_MONETARY=3D"it_IT.UTF-8"
LC_MESSAGES=3D"it_IT.UTF-8"
LC_PAPER=3D"it_IT.UTF-8"
LC_NAME=3D"it_IT.UTF-8"
LC_ADDRESS=3D"it_IT.UTF-8"
LC_TELEPHONE=3D"it_IT.UTF-8"
LC_MEASUREMENT=3D"it_IT.UTF-8"
LC_IDENTIFICATION=3D"it_IT.UTF-8"
LC_ALL=3Dit_IT.UTF-8

Questo =C3=A8 tutto. Ora si sta usando una localizzazione UTF-8, e il pross= imo passo =C3=A8 la configurazione delle applicazioni che si usano ogni giorno.

Supporto applicazioni

Quando Unicode inizi=C3=B2 a prendere forza nel mondo del software, i set di caratteri multibyte non erano adatti a linguaggi come il C, in cui sono scr= itti molti programmi che la gente usa ogni giorno. Perfino oggi, alcuni program= mi non sono in grado di gestire UTF-8 in maniera adeguata. Fortunatamente, la = gran parte di essi non d=C3=A0 problemi!

Nomi file, NTFS, e FAT

Ci sono diverse opzioni NLS nel men=C3=B9 di configurazione del kernel di L= inux, ma =C3=A8 importante non confondersi! In genere, la sola cosa da fare =C3=A8 compilar= e il supporto NLS per UTF-8 all'interno del kernel, impostando l'opzione NLS in = modo predefinito a utf8.

=46ile Systems -->
  Native Language Support -->
    (utf8) Default NLS Option
    <*> NLS UTF8
    ( <*> anche altri set di caratteri che sono utilizzati n=
ei filesystem FAT e nei CD-ROM Joilet.)

Se si prevede di montare partizioni NTFS, si potrebbe aver bisogno di specificare l'opzione nls=3D nel mount. Se si prevede di montare par= tizioni =46AT, potrebbe servire l'opzione codepage=3D. Se si vuole, si pu=C3= =B2 anche impostare un codepage predefinito per FAT nella configurazione del kernel. Notare che l'opzione codepage nel mount ha la precedenza sulle impostazioni del kernel.

=46ile Systems -->
  DOS/FAT/NT Filesystems  -->
    (437) Default codepage for fat

Si dovrebbe evitare di impostare Default iocharset for fat a UTF-8, = dato che =C3=A8 sconsigliato. Invece, =C3=A8 consigliabile utilizzare l'opzione = utf8=3Dtrue nel montare le partizioni FAT. Per maggiori informazioni, vedere man mount e la documentazione del kernel in /usr/src/linux/Documentation/filesystems/vfat.txt.

Per modificare la codifica dei nomi file, pu=C3=B2 essere utilizzato app-text/convmv.

# emerge --ask app-text/convmv
(Sintassi del comando)
# convmv -f <current-encoding> -t utf-8 <filename>
(Sostituisce iso-8859-1 con il charset utf-8)
# convmv -f iso-8859-1 -t utf-8 filename

Per modificare la codifica del contenuto dei file, utilizzare l'util= it=C3=A0 iconv, contenuta in glibc:

(Sostituisce iso-8859-1 con il charset utf-8)
(Controlla se l'output =C3=A8 corretto)
# iconv -f iso-8859-1 -t utf-8 filename
(Converte il file, creando un nuovo file)
# iconv -f iso-8859-1 -t utf-8 filename > newfile

A questo scopo pu=C3=B2 essere usato anche app-text/recode.

La console di sistema =C3=88 necessario >=3Dsys-apps/baselayout-1.11.9 per avere Unicode sulla= console.

Per abilitare UTF-8 sulla console, =C3=A8 necessario modificare /etc/rc.conf ed impostare UNICODE=3D"yes", leggendo anc= he i commenti in quel file: =C3=A8 importante avere un font che abbia un buon nu= mero di caratteri, se si vuole ottenere il massimo da Unicode. Per farlo funzionare, assicurarsi di aver creato correttamente una localizzazione Unicode come spiegato nel Capitolo 1.

La variabile KEYMAP, impostata in /etc/conf.d/keymaps, dovrebbe avere specificata una keymap Unicode.

(Cambiare "it" con il proprio layout locale)
KEYMAP=3D"it"

Ncurses e Slang Ignorare ogni riferimento a Slang in questa sezione se non lo si ha install= ato o non lo si utilizza.

=C3=88 cosa saggia aggiungere unicode alle flag USE globali in /etc/make.conf, successivamente effettuando di nuovo l'emerge = di sys-libs/ncurses e sys-libs/slang, se necessario. Portage lo = far=C3=A0 automaticamente all'aggiornamento del sistema:

# emerge --update --deep --newuse world

Bisogna anche ricompilare i pacchetti collegati ad essi, ora che i cambiame= nti alle flag USE sono stati applicati. Lo strumento che verr=C3=A0 utilizzato (revdep-rebuild) fa parte del pacchetto gentoolkit.

# revdep-rebuild --soname libncurses.so.5
# revdep-rebuild --soname libslang.so.1

KDE, GNOME e Xfce

Tutti i pi=C3=B9 importanti ambienti desktop supportano pienamente Unicode,= e non richiederanno nessuna ulteriore configurazione. Questo perch=C3=A9 i toolki= t grafici alla base di essi (Qt o GTK+2) supportano UTF-8. Di conseguenza, tutte le applicazioni che si basano su questi toolkit dovrebbero essere immediatamen= te compatibili con UTF-8.

Le eccezioni a questa regola arrivano con Xlib e GTK+1. GTK+1 richiede un =46ontSpec iso-10646-1 in ~/.gtkrc, per esempio -misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1. Inoltre, le applicazioni= che utilizzano Xlib or Xaw necessiteranno di un FontSpec simile, in mancanza del quale non funzioneranno.

Se si ha da qualche parte una versione del centro di controllo gnome1, usare quella. Da l=C3=AC selezionare un qualunque font iso10646-1.

style "user-font"
{
    fontset=3D"-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1"
}
widget_class "*" style "user-font"

Se un'applicazione supporta sia Qt che GTK+2, l'interfaccia grafica GTK+2 d= ar=C3=A0 in genere risultati migliori con Unicode.

X11 e Font x11-base/xorg-x11 ha un supporto Unicode di gran lunga migliore di q= uello di XFree86, ed =C3=A8 altamente raccomandato.

I font TrueType hanno il supporto per Unicode, e la maggior parte dei font inclusi in Xorg hanno un ottimo supporto per i caratteri, sebbene, ovviamen= te, non tutti i segni disponibili in Unicode siano stati creati per quei font. = Per compilare i font (compreso il set Bitstream Vera) con il supporto per i caratteri dell'Asia Orientale in X, assicurati di avere impostato la flag U= SE cjk. Molte altre applicazioni utilizzano questa flag, quindi potrebbe valere la pena di aggiungerla come permanente.

Inoltre, diversi pacchetti di font in Portage sono compatibili con Unicode.

# emerge terminus-font intlfonts freefonts cronyx-fonts corefonts

Gestori di finestre ed emulatori di terminale

I gestori di finestre ("Window manager", ndt) non compilati su GTK o Qt han= no generalmente un supporto Unicode molto buono, in quanto spesso utilizzano la libreria Xft per gestire i font. Se il proprio gestore di finestre non usa = Xft per i font, si pu=C3=B2 sempre utilizzare come font Unicode il FontSpec men= zionato nella sezione precedente.

Gli emulatori di terminale che utilizzano Xft e supportano Unicode sono pi= =C3=B9 difficili da trovare. A parte Konsole e gnome-terminal, le migliori opzioni= in Portage sono x11-terms/rxvt-unicode, xfce-extra/terminal, gnustep-apps/terminal, x11-terms/mlterm, o il semplice x11-terms/xterm, compilato con la flag USE unicode e avviato = con il comando uxterm. Anche app-misc/screen supporta UTF-8, se avviato con screen -U o se la seguente stringa =C3=A8 inserita in ~/.screenrc:

defutf8 on

Vim, Emacs, Xemacs e Nano

Vim fornisce pieno supporto UTF-8, e inoltre rileva automaticamente i file UTF-8. Per maggiori informazioni su Vim, usare :help mbyte.txt.

Anche Emacs 22.x o successivo supporta pienamente UTF-8. Xemacs 22.x non supporta ancora la combinazione dei caratteri.

Le versioni precedenti di Emacs e/o Xemacs potrebbero richiedere l'installa= zione di app-emacs/mule-ucs e/o di app-xemacs/mule-ucs, e l'aggiunt= a del seguente codice in ~/.emacs affinch=C3=A9 si possa avere il su= pporto per le lingue CJK in UTF-8:

(require 'un-define)
(require 'jisx0213)
(set-language-environment "Japanese")
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)

Nano supporta pienamente UTF-8 a partire dalla versione 1.3.6.

Shell

Attualmente, bash fornisce il pieno supporto Unicode attraverso la libreria GNU readline. Z Shell(zsh) offre il supporto a Unicode medi= ante la USE flag unicode.

La shell C, tcsh e ksh non forniscono alcun supporto UTF-8.

Irssi

Irssi ha un completo supporto UTF-8, ma richiede all'utente di impostare un'opzione.

/set term_charset UTF-8

Quando caratteri non ASCII sono spesso convertiti in charsets non UTF-8, il comando /recode pu=C3=B2 essere utilizzato per convertire i caratter= i. Digitare /help recode per maggiori informazioni.

Mutt

Il client di posta Mutt ha un supporto Unicode molto buono. Per usare UTF-8= con Mutt, non =C3=A8 necessario modificare alcun file di configurazione. Mutt l= avorer=C3=A0 in ambiente Unicode senza modifiche, se tutti i file di configurazione (firma compresa) sono codificati in UTF-8.

Si potrebbero ancora vedere '?' nella posta letta con Mutt. Questo =C3=A8 il risultato delle persone che utilizzano un client di posta che non indica il charset usato. Su questo non =C3=A8 possibile farci nulla, a parte chiedere= a costoro di configurare correttamente il loro client.

Maggiori informazioni sono disponibili nel Wiki di Mutt.

Man

Le pagine Man sono parte integrante di ogni macchina Linux. Per essere sicu= ri che ogni carattere Unicode nelle proprie pagine man sia visualizzato correttamente, modificare /etc/man.conf e sostituire una riga = come mostrato qui sotto.

(Questa =C3=A8 la vecchia riga)
NROFF           /usr/bin/nroff -Tascii -c -mandoc
(Sostituisci la riga sopra con questa)
NROFF           /usr/bin/nroff -mandoc -c

elinks e links

Elinks e links sono browser testuali usati comunemente, in cu= i =C3=A8 possibile abilitare il supporto UTF-8. Ci sono due modi per fare ci=C3=B2: utilizzando l'opzione Setup all'interno del browser o modificando il file di configurazione. Per impostare l'opzione attraverso il browser, aprre un sit= o con elinks o links, premere Alt+S per entrare nel men=C3= =B9 Setup, selezionare le opzioni Terminal o premere T. Scorrere verso il basso= e selezionare l'ultima opzione, UTF-8 I/O, premendo Invio. Infine salv= are ed uscire dal men=C3=B9. Su links probabilmente bisogner=C3=A0 preme= re nuovamente Alt+S, premendo poi S per salvare. La modifica del file di configurazione =C3=A8 descritta qui sotto.

(Per elinks, modificare /etc/elinks/elinks.conf o ~/.elinks/elinks=
=2Econf ed aggiungere la seguente riga)
set terminal.linux.utf_8_io =3D 1

(Per links, modificare ~/.links/links.cfg ed aggiungere la seguent=
e riga)
terminal "xterm" 0 1 0 us-ascii utf-8

Samba

Samba =C3=A8 una suite software che implementa il protocollo SMB (Server Me= ssage Block) per i sistemi UNIX come Mac, Linux e FreeBSD. Il protocollo =C3=A8 t= alvolta indicato come il Common Internet File System (CIFS). Samba include anche il sistema NETBIOS, utilizzato per la condivisione di file su reti Windows.

(Modificare /etc/samba/smb.conf ed aggiungere le righe seguenti ne=
lla sezione [global])
dos charset =3D 1255
unix charset =3D UTF-8
display charset =3D UTF-8

Testare il tutto

Ci sono numerosi siti per testare UTF-8. net-www/w3m, net-www/links, net-www/elinks, net-www/lynx e tutti i browser basati su Mozilla (incluso Firefox) supportano UTF-8. Anche Konquer= or e Opera hanno il pieno supporto UTF-8.

Quando si utilizza un browser testuale, assicurarsi sempre di essere su un terminale compatibile con Unicode.

Se si vefono alcuni caratteri visualizzati come riquadri con lettere o nume= ri all'interno, significa che il proprio font non ha un carattere per il simbo= lo che UTF-8 vuole. Al suo posto, visualizza un riquadro con il codice esadeci= male del simbolo UTF-8.

Pagi= na di test W3C UTF-8
= Pagina di test UTF-8 fornita dall'Universit=C3=A0 di Francoforte

Metodi di Input

Per scrivere, all'interno di X, caratteri non contenuti sulla propria tasti= era, si possono utilizzare le Dead keys. Esse consistono nel premere contemporaneamente il tasto AltGr e un tasto della sezione non alfabetica a= lla tastiera, a sinistra del tasto Invio. Fatto ci=C3=B2, premere una lettera e= la dead key dovrebbe modificarla. L'input pu=C3=B2 essere ulteriormente modificato utilizzando il tasto Shift insieme ad AltGr e premendo contemporaneamente la lettera da modificare.

Per abilitare le dead keys in X, =C3=A8 necessario un layout che le support= i. La maggior parte dei layout europei hanno gi=C3=A0 dead keys con le varianti predefinite. Tuttavia, questo non avviene nei layout nordamericani. Sebbene= vi sia un certo grado di incompatibilit=C3=A0 tra i layout, la soluzione pi=C3= =B9 semplice sembra essere quella di utilizzare un layout nella forma "en_US" anzich=C3= =A9 "us", per esempio. Il layout =C3=A8 impostato in /etc/X11/xorg.conf = in questo modo:

Section "InputDevice"
    Identifier "Keyboard0"
    Driver     "kbd"
    Option     "XkbLayout" "en_US" # Anzich=C3=A9 solo "us"
    (Altre opzioni Xkb vanno qui)
EndSection

La suddetta modifica deve essere applicata solo se si sta usando un layout nordamericano, o un altro layout in cui le dead keys non sembrano funzionar= e. Gli utenti europei dovrebbero avere le dead keys immediatamente funzionanti.

Questa modifica diverr=C3=A0 effettiva al riavvio del server X. Per applica= rla immediatamente, usare il tool setxkbmap, ad esempio, setxkbmap en_US.

Probabilmente =C3=A8 pi=C3=B9 semplice descrivere le dead keys con degli es= empi. Sebbene i risultati dipendano dalla localizzazione, i concetti dovrebbero rimanere gli stessi qualunque essa sia. Gli esempi qui sotto contengono UTF-8, quindi per vederli bisogna o impostare il proprio browser affinch=C3=A9 visualizzi la = pagina come UTF-8, oppure avere una localizzazione UTF-8 gi=C3=A0 configurata.

Premendo contemporaneamente AltGr e [, lasciandoli, e premendo poi 'a', vie= ne prodotta una '=C3=A4'. Premendo contemporaneamente AltGr e [, e premendo po= i 'e', viene prodotta una '=C3=AB'. Premendo contemporaneamente AltGr e ';' viene = prodotta una '=C3=A1', mentre premendo contemporaneamente AltGr e ';', lasciandoli,= e premendo poi 'e', viene prodotta una '=C3=A9'.

Premendo AltGr, Shift e '[' contemporaneamente, lasciandoli, e premendo poi= 'a', viene prodotta una '=C3=A5' scandinava. Similmente, premendo AltGr, Shift e= '[' contemporaneamente, lasciando solo la '[', e premendola poi di nuovo, viene prodotta una '=CB=9A'. Nonostante sembri lo stesso, questo (U+02DA) n= on =C3=A8 il simbolo di grado (U+00B0). Esso serve per altri accenti prodotti dalle dead keys. AltGr e '[', lasciando solo la '[' e poi premendola di nuovo, produco= no una '=C2=A8'.

AltGr pu=C3=B2 essere anche usato da solo con i tasti alfabetici. Ad esempi= o, AltGr ed 'm' formano una lettera mu greca minuscola: '=C2=B5'. AltGr ed 's' forma= no una '=C3=9F'. Come molti europei si aspettano (perch=C3=A9 cos=C3=AC =C3=A8 scr= itto sulla loro tastiera), AltGr e '4' (o 'E', dipende dal layout della tastiera) formano il simbolo dell'Euro, '=E2=82=AC'.

Risorse

Unicode su Wikipedia=
UTF-8 su Wikipedia
Unicode.org
UTF-8.com
RFC 3629
RFC 2277
Cha= racters vs. Bytes