  |
Il problema del formato |
  |
Tanti formati di documenti di origine |
  |
Tanti formati di sito di destinazione |
  |
Come impaginare i siti |
  |
Tradurre i documenti in un formato standard |
  |
Trasformare tale formato nei formati di rappresentazione |
Vediamo adesso come si possa realizzare in pratica il concetto di
impaginazione Web. Se ci poniamo il problema di riuscire a
visualizzare i vari tipi di documenti esistenti per il Web e le sue
future evoluzioni, ci rendiamo conto di avere molti possibili formati
di origine e molti formati di destinazione.
Per esempio se i documenti sono stati creati con un elaboratore di
testi, possono essere composti con Word, ma anche con Wordperfect o
addirittura WordStar. In alternativa i documenti possono essere HTML o
semplicemente in un formato testo scritto a mano. Allo stesso modo, i
documenti ottenuti possono dover essere trasformati in varie versioni
di HTML (3 per ampia compatibilità, 4 per usare i browser più
recenti, oppure WML per i cellulari, per non parlare delle differenze
di dialetto tra i vari browser).
Invece di pensare di poter tradurre tutti i possibili formati di
origine in tutti i possibili formati di destinazione, la strada da
intraprendere è quella di tradurre tutti i possibi formati di testo
in un unico formato che sia abbastanza potente e generale da
rappresentarli senza perdere informazione
Una volta stabilito il formato intermedio standardizzato, si
possono applicare dei metodi standard, che siano semplici ed efficaci,
per tradurre questo formato nei vari formati destinazione.
  |
Verso l'XML |
  |
L'HTML non è sufficientemente generico. |
  |
L'SGML è troppo complesso |
  |
L'XML è un sottinsieme di SGML |
  |
20% complessità e 80% potenza |
Un primo approccio potrebbe essere quello di usare come formato
standard l'HTML: in fondo non esistono già numerosi strumenti per
convertire vari formati in HTML, e non è l'HTML la lingua universale
del Web?
Purtroppo l'HTML non va bene, nemmeno nelle sue ultime versioni:
per quanto reso ricco di funzioni, non ha attualmente la
espressività necessaria per un formato universale: l'HTML non è in
grado di esprimere, per esempio, la complessità di documenti di Word
impaginati, e non prevede molte possibilità: per esempio, è dura
trovare un modo per scrivere in HTML le partiture musicali o le
formule chimiche.
In verità il problema di avere un formato standard e
neutrale per esprimere vari tipi di documento non è nuovo e non
occorreva il Web perchè delle grandi organizzazioni si ponessero il
problema. Infatti ancora prima del Web esisteva l'SGML, che significa
Standard Generalized Markup Language. L'SGML è stato definito ed
usato da strutture come il Pentagono (il ministero della difesa degli
Stati Uniti) per gestire il "mare di carta" richiesto dalla burocrazia
militare.
L'SGML è un meta-formato: ovvero un formato che serve
per descrivere altri linguaggi. Per esempio con SGML si può
descrivere un formato per formule chimiche, per partiture musicali o
per ipertesti. In effetti l'HTML è nato appunto come un formato
specifico, descritto in SGML per costruire ipertesti, ma non è
l'unico.
Ma se c'è già un formato che consente di risolvere i
problemi di rappresentazione di testo detti prima, perchè non
usarlo? Il grosso problema dell'SGML è la sua complessità, così
alta da rendere problematica la sua adozione per l'ampia gamma di
applicazioni possibili per il Web. In effetti l'SGML è nato per
applicazioni di tipo militare che potevano permettersi i costi di
gestione di un formato così complesso. Ma per il Web questa
complessità è un serio ostacolo alla sua diffusione.
La soluzione è stata quella di definire un sottinsieme
di SGML che fosse in qualche modo compatibile con esso, ma che
rappresentasse l'80% della sua potenza con solo il 20% della sua
complessità. Un gruppo di lavoro coordinati dal W3C (il Web
Consortium guidato da Tim Berners-Lee, invetore del Web) hanno
intrapreso quest'opera di semplificazione, e il risultato è stato
l'eXtensible Markup Language, o XML, che si è proposto per essere la
base per i futuri sviluppi del World Wide Web. A giudicare
dall'accettazione che ha riscosso sembra che il risultato sia stato
raggiunto.
In effetti anche se XML ha solo pochi anni di vita, sulla
base di XML sono stati fatti numerosi lavori aggiuntivi. L'XML è il
formato nativo prodotto da numerosi elaboratori di testi e fogli
elettronici di nuova concezione, ed è usato per vari nuovi formati
per il Web. Per esempio lo standard per la grafica vettoriale SVG, lo
standard per le animazioni Web SMIL sono entrambe basate su XML. Sono
inoltre in corso dei progetti per realizzare dei filtri in grado di
esportare in un formato XML altri formati di documenti come per
esempio i file di Microsoft Office.
|