ePrometeusCorsoJavaJava
testi articoli
Testi Articoli  Download
Home | Xml | Dtd | XPath | Xslt | Esempio | 
CorsoJava è ora Video! Free for all!
Clicca Qui!

Xml
XML
Tecnologie
Implementazioni
Esempio
Dati
Trasformazione

<<< XML >>>
Il problema del formato
Tanti formati di documenti di origine
Tanti formati di sito di destinazione
Come impaginare i siti
Tradurre i documenti in un formato standard
Trasformare tale formato nei formati di rappresentazione

Vediamo adesso come si possa realizzare in pratica il concetto di impaginazione Web. Se ci poniamo il problema di riuscire a visualizzare i vari tipi di documenti esistenti per il Web e le sue future evoluzioni, ci rendiamo conto di avere molti possibili formati di origine e molti formati di destinazione.

Per esempio se i documenti sono stati creati con un elaboratore di testi, possono essere composti con Word, ma anche con Wordperfect o addirittura WordStar. In alternativa i documenti possono essere HTML o semplicemente in un formato testo scritto a mano. Allo stesso modo, i documenti ottenuti possono dover essere trasformati in varie versioni di HTML (3 per ampia compatibilità, 4 per usare i browser più recenti, oppure WML per i cellulari, per non parlare delle differenze di dialetto tra i vari browser).

Invece di pensare di poter tradurre tutti i possibili formati di origine in tutti i possibili formati di destinazione, la strada da intraprendere è quella di tradurre tutti i possibi formati di testo in un unico formato che sia abbastanza potente e generale da rappresentarli senza perdere informazione

Una volta stabilito il formato intermedio standardizzato, si possono applicare dei metodi standard, che siano semplici ed efficaci, per tradurre questo formato nei vari formati destinazione.

Verso l'XML
L'HTML non è sufficientemente generico.
L'SGML è troppo complesso
L'XML è un sottinsieme di SGML
20% complessità e 80% potenza

Un primo approccio potrebbe essere quello di usare come formato standard l'HTML: in fondo non esistono già numerosi strumenti per convertire vari formati in HTML, e non è l'HTML la lingua universale del Web?

Purtroppo l'HTML non va bene, nemmeno nelle sue ultime versioni: per quanto reso ricco di funzioni, non ha attualmente la espressività necessaria per un formato universale: l'HTML non è in grado di esprimere, per esempio, la complessità di documenti di Word impaginati, e non prevede molte possibilità: per esempio, è dura trovare un modo per scrivere in HTML le partiture musicali o le formule chimiche.

In verità il problema di avere un formato standard e neutrale per esprimere vari tipi di documento non è nuovo e non occorreva il Web perchè delle grandi organizzazioni si ponessero il problema. Infatti ancora prima del Web esisteva l'SGML, che significa Standard Generalized Markup Language. L'SGML è stato definito ed usato da strutture come il Pentagono (il ministero della difesa degli Stati Uniti) per gestire il "mare di carta" richiesto dalla burocrazia militare.

L'SGML è un meta-formato: ovvero un formato che serve per descrivere altri linguaggi. Per esempio con SGML si può descrivere un formato per formule chimiche, per partiture musicali o per ipertesti. In effetti l'HTML è nato appunto come un formato specifico, descritto in SGML per costruire ipertesti, ma non è l'unico.

Ma se c'è già un formato che consente di risolvere i problemi di rappresentazione di testo detti prima, perchè non usarlo? Il grosso problema dell'SGML è la sua complessità, così alta da rendere problematica la sua adozione per l'ampia gamma di applicazioni possibili per il Web. In effetti l'SGML è nato per applicazioni di tipo militare che potevano permettersi i costi di gestione di un formato così complesso. Ma per il Web questa complessità è un serio ostacolo alla sua diffusione.

La soluzione è stata quella di definire un sottinsieme di SGML che fosse in qualche modo compatibile con esso, ma che rappresentasse l'80% della sua potenza con solo il 20% della sua complessità. Un gruppo di lavoro coordinati dal W3C (il Web Consortium guidato da Tim Berners-Lee, invetore del Web) hanno intrapreso quest'opera di semplificazione, e il risultato è stato l'eXtensible Markup Language, o XML, che si è proposto per essere la base per i futuri sviluppi del World Wide Web. A giudicare dall'accettazione che ha riscosso sembra che il risultato sia stato raggiunto.

In effetti anche se XML ha solo pochi anni di vita, sulla base di XML sono stati fatti numerosi lavori aggiuntivi. L'XML è il formato nativo prodotto da numerosi elaboratori di testi e fogli elettronici di nuova concezione, ed è usato per vari nuovi formati per il Web. Per esempio lo standard per la grafica vettoriale SVG, lo standard per le animazioni Web SMIL sono entrambe basate su XML. Sono inoltre in corso dei progetti per realizzare dei filtri in grado di esportare in un formato XML altri formati di documenti come per esempio i file di Microsoft Office.

ePrometeus s.r.l. - Web Software House & Open Source System Integrator
MILANO - SAN BENEDETTO DEL TRONTO(AP)
Contatti: info@eprometeus.com