|
I file XML li possiamo dunque ottenere da documenti Word come pure da
documenti HTML, o li possiamo editare utilizzando per esempio l'XMLNotepad
di Microsoft (programma freware per cominciare a mettere il piede nel nuovo
mondo). In realtà possiamo ottenere (e sempre più avremo in futuro) documenti
XML che rappresentano informazioni come disegni vettoriali, musica, o "business-rules".
Per esempio i file CDF che definiscono la "programmazione" dei canali
Web (e che probabilmente vi ritrovate nel vostro hard disk se avere installato
Windows 98 e/o Internet Explorer 4) sono dei file XML. Date un'occhiata
alla figura 3: non l'ho scritto io, l'ho trovato nell'hard disk. Explorer 4 incorpora
già un parser di XML che viene usato per gestire questi file ed essere
pronto alle future applicazioni.
<?XML VERSION="1.0" ENCODING="UTF-8"?>
<CHANNEL HREF="http://www.raicast.rai.it/intro.htm">
<ABSTRACT>Rai, di tutto di più</ABSTRACT>
</CHANNEL>
Figura 3
Le applicazioni possibili dell'XML sono davvero infinite. Stiamo parlando
infatti di un generico formato dati che ha il vantaggio della semplicità
e standardizzazione. Sicuramente avremo pensato tutti qualche applicazione
che preveda di estrarre informazioni o peggio modificare un documento Word
o Excel. Di solito ci si rinuncia, a causa della estrema difficoltà di
analizzare un documento in formato Word (anche se esportato in RTF non
è ancora una cosa propriamente semplicissima). Avendo un documento XML
già si comincia ad avere qualcosa di gestibile, ma c'è ancora una difficoltà:
il parsing dell'XML stesso. Pur essendo molto semplice rispetto all'SGML,
scrivere un parser che ne comprenda tutte le sottigliezze dello standard
non è esattamente un compito che si fa in mezz'ora di lavoro. Fortunatamente
di parser per l'XML ne esistono numerosi e sono gratuiti. Quindi abbiamo
tutto il necessario per metterci al lavoro: un formato standard e lo strumento
per analizzarlo.
L'applicazione che propongo è l'impaginazione di un documento con tanto
di creazione di indice. Si tratta di un esempio ridotto dell'applicazione
che utilizziamo nella nostra ditta per generare il nostro sito Web: a partire
da un documento XML (ottenuto a sua volta da vari documenti in formato
Word e HTML), viene impaginato, suddividendolo in tante pagine e per ogni
pagina viene creato l'indice, le barre di navigazione e tutto quanto serve
a rendere professionale un sito. Quello che faremo, più semplicemente,
è esemplificare il procedimento scrivendo un programma in Java per impaginare
in HTML (indice compreso) un articolo. In figura 1
potete vedere l'input mentre in
figura 2
. potete vedere il risultato. Il listato 1 mostra il programma, che andiamo
a commentare.
<ARTICOLO>
<TITOLO>Programmare in Java</TITOLO>
<AUTORE>Michele Sciabarra'</AUTORE>
<OCCHIELLO>
Java e' il linguaggio del futuro.
</OCCHIELLO>
<PARAGRAFO>
Benvenuti.
</PARAGRAFO>
<TITOLETTO>Perche' Java</TITOLETTO>
<PARAGRAFO>
Perche' Java e' un bel linguaggio.
</PARAGRAFO>
<TITOLETTO>Un programma</TITOLETTO>
<LISTATO>
class Hello {
public static void main(String[] args) {
System.out.println("Hello!"); } }
</LISTATO>
</ARTICOLO>
Figura 1
Figura 2
|