next up previous contents
Next: Sistemi con più unità Up: Indici e strumenti per Previous: Indici e strumenti per

Sistemi formati da una sola unità

 

L'indicizzazione di un servizio informativo contenuto in una unica ``macchina'' è argomento già standardizzato al di fuori delle problematiche di Rete; inoltre vi sono numerosi strumenti (per esempio WAIS [DKM+90], o Glimpse [MW94]) nati per fornire questo servizio utilizzando strutture ad alberi invertiti e altri algoritmi molto diffusi in letteratura.

Le precauzioni da prendere riguardo il loro utilizzo in un servizio strettamente WWW riguardano l'utilizzo dell'HTML come formato di pubblicazione dei documenti: come tutti le istanze SGML, infatti, un documento HTML contiene al suo interno sia il testo vero e proprio che elementi di markup per indicarne la funzione semantica. Un indicizzatore dovrebbe scartare il codice di markup durante l'analisi del documento e al tempo stesso utilizzarlo per ``pesare'' in maniera opportuna le varie sezioni. Tra gli strumenti disponibili che possiedono queste caratteristiche citiamo Swish [Hug95b] e WebGlimpse [MSG97].



Alessio Bragadini