Biblioteca Mario Rostoni - LIUC

Catalogo delle tesi di laurea

Facoltà: Ingegneria Gestionale - classe 10
Collocazione: 6785

Autore: Lo Grasso Giuseppina Fabiana
Data: 24/09/2008

Titolo: Un sistema di classificazione di pagine web basato su parole chiave

Relatore: Buonanno Giacomo
Correlatore: Borgonovo Emanuele

Autorizzazione per la consultazione: NO
Le tesi si possono consultare unicamente in sede

Abstract

L'obiettivo di tale progetto è la realizzazione di un grande motore di ricerca in grado di scandagliare periodicamente il web alla ricerca di tutte le informazioni riguardanti meeting, congressi, workshop, simposi (e così via) per poi renderle disponibili agli utenti interessati. Questa operazione dovrà comprendere una fase di analisi dei testi per ricavarne i dati significativi, una fase di riempimento di grandi basi di dati e la creazione di un sistema in grado di permettere interrogazioni di vario tipo da parte dell'utente che siano di natura più semplice come una richiesta di visualizzazione per data di creazione o una richiesta più complessa come, ad esempio, la ricerca di congressi che riguardino un ambito specifico. Innanzitutto, abbiamo preso in esame alcuni motori di ricerca per capire come essi rispondano alle richieste di utenti interessati a meeting e congressi. Tale analisi è sia teorica, ovvero non tralascerà una digressione sulla storia dei motori di ricerca e sulle differenze tra di essi, sia di tipo statistico al fine di monitorare effettivamente le diverse tipologie di risposta alle richieste dell'utente. Successivamente si discuterà dello strumento essenziale per la ricerca di informazioni nelle pagine web, che è il parser un programma specifico che consente l'analisi sintattica della pagina web in esame nell'ottica macro dell'Information Retrieval. Infine, obiettivo principale della tesi, è lo sviluppo di un software in Java con uno scopo preciso che si colloca nella fase successiva alla ricerca dei siti di interesse: esso è in grado di leggere documenti di tipo .html, per stabilire, attraverso una analisi basata su parole chiave, l'argomento trattato dai documenti stessi. Si spiegheranno con particolare cura le fasi di programmazione per concludere con qualche importante riflessione sul lavoro svolto, sia a livello di risultati ottenuti che a livello di nuovi traguardi da raggiungere.

 
| Indice del sito della Biblioteca | Homepage del sito della Biblioteca