buchspektrum Internet-Buchhandlung

Neuerscheinungen 2014

Stand: 2020-02-01
Schnellsuche
ISBN/Stichwort/Autor
Herderstraße 10
10625 Berlin
Tel.: 030 315 714 16
Fax 030 315 714 14
info@buchspektrum.de

Nicolas Faessel

Indexation et interrogation de pages Web décomposées en blocs visuels


BlockWeb : un modèle d´indexation et d´interrogation de pages Web
2014. 200 S. 220 mm
Verlag/Jahr: PRESSES ACADÉMIQUES FRANCOPHONES 2014
ISBN: 3-8381-4402-3 (3838144023)
Neue ISBN: 978-3-8381-4402-3 (9783838144023)

Preis und Lieferzeit: Bitte klicken


Cet ouvrage porte sur l´indexation et l´interrogation de pages Web. Nous présentons le modèle BlockWeb, qui s´appuie sur une décomposition de pages Web en une hiérarchie de blocs visuels et prend en compte l´importance visuelle de chaque bloc et la perméabilité des blocs au contenu de leurs blocs voisins dans la page. Cette décomposition permet notamment d´effectuer une interrogation à une granularité plus fine que la page : les blocs les plus similaires à une requête sont être renvoyés à la place de la page complète. Une page est représentée sous forme d´un graphe acyclique orienté dont chaque n ud est associé à un bloc et étiqueté par son importance et chaque arc est étiqueté par la perméabilité du bloc cible au bloc source. Afin de construire ce graphe à partir de la représentation en arbre de blocs d´une page, nous proposons un nouveau langage : XIML (XML Indexing Management Language), qui est un langage de règles. Ce modèle a été expérimenté sur deux applications distinctes : la recherche du meilleur point d´entrée sur un corpus d´articles de journaux électroniques et l´indexation et la recherche d´images sur un corpus de la campagne d´ImagEval 2006.