Une M�thode d''indexation S�mantique Adapt�e Aux Corpus Multilingues

Bok av Roussey-C
Cette thse propose une mthode d'indexation smantique pour les documents XML permettant de caractriser le contenu documentaire par des connaissances, non dpendante de la langue des documents. Ces connaissances sont dclines en deux types: Les connaissances du domaine sont utilises pour reprsenter les documents et les requtes dans le mme espace de reprsentation non dpendant des langues. Les connaissances terminologiques constituent plusieurs langages de prsentation des connaissances du domaine. Nous avons dfini notre propre modle de reprsentation des connaissances intitul les graphes smantiques. Ce modle est un enrichissement du modle des graphes conceptuels de Sowa. Premirement, notre modle diffrencie les connaissances du domaine, des connaissances terminologiques. Deuximement, une fonction de comparaison de graphes adapte aux besoins rels de la recherche d'information est propose. Pour valider notre proposition, un prototype, appel SyDoM, a t implant, rpondant aux besoins d'une bibliothque virtuelle.