Liknande böcker
Un Metabuscador Para La Recuperacion de Documentos Similares En La Web : Diseño e Implementación
Bok av Bravo-Marquez Felipe
Recuperar documentos que se parezcan a un documento dado dentro de la Web es un problema que no resuelven los motores de búsqueda comerciales. Esto se debe, a que los motores de búsqueda están pensados para resolver necesidades de información representadas por pequeños conjuntos de términos clave. Se define el problema de recuperación de documentos similares como el proceso en que un usuario ingresa un párrafo a un sistema de información y éste le retorna los documentos con mayor similitud a éste en la Web. Resolver el problema, podría ser de utilidad en contextos como la detección de plagio, el análisis de impacto de documentos en la Web y la recuperación de ideas similares. En este trabajo, el problema se resuelve mediante la generación probabílistca de consultas, el uso de distintos motores de búsqueda y la combinación de resultados retornados por distintas fuentes. Los documentos recuperados son rankeados por medio de una métrica de similitud basada en la ley de Zipf.