Incrustar presentación









El documento describe el problema de que las herramientas de búsqueda web producen resultados incompletos y des-estructurados, mientras que la investigación requiere un corpus exhaustivo de todos los documentos y los resultados estructurados en una base de datos. Plantea el focused crawling como una posible solución, el cual utiliza una URL semilla, keywords relevantes, definición de frontera, clasificación basada en relevancia, extracción de nuevas URLs, recuperación y almacenaje de datos e indización. Finalmente, solicita sugerencias y propuestas sobre sol







