El documento describe un estudio sobre la clasificación de páginas web en dominios específicos. Presenta la motivación y objetivos del estudio, que son clasificar páginas de forma automática en dominios como el teatro. Explica la creación de una colección de pruebas de páginas de teatro y experimentos de clasificación usando diferentes métodos como Bag of Words. Finalmente, propone un método basado en meta-información de encabezados, enlaces y URL que mejora los resultados frente a métodos previos.