Este documento describe un proyecto para digitalizar y capturar datos de 2.380.000 páginas de pruebas SIMCE 2015 para la Agencia de la Calidad de la Educación. El objetivo era extraer los datos de los formatos impresos a una base de datos para validación y análisis estadístico. Se implementó un proceso de 30 días con 4 líneas de producción para digitalizar, indexar imágenes y capturar datos usando software especializado. El resultado fue una base de datos de 90.000 registros y millones de caracteres a partir de 2.700 cajas y