El documento describe una nueva técnica llamada blindLight para procesar texto no estructurado mediante vectores de n-gramas de longitud variable. La técnica extrae n-gramas de diferentes longitudes de un texto y calcula la significatividad de cada n-grama para generar un vector representativo del documento. Estos vectores permiten comparar documentos y realizar tareas como clasificación, categorización, recuperación de información y resumen automático de manera independiente del idioma.