Bloque1 image enhancement_toolkit_051011

PROCESAMIENTO PREVIO DE LA IMAGEN SESIÓN DE DEMOSTRACIÓN IMPACT, Biblioteca Nacional de España, 5 de octubre de 2011

Reconocimiento Óptico de Caracteres (OCR) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Retos OCR: páginas dañadas, alabeadas, tintas traspasadas, maquetación compleja, fuentes históricas…etc.

Características comunes de las imágenes digitales …

Reconocimientos erróneos: ¿internet inventado en el XVIII?

Esquema del proceso OCR CONVERSIÓN DE FICHEROS CORRECCIONES GEOMÉTRICAS/ELIM. MÁRGENES “ BINARIZACIÓN” OCR POST-PROCESO + EVALUACIÓN DEMO TOOL WF TAVERNA WEB IMPACT

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Conversión Ir

Correcciones geométricas/Elim. márgenes ,[object Object],[object Object]

A.-Correcciones geométricas ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Basic IMPACT NCSR BorderRemoval B.- Eliminación de márgenes

‘ Binarización’ de imágenes ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

NCRS Image Enhancement Toolkit ( H-DocPro v.1)

Componentes para el procesamiento de imágenes Binarización NCSR: Basado en "B. Gatos, I. Pratikakis and S. J. Perantonis, Adaptive Degraded Document Image Binarization, Pattern Recognition, Vol. 39, pp. 317-327, 2006" FR8.1: FineReader Engine v. 8.1. IMPORTANTE: (a) Motor previamente instalado. (b) Añadir código de licencia de FineReader

Componentes para el procesamiento de imágenes Eliminación de bordes Auto: Basado en perfiles de proyección y análisis de componentes. Auto_Edit: Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador.

22.383 imágenes de prueba BL: 7% BNE: 34% BNF: 34% BSB: 11% JSI: 6% NLB: 2% ONB: 6% Sólo imágenes con bordes 38.718 imágenes de prueba BL: 9% BNE: 29% BNF: 32% BSB: 12% JSI: 11% NLB: 2% ONB: 5% Componentes para el procesamiento de imágenes Eliminación de bordes

Auto: Basado en "N. Stamatopoulos, B. Gatos, T. Georgiou, Page frame detection for double page document images, 9th IAPR International Workshop on Document Analysis Systems (DAS 2010), pp. 401-408, Cambridge, MA, USA, June 2010" Auto_Edit: Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador. Componentes para el procesamiento de imágenes Individualización de páginas

458 imágenes de la BNF Componentes para el procesamiento de imágenes Individualización de páginas 3.009 imágenes BL: 72% BSB: 10% JSI: 18%

Auto: Basado en "N. Stamatopoulos, B. Gatos, I. Pratikakis and S.J. Perantonis, Goal-oriented Rectification of Camera-Based Document Images, IEEE Transactions on Image Processing, vol. 20, no. 4, pp. 910-920, 2011." IMPORTANT NOTICES: (a) It needs the MATLAB Component Runtime Installer, (b) it can be applied only to single column documents. Auto_Edit: Corrección manual de líneas/curvas que delimitan el texto arrastrando los puntos activos de un rectángulo delimitador Componentes para el procesamiento de imágenes Corrección de curvatura

87,78% Corrección curvatura IMPACT v.4 (81,98% sólo corrección en bruto) BookRestorer 80,87% Componentes para el procesamiento de imágenes Corrección de curvatura

GRACIAS POR SU ATENCIÓN Isabel Bordes Cabrera Jefe de Servicio de Biblioteca Digital, BNE [email_address]

Bloque1 image enhancement_toolkit_051011

Recomendados

Recomendados

Más contenido relacionado

Similar a Bloque1 image enhancement_toolkit_051011

Similar a Bloque1 image enhancement_toolkit_051011 (19)

Más de IMPACT Centre of Competence

Más de IMPACT Centre of Competence (20)

Bloque1 image enhancement_toolkit_051011

Notas del editor