SlideShare una empresa de Scribd logo
1 de 33
PROCESAMIENTO PREVIO DE LA IMAGEN SESIÓN DE DEMOSTRACIÓN IMPACT,  Biblioteca Nacional de España, 5 de octubre de 2011
Reconocimiento Óptico de Caracteres (OCR) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Retos OCR:  páginas dañadas, alabeadas, tintas traspasadas, maquetación compleja, fuentes históricas…etc.
Características comunes de las imágenes digitales …
…  y sus efectos en el OCR
Reconocimientos erróneos: ¿internet inventado en el XVIII?
Esquema del proceso OCR CONVERSIÓN  DE FICHEROS CORRECCIONES GEOMÉTRICAS/ELIM. MÁRGENES “ BINARIZACIÓN” OCR POST-PROCESO + EVALUACIÓN DEMO TOOL WF TAVERNA WEB  IMPACT
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Conversión Ir
Correcciones geométricas/Elim. márgenes ,[object Object],[object Object]
A.-Correcciones geométricas ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
 
 
 
Basic IMPACT NCSR BorderRemoval B.- Eliminación de márgenes
 
 
‘ Binarización’ de imágenes ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
 
 
 
WFs en TAVERNA
WFs en TAVERNA
WFs en TAVERNA
PÁGINA WEB IMPACT
NCRS  Image Enhancement Toolkit ( H-DocPro v.1)
Componentes para el procesamiento de imágenes Binarización NCSR:   Basado en "B. Gatos, I. Pratikakis and S. J. Perantonis, Adaptive Degraded Document Image Binarization, Pattern Recognition, Vol. 39, pp. 317-327, 2006" FR8.1:  FineReader Engine v. 8.1. IMPORTANTE: (a) Motor previamente instalado. (b) Añadir código de licencia de FineReader
Componentes para el procesamiento de imágenes Eliminación de bordes Auto:  Basado en perfiles de proyección y análisis de componentes. Auto_Edit:  Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador.
22.383 imágenes de prueba BL: 7%  BNE: 34% BNF: 34%  BSB:  11% JSI: 6%  NLB: 2% ONB: 6% Sólo imágenes con bordes 38.718 imágenes de prueba BL: 9%  BNE: 29% BNF: 32%  BSB:  12% JSI: 11%  NLB: 2% ONB: 5% Componentes para el procesamiento de imágenes Eliminación de bordes
Auto:  Basado en "N. Stamatopoulos, B. Gatos, T. Georgiou, Page frame detection for double page document images, 9th IAPR International Workshop on Document Analysis Systems (DAS 2010), pp. 401-408, Cambridge, MA, USA, June 2010" Auto_Edit:  Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador. Componentes para el procesamiento de imágenes Individualización de páginas
458 imágenes de la BNF Componentes para el procesamiento de imágenes Individualización de páginas 3.009 imágenes BL:  72%  BSB:  10% JSI:  18%
Auto:  Basado en "N. Stamatopoulos, B. Gatos, I. Pratikakis and S.J. Perantonis, Goal-oriented Rectification of Camera-Based Document Images, IEEE Transactions on Image Processing, vol. 20, no. 4, pp. 910-920, 2011." IMPORTANT NOTICES: (a) It needs the MATLAB Component Runtime Installer, (b) it can be applied only to single column documents. Auto_Edit:  Corrección manual de líneas/curvas que delimitan el texto arrastrando los puntos activos de un rectángulo delimitador Componentes para el procesamiento de imágenes Corrección de curvatura
87,78%   Corrección curvatura IMPACT v.4 (81,98% sólo corrección en bruto) BookRestorer 80,87% Componentes para el procesamiento de imágenes Corrección de curvatura
GRACIAS POR SU ATENCIÓN Isabel Bordes Cabrera Jefe de Servicio de Biblioteca Digital, BNE [email_address]

Más contenido relacionado

Similar a Bloque1 image enhancement_toolkit_051011

Haciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGISHaciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGISEsri España
 
7 8-13-cursos de-computac_iyi_n
7 8-13-cursos de-computac_iyi_n7 8-13-cursos de-computac_iyi_n
7 8-13-cursos de-computac_iyi_nIng Felix Quintana
 
Utp pdiva_lab1 introduccion a mat_lab
 Utp pdiva_lab1 introduccion a mat_lab Utp pdiva_lab1 introduccion a mat_lab
Utp pdiva_lab1 introduccion a mat_labjcbenitezp
 
SISTEMA DE VISION ARTIFICIALPresentación2007
SISTEMA DE VISION ARTIFICIALPresentación2007SISTEMA DE VISION ARTIFICIALPresentación2007
SISTEMA DE VISION ARTIFICIALPresentación2007faustino830
 
Principios básicos de diseño web
Principios básicos de diseño webPrincipios básicos de diseño web
Principios básicos de diseño webOmar Sosa-Tzec
 
Dispositivos de imagen
Dispositivos de imagenDispositivos de imagen
Dispositivos de imagenacademico
 
Gb indexacion automatica
Gb indexacion automaticaGb indexacion automatica
Gb indexacion automaticaLATIPAT
 
Class 01 introduction_imagen_procesing
Class 01 introduction_imagen_procesingClass 01 introduction_imagen_procesing
Class 01 introduction_imagen_procesingPorfirio Rubio
 
Cartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informaticaCartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informaticajavier_cruz_cahuana
 
Cartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informaticaCartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informaticajavier_cruz_cahuana
 
Introducción al CAD
Introducción al CADIntroducción al CAD
Introducción al CADJeckson Loza
 
hardware y software para computacion
hardware y software para computacionhardware y software para computacion
hardware y software para computacionyadmay
 
Herramientas Y Programas Utiles
Herramientas Y Programas UtilesHerramientas Y Programas Utiles
Herramientas Y Programas UtilesJairo Gatjens
 
los buscadores
los buscadores los buscadores
los buscadores diosydario
 

Similar a Bloque1 image enhancement_toolkit_051011 (19)

Haciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGISHaciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGIS
 
7 8-13-cursos de-computac_iyi_n
7 8-13-cursos de-computac_iyi_n7 8-13-cursos de-computac_iyi_n
7 8-13-cursos de-computac_iyi_n
 
Utp pdiva_lab1 introduccion a mat_lab
 Utp pdiva_lab1 introduccion a mat_lab Utp pdiva_lab1 introduccion a mat_lab
Utp pdiva_lab1 introduccion a mat_lab
 
Defensa tesis
Defensa tesisDefensa tesis
Defensa tesis
 
SISTEMA DE VISION ARTIFICIALPresentación2007
SISTEMA DE VISION ARTIFICIALPresentación2007SISTEMA DE VISION ARTIFICIALPresentación2007
SISTEMA DE VISION ARTIFICIALPresentación2007
 
Principios básicos de diseño web
Principios básicos de diseño webPrincipios básicos de diseño web
Principios básicos de diseño web
 
LOS ESCANERS
LOS ESCANERSLOS ESCANERS
LOS ESCANERS
 
Dispositivos de imagen
Dispositivos de imagenDispositivos de imagen
Dispositivos de imagen
 
Gb indexacion automatica
Gb indexacion automaticaGb indexacion automatica
Gb indexacion automatica
 
Class 01 introduction_imagen_procesing
Class 01 introduction_imagen_procesingClass 01 introduction_imagen_procesing
Class 01 introduction_imagen_procesing
 
Cartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informaticaCartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informatica
 
Cartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informaticaCartel del alcances y contenidos de la especialidad de informatica
Cartel del alcances y contenidos de la especialidad de informatica
 
scaner
 scaner scaner
scaner
 
Introducción al CAD
Introducción al CADIntroducción al CAD
Introducción al CAD
 
hardware y software para computacion
hardware y software para computacionhardware y software para computacion
hardware y software para computacion
 
Herramientas Y Programas Utiles
Herramientas Y Programas UtilesHerramientas Y Programas Utiles
Herramientas Y Programas Utiles
 
Internet 
Internet Internet 
Internet 
 
Deformación incremental ISMF
Deformación incremental ISMFDeformación incremental ISMF
Deformación incremental ISMF
 
los buscadores
los buscadores los buscadores
los buscadores
 

Más de IMPACT Centre of Competence

Más de IMPACT Centre of Competence (20)

Session6 01.helmut schmid
Session6 01.helmut schmidSession6 01.helmut schmid
Session6 01.helmut schmid
 
Session1 03.hsian-an wang
Session1 03.hsian-an wangSession1 03.hsian-an wang
Session1 03.hsian-an wang
 
Session7 03.katrien depuydt
Session7 03.katrien depuydtSession7 03.katrien depuydt
Session7 03.katrien depuydt
 
Session7 02.peter kiraly
Session7 02.peter kiralySession7 02.peter kiraly
Session7 02.peter kiraly
 
Session6 04.giuseppe celano
Session6 04.giuseppe celanoSession6 04.giuseppe celano
Session6 04.giuseppe celano
 
Session6 03.sandra young
Session6 03.sandra youngSession6 03.sandra young
Session6 03.sandra young
 
Session6 02.jeremi ochab
Session6 02.jeremi ochabSession6 02.jeremi ochab
Session6 02.jeremi ochab
 
Session5 04.evangelos varthis
Session5 04.evangelos varthisSession5 04.evangelos varthis
Session5 04.evangelos varthis
 
Session5 03.george rehm
Session5 03.george rehmSession5 03.george rehm
Session5 03.george rehm
 
Session5 02.tom derrick
Session5 02.tom derrickSession5 02.tom derrick
Session5 02.tom derrick
 
Session5 01.rutger vankoert
Session5 01.rutger vankoertSession5 01.rutger vankoert
Session5 01.rutger vankoert
 
Session4 04.senka drobac
Session4 04.senka drobacSession4 04.senka drobac
Session4 04.senka drobac
 
Session3 04.arnau baro
Session3 04.arnau baroSession3 04.arnau baro
Session3 04.arnau baro
 
Session3 03.christian clausner
Session3 03.christian clausnerSession3 03.christian clausner
Session3 03.christian clausner
 
Session3 02.kimmo ketunnen
Session3 02.kimmo ketunnenSession3 02.kimmo ketunnen
Session3 02.kimmo ketunnen
 
Session3 01.clemens neudecker
Session3 01.clemens neudeckerSession3 01.clemens neudecker
Session3 01.clemens neudecker
 
Session2 04.ashkan ashkpour
Session2 04.ashkan ashkpourSession2 04.ashkan ashkpour
Session2 04.ashkan ashkpour
 
Session2 03.juri opitz
Session2 03.juri opitzSession2 03.juri opitz
Session2 03.juri opitz
 
Session2 02.christian reul
Session2 02.christian reulSession2 02.christian reul
Session2 02.christian reul
 
Session2 01.emad mohamed
Session2 01.emad mohamedSession2 01.emad mohamed
Session2 01.emad mohamed
 

Bloque1 image enhancement_toolkit_051011

  • 1. PROCESAMIENTO PREVIO DE LA IMAGEN SESIÓN DE DEMOSTRACIÓN IMPACT, Biblioteca Nacional de España, 5 de octubre de 2011
  • 2.
  • 3. Retos OCR: páginas dañadas, alabeadas, tintas traspasadas, maquetación compleja, fuentes históricas…etc.
  • 4. Características comunes de las imágenes digitales …
  • 5. … y sus efectos en el OCR
  • 6. Reconocimientos erróneos: ¿internet inventado en el XVIII?
  • 7. Esquema del proceso OCR CONVERSIÓN DE FICHEROS CORRECCIONES GEOMÉTRICAS/ELIM. MÁRGENES “ BINARIZACIÓN” OCR POST-PROCESO + EVALUACIÓN DEMO TOOL WF TAVERNA WEB IMPACT
  • 8.
  • 9.
  • 10.
  • 11.  
  • 12.  
  • 13.  
  • 14. Basic IMPACT NCSR BorderRemoval B.- Eliminación de márgenes
  • 15.  
  • 16.  
  • 17.
  • 18.  
  • 19.  
  • 20.  
  • 25. NCRS Image Enhancement Toolkit ( H-DocPro v.1)
  • 26. Componentes para el procesamiento de imágenes Binarización NCSR: Basado en "B. Gatos, I. Pratikakis and S. J. Perantonis, Adaptive Degraded Document Image Binarization, Pattern Recognition, Vol. 39, pp. 317-327, 2006" FR8.1: FineReader Engine v. 8.1. IMPORTANTE: (a) Motor previamente instalado. (b) Añadir código de licencia de FineReader
  • 27. Componentes para el procesamiento de imágenes Eliminación de bordes Auto: Basado en perfiles de proyección y análisis de componentes. Auto_Edit: Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador.
  • 28. 22.383 imágenes de prueba BL: 7% BNE: 34% BNF: 34% BSB: 11% JSI: 6% NLB: 2% ONB: 6% Sólo imágenes con bordes 38.718 imágenes de prueba BL: 9% BNE: 29% BNF: 32% BSB: 12% JSI: 11% NLB: 2% ONB: 5% Componentes para el procesamiento de imágenes Eliminación de bordes
  • 29. Auto: Basado en "N. Stamatopoulos, B. Gatos, T. Georgiou, Page frame detection for double page document images, 9th IAPR International Workshop on Document Analysis Systems (DAS 2010), pp. 401-408, Cambridge, MA, USA, June 2010" Auto_Edit: Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador. Componentes para el procesamiento de imágenes Individualización de páginas
  • 30. 458 imágenes de la BNF Componentes para el procesamiento de imágenes Individualización de páginas 3.009 imágenes BL: 72% BSB: 10% JSI: 18%
  • 31. Auto: Basado en "N. Stamatopoulos, B. Gatos, I. Pratikakis and S.J. Perantonis, Goal-oriented Rectification of Camera-Based Document Images, IEEE Transactions on Image Processing, vol. 20, no. 4, pp. 910-920, 2011." IMPORTANT NOTICES: (a) It needs the MATLAB Component Runtime Installer, (b) it can be applied only to single column documents. Auto_Edit: Corrección manual de líneas/curvas que delimitan el texto arrastrando los puntos activos de un rectángulo delimitador Componentes para el procesamiento de imágenes Corrección de curvatura
  • 32. 87,78% Corrección curvatura IMPACT v.4 (81,98% sólo corrección en bruto) BookRestorer 80,87% Componentes para el procesamiento de imágenes Corrección de curvatura
  • 33. GRACIAS POR SU ATENCIÓN Isabel Bordes Cabrera Jefe de Servicio de Biblioteca Digital, BNE [email_address]

Notas del editor

  1. B. Gatos Computational Intelligence Laboratory Institute of Informatics and Telecommunications National Center for Scientific Research ( NCSR ) "Demokritos" GR-153 10 Agia Paraskevi, Athens, Greece
  2. Outline of your presentation:
  3. Outline of your presentation:
  4. Outline of your presentation:
  5. Outline of your presentation:
  6. Outline of your presentation:
  7. Outline of your presentation:
  8. Outline of your presentation: