OCROpticalCharacterRecognition(Reconocimiento Óptico de Caracteres)Octubre 2011 – Lima - PerúYabed José Contreras ZambranoComentarios y/o sugerencias: yabedc@gmail.com
DefiniciónProceso mediante el cual, con la ayuda de programas especializados, se logra “leer” identificar y/o reconocer los caracteres contenidos en una imagen de manera automática. El resultado final de aplicar el proceso de OCR a una imagen es por lo general un archivo texto con las palabras contenidas en la imagen como si hubieran sido digitadas.
Beneficios potenciales de utilizar OCRAhorro de tiempo para ingresar datos que habitualmente se procesan manualmente.Reduce el número de personal que es necesario para ingresar gran cantidad de datos.Permite acceder a las opciones de algunos programas usados para leer archivos escaneados. Por ejemplo: Búsqueda de texto, cortar y pegar, copiar, resaltar texto, diccionario.A partir del OCR se desprende una serie de posibilidades para implementar un sistema inteligente de gestión de documentos.Brinda menos dificultades al crear contenido para personas con discapacidad visual, al complementar la tecnología OCR con la TTS (Text ToSpeech).
ConsideracionesCada vez disminuyen los costos de implementar una solución OCR.Existen diversos sistemas OCR, los cuales permiten abordar diversos tipos de escenarios, lo que implica evaluar con detenimiento que sistema usar.Los sistemas OCR están en continua investigación, aún queda por superar grandes desafíos como ejemplo: el reconocimiento de un manuscrito.
Algunos escenarios en los que se podría aplicar OCRSe requiere buscar texto en documentos escaneados.Ingreso automático de datos a través de formularios llenados de forma manual.Extraer texto desde imágenes.Identificar los caracteres de las placas de los vehículos en pleno movimiento.Control de acceso y/o identificación, lectura automática de cheques.Facilitar a bajo costo obras literarias a ciegos a través de software de lectura automática (TTS).Automatizar procesos de traducción de documentos basados en software.
Enlaces con información relevantehttp://en.wikipedia.org/wiki/Optical_character_recognitionhttp://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caractereshttp://www.iti.es/media/about/docs/tic/13/articulo2.pdf

Conceptos basicos ocr

  • 1.
    OCROpticalCharacterRecognition(Reconocimiento Óptico deCaracteres)Octubre 2011 – Lima - PerúYabed José Contreras ZambranoComentarios y/o sugerencias: yabedc@gmail.com
  • 2.
    DefiniciónProceso mediante elcual, con la ayuda de programas especializados, se logra “leer” identificar y/o reconocer los caracteres contenidos en una imagen de manera automática. El resultado final de aplicar el proceso de OCR a una imagen es por lo general un archivo texto con las palabras contenidas en la imagen como si hubieran sido digitadas.
  • 3.
    Beneficios potenciales deutilizar OCRAhorro de tiempo para ingresar datos que habitualmente se procesan manualmente.Reduce el número de personal que es necesario para ingresar gran cantidad de datos.Permite acceder a las opciones de algunos programas usados para leer archivos escaneados. Por ejemplo: Búsqueda de texto, cortar y pegar, copiar, resaltar texto, diccionario.A partir del OCR se desprende una serie de posibilidades para implementar un sistema inteligente de gestión de documentos.Brinda menos dificultades al crear contenido para personas con discapacidad visual, al complementar la tecnología OCR con la TTS (Text ToSpeech).
  • 4.
    ConsideracionesCada vez disminuyenlos costos de implementar una solución OCR.Existen diversos sistemas OCR, los cuales permiten abordar diversos tipos de escenarios, lo que implica evaluar con detenimiento que sistema usar.Los sistemas OCR están en continua investigación, aún queda por superar grandes desafíos como ejemplo: el reconocimiento de un manuscrito.
  • 5.
    Algunos escenarios enlos que se podría aplicar OCRSe requiere buscar texto en documentos escaneados.Ingreso automático de datos a través de formularios llenados de forma manual.Extraer texto desde imágenes.Identificar los caracteres de las placas de los vehículos en pleno movimiento.Control de acceso y/o identificación, lectura automática de cheques.Facilitar a bajo costo obras literarias a ciegos a través de software de lectura automática (TTS).Automatizar procesos de traducción de documentos basados en software.
  • 6.
    Enlaces con informaciónrelevantehttp://en.wikipedia.org/wiki/Optical_character_recognitionhttp://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caractereshttp://www.iti.es/media/about/docs/tic/13/articulo2.pdf