SlideShare una empresa de Scribd logo
1 de 5
OCR.
EL RECONOCIMIENTO ÓPTICO DE CARACTERES (ROC), O
GENERALMENTE COMO RECONOCIMIENTO DE CARACTERES, ES
UN PROCESO DIRIGIDO A LA DIGITALIZACIÓN DE TEXTOS, LOS
CUALES IDENTIFICAN AUTOMÁTICAMENTE A PARTIR DE UNA
IMAGEN SÍMBOLOS O CARACTERES QUE PERTENECEN A UN
DETERMINADO ALFABETO, PARA LUEGO ALMACENARLOS EN
FORMA DE DATOS, ASI PODREMOS INTERACTUAR CON ESTOS
MEDIANTE UN PROGRAMA DE EDICIÓN DE TEXTO O SIMILAR.
CON FRECUENCIA ES ABREVIADO EN TEXTOS ESCRITOS EN EL
IDIOMA ESPAÑOL, UTILIZANDO EL ACRÓNIMO A PARTIR DEL
INGLÉS OCR.
VENTAJAS DEL OCR.
   Si estás buscando solamente convertir cualquier documento en formato digital
    editable entonces no hay nada mejor que servicios del OCR. El proceso de
    caracteres ópticos del reconocimiento ahorra la época y el esfuerzo de
    desarrollar una reproducción digital de cualquier documento. Ninguna necesidad
    de mecanografiar caracteres manualmente en un archivo digital. El lugar justo la
    copia dura del documento dentro de un explorador y consigue el formato digital
    de ese documento con la ayuda de software del OCR.

   Con proceso del OCR puedes convertir un documento en varios formatos
    electrónicos como - Microsoft Word, Excel, el HTML, el pdf, el texto o los
    formatos de texto ricos.

   Los documentos, que se convierten con proceso del OCR, son editable y
    permiten que el usuario modifique el contenido. Comparado al servicio manual
    de la entrada de datos el coste de servicio del OCR es absolutamente menos
    para desarrollar la reproducción electrónica de cualquier documento. El servicio
    del OCR probó mejor que el servicio de la entrada de datos para las
    organizaciones, que se contratan a desarrollar la copia electrónica de libros
    impresos.
DESVENTAJAS DEL OCR.
   Hay varias desventajas del servicio del OCR con respecto al coste así como el proceso de reconocer los
    caracteres. Inicialmente, el coste de desarrollar la reproducción con proceso del OCR puede parecerse
    lucrativo pero si consideras el coste del ciclo vital entero del sistema del OCR, el coste será mucho más
    alto que servicio de la entrada de datos. Corregir errores del OCR cuenta más coste que preparando un
    formato digital del documento.

   El alto software del OCR de la exactitud puede leer más de 400 caracteres/en segundo lugar,
    aproximadamente, y genera menos número de los errores del OCR comparados a cualquier software
    ordinario del OCR. Por lo tanto, si estás buscando proceso del OCR tienes que mantener un sitio de
    trabajo separado para corregir errores del OCR.

   El software del OCR no es eficiente en el reconocimiento del cursivo y de las fuentes, que son
    absolutamente similares al cursivo. En tales casos el mecanografiar manual desempeña un papel mejor
    que proceso del OCR.

   ¿Cómo eficiente es el servicio de la entrada de datos que el OCR?

   Comparado al proceso ordinario del OCR, el coste de ciclo vital de la conversión está menos en servicio
    de la entrada de datos y proporciona flexibilidad completa a los operadores de entrada de datos que
    elaboran documentos digitales de formatos múltiples como copia dura o archivos audio. Considerar el
    servicio de la transcripción médica donde necesitas elaborar documentos digitales de archivos audio. El
    OCR no puede elaborar el documento digital explorando ninguna archivos audio. En tales servicios, la
    entrada de datos puede probar mejor que el OCR.
BENEFICIOS DEL OCR.
 El dispositivo que obtiene la imagen puede
  introducir niveles de grises al fondo que no
  pertenecen a la imagen original.
 La resolución de estos dispositivos puede
  introducir ruido en la imagen, afectando los
  píxeles que han de ser procesados.
 La distancia que separa a unos caracteres de
  otros, al no ser siempre la misma, puede
  producir errores de reconocimiento.
 La conexión de dos o más caracteres por
  píxeles comunes también puede producir
  errores.
UTILIDADES DEL OCR.
   La mayor parte de algoritmos de ROC parten como base de una
    imagen binaria (dos colores) por lo tanto es conveniente convertir
    una imagen de escala de grises, o una de color, en una imagen
    en blanco y negro, de tal forma que se preserven las propiedades
    esenciales de la imagen. Una forma de hacerlo es mediante el
    histograma de la imagen donde se muestra el número de pixeles
    para cada nivel de grises que aparece a la imagen. Para
    binarizarla tenemos que escoger un umbral adecuado, a partir
    del cual todos los pixeles que no lo superen se convertirán en
    negro y el resto en blanco.

   Mediante este proceso obtenemos una imagen en blanco y negro
    donde quedan claramente marcados los contornos de los
    caracteres y símbolos que contiene la imagen. A partir de aquí
    podemos aislar las partes de la imagen que contienen texto (más
    transiciones entre blanco y negro).

Más contenido relacionado

Destacado

Open Journal Systems y Open Monograph Press
Open Journal Systems y Open Monograph PressOpen Journal Systems y Open Monograph Press
Open Journal Systems y Open Monograph PressSocialBiblio
 
LOS COMPONENTES ACTIVOS DE LA MARCA 3COM
LOS COMPONENTES ACTIVOS DE LA MARCA 3COMLOS COMPONENTES ACTIVOS DE LA MARCA 3COM
LOS COMPONENTES ACTIVOS DE LA MARCA 3COMELIANATREJOM
 
El valor de la marca en el sector gran consumo
El valor de la marca en el sector gran consumoEl valor de la marca en el sector gran consumo
El valor de la marca en el sector gran consumoLa Salle BCN
 
10 estrategia competitiva genérica y su relación con el precio
10 estrategia competitiva genérica y su relación con el precio10 estrategia competitiva genérica y su relación con el precio
10 estrategia competitiva genérica y su relación con el precioRonald Santos Cori
 
Capital y valoración de marca
Capital y valoración de marcaCapital y valoración de marca
Capital y valoración de marcaEliza Mejia Uribe
 
Plan de Negocio de una Planta de Tratamiento de Aguas Residuales
Plan de Negocio de una Planta de Tratamiento de Aguas Residuales Plan de Negocio de una Planta de Tratamiento de Aguas Residuales
Plan de Negocio de una Planta de Tratamiento de Aguas Residuales Eduar Alexander Niño Aranguren
 
OMR Design And Evaluation System
OMR Design And Evaluation SystemOMR Design And Evaluation System
OMR Design And Evaluation SystemMridul Rawat
 
Estrategias genericas basicas
Estrategias genericas basicasEstrategias genericas basicas
Estrategias genericas basicasLeidy Pulido
 
OMP - Guía de usuario
OMP - Guía de usuarioOMP - Guía de usuario
OMP - Guía de usuarioJoel Torres
 
Componentes de un producto1
Componentes de un producto1Componentes de un producto1
Componentes de un producto1davidmarin911
 
Las cinco estrategias competitivas genericas
Las cinco estrategias competitivas genericasLas cinco estrategias competitivas genericas
Las cinco estrategias competitivas genericasGloria Garcia Galindo
 
Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...
Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...
Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...Jose M. Sanchez
 

Destacado (18)

Open Journal Systems y Open Monograph Press
Open Journal Systems y Open Monograph PressOpen Journal Systems y Open Monograph Press
Open Journal Systems y Open Monograph Press
 
Valor marca
Valor marcaValor marca
Valor marca
 
LOS COMPONENTES ACTIVOS DE LA MARCA 3COM
LOS COMPONENTES ACTIVOS DE LA MARCA 3COMLOS COMPONENTES ACTIVOS DE LA MARCA 3COM
LOS COMPONENTES ACTIVOS DE LA MARCA 3COM
 
El valor de la marca en el sector gran consumo
El valor de la marca en el sector gran consumoEl valor de la marca en el sector gran consumo
El valor de la marca en el sector gran consumo
 
10 estrategia competitiva genérica y su relación con el precio
10 estrategia competitiva genérica y su relación con el precio10 estrategia competitiva genérica y su relación con el precio
10 estrategia competitiva genérica y su relación con el precio
 
Capital y valoración de marca
Capital y valoración de marcaCapital y valoración de marca
Capital y valoración de marca
 
Plan de Negocio de una Planta de Tratamiento de Aguas Residuales
Plan de Negocio de una Planta de Tratamiento de Aguas Residuales Plan de Negocio de una Planta de Tratamiento de Aguas Residuales
Plan de Negocio de una Planta de Tratamiento de Aguas Residuales
 
OMR Design And Evaluation System
OMR Design And Evaluation SystemOMR Design And Evaluation System
OMR Design And Evaluation System
 
Estrategias competitivas genericas
Estrategias competitivas genericasEstrategias competitivas genericas
Estrategias competitivas genericas
 
Estrategias genericas basicas
Estrategias genericas basicasEstrategias genericas basicas
Estrategias genericas basicas
 
Valor de la marca
Valor de la marcaValor de la marca
Valor de la marca
 
El valor de la marca
El valor de la marcaEl valor de la marca
El valor de la marca
 
Valor de marca
Valor de marcaValor de marca
Valor de marca
 
OMP - Guía de usuario
OMP - Guía de usuarioOMP - Guía de usuario
OMP - Guía de usuario
 
Componentes de un producto1
Componentes de un producto1Componentes de un producto1
Componentes de un producto1
 
Estrategias Competitivas
Estrategias CompetitivasEstrategias Competitivas
Estrategias Competitivas
 
Las cinco estrategias competitivas genericas
Las cinco estrategias competitivas genericasLas cinco estrategias competitivas genericas
Las cinco estrategias competitivas genericas
 
Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...
Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...
Estrategias de Branding Intercultural: Valor de Marca para la Diversidad Cult...
 

Similar a El reconocimiento óptico de caracteres (roc),

Tecnologia de Imagenes (OCR) y Seguridad de datos electrónicos
Tecnologia de Imagenes (OCR) y Seguridad de datos electrónicosTecnologia de Imagenes (OCR) y Seguridad de datos electrónicos
Tecnologia de Imagenes (OCR) y Seguridad de datos electrónicosDigetech.net
 
Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.Sol Arriola
 
Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.Sol Arriola
 
Es Ca Ne O Op Tii Koo O
Es Ca Ne O Op Tii Koo OEs Ca Ne O Op Tii Koo O
Es Ca Ne O Op Tii Koo OMyScene
 
ESCANER E IMPRESORAS para las oficinas.pptx
ESCANER E IMPRESORAS para las oficinas.pptxESCANER E IMPRESORAS para las oficinas.pptx
ESCANER E IMPRESORAS para las oficinas.pptxjuan gonzalez
 
Digitalización - Definición, tipos, requerimientos y procedimientos
Digitalización - Definición, tipos, requerimientos y procedimientosDigitalización - Definición, tipos, requerimientos y procedimientos
Digitalización - Definición, tipos, requerimientos y procedimientosEdgama DeCuates
 
Sistemas De Escaneo Optico
Sistemas De Escaneo OpticoSistemas De Escaneo Optico
Sistemas De Escaneo Opticobengy16
 
Sistemas De Escaneo Optico
Sistemas De Escaneo OpticoSistemas De Escaneo Optico
Sistemas De Escaneo Opticoeduarts56
 
Escanner
EscannerEscanner
Escanneralanmc
 
Sharp and Autostore_spanish
Sharp and Autostore_spanishSharp and Autostore_spanish
Sharp and Autostore_spanishNSI LA
 
Tipos de escáneres copia
Tipos de escáneres   copiaTipos de escáneres   copia
Tipos de escáneres copiaMilton Negria
 
Tipos de escáneres copia
Tipos de escáneres   copiaTipos de escáneres   copia
Tipos de escáneres copiaMilton Negria
 

Similar a El reconocimiento óptico de caracteres (roc), (20)

Ocr
OcrOcr
Ocr
 
3 SESIÓN 3
3 SESIÓN 33 SESIÓN 3
3 SESIÓN 3
 
Tecnologia de Imagenes (OCR) y Seguridad de datos electrónicos
Tecnologia de Imagenes (OCR) y Seguridad de datos electrónicosTecnologia de Imagenes (OCR) y Seguridad de datos electrónicos
Tecnologia de Imagenes (OCR) y Seguridad de datos electrónicos
 
Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.
 
Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.Trabajo prático de tic. arriola sol camila.
Trabajo prático de tic. arriola sol camila.
 
Es Ca Ne O Op Tii Koo O
Es Ca Ne O Op Tii Koo OEs Ca Ne O Op Tii Koo O
Es Ca Ne O Op Tii Koo O
 
ESCANER E IMPRESORAS para las oficinas.pptx
ESCANER E IMPRESORAS para las oficinas.pptxESCANER E IMPRESORAS para las oficinas.pptx
ESCANER E IMPRESORAS para las oficinas.pptx
 
Andrea
AndreaAndrea
Andrea
 
INNOVACOMPU PRES
INNOVACOMPU PRESINNOVACOMPU PRES
INNOVACOMPU PRES
 
Escaner
EscanerEscaner
Escaner
 
Escanéo Óptico
Escanéo ÓpticoEscanéo Óptico
Escanéo Óptico
 
El escanéo óptico
El escanéo ópticoEl escanéo óptico
El escanéo óptico
 
Digitalización - Definición, tipos, requerimientos y procedimientos
Digitalización - Definición, tipos, requerimientos y procedimientosDigitalización - Definición, tipos, requerimientos y procedimientos
Digitalización - Definición, tipos, requerimientos y procedimientos
 
Sistemas De Escaneo Optico
Sistemas De Escaneo OpticoSistemas De Escaneo Optico
Sistemas De Escaneo Optico
 
Sistemas De Escaneo Optico
Sistemas De Escaneo OpticoSistemas De Escaneo Optico
Sistemas De Escaneo Optico
 
Scanner
ScannerScanner
Scanner
 
Escanner
EscannerEscanner
Escanner
 
Sharp and Autostore_spanish
Sharp and Autostore_spanishSharp and Autostore_spanish
Sharp and Autostore_spanish
 
Tipos de escáneres copia
Tipos de escáneres   copiaTipos de escáneres   copia
Tipos de escáneres copia
 
Tipos de escáneres copia
Tipos de escáneres   copiaTipos de escáneres   copia
Tipos de escáneres copia
 

El reconocimiento óptico de caracteres (roc),

  • 1. OCR. EL RECONOCIMIENTO ÓPTICO DE CARACTERES (ROC), O GENERALMENTE COMO RECONOCIMIENTO DE CARACTERES, ES UN PROCESO DIRIGIDO A LA DIGITALIZACIÓN DE TEXTOS, LOS CUALES IDENTIFICAN AUTOMÁTICAMENTE A PARTIR DE UNA IMAGEN SÍMBOLOS O CARACTERES QUE PERTENECEN A UN DETERMINADO ALFABETO, PARA LUEGO ALMACENARLOS EN FORMA DE DATOS, ASI PODREMOS INTERACTUAR CON ESTOS MEDIANTE UN PROGRAMA DE EDICIÓN DE TEXTO O SIMILAR. CON FRECUENCIA ES ABREVIADO EN TEXTOS ESCRITOS EN EL IDIOMA ESPAÑOL, UTILIZANDO EL ACRÓNIMO A PARTIR DEL INGLÉS OCR.
  • 2. VENTAJAS DEL OCR.  Si estás buscando solamente convertir cualquier documento en formato digital editable entonces no hay nada mejor que servicios del OCR. El proceso de caracteres ópticos del reconocimiento ahorra la época y el esfuerzo de desarrollar una reproducción digital de cualquier documento. Ninguna necesidad de mecanografiar caracteres manualmente en un archivo digital. El lugar justo la copia dura del documento dentro de un explorador y consigue el formato digital de ese documento con la ayuda de software del OCR.  Con proceso del OCR puedes convertir un documento en varios formatos electrónicos como - Microsoft Word, Excel, el HTML, el pdf, el texto o los formatos de texto ricos.  Los documentos, que se convierten con proceso del OCR, son editable y permiten que el usuario modifique el contenido. Comparado al servicio manual de la entrada de datos el coste de servicio del OCR es absolutamente menos para desarrollar la reproducción electrónica de cualquier documento. El servicio del OCR probó mejor que el servicio de la entrada de datos para las organizaciones, que se contratan a desarrollar la copia electrónica de libros impresos.
  • 3. DESVENTAJAS DEL OCR.  Hay varias desventajas del servicio del OCR con respecto al coste así como el proceso de reconocer los caracteres. Inicialmente, el coste de desarrollar la reproducción con proceso del OCR puede parecerse lucrativo pero si consideras el coste del ciclo vital entero del sistema del OCR, el coste será mucho más alto que servicio de la entrada de datos. Corregir errores del OCR cuenta más coste que preparando un formato digital del documento.  El alto software del OCR de la exactitud puede leer más de 400 caracteres/en segundo lugar, aproximadamente, y genera menos número de los errores del OCR comparados a cualquier software ordinario del OCR. Por lo tanto, si estás buscando proceso del OCR tienes que mantener un sitio de trabajo separado para corregir errores del OCR.  El software del OCR no es eficiente en el reconocimiento del cursivo y de las fuentes, que son absolutamente similares al cursivo. En tales casos el mecanografiar manual desempeña un papel mejor que proceso del OCR.  ¿Cómo eficiente es el servicio de la entrada de datos que el OCR?  Comparado al proceso ordinario del OCR, el coste de ciclo vital de la conversión está menos en servicio de la entrada de datos y proporciona flexibilidad completa a los operadores de entrada de datos que elaboran documentos digitales de formatos múltiples como copia dura o archivos audio. Considerar el servicio de la transcripción médica donde necesitas elaborar documentos digitales de archivos audio. El OCR no puede elaborar el documento digital explorando ninguna archivos audio. En tales servicios, la entrada de datos puede probar mejor que el OCR.
  • 4. BENEFICIOS DEL OCR.  El dispositivo que obtiene la imagen puede introducir niveles de grises al fondo que no pertenecen a la imagen original.  La resolución de estos dispositivos puede introducir ruido en la imagen, afectando los píxeles que han de ser procesados.  La distancia que separa a unos caracteres de otros, al no ser siempre la misma, puede producir errores de reconocimiento.  La conexión de dos o más caracteres por píxeles comunes también puede producir errores.
  • 5. UTILIDADES DEL OCR.  La mayor parte de algoritmos de ROC parten como base de una imagen binaria (dos colores) por lo tanto es conveniente convertir una imagen de escala de grises, o una de color, en una imagen en blanco y negro, de tal forma que se preserven las propiedades esenciales de la imagen. Una forma de hacerlo es mediante el histograma de la imagen donde se muestra el número de pixeles para cada nivel de grises que aparece a la imagen. Para binarizarla tenemos que escoger un umbral adecuado, a partir del cual todos los pixeles que no lo superen se convertirán en negro y el resto en blanco.  Mediante este proceso obtenemos una imagen en blanco y negro donde quedan claramente marcados los contornos de los caracteres y símbolos que contiene la imagen. A partir de aquí podemos aislar las partes de la imagen que contienen texto (más transiciones entre blanco y negro).