Digitalización, escaneo y reconocimiento óptico de caracteres

ó

á

Vallejos
Zaira

ó
á
El objetivo de la digitalización es mejorar el acceso a los materiales de tal
manera que muchos de los materiales digitalizados pueden ser
buscados a través de bases de datos en internet.
Para que los materiales puedan ser digitalizados existen varias maneras
de capturarlos, por medio de escaner, fotografía digital, grabación
digital, etc.
Los textos digitales pueden producirse de tres maneras. La primera es la
digital que se generan directamente en un dispositivo, el cual permite
su almacenamiento en un medio digital.
La segunda es obtener imágenes digitales a partir de la digitalización de
textos impresos en papel, diapositivas o microfilms.
La tercera es generando un texto digital que pueda ser
modificado, reorganizado, a partir de una imagen digital; esto se
logra aplicando tecnología OCR a la imagen de texto.

¿ ó
Para captar la imagen se ilumina ésta con un foco de luz, y la luz reflejada
se conduce mediante espejos hacia un dispositivo denominado CCD, que
la transforma en señales eléctricas.

Éstas señales son
convertidas a formato
digital gracias a un
convertidor analógico-
digital, que transmite el
caudal de bits resultante
al computador. El CCD, es
el elemento fundamental
del escáner. Es un
componente electrónico
que reacciona ante la
luz, transmitiendo más o
menos electricidad según
la intensidad y el color de
esta.
La calidad de lo
escaneado depende del
refinamiento del CCD; del
convertidor analógico-
digital, y una
adecuada limpieza.

El Reconocimiento Óptico de Caracteres (OCR) es un proceso a través del cual textos
en papel se convierten en imágenes con el uso de un escáner y un software. Los
caracteres que contienen estas imágenes son interpretados y convertidos a texto digital,
el cual puede ser almacenado en algunos de los formatos de texto. para documentos con
baja calidad de impresión o familias tipográficas complejas, el OCR no es una buena
opción, ya que cada carácter que no es reconocido correcta y automáticamente por el
software requiere de un trabajo extra de corrección.
Para evitar exhaustivas y grandes correcciones posteriores, es recomendable hacer pruebas
antes de iniciar un largo proceso de OCR.
Cuando se trata de manuscritos no es posible hacer muchas pruebas, porque no se pueden
someter a un proceso de OCR. Si fuera el caso la captura manual del texto es la mejor
opción, o bien, la digitalización del documento como imagen digital.
El software para realizar el proceso de OCR evoluciono y los productos son más eficientes,
entres sus principales funciones está poder entregar diferentes formatos de los archivos de
salida y el reconocimiento de diferentes idiomas.

El sensor de imágenes de la cámara de vídeo
transforma la luz en señales eléctricas. Estas
cámaras pueden estar dotadas de sensores de
imágenes que utilizan dos tipos de tecnología
diferentes:
CCD
CMOS

Los sensores CCD, que se utilizan en las cámaras de vídeo ofrecen
ventajas en términos de calidad, como una mayor sensibilidad a la
luz con respecto a los sensores CMOS. Esta mayor sensibilidad
conlleva que las imágenes que se captan tengan más calidad. Sin
embargo estos tienen un coste más elevado, ya que su
incorporación en las cámaras requiere operaciones complicadas.
Asimismo, si la escena contiene un objeto muy luminoso el sensor
CCD no puede captar correctamente las imágenes.

Los sensores CMOS pueden ofrecer imágenes de alta calidad
equivalentes a las de los sensores CCD, pero de todas formas
inadecuadas para las cámaras que deben generar imágenes de
una calidad elevada. Los sensores CMOS reducen el coste de la
cámara puesto que contienen todos los componentes necesarios de
la cámara. Una de las limitaciones de los sensores CMOS deriva de
la menor sensibilidad a la luz que tienen. Las imágenes que estos
sensores generan en condiciones de poca iluminación pueden ser
muy oscuras o borrosas.

¿ é é

ó

á barrido de
Para ello se utilizan técnicas de
imágenes, tales como el barrido entrelazado
y el progresivo. El barrido entrelazado se
utiliza principalmente en los sensores CCD. El
barrido progresivo se utiliza tanto en los
sensores CCD como CMOS.

Con un sensor de imagen de barrido progresivo, los
valores se obtienen para cada píxel del sensor y cada línea
de datos de la imagen se barre de manera secuencial, lo
que produce una imagen completa. En el barrido
progresivo, se envía una imagen completa a través de una
red y cuando se muestra en un monitor de ordenador de
barrido progresivo, cada línea de una imagen se coloca en
la pantalla en perfecto orden una tras otra. Los objetos en
movimiento se muestran mejor en las pantallas de
ordenador mediante la técnica de barrido progresivo. En
una aplicación de videovigilancia, esto puede resultar vital
para visualizar detalles de un sujeto en movimiento.

A la izquierda, una imagen de barrido entrelazado mostrada en un
monitor progresivo. A la derecha, una imagen de barrido progresivo en
un monitor de ordenador.
A la izquierda, una imagen JPEG de
tamaño completo utilizando el barrido
entrelazado. A la derecha, una imagen
JPEG de tamaño completo procedente de
una cámara de red Axis que utiliza la
tecnología de barrido progresivo. Ambas
cámaras utilizaron el mismo tipo de
objetivo y la velocidad del coche fue la
misma de 20 km/h. El fondo es claro en
ambas imágenes. Sin embargo, el
conductor sólo se aprecia con claridad en
la imagen que utiliza la tecnología de
barrido progresivo

Los códigos bidimensionales no cumplen otra función mas que almacenar
información. Almacenando hasta 7000 caracteres. Tales como:

Recientemente salió un nuevo formato de código conocido como Bidi, QR
de Shotocode.

Tras obtener una foto del código, el sistema emplea la misma red de
comunicaciones que la del móvil que obtiene la captura. Los servidores
interpretan el código Bidi y mantendrán comunicación interactiva con el usuario.
Este código permite : acceder al historial medico de algún paciente, información
adicional de un producto al fotografiar el Bidi en algún supermercado,
escuchar y descargar canciones desde la cubierta de un CD, comprar entradas a
eventos desde periódicos, carteles.

Un código QR es un módulo para almacenar información en una matriz de
puntos o un código de barras bidimensional creado por la
compañía japonesa Denso Wave en 1994. Se caracteriza por los tres
cuadrados que se encuentran en las esquinas y que permiten detectar la
posición del código al lector. Aspiran a que el código permita que su
contenido se lea a alta velocidad. La información que contienen estos
códigos más usadas son: correo electrónico, página web o localización.

Aunque un porcentaje de la imagen del código se encuentre fallado, se conserva la información
gracias a cuatro esquemas de corrección que permiten su lectura.

Capacidad de
corrección de
errores
Nivel L 7% de las claves se pueden restaurar
Nivel M 15% de las claves se pueden restaurar
Nivel Q 25% de las claves se pueden restaurar
Nivel H 30% de las claves se pueden restaurar

Es una técnica que agrega información visual a la realidad mediante
dispositivos de uso generalizado. Complementa la percepción e
interacción con el mundo real y permite al usuario estar en un
entorno real con información adicional generada por el ordenador.
Permite enlazar imágenes virtuales a los objetos reales, y ellos puede
tener muchas aplicaciones en diversos campos.

Un entorno virtual es una simulación de la realidad
generada por medio de ordenadores.
El usurario se encuentra en el mundo real y puede obtener
información añadida del mundo virtual sin necesidad
de trasladarse a este.

Los dispositivos que pueden ejecutar operaciones en realidad
aumentada deben contar con cámara, brújula, acelerómetro,
GPS y memoria para procesar la información. Tales como:
ordenadores, móviles inteligentes, tabletas
El móvil toma una imagen desde su aplicación especial, la
aplicaciones e conecta a internet de forma inalámbrica y nos
lleva a bases de datos como wikipedia.

Digitalización, escaneo y reconocimiento óptico de caracteres

Digitalización, escaneo y reconocimiento óptico de caracteres

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (17)

Destacado

Destacado (9)

Similar a Digitalización, escaneo y reconocimiento óptico de caracteres

Similar a Digitalización, escaneo y reconocimiento óptico de caracteres (20)

Más de Zaira Vallejos

Más de Zaira Vallejos (8)

Digitalización, escaneo y reconocimiento óptico de caracteres