2. Objetivos
Al final de esta lección, usted podrá:
• Identificar el equipo, software, recursos
humanos y fondos necesarios para digitalizar
documentos impresos.
Introducción
Estamos de acuerdo que debemos empezar a
digitalizar nuestros documentos. También hemos
decidido cuáles documentos debemos digitalizar.
Ahora, planeemos lo que necesitamos hacer…
Usted necesitará varios tipos de
recursos para digitalizar los
documentos que se incluirán en
una biblioteca digital.
¿Qué recursos se necesitan?
¿Cuánto costarán?
En esta lección, recibirá algunas
guías que le ayudarán a
determinar lo que necesitará.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 2
3. Requisitos
El siguiente cuadro lista los tipos de recursos que usted podría necesitar para digitalizar sus
documentos:
Equipo • Escáneres, computadoras y dispositivos de almacenamiento
• Equipo de captura de sonido y video (si va a manejar grabaciones)
Software • Escaneo
• Reconocimiento óptico de caracteres
• Procesamiento de textos
• Revisión ortográfica
• Manejo de imágenes
• Captura de sonido y video (si va a manejar grabaciones)
Recursos Personal y habilidades
humanos
Fondos Para cubrir:
• salarios
• equipo
• software
• costos de funcionamiento, y demás
Analicemos cada uno de estos ítemes en detalle...
Equipo
Lo primero que se necesita es el escáner. Los escáneres vienen en tres
amplios rangos de precio:
Escáneres planos
Escáneres planos Escáneres medianos con
Escáneres medianos con Escáneres
Escáneres
económicos
económicos alimentador de documentos
alimentador de documentos profesionales
profesionales
PRECIO VENTAJAS DESVENTAJAS CUÁNDO USAR
Los escáneres Cada página tiene que ser Conveniente para
De $100 económicos planos puesta cuidadosamente a mano trabajos pequeños con
a $300. pueden escanear en la superficie de vidrio del un número limitado de
imágenes en blanco y escáner, y el propio proceso páginas - hasta
negro, y a color. de escaneo es lento (sólo se aproximadamente 400
puede escanear una docena de páginas regularmente
Como el precio es bajo, páginas por hora). por mes, o trabajos de
cada computador puede una vez de hasta 2.000
estar equipado con su páginas.
propio escáner.
Si se quieren escanear tipos especiales de materiales, como microfichas, diapositivas o materiales
sobredimensionados, se necesitará de un equipo especial. En este caso, una solución podría ser juntar los
recursos y comprar un escáner o un PC entre 5 ó 10 organizaciones locales.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 3
4. Equipo
Lo primero que se necesita es el escáner. Los escáneres vienen en tres
amplios rangos de precio:
Escáneres planos
Escáneres planos Escáneres medianos con Escáneres
económicos Escáneres medianos con Escáneres
económicos alimentador de profesionales
profesionales
alimentador de
documentos
documentos
PRECIO VENTAJAS DESVENTAJAS CUÁNDO USAR
De $500 Éstos pueden • Es necesario cortar la Estos escáneres
manejar 10–50 encuadernación de los libros para son útiles hasta
a $1.200. hacer que las hojas se puedan alimentar
páginas al mismo por 3.000
tiempo, o al escáner (fotocopiar es una opción, pero páginas al mes.
aproximadamente esto consume tiempo y es caro).
200 páginas por • El escáner puede escanear sólo un
día. lado de la página a la vez, entonces la
pila de páginas se debe voltear y
alimentarlas de nuevo en la máquina,
para escanear el otro lado.
• El alimentador de hojas se puede
atascar.
Equipo
Lo primero que se necesita es el escáner. Los escáneres vienen en tres
amplios rangos de precio:
Escáneres planos
Escáneres planos Escáneres medianos con Escáneres
económicos Escáneres medianos con Escáneres
económicos alimentador de documentos
alimentador de documentos profesionales
profesionales
PRECIO VENTAJAS DESVENTAJAS CUÁNDO USAR
Los escáneres profesionales son máquinas Estos sistemas
De de trabajo pesado con un sistema de
$5.000 son caros, y Estos sistemas son
bandeja alimentadora de hojas, como algunos usan de interés para
a una fotocopiadora. Los mejores pueden sistemas grandes
$50.000. escanear ambos lados de la página de una patentados de instituciones que
vez. archivado que deseen crear
lo atan a usted grandes
Varias empresas producen escaneo al software de bibliotecas
dedicado y sistemas de archivado. Por esa empresa. digitales.
ejemplo, un escáner de primera clase
automáticamente crea un archivo para cada
documento, y le permite asignar temas y
palabras claves en un solo proceso.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 4
5. Computador
El escaneo y el reconocimiento óptico de caracteres
requiere mucho poder de procesamiento del
computador.
Es posible escanear varios cientos de páginas,
usando un computador con un escáner instalado.
Para trabajos más grandes, de miles de páginas,
sin embargo, se necesitan más computadores y
operadores.
Asegúrese de tener bastante capacidad en el
disco (20 ó 30 Gb) para manejar los volúmenes
de datos generados.
La corrección de pruebas demanda mucho tiempo,
pero requiere menos poder de computación; por
consiguiente, podrían usarse algunos computadores
menos poderosos para esta tarea.
Si se planea crear una biblioteca digital, se
necesitará un computador bastante poderoso para
manejar grandes cantidades de procesamiento
de datos.
Quemador de CDs
Necesitará un quemador de CDs, por dos
razones:
1. para copiar y guardar (copia de resguardo)
grandes cantidades de datos producidos (usando
CDs reescribibles);
2. para crear la copia master del CD-ROM final
para distribución (si se planean distribuir los
documentos electrónicos en CD-ROM).
Una red de computación también es muy útil
porque permite hacer fácilmente copias de
resguardo de los archivos, y para compartir
archivos entre las diferentes personas que
trabajan en la producción.
Si no se tiene una red, se tendrá que confiar en
los CD-ROMs para transferir los datos (o unidades
de cinta o USB).
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 5
7. Personal
Se necesita el siguiente personal para el proceso de digitalización:
Un gerente para coordinar el equipo y el flujo de
trabajo de la digitalización.
Personal asignado a los metadatos.
Los bibliotecarios experimentados familiares con el tema son
mejores para esta tarea.
Un curso de entrenamiento o taller será necesario para capacitar a los miembros del equipo
en las habilidades extras que necesitan, y para desarrollar un flujo de trabajo apropiado a su
organización.
Personal
Se necesita el siguiente personal para el proceso de digitalización:
Personal para escanear, OCR, corrección de pruebas y
diseño.
Es necesario tener habilidades de computación, y entender
el idioma de los documentos en que se está trabajando. No
es necesario ser experto en el tema aunque ésta sería una
ventaja.
El escaneo, el OCR, la corrección de pruebas y el diseño
requiere de diligencia y concentración. Los mejores
resultados se obtienen trabajando limitadas horas por día. Si
tiene el personal a tiempo completo, emplee sólo personas
experimentadas, motivadas y conscientes de calidad.
Personal logístico y secretarial.
Tendrán que obtener los documentos, limpiarlos,
ordenarlos, cortar las encuadernaciones y
reencuadernarlos y luego devolverlos a su sitio
original.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 7
8. Costos
Cuando se presupueste el escaneo, se necesita
¿Cuánto costará el proceso de considerar:
inicio al fin? ¡Es tiempo de echar
Equipo y software Escáner, software, computadores,
una mirada al presupuesto!
mobiliario de oficina.
Adquisición de Registro, categorización, costos de
documentos correo y transporte, tiempo del
personal.
Escaneo Tiempo del personal, fotocopiado (si
se fotocopian los documentos antes
de escanearlos).
OCR, corrección de Tiempo del personal, consumibles
pruebas y diseño (discos, papel).
Asignación de Tiempo del personal (depende del
metadatos número de documentos, la dificultad
del tema, y los salarios de los
especialistas).
Administración y Administración, gastos generales,
gastos generales entrenamiento del personal.
Contingencia Gastos adicionales, no anticipados.
En las siguientes pantallas nos enfocaremos en los costos de escaneo y OCR, pero ¡recuerde
cubrir todos los costos listados en el cuadro!
Costos
El costo total dependerá del número de páginas a escanear y convertir. Esto
determinará:
• Los costos del personal requerido para escanear y
convertir el número de páginas. Éstos se calculan con
base en el tiempo del personal requerido y sus
niveles de salario.
• El tipo y costo del escáner requerido para la tarea.
Ahora, miremos cómo calcular los costos con base en estas variables.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 8
9. Costos
COSTOS DEL PERSONAL PARA ESCANEAR Y OCR
Se pueden calcular los costos aproximados de digitalizar documentos en su organización
como sigue:
Primero, se necesitará estimar el sueldo mensual típico del personal experimentado en el
uso de computadores en su organización e introducir esta cantidad (en dólares) en el
siguiente campo:
US $
Para calcular el costo estimado de escanear por página, haga clic en el botón Costos
de Escaneo:
Costos de escaneo
Costos de escaneo
Para calcular el costo estimado de OCR, corrección de pruebas y diseño por página, haga clic
en el botón Costos de OCR:
Costos de OCR
Costos de OCR
Costos
COSTO TOTAL DE ESCANEO Y OCR
Como se ha visto, el costo total de escaneo y OCR depende del tamaño del trabajo, y del nivel
del personal y equipo usado. Por ejemplo, mientras que un escáner menos poderoso tiene un
costo superior de escaneo por página, puede ser más efectivo que comprar un escáner más
caro y poderoso para un trabajo de pequeño a mediano tamaño. Ahora, miremos tres
escenarios de costos diferentes que tienen en cuenta el tamaño del trabajo y el escáner
apropiado para usarse.
Primero, introduzca el salario típico mensual del personal experimentado en el uso de
computadores (en dólares americanos) en el siguiente campo:
US $
Despúes, haga clic en los iconos para ver el costo estimado para cada escenario.
1,000 páginas 5,000 páginas 100,000 páginas
1,000 páginas 5,000 páginas 100,000 páginas
Estos estimados están basados en Loots et al., From Paper to Collection, 2004.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 9
10. Costos
Costos de escaneo por página, con base en el tipo de escáner y
niveles del sueldo:
Tipo de escáner Producción del Costo por
escáner por mes página (US$)
De cama plana 2.500
Alimentación de hojas 8.000
Duplex profesional (baja prod.) 40.000
El costo resultante por estimado de página no incluye el costo de compra del
escáner.
Estas estimaciones se basan en Loots et al., 2001.
Costos de OCR, corrección de pruebas y diseño por página con base en la
productividad del personal * y los niveles de salario:
Productividad Horas por día Páginas por Costo por
persona/mes página (US$)
Baja (novato ) 3 (medio tiempo) 150
Alta (experimentado) 7 (tiempo completo) 600
El costo resultante por estimación de página no incluye el costo del software usado para el
OCR, corrección de pruebas, gráficos y diseño; o para cualquier instrucción del personal.
Estas estimaciones se basan en Loots et al., 2001.
• Recuerde, los mejores resultados y productividad en el OCR y la corrección de pruebas se logra durante un
número limitado de horas cada día. Por consiguiente, el trabajo se debe organizar con base en media
jornada, o en tiempo completo empleando personas experimentadas y altamente motivadas.
Costos
Costo total para escaneo y OCR (1.000 páginas)
Un trabajo de 1000 páginas representa media jornada de aproximadamente un mes para
escanear, y un media jornada hasta por seis meses para el OCR, corrección de pruebas y
diseño. Un escáner plano económico y un computador equipado con un CD-R bastará para
esta tarea.
Entradas Costo (US$)
Escáner de cama plana 300
Escaneo 40
OCR, corrección de pruebas y diseño de la hoja 286
Total (aproximado) 626
El costo estimado resultante asume que hay disponible un computador con el adecuado
poder de procesamiento, almacenamiento y un dispositivo de copias de resguardo. Si no,
esto también se necesita agregar a la estimación del costo total.
1) escaneo = 1.000 X costo por página (con base en los costos del salario y el uso de un
escáner plano, capaz de 2.500 páginas por mes como se calculó previamente).
2) OCR, corrección de pruebas y diseño = 1.000 X costo por página (con base en el nivel
bajo de productividad para el OCR, corrección de pruebas y diseño según se calculó
previamente).
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 10
11. Subcontratar
Ahora podemos estimar mejor los
costos y las consideraciones del
personal, nuestro equipo podrá Tomando los escenarios anteriores, como un
determinar el mejor enfoque global. punto de partida, se puede determinar el mejor
enfoque y combinación de recursos para sus
necesidades. Se puede considerar subcontratar
el trabajo.
Subcontratar podría ser conveniente si:
• se tiene un trabajo “único”, no una actividad
continua; y
• se tiene que escanear muchas páginas pero
no se puede justificar comprar un escáner
profesional caro.
Pondere los costos y compromisos del personal
requerido para el OCR interno, corrección de
pruebas y diseño contra el costo de
subcontratar el trabajo con una compañía
profesional de OCR.
Guía y procedimientos
De aquí puede descargar e imprimir los documentos provistos en esta lección.
Los puede usar como herramientas para su trabajo.
Software necesario para digitalizar
documentos
Categorías de costos
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 11
12. Resumen
•Para digitalizar publicaciones impresas, usted necesitará de
equipo adecuado, software, recursos humanos y fondos.
•El tipo y cantidad de equipo necesario depende de la cantidad
de páginas que se digitalizarán.
•Necesitará una variedad de software, pero puede conseguir
muchos si quiere usar software de fuente abierta.
•Tratar con idiomas diferentes en documentos impresos es un
problema que se debe considerar.
•Los costos de la biblioteca digital dependen de la cantidad de
páginas a escanear y los sueldos del personal experimentado.
Considere subcontratar esta tarea si no puede hacerlo
internamente.
Ejercicios
Los siguientes seis ejercicios le ayudarán a probar su comprensión de los conceptos tratados
en la lección y le proporcionarán información adicional.
¡Buena suerte!
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 12
13. Ejercicio 1
Antes de empezar el proceso de escaneo, el Sr. López consideró varios asuntos. Éstas son
algunas de sus notas:
“El proceso de escaneo es un compromiso constante, que tiene la ventaja de permitirnos
crear nuestra propia pequeña biblioteca digital. Una vez digitalizados, nuestros documentos
impresos se pueden distribuir fácilmente; ya he identificado al personal que participará en el
proceso”.
¿Qué asunto clave todavía no ha mencionado el Sr. López?
Escriba su respuesta en el recuadro y pulse Respuesta.
Ejercicio 2
El Sr. López ha listado varios ítemes para incluir en su presupuesto de la biblioteca
digital:
• Equipo y software
• Adquisición de documentos
• Escaneo
• OCR, corrección de pruebas y diseño
• Manejo y gastos generales
• Contingencia
¿Qué ha olvidado?
Escriba su respuesta en el recuadro y pulse Respuesta.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 13
14. Ejercicio 3
Mi procesador de textos no maneja el
idioma de estos documentos, entonces no
vale la pena pasarlos por el verificador
ortográfico…
Cierto
Falso
Haga clic en su respuesta
Ejercicio 4
Si tuviera que escanear aproximadamente 2000 páginas, ¿qué tipo de escáner sería
el más conveniente para sus necesidades?
Un escáner plano económico
Un escáner de bajo nivel con un alimentador de hojas
Un escáner profesional de primera clase
Haga clic en su respuesta
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 14
15. Ejercicio 5
Si tuviera que hacer la corrección de pruebas de 2000 páginas, ¿qué equipo
seleccionaría?
4 computadores poderosos
1 computador poderoso y 3 menos poderosos
3 computadores poderosos y 1 menos poderoso
Haga clic en su respuesta
Ejercicio 6
¿Cuál de estos factores influenciarán principalmente el costo total del proceso de
escaneo?
El número de individuos involucrados.
El tiempo necesario para el proceso.
El número de páginas a convertir.
El número de computadores necesarios.
Los niveles de salario de aquellos que harán el trabajo.
Seleccione sus respuestas (2 o más) y pulse Verifique
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 15
16. Para saber más …
Recursos en línea:
ACDSee (visualizador y conversor de imágenes): (http://es.acdsystems.com/)
Adobe Reader: (http://www.adobe.com/es/
CompuPic (programa de gestión de imágenes): (http://www.photodex.com)
CutePDF Writer (Genera documentos PDF desde cualquier aplicación):
(http://www.cutepdf.com/Products/CutePDF/writer.asp
FineReader website: ejemplo de escaneo y software OCR : (http://www.finereader.com
Guide to Digital Scientific Artwork: (http://www.mlab.nl/GtoDSA/Start.htm)
Irfanview (visualizador de imagen y vídeo): (http://www.irfanview.com)
Jornadas de Bibliotecas Digitales: (http://imhotep.unizar.es/JBIDI/index.html)
OmniPage website: ejemplo de escaneo y software OCR : (http://spain.scansoft.com/omnipage/)
PDF995 (Crea documentos PDF desde cualquier aplicación): (http://www.pdf995.com)
PDF-PHP (Libreria para PDF en PHP): (http://sourceforge.net/projects/pdf-php)
PDFCreator (programa para crear documentos en formato PDF):(http://sourceforge.net/projects/pdfcreator )
ReadIris website: ejemplo de escaneo y software OCR : (http://www.readiris.com)
El software de fuente abierta está disponible gratuitamente en varios sitios web. He aquí la lista de ellos:
Freshmeat (repositorio de software para linux): freshmeat.net: (http://freshmeat.net/)
OpenOffice.org - incluye un procesador de textos (Writer) que le permite crear documentos estructurados (utilizando
docbook) y convertirlos fácilmete a pdf: es.openoffice.org (http://es.openoffice.org)
The UNESCO Free Software Portal: (http://www.unesco.org/cgi-bin/webworld/portal_freesoftware/cgi/page.cgi?d=1)
Oss4lib - Software Abierto para Bibliotecas: www.oss4lib.org: (http://www.oss4lib.org)
Open Source and Linux News and Software: http://osdir.com: (http://osdir.com/)
Lectura adicional:
Witten, I.H. & Bainbridge, D. 2002. How to build a digital library. The Morgan Kaufmann Series in Multimedia
Information and Systems, Edward Fox, Series Editor. ISBN:1-55860-790-0.
4. Producción y manejo de documentos electrónicos - 3. Requisitos básicos para la digitalización página 16