Este documento presenta una guía sobre el proceso de digitalización de documentos en bibliotecas. Explica las etapas clave como la selección de materiales a digitalizar, el escaneo, el reconocimiento óptico de caracteres, la edición y corrección. También cubre aspectos importantes como los requerimientos técnicos, de software y recursos humanos necesarios, así como los costos asociados que dependen principalmente de la cantidad de páginas a digitalizar. El objetivo es proporcionar una introducción completa al tema para quienes de
RODELU presenta al mercado una completa línea de productos y servicios relacionados con la Gestión Documental, con las mejores herramientas para implementar una propia solución o para cubrir sus necesidades por medio del Outsourcing.
Nuestra oferta son soluciones integrales, robustas y adecuadamente respaldadas por los mejores profesionales y por nuestros exitosos proveedores internacionales.
Presentacion Digitalización de Documentos Marza Digitex 2013Manuel Martinez
Sistema de Digitalizacion de Documentos para cualquier tipo y tamaño de empresas. Basado en estandares de la industria y con servicios de almacenamiento en la nube, cloud-storage.
RODELU presenta al mercado una completa línea de productos y servicios relacionados con la Gestión Documental, con las mejores herramientas para implementar una propia solución o para cubrir sus necesidades por medio del Outsourcing.
Nuestra oferta son soluciones integrales, robustas y adecuadamente respaldadas por los mejores profesionales y por nuestros exitosos proveedores internacionales.
Presentacion Digitalización de Documentos Marza Digitex 2013Manuel Martinez
Sistema de Digitalizacion de Documentos para cualquier tipo y tamaño de empresas. Basado en estandares de la industria y con servicios de almacenamiento en la nube, cloud-storage.
Cómo la inteligencia documental simplifica su empresaXerox Global
Las organizaciones necesitan mucho más que una simple digitalización de documentos. Necesitan documentos inteligentes.Esto requiere un cambio de mentalidad que permita alejarse de los dispositivos de hardware para centrarse en ecosistemas de software que integren dispositivos y sistemas
Dossier de la empresa DigitalCLM de servicios a empresas entre los que destacan la digitalización documental, certificada de documentos, gestión documental, custodia documental, etc
Exposicion de Mag. Hugo Ambrosio Bejarano
IV Congreso Internacional de Informatica Forense y Hacking Etico
Sabado 13 de Septiembre
Sociedad de Ingenieros de Bolivia - Departamental Chuquisaca
Sucre 2014
Day 1: Legislative document management, Mr. Esteban Sanchez, Head of Technolo...wepc2016
Digital technologies and their underlying processes now allow parliaments to create systems that underpin the legislative, representative and oversight work of parliaments. This session looks at recent innovations in the field of legislative document management, including developments on open standards, and both XML- and non-XML based systems.
Cómo la inteligencia documental simplifica su empresaXerox Global
Las organizaciones necesitan mucho más que una simple digitalización de documentos. Necesitan documentos inteligentes.Esto requiere un cambio de mentalidad que permita alejarse de los dispositivos de hardware para centrarse en ecosistemas de software que integren dispositivos y sistemas
Dossier de la empresa DigitalCLM de servicios a empresas entre los que destacan la digitalización documental, certificada de documentos, gestión documental, custodia documental, etc
Exposicion de Mag. Hugo Ambrosio Bejarano
IV Congreso Internacional de Informatica Forense y Hacking Etico
Sabado 13 de Septiembre
Sociedad de Ingenieros de Bolivia - Departamental Chuquisaca
Sucre 2014
Day 1: Legislative document management, Mr. Esteban Sanchez, Head of Technolo...wepc2016
Digital technologies and their underlying processes now allow parliaments to create systems that underpin the legislative, representative and oversight work of parliaments. This session looks at recent innovations in the field of legislative document management, including developments on open standards, and both XML- and non-XML based systems.
Objeto de conferencia
III Simposio Internacional de Bibliotecas Digitales (San Pablo, Brasil)
El proceso de reconocimiento de la escritura manuscrita forma parte de las iniciativas que propenden a la preservación de patrimonio cultural resguardado en Bibliotecas y archivos donde existe una gran riqueza de documentos y hasta fichas manuscritas que acompañan libros incunables. Este trabajo es el punto de partida de un proyecto de investigación y desarrollo orientado a la digitalización y reconocimiento de material manuscrito y la ponencia que aquí se presenta discute diferentes algoritmos utilizados en una primera etapa dedicada a "limpiar" la imagen de ruido para mejorarla antes de comenzar el reconocimiento de caracteres. Dado que PrEBi-SeDiCI forman parte integrante de redes de bibliotecas que intercambian documentos digitalizados vía scanning, el presente desarrollo ha tenido una utilización adicional relacionada al mejoramiento de las imágenes de documentos de intercambio que presentaban problemas comunes en la digitalización: bordes, impurezas, descentrado, etc.., si bien no es esta la finalidad de esta investigación no por ello resulta una utilidad menor en el marco de intercambios de consorcios de bibliotecas. Para que el proceso de digitalización y reconocimiento de textos manuscritos sea eficiente debe estar precedido de una etapa de "preprocesamiento" de la imagen a tratar que incluye umbralización, limpieza de ruido, adelgazamiento, enderezamiento de la línea base y segmentación de la imagen entre otros. Cada uno de estos pasos permitirá reducir la variabilidad nociva al momento de reconocer los textos manuscritos (ruido, niveles aleatorios de grises, inclinación de caracteres, zonas con más y menos tinta), aumentando así la probabilidad de reconocer adecuadamente los textos. En este trabajo se consideran dos métodos de adelgazamiento de imágenes, se realiza la implementación y finalmente se lleva adelante una evaluación obteniendo conclusiones relativas a la eficiencia, velocidad y requerimientos, así como también ideas para futuras implementaciones. En la primera parte del documento, se presentan algunas definiciones relacionadas con los métodos utilizados, luego se muestran los resultados obtenidos sobre un mismo conjunto de imágenes aplicando las teorías propuestas y finalmente, se exponen algunas ideas para optimizar los algoritmos elegidos.; The handwritten manusctipt recognizing process belongs to the iniciatives which lean to cultural patrimony preservation shielded in Libraries and files where there exists a big wealth in documents and even handritten cards that accompany incunable books. This work is point to begin with a research and development proyect oriented to digitalization and recognition of manuscipt materials and the paper presented here discuss diferent algorithms used in the first stage ded
Ver registro completo en: http://sedici.unlp.edu.ar/handle/10915/5534
Esta presentacion nos muestra el flujo de un cad de administracion documental, desde el momento en que ingresa una camunicacion el flujo administrativo hasta su disposicion final el cual es la conservacion de este
Normas técnicas de Interoperabilidad e instrumentos para el documento electró...Miguel A. Amutio
TRIA Nº 19. 2015. I.S.S.N. 1134-1602 - Pags. 153-183
Revista Archivística de la Asociación de Archiveros de Andalucía
Tras un esfuerzo considerable de las administraciones públicas, a la vez colectivo y multidisciplinar, nos hemos dotado de una serie de normas técnicas relativas al documento electrónico que, en respuesta a las previsiones del marco legal de rango superior, y teniendo presentes los referentes de normalización y buenas prácticas, desarrollan
detalles concretos en cuanto a la política de gestión de documentos electrónicos, los metadatos, el documento electrónico, el expediente electrónico, la digitalización
de documentos, el copiado auténtico y la conversión de documentos (más otros asuntos cercanos como el catálogo de estándares o la política de firma electrónica).
Todas estas normas se han acompañado de las correspondientes guías de aplicación, junto con otra documentación complementaria en relación con la política
de gestión de documentos electrónicos, el esquema de metadatos de gestión del documento electrónico y los esquemas XML para el intercambio de documentos y
expedientes.
También se avanza en la provisión de servicios y herramientas informáticas para la gestión de documentos electrónicos.
Transformación digital, sí o sí; documento, expediente y archivo electrónicoMiguel A. Amutio
El Consultor de los Ayuntamientos nº 5/2017, de 15 de marzo, Nº 5, 15 de mar. de 2017, Editorial Wolters Kluwer
Resumen: La transformación digital de la Administración es ineludible. Las leyes 39/2015 y 40/2015 asientan el hecho del medio electrónico como habitual en el funcionamiento de la misma. La realización de las previsiones de ambas leyes relativas a documento, expediente y archivo electrónico es un reto considerable que requiere de un esfuerzo proporcional a su importancia, global y multidisciplinar, así como de acciones, apuntadas en este artículo, que faciliten la tarea de las entidades de la Administración
Proceso de digitalización de textos e imágenes ypaolarg
La digitalización es el proceso de convertir información analógica en formato digital. Los materiales que se convierten pueden adoptar varias formas: cartas, manuscritos, libros, fotografías, mapas, grabaciones sonoras, películas, efemérides, objetos tridimensionales, etc. Nosotros nos centraremos en textos e imágenes tangibles
Técnicas avanzadas para resolver tus problemas de sql server - SolidQ Summit ...SolidQ
A través de ejemplos reales, podrás conocer técnicas avanzadas de resolución de problemas, descubre nuevas ideas y aproximaciones que te ayudarán a la efectividad a la hora de resolver futuros problemas.
Charla introductoria a las metodologías ágiles, específicamente al mundo de las Historias de Usuario como herramienta para recopilación de requerimientos y a SCRUM como marco de trabajo para el Desarrollo de Software
Gánale la partida a tu SQL Server, configuración ideal para que todo vaya bie...SolidQ
Aunque SQL Server funciona bastante bien "por defecto" realmente una buena configuración puede marcar la diferencia durante un pico de carga o comprometer la estabilidad del sistema. Aprendemos cómo configurar correctamente nuestra instancia SQL Server para mejorar el rendimiento y evitar inestabilidades en su funcionamiento.
Real-time con Azure Stream Analytics - SolidQ Summit 2017SolidQ
Realizaremos una introducción a los datos en tiempo real. Descripción E2E de la arquitectura de un sistema en tiempo real: desde el envío de eventos hasta su visualización en un dashboard de Power BI, deteniéndose especialmente en el servicio de Azure Stream Analytics.
Operational Analytics, ¿amigo o enemigo de los ETLs y DQ clásicos? - SolidQ S...SolidQ
Con operational analytics tenemos otra aproximación potente al análisis de datos y que nos permitirá maximizar el uso del hardware, reduciendo costes considerablemente altos...¿cuáles son las ventajas e inconvenientes de esta aproximación?
OLAP Query Log: Hay vida más allá de las agregaciones - SolidQ Summit 2017SolidQ
¿Sabías que el OLAP Query Log se puede usar para algo más que hacer las agregaciones de un modelo multidimensional? Te vamos a enseñar cómo interpretar lo que aparece en las tablas del OLAP query log, a activar el OLAP query log y a hacer una pequeña solución de DW + cubo con la que monitorizar qué utilizan nuestros usuarios del resto de los cubos.
Software online para realizar encuestas, estudios e investigaciones online en áreas como marketing, calidad, recursos humanos, comunicación, auditoria, comercial, entre otras.
EncuestaFacil.com es el software de encuestas online líder en Europa y Latinoamérica. Permite a los usuarios elaborar por sí mismos, de una forma rápida y sencilla, encuestas internas y externas que ayuden en la toma de decisiones. EncuestaFacil.com permite obtener información en tiempo récord y sin destinar apenas recursos.
EncuestaFacil.com no requiere ningún tipo de instalación y cualquier persona con acceso a Internet puede, en pocos minutos, lanzar un estudio completo.
Date de alta GRATIS en EncuestaFacil.com para crear encuestas complejas o sencillas, académicas o profesionales. Al final, no dejes de personalizarla con los colores y el diseño que te vengan mejor.
Software disponible en 7 idiomas y utilizado por más de 500.000 profesionales desde 103 países.
http://www.encuestafacil.com/
http://www.enquetefacil.com/
http://www.easygoingsurvey.com/
http://www.enquetefacile.com/
http://www.einfacheumfrage.de/
http://www.prostopros.ru/
http://www.sondaggiofacile.com/
Esta presentación muestra los resultados de la prueba de conceptos realizada sobre SQL Server 2014 Enterprise en una empresa del rubro Bancario.
En resumen, este documento evidencia un mejoramiento en el rendimiento de hasta 6 veces en las consultas adhoc en SQL, y un 30% de mayor eficiencia en las tasas de compresión de datos.
Esta PPT la expuse en un evento organizado por Microsoft en junio del año 2014, en el marco de las nuevas herramientas que Microsoft ha desarrollado para satisfacer las necesidades en el ámbito de BI
Similar a El proceso de digitalización de los documentos (20)
Páginas de biblioteca más inclusivas: interfaz y recursos que se ofrecen a tr...Diana Rodríguez
Clase impartida en la Cátedra Fuentes y Servicios de Información en la Escuela de Bibliotecología de la Universidad Nacional de Córdoba el día 10 de mayo de 2021
Ponencia presentada en el V Conversatorio “Repensar nuestros espacios, ampliar nuestra comunidad” en Espacio de Diálogo, Biblioteca Nacional del Perú, 29 de abril de 2020
Buenas prácticas de inclusión en los recursos digitalesDiana Rodríguez
Ponencia presentada en la Feria Internacional del Libro Jurídico del Poder Judicial de la Federación Edición Virtual. Evento Organizado por la Red de Bibliotecas del Poder Judicial de la Nación, Suprema Corte de Justicia, México, 25 de noviembre de 2020
Formaciones de usuario más inclusivas en tiempos de pandemiaDiana Rodríguez
Ponencia brindada a UDGVirtual, a través de la Licenciatura en Bibliotecología y Gestión del Conocimiento en colaboración con su Biblioteca en la Universidad de Guadalajara el día 18 de mayo de 2021
Redes sociales más inclusivas, Buenas prácticas para los mensajes en las rede...Diana Rodríguez
Ponencia presentada en el 4to. Coloquio “Discapacidad y Acceso a la Cultura”, Red de Museos para la Atención de las Personas con Discapacidad, México el12 de noviembre de 2020
Ponencia en I SEMINARIO SOBRE LA APLICABILIDAD DE LA INTELIGENCIA ARTIFICIAL EN LA EDUCACIÓN SUPERIOR UNIVERSITARIA. 3 de junio de 2024. Facultad de Estudios Sociales y Trabajo, Universidad de Málaga.
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...JAVIER SOLIS NOYOLA
El Mtro. JAVIER SOLIS NOYOLA crea y desarrolla el “ROMPECABEZAS DE ECUACIONES DE 1ER. GRADO OLIMPIADA DE PARÍS 2024”. Esta actividad de aprendizaje propone retos de cálculo algebraico mediante ecuaciones de 1er. grado, y viso-espacialidad, lo cual dará la oportunidad de formar un rompecabezas. La intención didáctica de esta actividad de aprendizaje es, promover los pensamientos lógicos (convergente) y creativo (divergente o lateral), mediante modelos mentales de: atención, memoria, imaginación, percepción (Geométrica y conceptual), perspicacia, inferencia, viso-espacialidad. Esta actividad de aprendizaje es de enfoques lúdico y transversal, ya que integra diversas áreas del conocimiento, entre ellas: matemático, artístico, lenguaje, historia, y las neurociencias.
2. DIANA RODRÍGUEZ
Capacitaciones y Servicios de información digital
Planificación y gestión
de Bibliotecas Digitales
Módulo 5
(Resumen)
2013-2014
www.dianarodriguezcursos.com
2
3. EL PROCESO DE DIGITALIZACIÓN
2013-2014
www.dianarodriguezcursos.com
3
4. Cuestiones previas
¿Por qué?
¿Para qué?
¿Qué
material?
¿Para
quién?
¿Con qué?
¿Cómo
será?
2013-2014
• Preservar los documentos impresos
• Hacer los documentos más accesibles
• Reutilizar los documentos
• Evaluar impresos candidatos
• Cantidad de páginas
• Audiencia real y potencial
• Recursos necesarios
• Presupuestos
• Proyecto único y a término
• Proyecto continuo
www.dianarodriguezcursos.com
4
5. ¿Qué digitalizar?
Particular
Evaluar si…
Hay demanda
Usuarios
Vale la pena
Fácil de escanear
Es pertinente
Con los objetivos
de la biblioteca
Está libre de
derechos de autor
2013-2014
www.dianarodriguezcursos.com
5
6. No vale la
pena digitalizar
2013-2014
• Obsoletos o desactualizados
• Con impresión de calidad pobre
• Difíciles de digitalizar
• No pertinente con los objetivos de la
colección
• Con protección de derechos de autor
• Material ”sensible”
• Ya está digitalizado y se puede compartir
o enlazar
www.dianarodriguezcursos.com
6
9. Recursos Humanos
Un gestor
2013-2014
• Coordinar el equipo y el flujo de trabajo
Bibliotecarios y documentalistas
• Escanear
• OCR
• Corrección de pruebas y diseño
• Asignación de metadatos
Personal administrativo
• Manejo del material impreso
• obtener los documentos
• limpiarlos y ordenarlos
• cortar las encuadernaciones y reencuadernarlos
• devolverlos a su sitio original.
www.dianarodriguezcursos.com
9
10. Costos y presupuestos
Equipo y software
Costos
• Escáner, software, computadores, mobiliario de
oficina
Adquisición de documentos
• Registro, categorización, costos de correo y
transporte, tiempo del personal
Documentos
• Cantidad de páginas (MUY IMPORTANTE)
2013-2014
www.dianarodriguezcursos.com
10
11. Escaneo
Costos
• Tiempo del personal
OCR, Corrección de pruebas y Diseño
• Tiempo del personal, insumos de oficina
Asignación de metadatos
• Tiempo del personal (depende del número de
documentos, la dificultad del tema y los salarios
de los especialistas)
2013-2014
www.dianarodriguezcursos.com
11
12. Costos
Capacitación del personal
Administración y gastos generales
• Administración, gastos generales, salarios
del personal y de especialistas
Contingencias. Imprevistos
2013-2014
www.dianarodriguezcursos.com
12
13. Cantidad de páginas
Determina
Costo Final
Costos de Equipamiento
• Tipo y Cantidad
2013-2014
Costos de Personal
• Tiempo y Salario
www.dianarodriguezcursos.com
13
15. PÁGINAS
TAREA
JORNADA
TIEMPO
APROX.
EQUIPAM.
BÁSICO
NIVEL DE
RRHH
5000
Escaneo
½ jornada
Un mes
Escáner con
alimentador de
hojas
Novatos
Intermedios
OCR, Corrección ½ jornada
de pruebas y
Diseño
Entre 8
meses y 33
meses
(depende
del nivel de
RRHH)
Varias
computadoras
adecuadas
Varias
grabadoras
DVD u otros
dispositivos
para almacenar
copias de
resguardo
2013-2014
www.dianarodriguezcursos.com
15
17. Etapas de la digitalización
Selección de
documentos
2013-2014
Registro de
documentos
Escaneado
www.dianarodriguezcursos.com
OCR y
Corrección
de pruebas y
Diseño
Producción
de la versión
final
17
19. Autor, título,
edición etc
Registro
Datos y metadatos
del documento
Responsable de
cada etapa
Fecha de cada
etapa
Datos del proceso
Lugar actual del
documento
Versiones
etc
2013-2014
www.dianarodriguezcursos.com
19
20. Guardar las versiones
separadas de cada
archivo en diferentes
subdirectorios
Mantener las versiones
anteriores de un archivo
hasta que se haya
terminado de digitalizar
el documento
TIPS
Hacer copias de
seguridad de todos los
documentos en cada
fase
2013-2014
Guardar las copias de
seguridad en
computadoras o
dispositivos diferentes.
www.dianarodriguezcursos.com
20
21. Escaneo
Limpiar los documentos
2013-2014
Acciones Previas
Verificar que todas las
páginas estén presentes y
en el orden correcto
Si el documento está
deteriorado, cambiar por
una copia si existe
www.dianarodriguezcursos.com
21
22. Si el
documento
contiene
texto y
gráfico
2013-2014
Escanear dos
veces
• una vez para
escanear el texto en
blanco y negro
• y la otra para
escanear las fotos
de color
Guardar texto
y gráfico
como
archivos
separados
www.dianarodriguezcursos.com
Se
reincorporarán
al documento
en la etapa
final
22
23. Guardar en este formato de
archivo
Profundidad de
color
Resolución
Para acceso
Para ver en
pantalla
Para impresión
Para
preservación y
utilización
Dibujo de
líneas en
blanco y
negro
Blanco y negro
o escala de
grises (16
grises)
72 ppp
300 ppp
Si las líneas
son muy finas,
600 ppp.
GIF o TIFF
GIF
Gráfico en
colores con
áreas del
mismo color
8 bit (256
72 ppp
colores) ó 24 bit
(16 millones de
colores)
300 ppp
Si las líneas
son muy finas,
600 ppp
GIF o TIFF
GIF
Fotografías
en blanco y
negro
8 bit gris (256
grises)
72 ppp
300 ppp
Para fotos de
alta calidad,
600 ppp.
GIF o TIFF
JPG o GIF
Fotografías a
color
24 bit (16
millones de
colores)
72 ppp
300 ppp
Para fotos de
alta calidad,
600 ppp
JPG o TIFF
JPG
Imágenes
Escanear y guardar con esta configuración
2013-2014
www.dianarodriguezcursos.com
23
24. TABLAS PROCEDIMIENTO
COMENTARIO
CASO 1
Trate la tabla como texto. Escanee
y haga OCR en ella. Después
corrija y verifique el diseño.
Esta tarea requiere tiempo y es
susceptible a errores, por lo que se
necesita una corrección de pruebas
cuidadosa.
CASO 2
Escanee las tablas y trátelas como
fotos en lugar de texto.
Este procedimiento es rápido, fácil y
libre de errores, pero toma mucho
espacio en el disco.
A veces es imposible mostrar las
tablas grandes en el monitor de la
computadora y la reducción de su
tamaño puede ocasionar que sea
difícil leer las figuras.
CASO 3
2013-2014
Vuelva a escribir las tablas en
lugar de escanear e intentar
hacerlas OCR.
www.dianarodriguezcursos.com
Esto lleva tiempo y puede
producir errores.
24
25. = Reconocimiento Óptico
de Caracteres
Unicode
Posible problema:
IDIOMA
OCR
convierte una imagen
escaneada en un archivo
de texto
Para que puede ser leído
y editada por un
procesador de textos
Diccionario adecuado en
su procesador de texto
Reescribir el texto
Escanear como imagen
De texto para producir
PDF
Formato adecuado
Después de escanear,
guarde
HTML para producir HTML
Nombre que ya tenía
2013-2014
www.dianarodriguezcursos.com
25
26. Texto
Tablas
Diseño
Gráficos
Editar en procesador
de texto
Imágenes
Corrección de pruebas
Verificar y corregir
Documento destinado
a ser PDF
Guardar como PDF
Editar en el
procesador de textos
Documento destinado
a ser HTML
Guardar como texto
sin formato
Abrir con editor web
Guardar con HTML
2013-2014
www.dianarodriguezcursos.com
26
29. DIANA RODRÍGUEZ
Capacitaciones y Servicios de información digital
Hasta el próximo módulo….
Diana Rodríguez
www.dianarodriguezcursos.com
2013-2014
www.dianarodriguezcursos.com
29