Presentation introducing OCR NCSR Image enhancement toolkit in relation to IMPACT project presented by Isabel Bordes during demo session held at the BNE 5th of October 2011.
Este documento presenta el diseño de un microsistema basado en FPGA para medir el área de una lámina de cuero. Describe los fundamentos del procesamiento digital de imágenes, incluyendo la captura, corrección, mejoramiento y segmentación de imágenes. Además, detalla la iluminación, calibración y simulación de los algoritmos usados, así como la implementación hardware de estos mediante arquitecturas basadas en FPGA. El objetivo final es desarrollar un sistema embebido en tiempo real capaz de medir automáticamente el á
BIT has developed an adaptive OCR solution called BIT-Alpha that can adapt to all types of text regardless of language, font, or age. BIT-Alpha contains the full workflow including binarization, segmentation, OCR recognition, post-OCR correction with spellchecking, picture processing and export. It can automatically learn characters during processing and has advanced technology for reconstructing damaged letters and extending abbreviations. BIT-Alpha also allows exporting results in formats like text, PDF, ALTO and TEI.
Presentation of the paper Wittgenstein’s Nachlass: WiTTFind and Wittgenstein Advanced Search Tools (WAST) by Maximilian Hadersbeck, Alois Pichler, Florian Fink and Øyvind Liland Gjesdal in DATeCH 2014. #digidays
The document discusses digitization efforts at the British Library and other national libraries in Europe. It notes that while digitization projects have created valuable digital resources, the vast majority of collections still need to be digitized. Ongoing improvements in technology could eventually make it feasible to digitize entire library holdings and make the world's knowledge universally accessible.
BIT has developed an adaptive OCR solution called BIT-Alpha that can adapt to all types of text regardless of language, font, or age. BIT-Alpha contains the full workflow including binarization, segmentation, OCR recognition, post-OCR correction with spellchecking, picture processing and export. It can automatically learn characters during processing and has advanced technology for reconstructing damaged letters and extending abbreviations. BIT-Alpha also allows exporting results in formats like text, PDF, ALTO and TEI.
Digitization Projects for Small Archives and MuseumsAnna Naruta-Moya
Training at New Mexico State Archives hosted by the New Mexico Historical Records Advisory Board. Request was for training in conducting digitization projects, with attention to the guidelines of the NM State Records Center and Archives and the guidelines of the Federal Agencies Digitization Guidelines Initiative, Still Images Working Group (FADGI guidelines).
Este documento presenta el diseño de un microsistema basado en FPGA para medir el área de una lámina de cuero. Describe los fundamentos del procesamiento digital de imágenes, incluyendo la captura, corrección, mejoramiento y segmentación de imágenes. Además, detalla la iluminación, calibración y simulación de los algoritmos usados, así como la implementación hardware de estos mediante arquitecturas basadas en FPGA. El objetivo final es desarrollar un sistema embebido en tiempo real capaz de medir automáticamente el á
BIT has developed an adaptive OCR solution called BIT-Alpha that can adapt to all types of text regardless of language, font, or age. BIT-Alpha contains the full workflow including binarization, segmentation, OCR recognition, post-OCR correction with spellchecking, picture processing and export. It can automatically learn characters during processing and has advanced technology for reconstructing damaged letters and extending abbreviations. BIT-Alpha also allows exporting results in formats like text, PDF, ALTO and TEI.
Presentation of the paper Wittgenstein’s Nachlass: WiTTFind and Wittgenstein Advanced Search Tools (WAST) by Maximilian Hadersbeck, Alois Pichler, Florian Fink and Øyvind Liland Gjesdal in DATeCH 2014. #digidays
The document discusses digitization efforts at the British Library and other national libraries in Europe. It notes that while digitization projects have created valuable digital resources, the vast majority of collections still need to be digitized. Ongoing improvements in technology could eventually make it feasible to digitize entire library holdings and make the world's knowledge universally accessible.
BIT has developed an adaptive OCR solution called BIT-Alpha that can adapt to all types of text regardless of language, font, or age. BIT-Alpha contains the full workflow including binarization, segmentation, OCR recognition, post-OCR correction with spellchecking, picture processing and export. It can automatically learn characters during processing and has advanced technology for reconstructing damaged letters and extending abbreviations. BIT-Alpha also allows exporting results in formats like text, PDF, ALTO and TEI.
Digitization Projects for Small Archives and MuseumsAnna Naruta-Moya
Training at New Mexico State Archives hosted by the New Mexico Historical Records Advisory Board. Request was for training in conducting digitization projects, with attention to the guidelines of the NM State Records Center and Archives and the guidelines of the Federal Agencies Digitization Guidelines Initiative, Still Images Working Group (FADGI guidelines).
Haciendo visible lo invisible: imágenes en la plataforma ArcGISEsri España
ArcGIS proporciona una plataforma completa para la visualización, gestión, producción, análisis y difusión de imágenes a todas las escalas. Es una plataforma escalable para crear productos con valor añadido integrados en el Sistema de Información Geográfica más completo.
En este workshop mostraremos una visión general de las capacidades de ArcGIS para el tratamiento de imágenes. Haremos un recorrido por las nuevas funcionalidades de ArcGIS Pro para el análisis de imágenes, los recursos disponibles más actualizados y el manejo de las aplicaciones más potentes para poner en práctica la producción, el análisis y la difusión de este tipo de información geoespacial
Este documento presenta una variedad de cursos de computación con diferentes niveles de dificultad, como HTML básico, PHP avanzado, diseño gráfico, bases de datos y redes. Los cursos varían en duración de 8 a 64 horas y cuestan entre 300 y 600 bolívares. También proporciona información de contacto para la inscripción.
Este documento presenta el laboratorio introductorio al software MATLAB. Explica que MATLAB es un entorno de desarrollo para el cálculo numérico y la visualización de datos, con características como lenguaje de programación, gráficos, cajas de herramientas y línea de comandos. Describe las principales interfaces de usuario como la ventana de comandos, historial de comandos, explorador de espacio de trabajo y depurador. Finalmente, presenta algunos ejercicios básicos para familiarizarse con conceptos como variables, funciones, grá
Este documento analiza diferentes servidores webmapping comerciales y no comerciales para implementar un sistema de información geográfica prototipo para el Cuerpo de Bomberos de Riobamba. Los objetivos incluyen investigar y comparar servidores de mapas como MapObjects, ArcIMS, MonoGIS y MapServer, y diseñar bases de datos espaciales para extraer datos para el prototipo. El documento concluye recomendando ampliar la georreferenciación del mapa a la publicación web y capacitar a las instituciones sobre la importancia de los sistemas de información geogr
SISTEMA DE VISION ARTIFICIALPresentación2007faustino830
Este documento describe el diseño e implementación de un sistema de visión artificial para verificar las especificaciones de calidad en herrajes de acero inoxidable en la empresa Tempro S.A. El proyecto será desarrollado por dos estudiantes de ingeniería electrónica y telecomunicaciones de la Universidad Autónoma del Caribe. El sistema permitirá inspeccionar las piezas de manera automática para detectar imperfecciones en el acabado, alineación y dimensión con el fin de mejorar el control de calidad.
Este documento presenta los conceptos básicos de diseño web. Explica elementos de arquitectura de información como sistemas de navegación, búsqueda, etiquetado y organización. También cubre conceptos técnicos como modelos de color, resoluciones de pantalla, formatos de imágenes y la separación de contenido y diseño con XHTML y CSS. Finalmente, propone un ejercicio práctico sobre la estructuración de información sobre dinosaurios antes de aplicar cualquier diseño visual.
El documento define un escáner como un dispositivo que digitaliza imágenes y texto de documentos físicos. Explica que un escáner consta de una cama de cristal, lámpara, CCD y otros componentes que permiten convertir la imagen en una representación digital de píxeles con valores de color binarios. Finalmente, describe algunos tipos comunes de escáner como escáner de mano, de libros y portátiles, así como características como la resolución y profundidad.
El documento describe cómo funcionan los escáneres y las cámaras digitales. Explica que los escáneres capturan imágenes y texto para procesarlos y almacenarlos en archivos digitales, y menciona varios tipos como planos, de hoja y de tambor. También explica que las cámaras capturan imágenes a través de una lente y un sensor, y lista tipos como de caja, réflex y cuadradas. Finalmente, enumera algunos tipos de adaptadores de video como VGA, SVGA, AGP y PCI Express.
Este documento describe un método propuesto para indexar automáticamente documentos técnicos como solicitudes de patentes mediante el uso de herramientas de reconocimiento óptico de caracteres (OCR). Actualmente, la indexación se realiza manualmente, lo que es costoso y propenso a errores. El método propuesto utilizaría OCR para convertir imágenes escaneadas en texto, que luego se indexaría automáticamente detectando palabras clave en secciones estructuradas como las reivindicaciones. Esto podría reducir costos en la digitalización de archivos, aunque
Este documento presenta una introducción al procesamiento de imágenes. Explica que la visión artificial intenta programar computadoras para entender escenas y características de imágenes digitales. También describe las aplicaciones de la visión artificial, los desafíos que enfrenta y los componentes clave de un sistema de visión artificial como la digitalización, procesamiento de imágenes y reconocimiento de objetos.
Cartel del alcances y contenidos de la especialidad de informaticajavier_cruz_cahuana
El documento presenta el plan de estudios de la especialidad de Informática, organizado en 5 trimestres. Incluye asignaturas sobre hardware, software, sistemas operativos, office, diseño gráfico, programación, bases de datos, emprendimiento y gestión empresarial. El objetivo es formar técnicos con habilidades en computación, diseño, programación y administración, para su inserción laboral o creación de mypes.
Cartel del alcances y contenidos de la especialidad de informaticajavier_cruz_cahuana
Este documento presenta el plan de estudios de la especialidad de informática. Incluye los principales temas organizados en 5 trimestres como computación, Microsoft Office, Corel Draw, programación, hardware y redes. El plan cubre temas técnicos de programación, diseño gráfico, bases de datos y herramientas de software, además de contenidos sobre identidad cultural, estrategias de aprendizaje y medidas de seguridad y prevención.
Este documento describe los diferentes tipos de escáneres, incluyendo escáneres de sobremesa, de mano, de rodillo y para transparencias. Explica que los escáneres digitalizan imágenes y texto convirtiéndolos a código binario para ser procesados por una computadora. También menciona que el software OCR ayuda a reconocer los caracteres escaneados y convertirlos a texto editable.
Este documento describe los dispositivos de hardware y software utilizados en computación gráfica. Explica los dispositivos de vectores y de raster para la generación de imágenes, así como las tarjetas de video y monitores. También cubre conceptos de software como modelado, NURBS, renderizado y paquetes populares de modelado 3D y animación.
Este documento describe herramientas y programas útiles para un equipo de diseño, incluyendo aplicaciones de escritorio y web como Skitch y Eclipse, así como programas 3D como Blender. También incluye tutoriales y recursos sobre Flash, CSS, JavaScript, Illustrator y Photoshop.
Este documento presenta información sobre diferentes herramientas digitales como editores de video, editores de imágenes, mapas digitales y buscadores jerárquicos. Incluye definiciones, descripciones y capturas de pantalla de cada herramienta.
La deformación incremental de chapa es un proceso automatizado para fabricar prototipos y series cortas de piezas de chapa sin necesidad de utillajes caros. Se basa en deformar el metal aplicando presión localizada con una herramienta esférica móvil guiada por un sistema CAD/CAM. Esto permite fabricar piezas directamente a partir de diseños 3D para aplicaciones en sectores como aeronáutica, automoción y metalmecánica.
Este documento describe los diferentes tipos de buscadores que existen en Internet. Menciona que los buscadores jerárquicos como Google recorren las páginas web indexando su contenido y ofrecen resultados ordenados por relevancia, mientras que los buscadores directos como directorios clasifican los sitios web en categorías revisadas por humanos. También señala que los buscadores jerárquicos requieren más recursos que los directos.
Slides of the paper Deep Learning-Based Morphological Taggers and Lemmatizers for Annotating Historical Texts by Helmut Schmid at the 3rd Edition of the DATeCH2019 International Conference
This document discusses using text models to improve the accuracy of optical character recognition (OCR) on Chinese rare books. It conducted experiments using n-gram, backward/forward n-gram, and LSTM models on OCR data from ancient medicine books. The backward and forward 4-gram model achieved the highest correction rate at 97.57%. Mixing the LSTM 6-gram model with the OCR's top 5 candidates and probability of the top candidate further improved accuracy to 97.71%, demonstrating that combining text models with OCR probabilities can better correct OCR errors than text models alone. In conclusion, text models are effective for increasing OCR accuracy on rare books, with backward/forward 4-gram and LSTM 6-gram
Slides of the paper Turning Digitised Material into a Diachronic Corpus: Metadata Challenges in the Nederlab Project by Katrien Depuydt and Hennie Brugman at the 3rd Edition of the DATeCH2019 International Conference
Más contenido relacionado
Similar a Bloque1 image enhancement_toolkit_051011
Haciendo visible lo invisible: imágenes en la plataforma ArcGISEsri España
ArcGIS proporciona una plataforma completa para la visualización, gestión, producción, análisis y difusión de imágenes a todas las escalas. Es una plataforma escalable para crear productos con valor añadido integrados en el Sistema de Información Geográfica más completo.
En este workshop mostraremos una visión general de las capacidades de ArcGIS para el tratamiento de imágenes. Haremos un recorrido por las nuevas funcionalidades de ArcGIS Pro para el análisis de imágenes, los recursos disponibles más actualizados y el manejo de las aplicaciones más potentes para poner en práctica la producción, el análisis y la difusión de este tipo de información geoespacial
Este documento presenta una variedad de cursos de computación con diferentes niveles de dificultad, como HTML básico, PHP avanzado, diseño gráfico, bases de datos y redes. Los cursos varían en duración de 8 a 64 horas y cuestan entre 300 y 600 bolívares. También proporciona información de contacto para la inscripción.
Este documento presenta el laboratorio introductorio al software MATLAB. Explica que MATLAB es un entorno de desarrollo para el cálculo numérico y la visualización de datos, con características como lenguaje de programación, gráficos, cajas de herramientas y línea de comandos. Describe las principales interfaces de usuario como la ventana de comandos, historial de comandos, explorador de espacio de trabajo y depurador. Finalmente, presenta algunos ejercicios básicos para familiarizarse con conceptos como variables, funciones, grá
Este documento analiza diferentes servidores webmapping comerciales y no comerciales para implementar un sistema de información geográfica prototipo para el Cuerpo de Bomberos de Riobamba. Los objetivos incluyen investigar y comparar servidores de mapas como MapObjects, ArcIMS, MonoGIS y MapServer, y diseñar bases de datos espaciales para extraer datos para el prototipo. El documento concluye recomendando ampliar la georreferenciación del mapa a la publicación web y capacitar a las instituciones sobre la importancia de los sistemas de información geogr
SISTEMA DE VISION ARTIFICIALPresentación2007faustino830
Este documento describe el diseño e implementación de un sistema de visión artificial para verificar las especificaciones de calidad en herrajes de acero inoxidable en la empresa Tempro S.A. El proyecto será desarrollado por dos estudiantes de ingeniería electrónica y telecomunicaciones de la Universidad Autónoma del Caribe. El sistema permitirá inspeccionar las piezas de manera automática para detectar imperfecciones en el acabado, alineación y dimensión con el fin de mejorar el control de calidad.
Este documento presenta los conceptos básicos de diseño web. Explica elementos de arquitectura de información como sistemas de navegación, búsqueda, etiquetado y organización. También cubre conceptos técnicos como modelos de color, resoluciones de pantalla, formatos de imágenes y la separación de contenido y diseño con XHTML y CSS. Finalmente, propone un ejercicio práctico sobre la estructuración de información sobre dinosaurios antes de aplicar cualquier diseño visual.
El documento define un escáner como un dispositivo que digitaliza imágenes y texto de documentos físicos. Explica que un escáner consta de una cama de cristal, lámpara, CCD y otros componentes que permiten convertir la imagen en una representación digital de píxeles con valores de color binarios. Finalmente, describe algunos tipos comunes de escáner como escáner de mano, de libros y portátiles, así como características como la resolución y profundidad.
El documento describe cómo funcionan los escáneres y las cámaras digitales. Explica que los escáneres capturan imágenes y texto para procesarlos y almacenarlos en archivos digitales, y menciona varios tipos como planos, de hoja y de tambor. También explica que las cámaras capturan imágenes a través de una lente y un sensor, y lista tipos como de caja, réflex y cuadradas. Finalmente, enumera algunos tipos de adaptadores de video como VGA, SVGA, AGP y PCI Express.
Este documento describe un método propuesto para indexar automáticamente documentos técnicos como solicitudes de patentes mediante el uso de herramientas de reconocimiento óptico de caracteres (OCR). Actualmente, la indexación se realiza manualmente, lo que es costoso y propenso a errores. El método propuesto utilizaría OCR para convertir imágenes escaneadas en texto, que luego se indexaría automáticamente detectando palabras clave en secciones estructuradas como las reivindicaciones. Esto podría reducir costos en la digitalización de archivos, aunque
Este documento presenta una introducción al procesamiento de imágenes. Explica que la visión artificial intenta programar computadoras para entender escenas y características de imágenes digitales. También describe las aplicaciones de la visión artificial, los desafíos que enfrenta y los componentes clave de un sistema de visión artificial como la digitalización, procesamiento de imágenes y reconocimiento de objetos.
Cartel del alcances y contenidos de la especialidad de informaticajavier_cruz_cahuana
El documento presenta el plan de estudios de la especialidad de Informática, organizado en 5 trimestres. Incluye asignaturas sobre hardware, software, sistemas operativos, office, diseño gráfico, programación, bases de datos, emprendimiento y gestión empresarial. El objetivo es formar técnicos con habilidades en computación, diseño, programación y administración, para su inserción laboral o creación de mypes.
Cartel del alcances y contenidos de la especialidad de informaticajavier_cruz_cahuana
Este documento presenta el plan de estudios de la especialidad de informática. Incluye los principales temas organizados en 5 trimestres como computación, Microsoft Office, Corel Draw, programación, hardware y redes. El plan cubre temas técnicos de programación, diseño gráfico, bases de datos y herramientas de software, además de contenidos sobre identidad cultural, estrategias de aprendizaje y medidas de seguridad y prevención.
Este documento describe los diferentes tipos de escáneres, incluyendo escáneres de sobremesa, de mano, de rodillo y para transparencias. Explica que los escáneres digitalizan imágenes y texto convirtiéndolos a código binario para ser procesados por una computadora. También menciona que el software OCR ayuda a reconocer los caracteres escaneados y convertirlos a texto editable.
Este documento describe los dispositivos de hardware y software utilizados en computación gráfica. Explica los dispositivos de vectores y de raster para la generación de imágenes, así como las tarjetas de video y monitores. También cubre conceptos de software como modelado, NURBS, renderizado y paquetes populares de modelado 3D y animación.
Este documento describe herramientas y programas útiles para un equipo de diseño, incluyendo aplicaciones de escritorio y web como Skitch y Eclipse, así como programas 3D como Blender. También incluye tutoriales y recursos sobre Flash, CSS, JavaScript, Illustrator y Photoshop.
Este documento presenta información sobre diferentes herramientas digitales como editores de video, editores de imágenes, mapas digitales y buscadores jerárquicos. Incluye definiciones, descripciones y capturas de pantalla de cada herramienta.
La deformación incremental de chapa es un proceso automatizado para fabricar prototipos y series cortas de piezas de chapa sin necesidad de utillajes caros. Se basa en deformar el metal aplicando presión localizada con una herramienta esférica móvil guiada por un sistema CAD/CAM. Esto permite fabricar piezas directamente a partir de diseños 3D para aplicaciones en sectores como aeronáutica, automoción y metalmecánica.
Este documento describe los diferentes tipos de buscadores que existen en Internet. Menciona que los buscadores jerárquicos como Google recorren las páginas web indexando su contenido y ofrecen resultados ordenados por relevancia, mientras que los buscadores directos como directorios clasifican los sitios web en categorías revisadas por humanos. También señala que los buscadores jerárquicos requieren más recursos que los directos.
Similar a Bloque1 image enhancement_toolkit_051011 (19)
Slides of the paper Deep Learning-Based Morphological Taggers and Lemmatizers for Annotating Historical Texts by Helmut Schmid at the 3rd Edition of the DATeCH2019 International Conference
This document discusses using text models to improve the accuracy of optical character recognition (OCR) on Chinese rare books. It conducted experiments using n-gram, backward/forward n-gram, and LSTM models on OCR data from ancient medicine books. The backward and forward 4-gram model achieved the highest correction rate at 97.57%. Mixing the LSTM 6-gram model with the OCR's top 5 candidates and probability of the top candidate further improved accuracy to 97.71%, demonstrating that combining text models with OCR probabilities can better correct OCR errors than text models alone. In conclusion, text models are effective for increasing OCR accuracy on rare books, with backward/forward 4-gram and LSTM 6-gram
Slides of the paper Turning Digitised Material into a Diachronic Corpus: Metadata Challenges in the Nederlab Project by Katrien Depuydt and Hennie Brugman at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Standoff Annotation for the Ancient Greek and Latin Dependency Treebank by Giuseppe Celano at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Using lexicography to characterise relations between species mentions in the biodiversity literature by Sandra Young at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Implementation of a Databaseless Web REST API for the Unstructured Texts of Migne's Patrologia Graeca with Searching capabilities and additional Semantic and Syntactic expandability by Evagelos Varthis, Marios Poulos, Ilias Yarenis and Sozon Papavlasopoulos at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Curation Technologies for a Cultural Heritage Archive: Analysing and transforming a heterogeneous data set into an interactive curation workbench by Georg Rehm, Martin Lee, Julián Moreno Schneider and Peter Bourgonje at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Cross-disciplinary collaborations to enrich access to non-Western language material in the Cultural Heritage sector by Tom Derrick and Nora McGregor at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Tribunal Archives as Digital Research Facility (TRIADO): new ways to make archives accessible and useable by Anne Gorter, Edwin Klijn, Rutger Van Koert, Marielle Scherer and Ismee Tames at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Improving OCR of historical newspapers and journals published in Finland by Senka Drobac, Pekka Kauppinen and Krister Lindén at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards a generic unsupervised method for transcription of encoded manuscripts by Arnau Baró, Jialuo Chen, Alicia Fornés and Beáta Megyesi at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards the Extraction of Statistical Information from Digitised Numerical Tables - The Medical Officer of Health Reports Scoping Study by Christian Clausner, Apostolos Antonacopoulos, Christy Henshaw and Justin Hayes at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Detecting Articles in a Digitized Finnish Historical Newspaper Collection 1771–1929: Early Results Using the PIVAJ Software by Kimmo Kettunen, Teemu Ruokolainen, Erno Liukkonen, Pierrick Tranouez, Daniel Antelme and Thierry Paquet at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper OCR-D: An end-to-end open-source OCR framework for historical documents by Clemens Neudecker, Konstantin Baierer, Maria Federbusch, Kay-Michael Würzner, Matthias Boenig, Elisa Hermann and Volker Hartmann at the 3rd Edition of the DATeCH2019 International Conference
- The document describes a project to fill gaps in knowledge about diamond mining, trading, and polishing in Borneo by developing a workflow using various CLARIAH tools and resources.
- The workflow involved digitizing a diamond encyclopedia, extracting concepts and place names, linking the data to external sources to create linked open data, and querying newspaper archives to build a corpus of relevant articles.
- Promising results showed mining, trading, and polishing continued in Borneo for Southeast Asian customers, and described previously unknown diamond fields and polishing locations in Borneo. The project aims to apply the workflow to other commodities like sugar.
Slides of the paper Automatic Reconstruction of Emperor Itineraries from the Regesta Imperii by Juri Opitz, Leo Born, Vivi Nastase and Yannick Pultar at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Automatic Semantic Text Tagging on Historical Lexica by Combining OCR and Typography Classification by Christian Reul, Sebastian Göttel, Uwe Springmann, Christoph Wick, Kay-Michael Würzner and Frank Puppe at the 3rd Edition of the DATeCH2019 International Conference
This document describes the SOS system for segmenting, stemming, and standardizing Arabic text. It presents the challenges of processing Arabic cultural heritage texts which contain orthographic variations. The system uses gradient boosting machines and achieves state-of-the-art performance on segmentation and derives stemming as a byproduct. It also standardizes orthography with high accuracy, which further improves segmentation. The system addresses issues like hamza forms and letter confusions that previous systems did not handle well.
26. Componentes para el procesamiento de imágenes Binarización NCSR: Basado en "B. Gatos, I. Pratikakis and S. J. Perantonis, Adaptive Degraded Document Image Binarization, Pattern Recognition, Vol. 39, pp. 317-327, 2006" FR8.1: FineReader Engine v. 8.1. IMPORTANTE: (a) Motor previamente instalado. (b) Añadir código de licencia de FineReader
27. Componentes para el procesamiento de imágenes Eliminación de bordes Auto: Basado en perfiles de proyección y análisis de componentes. Auto_Edit: Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador.
28. 22.383 imágenes de prueba BL: 7% BNE: 34% BNF: 34% BSB: 11% JSI: 6% NLB: 2% ONB: 6% Sólo imágenes con bordes 38.718 imágenes de prueba BL: 9% BNE: 29% BNF: 32% BSB: 12% JSI: 11% NLB: 2% ONB: 5% Componentes para el procesamiento de imágenes Eliminación de bordes
29. Auto: Basado en "N. Stamatopoulos, B. Gatos, T. Georgiou, Page frame detection for double page document images, 9th IAPR International Workshop on Document Analysis Systems (DAS 2010), pp. 401-408, Cambridge, MA, USA, June 2010" Auto_Edit: Ajuste manual mediante el arrastre de puntos activos de un rectángulo delimitador. Componentes para el procesamiento de imágenes Individualización de páginas
30. 458 imágenes de la BNF Componentes para el procesamiento de imágenes Individualización de páginas 3.009 imágenes BL: 72% BSB: 10% JSI: 18%
31. Auto: Basado en "N. Stamatopoulos, B. Gatos, I. Pratikakis and S.J. Perantonis, Goal-oriented Rectification of Camera-Based Document Images, IEEE Transactions on Image Processing, vol. 20, no. 4, pp. 910-920, 2011." IMPORTANT NOTICES: (a) It needs the MATLAB Component Runtime Installer, (b) it can be applied only to single column documents. Auto_Edit: Corrección manual de líneas/curvas que delimitan el texto arrastrando los puntos activos de un rectángulo delimitador Componentes para el procesamiento de imágenes Corrección de curvatura
32. 87,78% Corrección curvatura IMPACT v.4 (81,98% sólo corrección en bruto) BookRestorer 80,87% Componentes para el procesamiento de imágenes Corrección de curvatura
33. GRACIAS POR SU ATENCIÓN Isabel Bordes Cabrera Jefe de Servicio de Biblioteca Digital, BNE [email_address]
Notas del editor
B. Gatos Computational Intelligence Laboratory Institute of Informatics and Telecommunications National Center for Scientific Research ( NCSR ) "Demokritos" GR-153 10 Agia Paraskevi, Athens, Greece