Taller en el XVIII Congreso de la Sociedad Española de Didáctica de la Lengua y la Literatura.
Universidad de Castilla-La Mancha, Facultad de Educación, Ciudad Real.
Bases de Datos y Web
Herramientas y tecnologías de desarrollo para la Web
Datos Semiestructurados
XML (eXtensive Markup Language)
RDF (Resource Description Framework)
Ontologías y OWL (Ontology Web Language)
La Web Semántica
Mashups
Constelaciones literarias y Pechakucha para el desarrollo de la literacidad d...Pep Hernández
Ponencia dentro del 6º Foro Iberoamericano sobre Literacidad y Aprendizaje, AELE. Universidad Complutense de Madrid, 5 de julio de 2017.
http://aelemadrid2017.com/es/foro-iberoamericano/
Taller en el XVIII Congreso de la Sociedad Española de Didáctica de la Lengua y la Literatura.
Universidad de Castilla-La Mancha, Facultad de Educación, Ciudad Real.
Bases de Datos y Web
Herramientas y tecnologías de desarrollo para la Web
Datos Semiestructurados
XML (eXtensive Markup Language)
RDF (Resource Description Framework)
Ontologías y OWL (Ontology Web Language)
La Web Semántica
Mashups
Constelaciones literarias y Pechakucha para el desarrollo de la literacidad d...Pep Hernández
Ponencia dentro del 6º Foro Iberoamericano sobre Literacidad y Aprendizaje, AELE. Universidad Complutense de Madrid, 5 de julio de 2017.
http://aelemadrid2017.com/es/foro-iberoamericano/
Material de apoyo utilizado en la conferencia "La industria del lenguaje" dentro de la Semana de la Facultad de Ciencias Sociales y Humanas de la Universidad de Deusto en enero de 2010
'Para qué sirve un traductor - Traducción de productos culturales' - Curso de...miguelmarques78
La traducción de productos culturales y el papel del traductor en un producto cultural, explicado a directores de proyectos culturales (exposiciones, videoarte, espectáculos escénicos...).
Slides of the paper Deep Learning-Based Morphological Taggers and Lemmatizers for Annotating Historical Texts by Helmut Schmid at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards a Higher Accuracy of Optical Character Recognition of Chinese Rare Books in Making Use of Text Model by Hsiang-An Wang and Pin-Ting Liu at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Turning Digitised Material into a Diachronic Corpus: Metadata Challenges in the Nederlab Project by Katrien Depuydt and Hennie Brugman at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Standoff Annotation for the Ancient Greek and Latin Dependency Treebank by Giuseppe Celano at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Using lexicography to characterise relations between species mentions in the biodiversity literature by Sandra Young at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Implementation of a Databaseless Web REST API for the Unstructured Texts of Migne's Patrologia Graeca with Searching capabilities and additional Semantic and Syntactic expandability by Evagelos Varthis, Marios Poulos, Ilias Yarenis and Sozon Papavlasopoulos at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Curation Technologies for a Cultural Heritage Archive: Analysing and transforming a heterogeneous data set into an interactive curation workbench by Georg Rehm, Martin Lee, Julián Moreno Schneider and Peter Bourgonje at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Cross-disciplinary collaborations to enrich access to non-Western language material in the Cultural Heritage sector by Tom Derrick and Nora McGregor at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Tribunal Archives as Digital Research Facility (TRIADO): new ways to make archives accessible and useable by Anne Gorter, Edwin Klijn, Rutger Van Koert, Marielle Scherer and Ismee Tames at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Improving OCR of historical newspapers and journals published in Finland by Senka Drobac, Pekka Kauppinen and Krister Lindén at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards a generic unsupervised method for transcription of encoded manuscripts by Arnau Baró, Jialuo Chen, Alicia Fornés and Beáta Megyesi at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards the Extraction of Statistical Information from Digitised Numerical Tables - The Medical Officer of Health Reports Scoping Study by Christian Clausner, Apostolos Antonacopoulos, Christy Henshaw and Justin Hayes at the 3rd Edition of the DATeCH2019 International Conference
Más contenido relacionado
Similar a Xii simposi internacional noves tendencies
Material de apoyo utilizado en la conferencia "La industria del lenguaje" dentro de la Semana de la Facultad de Ciencias Sociales y Humanas de la Universidad de Deusto en enero de 2010
'Para qué sirve un traductor - Traducción de productos culturales' - Curso de...miguelmarques78
La traducción de productos culturales y el papel del traductor en un producto cultural, explicado a directores de proyectos culturales (exposiciones, videoarte, espectáculos escénicos...).
Slides of the paper Deep Learning-Based Morphological Taggers and Lemmatizers for Annotating Historical Texts by Helmut Schmid at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards a Higher Accuracy of Optical Character Recognition of Chinese Rare Books in Making Use of Text Model by Hsiang-An Wang and Pin-Ting Liu at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Turning Digitised Material into a Diachronic Corpus: Metadata Challenges in the Nederlab Project by Katrien Depuydt and Hennie Brugman at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Standoff Annotation for the Ancient Greek and Latin Dependency Treebank by Giuseppe Celano at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Using lexicography to characterise relations between species mentions in the biodiversity literature by Sandra Young at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Implementation of a Databaseless Web REST API for the Unstructured Texts of Migne's Patrologia Graeca with Searching capabilities and additional Semantic and Syntactic expandability by Evagelos Varthis, Marios Poulos, Ilias Yarenis and Sozon Papavlasopoulos at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Curation Technologies for a Cultural Heritage Archive: Analysing and transforming a heterogeneous data set into an interactive curation workbench by Georg Rehm, Martin Lee, Julián Moreno Schneider and Peter Bourgonje at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Cross-disciplinary collaborations to enrich access to non-Western language material in the Cultural Heritage sector by Tom Derrick and Nora McGregor at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Tribunal Archives as Digital Research Facility (TRIADO): new ways to make archives accessible and useable by Anne Gorter, Edwin Klijn, Rutger Van Koert, Marielle Scherer and Ismee Tames at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Improving OCR of historical newspapers and journals published in Finland by Senka Drobac, Pekka Kauppinen and Krister Lindén at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards a generic unsupervised method for transcription of encoded manuscripts by Arnau Baró, Jialuo Chen, Alicia Fornés and Beáta Megyesi at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Towards the Extraction of Statistical Information from Digitised Numerical Tables - The Medical Officer of Health Reports Scoping Study by Christian Clausner, Apostolos Antonacopoulos, Christy Henshaw and Justin Hayes at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Detecting Articles in a Digitized Finnish Historical Newspaper Collection 1771–1929: Early Results Using the PIVAJ Software by Kimmo Kettunen, Teemu Ruokolainen, Erno Liukkonen, Pierrick Tranouez, Daniel Antelme and Thierry Paquet at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper OCR-D: An end-to-end open-source OCR framework for historical documents by Clemens Neudecker, Konstantin Baierer, Maria Federbusch, Kay-Michael Würzner, Matthias Boenig, Elisa Hermann and Volker Hartmann at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Diamonds in Borneo: Commodities as Concepts in Context by Karin Hofmeester, Ashkan Ashkpour, Katrien Depuydt and Jesse de Does at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Automatic Reconstruction of Emperor Itineraries from the Regesta Imperii by Juri Opitz, Leo Born, Vivi Nastase and Yannick Pultar at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Automatic Semantic Text Tagging on Historical Lexica by Combining OCR and Typography Classification by Christian Reul, Sebastian Göttel, Uwe Springmann, Christoph Wick, Kay-Michael Würzner and Frank Puppe at the 3rd Edition of the DATeCH2019 International Conference
Slides of the paper Arabic-SOS Segmenter, Stemmer and Orthography Standardizer for the Arabic Cultural Heritage by Emad Mohamed & Zeeshas Sayyed at the 3rd Edition of the DATeCH2019 International Conference
Es un diagrama para La asistencia técnica o apoyo técnico es brindada por las compañías para que sus clientes puedan hacer uso de sus productos o servicios de la manera en que fueron puestos a la venta.
3Redu: Responsabilidad, Resiliencia y Respetocdraco
¡Hola! Somos 3Redu, conformados por Juan Camilo y Cristian. Entendemos las dificultades que enfrentan muchos estudiantes al tratar de comprender conceptos matemáticos. Nuestro objetivo es brindar una solución inclusiva y accesible para todos.
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informáticavazquezgarciajesusma
En este proyecto de investigación nos adentraremos en el fascinante mundo de la intersección entre el arte y los medios de comunicación en el campo de la informática.
La rápida evolución de la tecnología ha llevado a una fusión cada vez más estrecha entre el arte y los medios digitales, generando nuevas formas de expresión y comunicación.
Continuando con el desarrollo de nuestro proyecto haremos uso del método inductivo porque organizamos nuestra investigación a la particular a lo general. El diseño metodológico del trabajo es no experimental y transversal ya que no existe manipulación deliberada de las variables ni de la situación, si no que se observa los fundamental y como se dan en su contestó natural para después analizarlos.
El diseño es transversal porque los datos se recolectan en un solo momento y su propósito es describir variables y analizar su interrelación, solo se desea saber la incidencia y el valor de uno o más variables, el diseño será descriptivo porque se requiere establecer relación entre dos o más de estás.
Mediante una encuesta recopilamos la información de este proyecto los alumnos tengan conocimiento de la evolución del arte y los medios de comunicación en la información y su importancia para la institución.
En este documento analizamos ciertos conceptos relacionados con la ficha 1 y 2. Y concluimos, dando el porque es importante desarrollar nuestras habilidades de pensamiento.
Sara Sofia Bedoya Montezuma.
9-1.
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...espinozaernesto427
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta intensidad son un tipo de lámpara eléctrica de descarga de gas que produce luz por medio de un arco eléctrico entre electrodos de tungsteno alojados dentro de un tubo de alúmina o cuarzo moldeado translúcido o transparente.
lámparas más eficientes del mercado, debido a su menor consumo y por la cantidad de luz que emiten. Adquieren una vida útil de hasta 50.000 horas y no generan calor alguna. Si quieres cambiar la iluminación de tu hogar para hacerla mucho más eficiente, ¡esta es tu mejor opción!
Las nuevas lámparas de descarga de alta intensidad producen más luz visible por unidad de energía eléctrica consumida que las lámparas fluorescentes e incandescentes, ya que una mayor proporción de su radiación es luz visible, en contraste con la infrarroja. Sin embargo, la salida de lúmenes de la iluminación HID puede deteriorarse hasta en un 70% durante 10,000 horas de funcionamiento.
Muchos vehículos modernos usan bombillas HID para los principales sistemas de iluminación, aunque algunas aplicaciones ahora están pasando de bombillas HID a tecnología LED y láser.1 Modelos de lámparas van desde las típicas lámparas de 35 a 100 W de los autos, a las de más de 15 kW que se utilizan en los proyectores de cines IMAX.
Esta tecnología HID no es nueva y fue demostrada por primera vez por Francis Hauksbee en 1705. Lámpara de Nernst.
Lámpara incandescente.
Lámpara de descarga. Lámpara fluorescente. Lámpara fluorescente compacta. Lámpara de haluro metálico. Lámpara de vapor de sodio. Lámpara de vapor de mercurio. Lámpara de neón. Lámpara de deuterio. Lámpara xenón.
Lámpara LED.
Lámpara de plasma.
Flash (fotografía) Las lámparas de descarga de alta intensidad (HID) son un tipo de lámparas de descarga de gas muy utilizadas en la industria de la iluminación. Estas lámparas producen luz creando un arco eléctrico entre dos electrodos a través de un gas ionizado. Las lámparas HID son conocidas por su gran eficacia a la hora de convertir la electricidad en luz y por su larga vida útil.
A diferencia de las luces fluorescentes, que necesitan un recubrimiento de fósforo para emitir luz visible, las lámparas HID no necesitan ningún recubrimiento en el interior de sus tubos. El propio arco eléctrico emite luz visible. Sin embargo, algunas lámparas de halogenuros metálicos y muchas lámparas de vapor de mercurio tienen un recubrimiento de fósforo en el interior de la bombilla para mejorar el espectro luminoso y reproducción cromática. Las lámparas HID están disponibles en varias potencias, que van desde los 25 vatios de las lámparas de halogenuros metálicos autobalastradas y los 35 vatios de las lámparas de vapor de sodio de alta intensidad hasta los 1.000 vatios de las lámparas de vapor de mercurio y vapor de sodio de alta intensidad, e incluso hasta los 1.500 vatios de las lámparas de halogenuros metálicos.
Las lámparas HID requieren un equipo de control especial llamado balasto para funcionar
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Xii simposi internacional noves tendencies
1. Corpus diacrónico de la Biblioteca Virtual
Miguel de Cervantes
Gustavo Candela Romero gcandela@ua.es
Mª Pilar Escobar Esteban mpilar.escobar@ua.es
Departamento de Lenguajes y
Sistemas Informáticos
UNIVERSIDAD DE ALICANTE
XII Simposi Internacional Noves Tendències I+D+I en literatura, llengua,
educació y TIC sobre la Corona d'Aragó. De la Innovació al Cànon
2. Gustavo Candela Romero
gcandela@ua.es
María Pilar Escobar Esteban
mpilar.escobar@ua.es
Corpus diacrónico de la Biblioteca Virtual Miguel de
Cervantes
XII Simposi Internacional Noves Tendències I+D+I en literatura, llengua, educació
y TIC sobre la Corona d'Aragó. De la Innovació al Cànon
3. Índice
● Biblioteca Virtual Miguel de Cervantes
● IMPACT
● Proceso de creación de corpus diacrónico
● Selección de obras
● Edición en CoBaLT
● Fichero de sinónimos
● Herramienta de búsqueda
● Trabajo en curso
4. Biblioteca Virtual Miguel de Cervantes
Su catálogo se compone de alrededor de 230.000 registros, de los cuales 60.000 son libros,
aunque también ofrece estudios críticos y de investigación, materiales históricos, periódicos y
revistas, audiovisuales, archivos sonoros, vídeos en lengua de signos española, etc. Se trata
principalmente de obras antiguas, pertenecientes al dominio público, pero también de obras
actuales de jóvenes autores como Itziar Pascual, Mariam Budia o Carles Batlle, entre otros,
incluidas en el portal de Autores de Teatro.
5. Centro de competencia IMPACT - 2013
● Resultado del proyecto europeo IMPACT (2008 - 2012) gestionado por la
Universidad de Alicante y la FBVMC desde 2010.
● Tiene como objetivo realizar la digitalización de los textos históricos de forma
eficiente, rápida y económica (better, faster and cheaper).
● Proporciona herramientas y servicios para procesamiento de imágenes y
texto.
https://www.digitisation.eu/about/
6. Proceso de creación de corpus diacrónico
5
Herram
ienta
de
búsqueda
4
Fichero
de
sinónim
os
3
Exportación
a
TEI
Edición
en
CoBaLT
21
Selección
de
obras
Expertos literatura,
filólogos,...
Parte tecnológica
7. Selección de obras
● El corpus contiene 86 obras, proporcionadas por la Biblioteca Virtual Miguel
de Cervantes, impresas entre el siglo 15 y 17
● 2 millones de palabras en total
● El 27% de las palabras han sido anotadas con su lema, categoría gramatical
y su forma moderna equivalente (Text Encoding Initiative)
● Disponible con licencia abierta
8. Selección de obras
https://link.springer.com/article/10.1007%2Fs10579-013-9239-y#Sec7
Título Autor Primer edición Edición fuente
Oráculo manual y arte de la
prudencia
Baltasar Gracián 1647 1647
La Celestina Fernando Rojas 1499–1502 1499, 1514
Las Mocedades del Cid Guillén de Castro 1605–1615 1618
Laberinto de Fortuna Juan de Mena 1481 1505
Comedia del Príncipe Ynocente Lope de Vega 1590 1762
La Galatea Miguel de
Cervantes
Saavedra
1585 1585
9. Edición en CoBaLT
Fue desarrollado por el Institute for Dutch Lexicology (INL - Instituut voor
Nederlandse Lexicologie - https://ivdnt.org/)
CoBalt es una aplicación que permite la carga de documentos y la anotación de
cada una de las palabras con su lema y otras etiquetas:
1. Carga de documentos
2. Anotación de textos
3. Exportación a XML
10. Edición en CoBaLT
<entry xml:id="lex.f1d62ce3576c326bbf26db231898771a" n="necesario-adj">
<form type="lemma">
<orth type="normal">necesario</orth>
<gramGrp>
<gram type="PoS">adj</gram>
</gramGrp>
<lbl type="occurrences">282</lbl>
</form>
<form type="wordform">
<orth type="normal">necesarios</orth>
<form type="historical">
<orth type="normalised">necessarios</orth>
<form type="cited">
<orth type="exact">necessarios.</orth>
<cit>
<quote >ya no fuesse a hazer agua o a tomar bastimentos
<oVar>necessarios.</oVar> La barbara Ricla bien comprara a pedaços de oro que</quote>
<bibl>
<title>5412.xml.txt</title>
</bibl>
</cit>
</form>
11. Fichero de sinónimos
Las categorías gramaticales (pos#) que han sido anotadas son las siguientes:
Categoría Etiqueta
abreviación abr
adjetivo adj
adverbio adv
Categoría Etiqueta
determinante det
nombre n
conjunción cnj
Categoría Etiqueta
pronombre prn
pronombre
relativo
rel
verbo verb
13. Herramienta de búsqueda
Cada término puede ir precedido de un prefijo:
● Si no se añade prefijo, la búsqueda se realiza por texto.
● El prefijo modern# denota una forma moderna.
● El prefijo lemma# denota un lema.
● El prefijo pos# denota la categoría gramatical (part-of-speech).
15. Ejemplos de anotación
La forma de la palabra celebrada genera 5
entradas:
● lemma#celebrar
● pos#verb
● modern#celebrada
● lemma#celebrado
● pos#adj
La forma de la palabra yerro genera 7 entradas:
● lemma#yerro
● pos#n
● modern#yerro
● lemma#hierro
● modern#hierro
● lemma#errar
● pos#verb
yerro => yerro, lemma#errar, modern#yerro, pos#verb
yerro => yerro, lemma#hierro, modern#hierro, pos#n
yerro => yerro, lemma#yerro, modern#yerro, pos#n
16. Ejemplos de búsqueda
● lemma#haber modern#de pos#verb (han de tener, han de negar)
● pos#verb
● modern#haber
● lemma#hacer
● pos#adj
17. Trabajo en curso
Selección
de Obras
Procesar
textos
Creación de
sinónimos
abogada => abogada, pos#noun,
lemma#abogado
esperaré => esperaré, pos#verb, lemma#esperar
expresa => expresa, pos#verb, lemma#expresar
mimada => mimada, pos#verb, lemma#mimar
resuenan => resuenan, pos#verb,
lemma#resonar
sabrá => sabrá, pos#verb, lemma#saber
santa => santa, pos#adjective, lemma#santo
santa => santa, pos#noun, lemma#santo
viejo => viejo, pos#adjective, lemma#viejo
Revisión
manual
FreeLing
18. Trabajo en curso
http://nlp.lsi.upc.edu/freeling/demo/demo.php
En un lugar de la Mancha, de cuyo
nombre no quiero acordarme, no ha
mucho tiempo que vivía un hidalgo de
los de lanza en astillero, adarga
antigua, rocín flaco y galgo corredor.
Una olla de algo más vaca que carnero,
salpicón las más noches, duelos y
quebrantos los sábados, lantejas los
viernes, algún palomino de añadidura
los domingos
<document>
<wordcount>69</wordcount>
<paragraph>
<sentence id="1">
<token begin="0" ctag="SP" end="2" form="En"
id="t1.1" lemma="en" pos="adposition" tag="SP"
type="preposition">
<morpho>
<analysis ctag="SP" lemma="en" pos="adposition"
selected="1" tag="SP" type="preposition"/>
</morpho>
</token>
<token begin="3" ctag="DI" end="5" form="un"
gen="masculine" id="t1.2" lemma="uno" num="singular"
pos="determiner" tag="DI0MS0" type="indefinite">
……..
21. Referencias
● http://data.cervantesvirtual.com/blog/documentacion-corpus-diacronico/
● http://data.cervantesvirtual.com/blog/diasearch/
● Sánchez-Martínez, F., Martínez-Sempere, I., Ivars-Ribes, X., Carrasco, R.C.: An open diachronic corpus of historical
Spanish published in Language Resources and Evaluation.
http://link.springer.com/article/10.1007%2Fs10579-013-9239-y
● Rafael C. Carrasco, Isabel Martínez-Sempere, Enrique Mollá-Gandía, Felipe Sánchez-Martínez, Gustavo Candela
Romero, Maria Pilar Escobar Esteban: Linguistically-Enhanced Search over an Open Diachronic Corpus. ECIR
2015: 801-804. https://link.springer.com/chapter/10.1007%2F978-3-319-16354-3_89
● https://github.com/INL/COBALT/blob/master/Documentation/CoBaLT.pdf
● http://nlp.lsi.upc.edu/freeling/index.php/node/1