SlideShare una empresa de Scribd logo
1 de 93
Introducción a la edición digital
académica
Gimena del Rio
(IIBICRIT, CONICET)
Pontificia Universidad Católica de Chile
29 de agosto de 2016
A Companion to Digital Humanities
Kantorowicz (1962): la forma más extendida de
hacer filología es a través de la edición de
textos.
Disciplina (ciencia) que, basada en sus propios métodos
y recogiendo la experiencia de varios siglos, pretende
fijar un texto, generalmente literario, tal y como salió
de las manos de su autor, depurándolo de las
imperfecciones y errores, así como de los aciertos que
en dicho texto acumularon la intervención de los
hombres y el paso del tiempo.
Alberto Blecua. Manual de Crítica Textual.
• Historia del libro
• Historia de la escritura
• Arqueología de los medios
• Hipólito Escolar, Sven Dhal
• •Floriano Cumbreño, Millares Carlo
• •Friedrich Kittler, Lori Emerson
Concepto de escritura
• Conjunto de operaciones y procesos
recursivos en los que la escritura-lectura
entablan un juego dialéctico.
• Escritura es siempre sinónimo de reescritura.
• Procesos lingüísticos cognitivos y culturales.
Sobre el soporte material
El códice medieval es el resultado de un
fenómeno socio-cultural, una consecuencia de la
interacción de factores de tipo económico,
cultural y funcional.
Pantalla como un nuevo soporte intelectual.
Alejandro Piscitelli, Internet, La imprenta del Siglo XXI
http://vbd.humnet.unipi.it/beta2
31/08/2016
Immanuel Kant Opus Postumum – Online-Edition – http://telota.bbaw.de/kant_op
Lector (…) dinámico e inmersivo, (…) desarrolla
capacidades cognitivas avanzadas (…) un conocimiento
de la organización del texto, y concibe el espacio
informativo de la pantalla no sólo en su longitud sino
en su profundidad.
Javier Díaz Noci, Multimedia y modalidades de lectura: una
aproximación al estado de la cuestión
Los Nuevos proyectos digitales
-Tecnologías adaptadas a las HD
-Filosofía del software libre
-Trabajo colaborativo y compartido: coworking/crowdsourcing
-Herramientas y estándares
Bases de datos
Etiquetado TEI-XML
Web semántica
Visualización de datos
Proyectos de investigación en Humanidades
Digitales
• Academia
• Financiamiento
• Grupos de investigación multinacionales, híbridos
y numerosos
• Grandes corpus
• Datos primarios y/o secundarios
• Perdurables
• Modificables
• Accesibles en abierto en la web
The World of Dante, 1992.
http://www.worldofdante.org/
Edición Digital Académica
• Plan / Concepto/ Flujo de trabajo
• Modelización de los datos
• Estándar → TEI
• Arquitectura/estructura
• Open source/ licencias
• Aspecto “user friendly”
• Búsquedas a texto completo / Índices
• Visualización
• Accesibilidad a largo plazo
• Identificadores persistentes
• Documentación
www.remetca.uned.es
http://dialogo.linhd.es/
POEMETCA. http://poemetca.linhd.es/
http://sade.textgrid.de/exist/apps/SADE/Dialogo_Medieval/index.ht
Diálogo Medieval
Ediciones con TEI
• American memory:
http://memory.loc.gov/ammem/index.html
• Biblioteca Digital del Pensamiento Novohispano:
http://www.bdpn.unam.mx/
• Vincent Van Gogh: http://vangoghletters.org
• Voices of the Holocaust: http://voices.iit.edu/
• Manuscritos de Montesquieu:
https://www.unicaen.fr/services/puc/sources/Montesquieu/
• Diálogo Medieval:
http://sade.textgrid.de/exist/apps/SADE/Dialogo_Medieval/in
dex.html
EDITORES “PLANOS”
Proyectos de crowdediting
http://transcriu.bnc.cat/
http://beta.fromthepage.com/
http://www.ancestry.com/wiki/index.php?title=Keying
_tool_how-tos
http://diyhistory.lib.uiowa.edu/
http://www.archives.gov/citizen-archivist/
http://transcribe.archives.gov/
http://beta.fromthepage.com/
• innovatics /innovatics
• Collections > Edición y crítica textual
TEIScribe
http://www.evilinhd.com:8080/TextEditor/?session=prueb
Publicación
online
Creación de
una
biblioteca
digital
Edición digital
en XML-TEI Compartir
datos
Compartir
documentos
Enviar
mensajes
Edición Digital y publicación Trabajo en
grupo
Proyecto de Humanidades en un EVI
EVI
www.evilinhd.com
…
proyecto1.evilinhd.com
proyecto2.evilinhd.com
proyectoN.evilinhd.com
>Los proyectos son integrados en diferentes módulos
> Los usuarios pueden trabajar en diferentes
proyectos a la vez
Internet
www.evilinhd.com
. . .
Arquitectura
http://www.evilinhd.com/
• innovatics/innovatics
Oxygen
• http://www.oxygenxml.com/xml_editor/down
load_oxygen_xml_editor.html (licencia
gratuita por 30 días; por favor, tengan en
cuenta si la máquina trabaja a 32 o 64 bit para
descargar la versión correcta del editor).
¿Qué vamos a aprender hoy?
• Trabajar con metalenguaje y editar =
Etiquetar, marcar, codificar o, lo que es lo
mismo,
usar un lenguaje de marcado xml llamado TEI
(Text Encoding Initiative):
-Módulos, etiquetas, esquemas
Transcripción de un texto
Digitalización Transcripción Codificación
Paz a España, paz segura.
Canten abiertos los campos
dichosos de Extremadura. !
Lean los niños, las flores,
y entre las negras encinas
todos los trabajadores. !
¡Lejos tanta noche oscura!
¡Para siempre en primavera,
la tierra de Extremadura! !
Yo os traigo en este pregón,
el libro, fuente de gracia,
que ilumina el corazón. !
Agua tranquila, agua pura,
agua que riegue la sangre
del alma de Extremadura. !
Libros de amor, luz, ensueño.
Alta vida y viento en calma
en todo el pueblo extremeño
Segunda etapa
• Indagar en los documentos TEI
• Base de datos (xml nativas)
• Un motor de búsqueda
• Una interfaz web
Lenguajes de marcado
• Se desarrollan para tratar con documentos (información
predominantemente textual), también para gestión de datos.
• Describen las partes lógicas (estructura, lógica y semántica) de un tipo de
documento (o conjunto de datos), sin límite en el nivel de profundidad o
detalle.
• Son lenguajes porque tienen
– Vocabulario: Para denominar a cada elemento estructural del
documento de cualquier nivel de profundidad, a cada atributo de
estos elementos, a cada valor de estos atributos (para cierto tipo de
atributo), etc.
– Sintaxis (o gramática): Para indicar qué construcciones estructurales
están permitidas: qué debe o puede contener cada elemento, si un
elemento o atributo es obligatorio, si un elemento puede o no
repetirse, qué tipo de valor admite un atributo, etc.
¿Qué es XML?
• XML = Extensible Markup Language
• XML es un heredero, más sencillo y eficaz, de su
antecesor SGML (Standard Generalized Markup
Language)
• Se publicó en febrero de 1998 por el W3C
Consortium.
• La documentación oficial está disponible en:
http://www.w3.org/XML/
• Tutoriales en línea: Introducción a XML
elaborada por TEI
Ventajas del XML
• Simple, flexible y “human-readable”
• Soporta diferentes sistemas de escritura; utiliza el estándar
Unicode, por defecto, el marcado es UTF-8.
• Ampliamente utilizado (soporte y herramientas)
• ISO estándar (International Organization for Standardization)
• Independiente de cualquier software
• Facilita el movimiento de datos (interoperabilidad) y su
preservación
• Separa contenido de presentación
• Enorme cantidad de tutoriales en línea
Noción de marcado
• Aislar una porción de texto con un significado
semántico específico.
• La estructura consiste en la anidación sin límites
de unos elementos al interior de otros,
construyendo así una especie de árbol
genealógico. Por eso, necesitamos siempre un
solo elemento raíz del que cuelguen todos los
otros.
Estructura de una etiqueta
Elemento: son las unidades de información semántica
compuestas de una marca de apertura <elemento> y de cierre
</elemento>. La etiqueta es el identificador general. Puede
contener texto, otros elementos o estar vacío <elemento/>.
Atributo: añaden una característica adicional al elemento y
deben siempre llevar un valor. Pueden ser generales, es decir,
utilizables en todos los elementos TEI (@xml:id,@xml:lang), o
específicos de un elemento.
Valor: rellena el valor o contenido del atributo.
Reglas
• El nombre del elemento puede solo contener
letras y números, sin acentos ni espacios, y solo
algunos signos: - _ .
• El nombre no puede empezar por un número,
ni por un signo, etc.
<titulo>Int. a TEI</titulo>
<autor>Gimena del Rio</autor>
<fecha>24/10/2015</fecha>
Abrir Oxygen
Abrir file en blanco
Ver documento_xml_basico.xml
Reglas del doc. XML
• Tiene que estar Bien formado, es decir estar expresado
correctamente según la gramática del XML
• Tiene que ser Válido
-Para ello, necesita un modelo que fije la estructura básica y las
posibilidades de anidación del documento. Los esquemas
(RelaxNG, W3CSchema) establecen la sintaxis que debe tener
el documento XML. Si este está formado según sus reglas,
será válido.
¿Qué significa bien formado?
1. Tiene que existir un único elemento raíz que contenga todo el
documento
2. Cada subárbol debe estar correctamente anidado, es decir, no se
pueden solapar
3. Los nombres de las etiquetas son case/sensitive:
<de> ≠ <De> ≠ <DE>
4. Una etiqueta de apertura <p> debe tener siempre una etiqueta de
cierre </p> (salvo en los casos de etiquetas vacías <vacia/> )
5. No debe haber espacios en blanco tras < o antes de </
<p>párrafo</p>
Y no < p>párrafo</ p> ni <p >párrafo</p >
6. El valor de los atributos ha de estar siempre entrecomillado
<p type="text">algo de texto</p>
¿Qué significa válido?
Un documento XML es válido cuando cumple las reglas
establecidas en un esquema externo.
El esquema especifica, entre otras cosas,
1. El nombre del elemento raíz
2. El nombre de todos los elementos que se pueden utilizar
3. Los nombres, tipo de datos y (ocasionalmente) los valores
por defecto de los atributos
4. Reglas acerca de cómo se pueden anidar los elementos
Ahora veamos cómo TEI se expresa a
través del XML
Text Encoding Initiative. http://www.tei-c.org
Text Encoding Initiative
• 1987: primera reunión (Vassar College, NY) con el fin de crear
unas guías directrices para la codificación de textos
electrónicos
• 1988 – 1990: TEI P1
• 1990 – 1992: TEI P2 y creación de grupos de trabajo por •
1993 – 1994: TEI P3, primera versión oficial de las Guidelines
• 2000: creación del Consortium TEI
• 2002: TEI P4, primera versión en XML (de la P3)
• 2007: TEI P5
• 2011-2015: TEI P5 en sus versiones
• 2015: TAPAS project, TEI Simple
http://www.tei-c.org
- Guidelines
- Lista de proyectos que utilizan TEI
- Una Wiki
- Herramientas
- Lista de discusión
Text Encoding Initiative
• Iniciativa de codificación de textos en
Humanidades, Cs. Sociales y Lingüística.
• Se describe en las TEI Guidelines: el manual de
uso.
• Se expresa a través del lenguaje XML.
• Tiene un carácter modular y es personalizable
• Es código abierto (GIThub), independiente de
cualquier programa o plataforma.
Algunos problemas
• Traducción parcial en español de las
Guidelines.
• Modelo todavía poco conocido, utilizado
sobretodo en países anglosajones, aunque
también hay fuertes iniciativas en Francia,
Alemania, Holanda, entre otros.
• Se tiende todavía a delegar el trabajo de
codificar a los informáticos.
• Poca oferta de formación inicial y avanzada.
Qué podemos marcar
• Estructura textual (párrafos, listas, tablas…)
• Lagunas, caracteres especiales, saltos de línea,
saltos de página, abreviaturas
• Comentarios, glosas
• Errores, cancelaciones
• Lecturas diferentes, adiciones
• Poemas, versos, rimas
Todo eso podemos expresar en XML según las
directrices de la Text Encoding Initiative.
• Divisiones estructurales del texto
• Información semántica
• Elementos tipográficos puntuales
• Otra información de interés:
– personas, lugares, fechas
– cuestiones gramaticales
– imágenes, etc.
Todo depende de la información que busquemos recuperar
a posteriori y procesar informáticamente.
• Para el procesamiento informático necesitamos
hacer explícita toda la información.
• Debemos diferenciar el contenido semántico de su
presentación.
Guidelines
Definen y documentan un lenguaje de marcado para la
representación de las características estructurales, físicas y
conceptuales de los textos. Su foco de atención es el marcado de
documentos en Humanidades y Cs. Sociales (aunque no
exclusivamente), y en particular la representación de fuentes
primarias para su explotación y análisis. Se expresan de forma
modular, a través de esquemas XML extensibles, son
acompañadas de una documentación detallada, y publicadas
bajo una licencia open-source. Las Guidelines son mantenidas y
desarrolladas por el TEI Consortium, a través de su Technical
Council, con el respaldo y la participación de la comunidad TEI.
http://www.tei-c.org/Guidelines/
Guidelines
• Marco de trabajo flexible basado en módulos
(un total de 21; 4 obligatorios)
• Una selección de más de 500 etiquetas
• Una estructura en clases de modelo y
atributos
• Módulos: http://www.tei-
c.org/release/doc/tei-p5-doc/en/html/
Módulos principales
• tei: definición de las clases, macros y tipos de
datos
• textstructure: elementos de base para
estructurar un texto de tipo libro
• core: elementos disponibles en todos los
documentos TEI
• header: encabezado TEI (metadatos del
documento)
Recordemos. Tipos de elementos
Un elemento puede contener, según se especifique en el esquema :
1. Otros elementos, subelementos o elementos hijos .
Ej.: <text><body><lg><l>
2. Texto.
Ej.: <author>Prescod, Paul</author>
3. Contenido mixto, o sea, una mezcla de elementos hijos y texto.
Ej.: <title>Charles F. Goldfarb's<enfasis>XML</enfasis>
Handbook</title>
4. Nada, si es un elemento vacío. Ej.:<Cartel fuente=“imagen1.jpg"/>
Tipos de elementos
Un elemento puede ser, según se especifique en el esquema,
1. Obligatorio
2. Opcional
3. Prohibido
Etiquetas core
HEADER
<fileDesc>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title></title>
<author></author>
<editor></editor>
</titleStmt>
<publicationStmt>
<date></date>
<publisher></publisher>
<availability>
<licence></licence>
</availability>
</publicationStmt>
</fileDesc>
<fileDesc>
<teiHeader>
<fileDesc>
<titleStmt>
<title>Vi estar fermosa vista</title>
<author>Pero González de Uceda</author>
<editor>Gimena del Rio</editor>
</titleStmt>
<publicationStmt>
<date>08/11/2014</date>
<publisher>Jornadas de la AAHD</publisher>
<availability>
<licence>Creative Commons</licence>
</availability>
</publicationStmt>
</fileDesc>
<sourceDesc>
<sourceDesc>
<bibl>
<title></title>
<editor></editor>
<pubPlace></pubPlace>
<publisher></publisher>
<date></date>
</bibl>
</sourceDesc>
<sourceDesc>
<sourceDesc>
<bibl type="url">http://cancionerovirtual.liv.ac.uk</bibl>
<title>Cancionero Virtual</title>
<editor>Brian Dutton</editor>
<pubPlace>Liverpool</pubPlace>
<publisher>U. of Liverpool</publisher>
<date>2006-</date>
</sourceDesc>
Esquema
•Todo documento TEI necesita un esquema que establezca una
sintaxis precisa. TEI ofrece algunos modelos, como una versión
light (teilite.rng) o una versión con todos los elementos
(tei_all.rng)(que es poco recomendable).
• La buena práctica sugiere que cada proyecto debe crear a su
medida un esquema, adoptando los módulos que crea
conveniente, eliminando y añadiendo elementos, eliminando y
concretando atributos y valores. Así, la labor de marcado será
mucho más fácil y consistente.
¿Para qué un esquema?
1. Asegura que en los documentos solo se utilizan
los elementos, atributos y entidades predefinidas.
2. Establece las reglas estructurales del tipo ‘toda
receta debe incluir una lista de ingredientes’
3. Asegura que la misma cosa se llame de la misma
manera siempre
ROMA
Para crear nuestro esquema, disponemos de una herramienta
muy útil y fácil de manejar que se llama ROMA.
• Gracias a esta aplicación, podremos crear el fichero ODD = One
Document Does it All, que será esencial para nuestro trabajo.
• Sería algo así como… :
– Roma: “el supermercado”
– Esquema: “los ingredientes”
– ODD: “la receta”
ROMA
• Generar y modificar un esquema
• Elegir la lengua de la documentación
• Elegir los módulos que nos interesan
• Añadir y eliminar elementos en una determinada clase
• Modificar clases de atributos
• Elegir el tipo de esquema: RelaxNG, Schematron, W3C,
Schema (no DTD)
• Generar una documentación (en HTML, por ejemplo)
• Guardar nuestra personalización
• No hay una sola manera “correcta” de marcar los textos.
• Seguir la TEI significa seguir, en la medida de lo posible, las
recomendaciones de codificación consensuadas en las
Guidelines.
• Aprender de la codificación de otros proyectos es muy
importante, por eso es importante compartir el código.
• Cada proyecto debe personalizar un modelo de marcado y un
esquema, así como documentarlo detalladamente.
• El uso de TEI facilita el re-uso del texto, en diferentes
formatos, en diferentes contextos, por diferentes usuarios, en
diferentes plataformas, etc.
ROMA. http://www.tei-c.org/Roma/
Ejercicio 1. Esquema en Roma
Ejercicio 2. Crear xml doc y asociar
esquema
Semáforo verde
• Para crear un doc. xml válido tengo que
asociarle un esquema también válido. Solo así
obtendré un documento bien formado
(LUZ ROJA vs. LUZ VERDE)
EJEMPLOS
6. Verso
HEADER Y VERSO
1782-a
Arbolito naranjado,
¡bonito pago me has dado!,
después de quedar conmigo,
a la luna me has dejado.
http://www.cervantesvirtual.com/obra-visor-din/cancionero-popular-
de-jujuy--0/html/ffea72c4-82b1-11df-acc7-
002185ce6064_168.html#I_2265_
Ejercicio 3. Completar
<text> <body> módulo verso
Otros ejemplos.Transcripción de
discurso
Nombres, fechas, personas, lugares
Desc. de manuscritos
Diccionarios
Tutoriales
• Learn TEI
• TEI WIKI
• TEI by Example
Algunas herramientas
Lista de herramientas:
• Interedtion Wiki. Existing Tools
• TEI Tools
Herramientas de transformación:
• Oxgarage
Visualización y plataformas de publicación:
• TEI Viewer
• TEI Boilerplate
• V-Machine

Más contenido relacionado

Similar a Introducción a la edición digital académica con TEI

Similar a Introducción a la edición digital académica con TEI (20)

Clara herramientas digitales para la edición
Clara herramientas digitales para la ediciónClara herramientas digitales para la edición
Clara herramientas digitales para la edición
 
Herramientas digitales para la edición
Herramientas digitales para la ediciónHerramientas digitales para la edición
Herramientas digitales para la edición
 
Datos semiestructurados Xml
Datos semiestructurados XmlDatos semiestructurados Xml
Datos semiestructurados Xml
 
Parseo de xml y TEI
Parseo de xml y TEIParseo de xml y TEI
Parseo de xml y TEI
 
CONCEPTOS BÁSICOS DE BASE DE DATOS
CONCEPTOS BÁSICOS DE BASE DE DATOSCONCEPTOS BÁSICOS DE BASE DE DATOS
CONCEPTOS BÁSICOS DE BASE DE DATOS
 
Diseño de archivos
Diseño de archivosDiseño de archivos
Diseño de archivos
 
Xml
XmlXml
Xml
 
Apuntes informatica higiene_y_seguridad
Apuntes informatica higiene_y_seguridadApuntes informatica higiene_y_seguridad
Apuntes informatica higiene_y_seguridad
 
Eje tematico 5
Eje tematico 5Eje tematico 5
Eje tematico 5
 
La web semantica
La web semanticaLa web semantica
La web semantica
 
Procesamiento del lenguaje natural
Procesamiento del lenguaje naturalProcesamiento del lenguaje natural
Procesamiento del lenguaje natural
 
Eje tematico 5 los metadatos
Eje tematico 5   los metadatosEje tematico 5   los metadatos
Eje tematico 5 los metadatos
 
Los metadatos
Los metadatosLos metadatos
Los metadatos
 
Web semántica
Web semánticaWeb semántica
Web semántica
 
Bases de datos electronicos
Bases de datos electronicosBases de datos electronicos
Bases de datos electronicos
 
Teoria de la informacion
Teoria de la informacionTeoria de la informacion
Teoria de la informacion
 
ANALISIS DE INFORMACION
ANALISIS DE INFORMACIONANALISIS DE INFORMACION
ANALISIS DE INFORMACION
 
Introduccion a las bases de datos
Introduccion a las bases de datosIntroduccion a las bases de datos
Introduccion a las bases de datos
 
Teoria de la informacion
Teoria de la informacionTeoria de la informacion
Teoria de la informacion
 
Grupo 5 los_metadatos
Grupo 5 los_metadatosGrupo 5 los_metadatos
Grupo 5 los_metadatos
 

Más de Gimena Del Rio Riande

Digital Humanities: a God of many faces
Digital Humanities: a God of many facesDigital Humanities: a God of many faces
Digital Humanities: a God of many facesGimena Del Rio Riande
 
Refounding the Digital Humanities from the South
Refounding the Digital Humanities from the SouthRefounding the Digital Humanities from the South
Refounding the Digital Humanities from the SouthGimena Del Rio Riande
 
Taller Pelagios jornadas ficcionalización FFYL UBA
Taller Pelagios jornadas ficcionalización FFYL UBATaller Pelagios jornadas ficcionalización FFYL UBA
Taller Pelagios jornadas ficcionalización FFYL UBAGimena Del Rio Riande
 
Recursos y herramientas digitales para la investigación
Recursos y herramientas digitales para la investigaciónRecursos y herramientas digitales para la investigación
Recursos y herramientas digitales para la investigaciónGimena Del Rio Riande
 
Humanidades digitales. life on the other side
Humanidades digitales. life on the other side Humanidades digitales. life on the other side
Humanidades digitales. life on the other side Gimena Del Rio Riande
 
DelRio-Humanidades digitales y big data
DelRio-Humanidades digitales y big dataDelRio-Humanidades digitales y big data
DelRio-Humanidades digitales y big dataGimena Del Rio Riande
 
Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...
Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...
Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...Gimena Del Rio Riande
 
Buenas prácticas en Humanidades Digitales.El rol de bibliotecas
Buenas prácticas en Humanidades Digitales.El rol de bibliotecasBuenas prácticas en Humanidades Digitales.El rol de bibliotecas
Buenas prácticas en Humanidades Digitales.El rol de bibliotecasGimena Del Rio Riande
 
Estado arte de las Humanidades Digitales. Algunos proyectos de investigación
Estado arte de las Humanidades Digitales. Algunos proyectos de investigaciónEstado arte de las Humanidades Digitales. Algunos proyectos de investigación
Estado arte de las Humanidades Digitales. Algunos proyectos de investigaciónGimena Del Rio Riande
 
Buenas prácticas en humanidades digitales
Buenas prácticas en humanidades digitalesBuenas prácticas en humanidades digitales
Buenas prácticas en humanidades digitalesGimena Del Rio Riande
 
Camino a la edicion filológica digital
Camino a la edicion filológica digitalCamino a la edicion filológica digital
Camino a la edicion filológica digitalGimena Del Rio Riande
 
A viewpoint on digital scholar research in the Hispanic world
A viewpoint on digital scholar research in the Hispanic worldA viewpoint on digital scholar research in the Hispanic world
A viewpoint on digital scholar research in the Hispanic world Gimena Del Rio Riande
 
Recursos digitales para el estudio y la edición (1)
Recursos digitales para el estudio y la edición (1)Recursos digitales para el estudio y la edición (1)
Recursos digitales para el estudio y la edición (1)Gimena Del Rio Riande
 
Asociación Argentina de Humanidades Digitales (AAHD)
Asociación Argentina de Humanidades Digitales (AAHD)Asociación Argentina de Humanidades Digitales (AAHD)
Asociación Argentina de Humanidades Digitales (AAHD)Gimena Del Rio Riande
 
Nuevos abordajes, nuevas dinámicas, antigua poesía
Nuevos abordajes, nuevas dinámicas, antigua poesíaNuevos abordajes, nuevas dinámicas, antigua poesía
Nuevos abordajes, nuevas dinámicas, antigua poesíaGimena Del Rio Riande
 
Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...
Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...
Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...Gimena Del Rio Riande
 
Humanidades Digitales. la conformación de un campo académico
Humanidades Digitales. la conformación de un campo académicoHumanidades Digitales. la conformación de un campo académico
Humanidades Digitales. la conformación de un campo académicoGimena Del Rio Riande
 
Transformación de datos y jerarquización de saberes. Notas acerca del proyect...
Transformación de datos y jerarquización de saberes. Notas acerca del proyect...Transformación de datos y jerarquización de saberes. Notas acerca del proyect...
Transformación de datos y jerarquización de saberes. Notas acerca del proyect...Gimena Del Rio Riande
 
Verse patterns in the dialogue poems of the cancionero de baena
Verse patterns in the dialogue poems of the cancionero de baenaVerse patterns in the dialogue poems of the cancionero de baena
Verse patterns in the dialogue poems of the cancionero de baenaGimena Del Rio Riande
 

Más de Gimena Del Rio Riande (20)

Digital Humanities: a God of many faces
Digital Humanities: a God of many facesDigital Humanities: a God of many faces
Digital Humanities: a God of many faces
 
Refounding the Digital Humanities from the South
Refounding the Digital Humanities from the SouthRefounding the Digital Humanities from the South
Refounding the Digital Humanities from the South
 
Pelagios Commons al Sur
Pelagios Commons al SurPelagios Commons al Sur
Pelagios Commons al Sur
 
Taller Pelagios jornadas ficcionalización FFYL UBA
Taller Pelagios jornadas ficcionalización FFYL UBATaller Pelagios jornadas ficcionalización FFYL UBA
Taller Pelagios jornadas ficcionalización FFYL UBA
 
Recursos y herramientas digitales para la investigación
Recursos y herramientas digitales para la investigaciónRecursos y herramientas digitales para la investigación
Recursos y herramientas digitales para la investigación
 
Humanidades digitales. life on the other side
Humanidades digitales. life on the other side Humanidades digitales. life on the other side
Humanidades digitales. life on the other side
 
DelRio-Humanidades digitales y big data
DelRio-Humanidades digitales y big dataDelRio-Humanidades digitales y big data
DelRio-Humanidades digitales y big data
 
Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...
Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...
Humanidades Digitales: posibilidades de desarrollo en el campo de la edición ...
 
Buenas prácticas en Humanidades Digitales.El rol de bibliotecas
Buenas prácticas en Humanidades Digitales.El rol de bibliotecasBuenas prácticas en Humanidades Digitales.El rol de bibliotecas
Buenas prácticas en Humanidades Digitales.El rol de bibliotecas
 
Estado arte de las Humanidades Digitales. Algunos proyectos de investigación
Estado arte de las Humanidades Digitales. Algunos proyectos de investigaciónEstado arte de las Humanidades Digitales. Algunos proyectos de investigación
Estado arte de las Humanidades Digitales. Algunos proyectos de investigación
 
Buenas prácticas en humanidades digitales
Buenas prácticas en humanidades digitalesBuenas prácticas en humanidades digitales
Buenas prácticas en humanidades digitales
 
Camino a la edicion filológica digital
Camino a la edicion filológica digitalCamino a la edicion filológica digital
Camino a la edicion filológica digital
 
A viewpoint on digital scholar research in the Hispanic world
A viewpoint on digital scholar research in the Hispanic worldA viewpoint on digital scholar research in the Hispanic world
A viewpoint on digital scholar research in the Hispanic world
 
Recursos digitales para el estudio y la edición (1)
Recursos digitales para el estudio y la edición (1)Recursos digitales para el estudio y la edición (1)
Recursos digitales para el estudio y la edición (1)
 
Asociación Argentina de Humanidades Digitales (AAHD)
Asociación Argentina de Humanidades Digitales (AAHD)Asociación Argentina de Humanidades Digitales (AAHD)
Asociación Argentina de Humanidades Digitales (AAHD)
 
Nuevos abordajes, nuevas dinámicas, antigua poesía
Nuevos abordajes, nuevas dinámicas, antigua poesíaNuevos abordajes, nuevas dinámicas, antigua poesía
Nuevos abordajes, nuevas dinámicas, antigua poesía
 
Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...
Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...
Definir, clasificar, usar, pensar las herramientas para las Humanidades Digit...
 
Humanidades Digitales. la conformación de un campo académico
Humanidades Digitales. la conformación de un campo académicoHumanidades Digitales. la conformación de un campo académico
Humanidades Digitales. la conformación de un campo académico
 
Transformación de datos y jerarquización de saberes. Notas acerca del proyect...
Transformación de datos y jerarquización de saberes. Notas acerca del proyect...Transformación de datos y jerarquización de saberes. Notas acerca del proyect...
Transformación de datos y jerarquización de saberes. Notas acerca del proyect...
 
Verse patterns in the dialogue poems of the cancionero de baena
Verse patterns in the dialogue poems of the cancionero de baenaVerse patterns in the dialogue poems of the cancionero de baena
Verse patterns in the dialogue poems of the cancionero de baena
 

Último

el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfMaryRotonda1
 
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfResolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADOJosé Luis Palma
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docxGLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docxAleParedes11
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosCesarFernandez937857
 

Último (20)

el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdf
 
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfResolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.
 
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docxGLOSAS  Y PALABRAS ACTO 2 DE ABRIL 2024.docx
GLOSAS Y PALABRAS ACTO 2 DE ABRIL 2024.docx
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Repaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia GeneralRepaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia General
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos Básicos
 

Introducción a la edición digital académica con TEI

  • 1. Introducción a la edición digital académica Gimena del Rio (IIBICRIT, CONICET) Pontificia Universidad Católica de Chile 29 de agosto de 2016
  • 2. A Companion to Digital Humanities
  • 3.
  • 4. Kantorowicz (1962): la forma más extendida de hacer filología es a través de la edición de textos.
  • 5. Disciplina (ciencia) que, basada en sus propios métodos y recogiendo la experiencia de varios siglos, pretende fijar un texto, generalmente literario, tal y como salió de las manos de su autor, depurándolo de las imperfecciones y errores, así como de los aciertos que en dicho texto acumularon la intervención de los hombres y el paso del tiempo. Alberto Blecua. Manual de Crítica Textual.
  • 6. • Historia del libro • Historia de la escritura • Arqueología de los medios
  • 7. • Hipólito Escolar, Sven Dhal • •Floriano Cumbreño, Millares Carlo • •Friedrich Kittler, Lori Emerson
  • 8. Concepto de escritura • Conjunto de operaciones y procesos recursivos en los que la escritura-lectura entablan un juego dialéctico. • Escritura es siempre sinónimo de reescritura. • Procesos lingüísticos cognitivos y culturales.
  • 9.
  • 10. Sobre el soporte material El códice medieval es el resultado de un fenómeno socio-cultural, una consecuencia de la interacción de factores de tipo económico, cultural y funcional.
  • 11.
  • 12.
  • 13. Pantalla como un nuevo soporte intelectual. Alejandro Piscitelli, Internet, La imprenta del Siglo XXI
  • 15. 31/08/2016 Immanuel Kant Opus Postumum – Online-Edition – http://telota.bbaw.de/kant_op
  • 16. Lector (…) dinámico e inmersivo, (…) desarrolla capacidades cognitivas avanzadas (…) un conocimiento de la organización del texto, y concibe el espacio informativo de la pantalla no sólo en su longitud sino en su profundidad. Javier Díaz Noci, Multimedia y modalidades de lectura: una aproximación al estado de la cuestión
  • 17. Los Nuevos proyectos digitales -Tecnologías adaptadas a las HD -Filosofía del software libre -Trabajo colaborativo y compartido: coworking/crowdsourcing -Herramientas y estándares Bases de datos Etiquetado TEI-XML Web semántica Visualización de datos
  • 18. Proyectos de investigación en Humanidades Digitales • Academia • Financiamiento • Grupos de investigación multinacionales, híbridos y numerosos • Grandes corpus • Datos primarios y/o secundarios • Perdurables • Modificables • Accesibles en abierto en la web
  • 19. The World of Dante, 1992. http://www.worldofdante.org/
  • 20. Edición Digital Académica • Plan / Concepto/ Flujo de trabajo • Modelización de los datos • Estándar → TEI • Arquitectura/estructura • Open source/ licencias • Aspecto “user friendly” • Búsquedas a texto completo / Índices • Visualización • Accesibilidad a largo plazo • Identificadores persistentes • Documentación
  • 21.
  • 24.
  • 25. Ediciones con TEI • American memory: http://memory.loc.gov/ammem/index.html • Biblioteca Digital del Pensamiento Novohispano: http://www.bdpn.unam.mx/ • Vincent Van Gogh: http://vangoghletters.org • Voices of the Holocaust: http://voices.iit.edu/ • Manuscritos de Montesquieu: https://www.unicaen.fr/services/puc/sources/Montesquieu/ • Diálogo Medieval: http://sade.textgrid.de/exist/apps/SADE/Dialogo_Medieval/in dex.html
  • 27.
  • 29. http://beta.fromthepage.com/ • innovatics /innovatics • Collections > Edición y crítica textual
  • 30.
  • 32. Publicación online Creación de una biblioteca digital Edición digital en XML-TEI Compartir datos Compartir documentos Enviar mensajes Edición Digital y publicación Trabajo en grupo Proyecto de Humanidades en un EVI
  • 34. > Los usuarios pueden trabajar en diferentes proyectos a la vez Internet www.evilinhd.com . . .
  • 37. Oxygen • http://www.oxygenxml.com/xml_editor/down load_oxygen_xml_editor.html (licencia gratuita por 30 días; por favor, tengan en cuenta si la máquina trabaja a 32 o 64 bit para descargar la versión correcta del editor).
  • 38. ¿Qué vamos a aprender hoy? • Trabajar con metalenguaje y editar = Etiquetar, marcar, codificar o, lo que es lo mismo, usar un lenguaje de marcado xml llamado TEI (Text Encoding Initiative): -Módulos, etiquetas, esquemas
  • 39. Transcripción de un texto Digitalización Transcripción Codificación Paz a España, paz segura. Canten abiertos los campos dichosos de Extremadura. ! Lean los niños, las flores, y entre las negras encinas todos los trabajadores. ! ¡Lejos tanta noche oscura! ¡Para siempre en primavera, la tierra de Extremadura! ! Yo os traigo en este pregón, el libro, fuente de gracia, que ilumina el corazón. ! Agua tranquila, agua pura, agua que riegue la sangre del alma de Extremadura. ! Libros de amor, luz, ensueño. Alta vida y viento en calma en todo el pueblo extremeño
  • 40. Segunda etapa • Indagar en los documentos TEI • Base de datos (xml nativas) • Un motor de búsqueda • Una interfaz web
  • 41. Lenguajes de marcado • Se desarrollan para tratar con documentos (información predominantemente textual), también para gestión de datos. • Describen las partes lógicas (estructura, lógica y semántica) de un tipo de documento (o conjunto de datos), sin límite en el nivel de profundidad o detalle. • Son lenguajes porque tienen – Vocabulario: Para denominar a cada elemento estructural del documento de cualquier nivel de profundidad, a cada atributo de estos elementos, a cada valor de estos atributos (para cierto tipo de atributo), etc. – Sintaxis (o gramática): Para indicar qué construcciones estructurales están permitidas: qué debe o puede contener cada elemento, si un elemento o atributo es obligatorio, si un elemento puede o no repetirse, qué tipo de valor admite un atributo, etc.
  • 42. ¿Qué es XML? • XML = Extensible Markup Language • XML es un heredero, más sencillo y eficaz, de su antecesor SGML (Standard Generalized Markup Language) • Se publicó en febrero de 1998 por el W3C Consortium. • La documentación oficial está disponible en: http://www.w3.org/XML/ • Tutoriales en línea: Introducción a XML elaborada por TEI
  • 43. Ventajas del XML • Simple, flexible y “human-readable” • Soporta diferentes sistemas de escritura; utiliza el estándar Unicode, por defecto, el marcado es UTF-8. • Ampliamente utilizado (soporte y herramientas) • ISO estándar (International Organization for Standardization) • Independiente de cualquier software • Facilita el movimiento de datos (interoperabilidad) y su preservación • Separa contenido de presentación • Enorme cantidad de tutoriales en línea
  • 44. Noción de marcado • Aislar una porción de texto con un significado semántico específico. • La estructura consiste en la anidación sin límites de unos elementos al interior de otros, construyendo así una especie de árbol genealógico. Por eso, necesitamos siempre un solo elemento raíz del que cuelguen todos los otros.
  • 45. Estructura de una etiqueta Elemento: son las unidades de información semántica compuestas de una marca de apertura <elemento> y de cierre </elemento>. La etiqueta es el identificador general. Puede contener texto, otros elementos o estar vacío <elemento/>. Atributo: añaden una característica adicional al elemento y deben siempre llevar un valor. Pueden ser generales, es decir, utilizables en todos los elementos TEI (@xml:id,@xml:lang), o específicos de un elemento. Valor: rellena el valor o contenido del atributo.
  • 46. Reglas • El nombre del elemento puede solo contener letras y números, sin acentos ni espacios, y solo algunos signos: - _ . • El nombre no puede empezar por un número, ni por un signo, etc.
  • 47.
  • 48. <titulo>Int. a TEI</titulo> <autor>Gimena del Rio</autor> <fecha>24/10/2015</fecha> Abrir Oxygen Abrir file en blanco Ver documento_xml_basico.xml
  • 49. Reglas del doc. XML • Tiene que estar Bien formado, es decir estar expresado correctamente según la gramática del XML • Tiene que ser Válido -Para ello, necesita un modelo que fije la estructura básica y las posibilidades de anidación del documento. Los esquemas (RelaxNG, W3CSchema) establecen la sintaxis que debe tener el documento XML. Si este está formado según sus reglas, será válido.
  • 50. ¿Qué significa bien formado? 1. Tiene que existir un único elemento raíz que contenga todo el documento 2. Cada subárbol debe estar correctamente anidado, es decir, no se pueden solapar 3. Los nombres de las etiquetas son case/sensitive: <de> ≠ <De> ≠ <DE> 4. Una etiqueta de apertura <p> debe tener siempre una etiqueta de cierre </p> (salvo en los casos de etiquetas vacías <vacia/> ) 5. No debe haber espacios en blanco tras < o antes de </ <p>párrafo</p> Y no < p>párrafo</ p> ni <p >párrafo</p > 6. El valor de los atributos ha de estar siempre entrecomillado <p type="text">algo de texto</p>
  • 51. ¿Qué significa válido? Un documento XML es válido cuando cumple las reglas establecidas en un esquema externo. El esquema especifica, entre otras cosas, 1. El nombre del elemento raíz 2. El nombre de todos los elementos que se pueden utilizar 3. Los nombres, tipo de datos y (ocasionalmente) los valores por defecto de los atributos 4. Reglas acerca de cómo se pueden anidar los elementos
  • 52. Ahora veamos cómo TEI se expresa a través del XML
  • 53. Text Encoding Initiative. http://www.tei-c.org
  • 54. Text Encoding Initiative • 1987: primera reunión (Vassar College, NY) con el fin de crear unas guías directrices para la codificación de textos electrónicos • 1988 – 1990: TEI P1 • 1990 – 1992: TEI P2 y creación de grupos de trabajo por • 1993 – 1994: TEI P3, primera versión oficial de las Guidelines • 2000: creación del Consortium TEI • 2002: TEI P4, primera versión en XML (de la P3) • 2007: TEI P5 • 2011-2015: TEI P5 en sus versiones • 2015: TAPAS project, TEI Simple
  • 55. http://www.tei-c.org - Guidelines - Lista de proyectos que utilizan TEI - Una Wiki - Herramientas - Lista de discusión
  • 56. Text Encoding Initiative • Iniciativa de codificación de textos en Humanidades, Cs. Sociales y Lingüística. • Se describe en las TEI Guidelines: el manual de uso. • Se expresa a través del lenguaje XML. • Tiene un carácter modular y es personalizable • Es código abierto (GIThub), independiente de cualquier programa o plataforma.
  • 57. Algunos problemas • Traducción parcial en español de las Guidelines. • Modelo todavía poco conocido, utilizado sobretodo en países anglosajones, aunque también hay fuertes iniciativas en Francia, Alemania, Holanda, entre otros. • Se tiende todavía a delegar el trabajo de codificar a los informáticos. • Poca oferta de formación inicial y avanzada.
  • 58. Qué podemos marcar • Estructura textual (párrafos, listas, tablas…) • Lagunas, caracteres especiales, saltos de línea, saltos de página, abreviaturas • Comentarios, glosas • Errores, cancelaciones • Lecturas diferentes, adiciones • Poemas, versos, rimas Todo eso podemos expresar en XML según las directrices de la Text Encoding Initiative.
  • 59. • Divisiones estructurales del texto • Información semántica • Elementos tipográficos puntuales • Otra información de interés: – personas, lugares, fechas – cuestiones gramaticales – imágenes, etc. Todo depende de la información que busquemos recuperar a posteriori y procesar informáticamente.
  • 60. • Para el procesamiento informático necesitamos hacer explícita toda la información. • Debemos diferenciar el contenido semántico de su presentación.
  • 61. Guidelines Definen y documentan un lenguaje de marcado para la representación de las características estructurales, físicas y conceptuales de los textos. Su foco de atención es el marcado de documentos en Humanidades y Cs. Sociales (aunque no exclusivamente), y en particular la representación de fuentes primarias para su explotación y análisis. Se expresan de forma modular, a través de esquemas XML extensibles, son acompañadas de una documentación detallada, y publicadas bajo una licencia open-source. Las Guidelines son mantenidas y desarrolladas por el TEI Consortium, a través de su Technical Council, con el respaldo y la participación de la comunidad TEI. http://www.tei-c.org/Guidelines/
  • 62. Guidelines • Marco de trabajo flexible basado en módulos (un total de 21; 4 obligatorios) • Una selección de más de 500 etiquetas • Una estructura en clases de modelo y atributos • Módulos: http://www.tei- c.org/release/doc/tei-p5-doc/en/html/
  • 63. Módulos principales • tei: definición de las clases, macros y tipos de datos • textstructure: elementos de base para estructurar un texto de tipo libro • core: elementos disponibles en todos los documentos TEI • header: encabezado TEI (metadatos del documento)
  • 64. Recordemos. Tipos de elementos Un elemento puede contener, según se especifique en el esquema : 1. Otros elementos, subelementos o elementos hijos . Ej.: <text><body><lg><l> 2. Texto. Ej.: <author>Prescod, Paul</author> 3. Contenido mixto, o sea, una mezcla de elementos hijos y texto. Ej.: <title>Charles F. Goldfarb's<enfasis>XML</enfasis> Handbook</title> 4. Nada, si es un elemento vacío. Ej.:<Cartel fuente=“imagen1.jpg"/>
  • 65. Tipos de elementos Un elemento puede ser, según se especifique en el esquema, 1. Obligatorio 2. Opcional 3. Prohibido
  • 69. <fileDesc> <teiHeader> <fileDesc> <titleStmt> <title>Vi estar fermosa vista</title> <author>Pero González de Uceda</author> <editor>Gimena del Rio</editor> </titleStmt> <publicationStmt> <date>08/11/2014</date> <publisher>Jornadas de la AAHD</publisher> <availability> <licence>Creative Commons</licence> </availability> </publicationStmt> </fileDesc>
  • 71. <sourceDesc> <sourceDesc> <bibl type="url">http://cancionerovirtual.liv.ac.uk</bibl> <title>Cancionero Virtual</title> <editor>Brian Dutton</editor> <pubPlace>Liverpool</pubPlace> <publisher>U. of Liverpool</publisher> <date>2006-</date> </sourceDesc>
  • 72. Esquema •Todo documento TEI necesita un esquema que establezca una sintaxis precisa. TEI ofrece algunos modelos, como una versión light (teilite.rng) o una versión con todos los elementos (tei_all.rng)(que es poco recomendable). • La buena práctica sugiere que cada proyecto debe crear a su medida un esquema, adoptando los módulos que crea conveniente, eliminando y añadiendo elementos, eliminando y concretando atributos y valores. Así, la labor de marcado será mucho más fácil y consistente.
  • 73. ¿Para qué un esquema? 1. Asegura que en los documentos solo se utilizan los elementos, atributos y entidades predefinidas. 2. Establece las reglas estructurales del tipo ‘toda receta debe incluir una lista de ingredientes’ 3. Asegura que la misma cosa se llame de la misma manera siempre
  • 74. ROMA Para crear nuestro esquema, disponemos de una herramienta muy útil y fácil de manejar que se llama ROMA. • Gracias a esta aplicación, podremos crear el fichero ODD = One Document Does it All, que será esencial para nuestro trabajo. • Sería algo así como… : – Roma: “el supermercado” – Esquema: “los ingredientes” – ODD: “la receta”
  • 75. ROMA • Generar y modificar un esquema • Elegir la lengua de la documentación • Elegir los módulos que nos interesan • Añadir y eliminar elementos en una determinada clase • Modificar clases de atributos • Elegir el tipo de esquema: RelaxNG, Schematron, W3C, Schema (no DTD) • Generar una documentación (en HTML, por ejemplo) • Guardar nuestra personalización
  • 76. • No hay una sola manera “correcta” de marcar los textos. • Seguir la TEI significa seguir, en la medida de lo posible, las recomendaciones de codificación consensuadas en las Guidelines. • Aprender de la codificación de otros proyectos es muy importante, por eso es importante compartir el código. • Cada proyecto debe personalizar un modelo de marcado y un esquema, así como documentarlo detalladamente. • El uso de TEI facilita el re-uso del texto, en diferentes formatos, en diferentes contextos, por diferentes usuarios, en diferentes plataformas, etc.
  • 79. Ejercicio 2. Crear xml doc y asociar esquema
  • 80. Semáforo verde • Para crear un doc. xml válido tengo que asociarle un esquema también válido. Solo así obtendré un documento bien formado (LUZ ROJA vs. LUZ VERDE)
  • 84.
  • 85. 1782-a Arbolito naranjado, ¡bonito pago me has dado!, después de quedar conmigo, a la luna me has dejado. http://www.cervantesvirtual.com/obra-visor-din/cancionero-popular- de-jujuy--0/html/ffea72c4-82b1-11df-acc7- 002185ce6064_168.html#I_2265_
  • 92. Tutoriales • Learn TEI • TEI WIKI • TEI by Example
  • 93. Algunas herramientas Lista de herramientas: • Interedtion Wiki. Existing Tools • TEI Tools Herramientas de transformación: • Oxgarage Visualización y plataformas de publicación: • TEI Viewer • TEI Boilerplate • V-Machine