1. Cumpliendo un desafío: “Post Scriptum: A
Digital Archive of Ordinary Writings (Early
Modern Portugal and Spain)”
Guadalupe Adámez Castro, Laura Martínez Martín y Carmen Serrano Sánchez
10 años haciendo camino: balance y perspectivas
IX Jornadas Científicas de la RedAIEP
Alcalá de Henares, 17 de octubre de 2014
2. ¿QUÉ ES POST SCRIPTUM?
Podemos regocijarnos como si se tratara de una venganza
de la suerte que permite que esta gente absolutamente sin
gloria surja en medio de tantos muertos, gesticule aún,
manifieste permanentemente su rabia, su aflicción o su
invencible empecinamiento en vagar sin cesar, lo que
posiblemente compensa la mala suerte que había hecho
concentrarse en ella, a pesar de su modestia y su
anonimato, al rayo del poder.
Michel Foucault: “La vida de los hombres infames”, en Obras esenciales, vol. II,
Estrategias de poder, Barcelona: Paidós, 1999, p. 396.
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
2
3. ¿QUÉ ES POST SCRIPTUM?
- Evolución de proyectos anteriores (CARDS, FLY)
- Proyecto Europeo concedido por el European Research
Council (abril 2012 - marzo 2017)
- Equipo interdisciplinar e internacional:
- Lingüistas
- Lingüistas computacionales
- Historiadores
- Sociólogos
- Humanistas
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
3
4. ¿QUÉ ES POST SCRIPTUM?
OBJETIVOS
- Búsqueda sistemática de 7.000 cartas privadas (3.500
España, 3.500 Portugal) entre 1500 y 1834 para
configurar un corpus diacrónico
- Edición digital de las misivas localizadas
- Estudio histórico-lingüístico a partir del corpus
conformado
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
4
5. EL TRABAJO EN POST SCRIPTUM
1. Localizar, digitalizar y extraer el contexto situacional de las
misivas encontradas
2. Edición digital:
- Transcripción XML (Extensible Mark-Up Language)
- Edición Filológica TEI (Text Encoding Initiative)
3. Anotación lingüística (FreeLing)
4. Análisis histórico-lingüístico:
- Apertura de nuevas líneas de investigación
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
5
6. LOCALIZAR, DIGITALIZAR Y EXTRAER EL
CONTEXTO SITUACIONAL DE LAS MISIVAS
ENCONTRADAS
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
6
7. LOCALIZAR, DIGITALIZAR Y EXTRAER EL
CONTEXTO SITUACIONAL DE LAS MISIVAS
ENCONTRADAS
FONDOS CONSULTADOS EN ESPAÑA
Archivo Histórico Nacional
- Tribunal del Santo Oficio de la Inquisición de Toledo
- Consejo de Inquisición – Secretaría de Aragón
- Consejo de Castilla
- Órdenes Militares
- Universidades
Archivo Diocesano de Cuenca
- Tribunal del Santo Oficio de la Inquisición de Cuenca
Archivo Histórico Provincial de Zaragoza
- Tribunal del Santo Oficio de la Inquisición de Zaragoza
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
7
8. LOCALIZAR, DIGITALIZAR Y EXTRAER EL
CONTEXTO SITUACIONAL DE LAS MISIVAS
ENCONTRADAS
FONDOS CONSULTADOS EN ESPAÑA
Archivo de la Villa de Madrid
- Corregimiento
Archivo Regional de Madrid
- Depósito de fondos municipales
Archivo de la Real Chancillería de Valladolid
- Real Audiencia y Chancillería de Valladolid
Archivo General de Simancas
- Cámara de Castilla
Archivo Histórico Provincial de Guadalajara
- Jurisdicción Provincial y Notarial
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
8
9. LOCALIZAR, DIGITALIZAR Y EXTRAER EL
CONTEXTO SITUACIONAL DE LAS MISIVAS
ENCONTRADAS
FONDOS CONSULTADOS EN ESPAÑA
Archivo Histórico de Asturias
- Fondos familiares y personales
Archivo Histórico del Reino de Galicia
- Real Audiencia de Galicia
Archivo Histórico Provincial de Pontevedra
- Jurisdicción municipal
Archivo Histórico Provincial de Orense
- Jurisdicción Provincial
Biblioteca Nacional de España
- Sección manuscritos
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
9
10. LOCALIZAR, DIGITALIZAR Y EXTRAER EL
CONTEXTO SITUACIONAL DE LAS MISIVAS
ENCONTRADAS
FONDOS CONSULTADOS EN ESPAÑA
Archivo Histórico de la Ciudad de Barcelona
Archivo Diocesano de Barcelona
- Expedientes e informaciones
Archivo de la Corona de Aragón
- Real Audiencia de Cataluña
Archivo Histórico Provincial de Murcia
Archivo Municipal de Murcia
- Corregimiento
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
10
11. LOCALIZAR, DIGITALIZAR Y EXTRAER EL
CONTEXTO SITUACIONAL DE LAS MISIVAS
ENCONTRADAS
FONDOS CONSULTADOS EN ESPAÑA
Archivo Municipal de Toledo
Archivo Histórico Provincial de Toledo
- Corregimientos de Orgaz y Talavera de la Reina
Archivo Municipal de Palencia
Archivo Catedralicio de Palencia
Archivo Arzobispal de Sevilla
Real Audiencia de Grados de Sevilla
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
11
12. PROBLEMÁTICA EN LA LOCALIZACIÓN
DE FONDOS
- Atomización de la Administración
de Justicia en la Edad Moderna
- Disgregación de la documentación
generada por los organismos
judiciales en Archivos de muy
distinto tipo
- Destrucción intencionada de
relevantes volúmenes documentales
- Desigual descripción archivística y
escasez de instrumentos de consulta
- Escasa representación de las clases
populares en la documentación
conservada por los estamentos
oficiales
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
12
13. EL TRABAJO EN POST SCRIPTUM
1. Localizar, digitalizar y extraer el contexto situacional de las
misivas encontradas
2. Edición digital:
- Transcripción XML (Extensible Mark-Up Language)
- Edición Filológica TEI (Text Encoding Initiative)
3. Anotación lingüística (FreeLing)
4. Análisis histórico-lingüístico:
- Apertura de nuevas líneas de investigación
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
13
16. EDICIÓN DIGITAL
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
16
<TEI.2>
<teiHeader> Extratexto
<fileDesc> <encodingDesc> <revisionDesc>
<titleStmt> <publicationStmt> <sourceDesc>
<text> Texto
<title>
<sponso>
<funder>
<respStmt>
project
coordination
transcription
revision
modernizedEdition
dataBaseDesignAndProgramming
WebDesignAndProgramming
supervision
<publisher>
<address>
<date>
<availability>
<pubPlace>
<letDesc>
<letIdentifier> <letIHeading> <physDesc> <envOcc> <letContents> <additional>
<country>
<settlement>
<institution>
<repository>
<collection>
<idno>
<note>
<author>
<addressee>
<note>
<type>
<support>
<extent>
<layout>
<decoration>
<condition>
<class type>
<class linguist.>
<class sociohis.>
<adminInfo>
<surrogates>
<note context>
<change
>
<data>
<respStmt>
<item>
<projectDesc>
<envelope> <body>
<opener>
<p>
<closer>
<ps>
Jerarquía de etiquetas XML para PS
Se destacan las etiquetas que hay que rellenar
para cada transcripción. Téngase en cuenta que:
- <date> varía una vez por año
- <country> para nosotros siempre España
- <decoration> solo si se da el caso
- <condition> solo si se da el caso
- <class linguist.> solo lingüistas
- <class socioHis.> solo historiadores
<placeLet>
<dateLet>
<p> <note modernizedText>
19. EL TRABAJO EN POST SCRIPTUM
1. Localizar, digitalizar y extraer el contexto situacional de las
misivas encontradas
2. Edición digital:
- Transcripción XML (Extensible Mark-Up Language)
- Edición Filológica TEI (Text Encoding Initiative)
3. Anotación lingüística (FreeLing)
4. Análisis histórico-lingüístico:
- Apertura de nuevas líneas de investigación
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
19
20. ANOTACIÓN LINGÜÍSTICA
- Medio para enriquecer el corpus seleccionado y transcrito
- Método para recuperar información
- Anotación de palabras dependiendo de su categoría gramatical
(partes del discurso / Parts of Speech / POS)
- Herramienta informática: FreeLing (Anotador automático
desarrollado para ocho idiomas)
- Posibilita el entrenamiento del sistema en función de las
necesidades específicas del corpus
- Diccionario
- Dificultad: Necesita una revisión manual
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
20
23. EL TRABAJO EN POST SCRIPTUM
1. Localizar, digitalizar y extraer el contexto situacional de las
misivas encontradas
2. Edición digital:
- Transcripción XML (Extensible Mark-Up Language)
- Edición Filológica TEI (Text Encoding Initiative)
3. Anotación lingüística (FreeLing)
4. Análisis histórico-lingüístico:
- Apertura de nuevas líneas de investigación
A
idade
dos
'desvios':
diacronia,
variação
social
e
linguística
de
corpus
23
24. ANÁLISIS HISTÓRICO-LINGÜÍSTICO
- Nuevas líneas de investigación:
- Estudios de pragmática textual en la Edad Moderna (influencia de las
situaciones comunicativas y de la condición social en las estrategias
discursivas)
- Atención a las fronteras en las sociedades a caballo entre la modernidad y la
postmodernidad superando las visiones etnocentristas y cronocentristas a
partir de testimonios generados por los protagonistas anónimos de los
fenómenos estudiados
- Análisis de la influencia de las características geográficas y culturales de los
individuos en su producción escrita atendiendo especialmente a la escritura
epistolar
- Viabilidad de los corpora discursivos: ¿Es posible elaborar un sistema de
anotación de corpus extrapolable a otros idiomas?
A
idade
dos
'desvios':
diacronia,variação
social
e
linguística
de
corpus
24
25. RESULTADOS (10 de octubre de 2014)
SIGLO XVI SIGLO XVII SIGLO XVIII SIGLO XIX TOTAL
ESPAÑA 367 1235 1468 506 3576
PORTUGAL 245 721 976 784 2726
A
idade
dos
'desvios':
diacronia,variação
social
e
linguística
de
corpus
25
Cartas encontradas
Cartas transcritas
SIGLO XVI SIGLO XVII SIGLO XVIII SIGLO XIX TOTAL
ESPAÑA 116 285 395 248 1044
PORTUGAL 68 246 349 780 1443