SlideShare una empresa de Scribd logo
1 de 12
Los corpus electrónicos
• Paloma Ibis Sorribes Miñana
• Curso: 2º Traducción y Comunicación
Intercultural
• Asignatura: Traducción asistida por ordenador
• Profesor/a: Gisela Abad
1. ¿Qué son?
• Un corpus lingüístico es una colección más o menos extensa de textos o de
fragmentos de ellos en soporte electrónico.
• Su principal característica es la representatividad del estado o sector de la
lengua seleccionado.
• Su objetivo es constituirse en elementos de referencia para el estudio de
una frase concreta o un cierto aspecto de una lengua (p.e.: los corpus
textuales que facilitan el estudio del español en los dialectos
latinoamericanos).
2. Tipos de corpus
En general, los principales parámetros para clasificar los corpus se centran en:
• La modalidad de la lengua: corpus orales, corpus textuales o corpus mixtos.
• El número de lenguas a que pertenecen los textos: monolingües, bilingües o multilingües.
• El tamaño o cantidad de textos que conforman el corpus: corpus grandes, equilibrados y
piramidales.
• Los límites del corpus : corpus cerrados o abiertos (también llamados corpus monitor).
• La variedad lingüística o el grado de especialización de los textos:
 Generales o especializados.
 Genéricos o canónicos.
• El período temporal que abarcan los textos:
 Periódicos o cronológicos.
 Diacrónicos o históricos (a través del tiempo), diferenciándose de los sincrónicos (presente).
• El tratamiento aplicado al corpus:
 Corpus simples.
 Corpus verticales.
 Corpus simplificados o anotados.
De todos modos, debido al límite de tiempo, en esta exposición se va a tratar solamente tres tipos de
corpus muy diferenciados entre sí según la modalidad utilizada (es decir, el primer criterio de
clasificación de la lista).
3. Los corpus orales
• Sirven para el estudio de una lengua desde un
determinado aspecto (p.e., los dialectos).
• Únicamente recogen muestras de lengua hablada.
• El objetivo no es tanto el análisis de las características
de tipo fonético, sino la obtención de una
transcripción ortográfica de la lengua hablada.
Algunos corpus orales
• ACUAH: Análisis de la conversación de la Universidad de Alcalá de Henares. Cedido por
la Universidad de Alcalá de Henares, Madrid.
• ALFAL: Macrocorpus de la Norma Lingüística Culta de las Principales Ciudades del
Mundo Hispánico. Cedido por la Asociación de Lingüística y Filología de América Latina.
• The Bergen Corpus of London Teenage Language (COLT) es un corpus de medio millón
de palabras cuyo objetivo fundamental es dar cuenta del dialecto de los adolescentes
de Londres y, por tanto, servir como punto de referencia para estudios de índole
lingüística.
• Corpus Oral de Lenguaje Adolescente (COLA): características similares al COLT.
• Corpus de Conversación Coloquial: también similar al COLT.
• Grabaciones orales.
4. Los corpus textuales
• Conjunto de datos, textos u otros materiales sobre
determinadas materias que pueden servir de base para una
investigación o trabajo. Están conformados exclusivamente
por muestras de lengua escrita.
• Son de gran ayuda para el uso de términos, lexicografía,
neologismos… en las traducciones.
• También se utilizan para otros fines, como la realización de
análisis estadísticos o la validación de reglas lingüísticas
dentro de un territorio específico de una lengua.
Algunos corpus textuales
• Thesaurus Linguae Graecae (sobre griego antiguo).
• Eastern Armenian National Corpus (EANC)
(110 millones palabras).
• National Corpus of Polish.
• German Reference Corpus (DeReKo) (más de 4 billones
de palabras de alemán contemporáneo).
• Corpus textual español (Molino de Ideas) (660 millones
de palabras).
• Turkish National Corpus [5]
5. Los corpus mixtos
• Los corpus mixtos combinan ambas
modalidades de lengua, aunque siempre
favoreciendo la escrita, ya que su obtención es
menos costosa que la de la lengua oral.
Algunos corpus mixtos
• El Corpus de Referencia del Español Actual (CREA)
• El British National Corpus (BNC)
• Afasia: Corpus mixto de lenguaje conversacional
(libro), publicado por Carlos Hernández Sacristán,
Enrique Serra Alegre y Montserrat Veyrat Rigat.
Índice
• 1. ¿Qué son?
• 2. Tipos de corpus
• 3. Los corpus orales
• 4. Los corpus textuales
• 5. Los corpus mixtos
Bibliografía
http://www.wordreference.com/definicion/Corpus%20textual%20del%20castel
http://liceu.uab.cat/~joaquim/publicacions/Torruella_Llisterri_99.pdf
http://www.elplacerdetraducir.com/note/traducir-con-corpus
http://www.scielo.cl/scielo.php?pid=S071848832012000200002&script=sci_arttext
http://elies.rediris.es/elies18/23.html
http://fhyc.unileon.es/Milka/LCII/Corpus4.pdf
http://en.wikipedia.org/wiki/Text_corpus
http://roderic.uv.es/handle/10550/29005
Observaciones
• Personalmente para mí, la búsqueda de información sobre los corpus ha
resultado ser una tarea nada fácil, ya que en la red no parece haber tanta
información concreta sobre ellos como debería –definiciones de los
mismos, objetivos, utilización–.
• Tampocohe podido disponer de mucha información en los libros, ya que
no disponía de obras escritas que hablaran sobre ellos al ser una
herramienta de reciente aparición.
• He hallado mucho ruido informativo en mi búsqueda en la red incluso con
la utilización constante de buscadores booleanos, lo cual no ha
contribuido tanto a la eficacia de mi búsqueda como yo hubiera deseado.

Más contenido relacionado

La actualidad más candente

Plantilla de recogida de datos sobre lectura
Plantilla de recogida de datos sobre lecturaPlantilla de recogida de datos sobre lectura
Plantilla de recogida de datos sobre lecturaCEDEC
 
La lengua y el habla
La lengua y el hablaLa lengua y el habla
La lengua y el hablaJoseangel__c
 
Los lenguajes específicos-Bachillerato
Los lenguajes específicos-BachilleratoLos lenguajes específicos-Bachillerato
Los lenguajes específicos-Bachilleratovgarcialyl
 
La lingüística
La lingüísticaLa lingüística
La lingüísticaesantosf
 
Gramatica transformacional
Gramatica transformacionalGramatica transformacional
Gramatica transformacionalSantiago Andres
 
Historia de-la-linguistica
Historia de-la-linguistica Historia de-la-linguistica
Historia de-la-linguistica Tahia Saavedra
 
Plantilla de trabajo en torno a los prejuicios lingüísticos
Plantilla de trabajo en torno a los prejuicios lingüísticosPlantilla de trabajo en torno a los prejuicios lingüísticos
Plantilla de trabajo en torno a los prejuicios lingüísticosCEDEC
 
El Yo DetráS Del Lenguaje
El Yo DetráS Del LenguajeEl Yo DetráS Del Lenguaje
El Yo DetráS Del LenguajePaloma Botero
 
Introduccion a la linguistica coseriu
Introduccion a la linguistica coseriuIntroduccion a la linguistica coseriu
Introduccion a la linguistica coseriuMarcela Tornier
 
Estudio cientifico del lenguaje
Estudio cientifico del lenguajeEstudio cientifico del lenguaje
Estudio cientifico del lenguajerogervec
 
UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)
UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)
UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)Videoconferencias UTPL
 
Plantilla de observación de una biografía
Plantilla de observación de una biografíaPlantilla de observación de una biografía
Plantilla de observación de una biografíaCEDEC
 
01. guia lengua_materna_1
01. guia lengua_materna_101. guia lengua_materna_1
01. guia lengua_materna_1Ustadistancia
 
Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...
Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...
Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...Nancy Quiroga
 

La actualidad más candente (20)

2 marcoteórico
2 marcoteórico2 marcoteórico
2 marcoteórico
 
Plantilla de recogida de datos sobre lectura
Plantilla de recogida de datos sobre lecturaPlantilla de recogida de datos sobre lectura
Plantilla de recogida de datos sobre lectura
 
La lengua y el habla
La lengua y el hablaLa lengua y el habla
La lengua y el habla
 
Los lenguajes específicos-Bachillerato
Los lenguajes específicos-BachilleratoLos lenguajes específicos-Bachillerato
Los lenguajes específicos-Bachillerato
 
La lingüística
La lingüísticaLa lingüística
La lingüística
 
Historia de la lingüística
Historia de la lingüísticaHistoria de la lingüística
Historia de la lingüística
 
Gramatica transformacional
Gramatica transformacionalGramatica transformacional
Gramatica transformacional
 
Mother tongue 1
Mother tongue 1Mother tongue 1
Mother tongue 1
 
Historia de-la-linguistica
Historia de-la-linguistica Historia de-la-linguistica
Historia de-la-linguistica
 
Lengua y literatura
Lengua y literatura Lengua y literatura
Lengua y literatura
 
Plantilla de trabajo en torno a los prejuicios lingüísticos
Plantilla de trabajo en torno a los prejuicios lingüísticosPlantilla de trabajo en torno a los prejuicios lingüísticos
Plantilla de trabajo en torno a los prejuicios lingüísticos
 
El Yo DetráS Del Lenguaje
El Yo DetráS Del LenguajeEl Yo DetráS Del Lenguaje
El Yo DetráS Del Lenguaje
 
La lingüística como ciencia
La lingüística como cienciaLa lingüística como ciencia
La lingüística como ciencia
 
Introduccion a la linguistica coseriu
Introduccion a la linguistica coseriuIntroduccion a la linguistica coseriu
Introduccion a la linguistica coseriu
 
Estudio cientifico del lenguaje
Estudio cientifico del lenguajeEstudio cientifico del lenguaje
Estudio cientifico del lenguaje
 
UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)
UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)
UTPL-INTRODUCCIÓN A LA LINGUÍSTICA-(OCTUBRE 2011-FEBRERO 2012)
 
Plantilla de observación de una biografía
Plantilla de observación de una biografíaPlantilla de observación de una biografía
Plantilla de observación de una biografía
 
01. guia lengua_materna_1
01. guia lengua_materna_101. guia lengua_materna_1
01. guia lengua_materna_1
 
Evolución de la lingüística
Evolución de la lingüísticaEvolución de la lingüística
Evolución de la lingüística
 
Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...
Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...
Lingüística y Gramática; Un poco de historia sobre Gramática; Concepto; Tipos...
 

Destacado

surge certificate
surge certificatesurge certificate
surge certificateNeel Shah
 
2014 annual R&D summary final
2014 annual R&D summary final2014 annual R&D summary final
2014 annual R&D summary finalRachel King
 
Diccionarios y corpus electrónicos como herramientas del traductor
Diccionarios y corpus electrónicos como herramientas del traductorDiccionarios y corpus electrónicos como herramientas del traductor
Diccionarios y corpus electrónicos como herramientas del traductorGisela Abad UE Valencia
 
Unclenching, the fist discovered a caress inside it
Unclenching, the fist discovered a caress inside itUnclenching, the fist discovered a caress inside it
Unclenching, the fist discovered a caress inside itAngelos Michalopoulos
 
First project, streatham
First project, streathamFirst project, streatham
First project, streathamFidel Karim
 
IP summative essay
IP summative essayIP summative essay
IP summative essayLee Tudor
 
Human Hair Extensions In Australia
Human Hair Extensions In AustraliaHuman Hair Extensions In Australia
Human Hair Extensions In Australiaelishaclark28
 
Que es un marcador web
Que es un marcador webQue es un marcador web
Que es un marcador webLena Vargas
 
Empathetic Communication
Empathetic CommunicationEmpathetic Communication
Empathetic Communicationnooru1987
 
كتاب الخرائط الذهنية لسور القرآن
كتاب الخرائط الذهنية لسور القرآنكتاب الخرائط الذهنية لسور القرآن
كتاب الخرائط الذهنية لسور القرآنYassin Balja
 

Destacado (18)

surge certificate
surge certificatesurge certificate
surge certificate
 
2014 annual R&D summary final
2014 annual R&D summary final2014 annual R&D summary final
2014 annual R&D summary final
 
Diccionarios y corpus electrónicos como herramientas del traductor
Diccionarios y corpus electrónicos como herramientas del traductorDiccionarios y corpus electrónicos como herramientas del traductor
Diccionarios y corpus electrónicos como herramientas del traductor
 
Unclenching, the fist discovered a caress inside it
Unclenching, the fist discovered a caress inside itUnclenching, the fist discovered a caress inside it
Unclenching, the fist discovered a caress inside it
 
First project, streatham
First project, streathamFirst project, streatham
First project, streatham
 
IP summative essay
IP summative essayIP summative essay
IP summative essay
 
Porrusalda
PorrusaldaPorrusalda
Porrusalda
 
A Multichannel Analytics Roadmap
A Multichannel Analytics RoadmapA Multichannel Analytics Roadmap
A Multichannel Analytics Roadmap
 
Human Hair Extensions In Australia
Human Hair Extensions In AustraliaHuman Hair Extensions In Australia
Human Hair Extensions In Australia
 
Rodney Sims Resume
Rodney Sims ResumeRodney Sims Resume
Rodney Sims Resume
 
Ossobuco asado
Ossobuco asadoOssobuco asado
Ossobuco asado
 
Tips
TipsTips
Tips
 
Voeux 2017 b.muscolo
Voeux 2017 b.muscolo Voeux 2017 b.muscolo
Voeux 2017 b.muscolo
 
Adolescent Medical Home Policy Brief July 2016. Tebb, K.P., Pica, G., Peake, ...
Adolescent Medical Home Policy Brief July 2016. Tebb, K.P., Pica, G., Peake, ...Adolescent Medical Home Policy Brief July 2016. Tebb, K.P., Pica, G., Peake, ...
Adolescent Medical Home Policy Brief July 2016. Tebb, K.P., Pica, G., Peake, ...
 
Mobile Integrated Health Care - Community Paramedicine: A Resource for Commun...
Mobile Integrated Health Care - Community Paramedicine: A Resource for Commun...Mobile Integrated Health Care - Community Paramedicine: A Resource for Commun...
Mobile Integrated Health Care - Community Paramedicine: A Resource for Commun...
 
Que es un marcador web
Que es un marcador webQue es un marcador web
Que es un marcador web
 
Empathetic Communication
Empathetic CommunicationEmpathetic Communication
Empathetic Communication
 
كتاب الخرائط الذهنية لسور القرآن
كتاب الخرائط الذهنية لسور القرآنكتاب الخرائط الذهنية لسور القرآن
كتاب الخرائط الذهنية لسور القرآن
 

Similar a Córpora electrónicos

Corpora monolingües
Corpora monolingüesCorpora monolingües
Corpora monolingüesaeligo
 
Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5
Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5
Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5José Antonio Rubio Palazón
 
Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.
Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.
Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.DanuvisGutirrez
 
Folleto gramática
Folleto gramáticaFolleto gramática
Folleto gramáticaFann Andrade
 
Historia de la Lengua Española (clase introducción) 2014.ppt
Historia de la Lengua Española (clase introducción) 2014.pptHistoria de la Lengua Española (clase introducción) 2014.ppt
Historia de la Lengua Española (clase introducción) 2014.pptMaricRodrguezGalloMa
 
Origen, actualidad del español. Las variedades de la lengua.
Origen, actualidad del español. Las variedades de la lengua.Origen, actualidad del español. Las variedades de la lengua.
Origen, actualidad del español. Las variedades de la lengua.Rosa Malrás
 
Multilinguismo en el perú
Multilinguismo en el perúMultilinguismo en el perú
Multilinguismo en el perúELICHA2013
 
La situación lingüistica del español actual
La situación lingüistica del español actualLa situación lingüistica del español actual
La situación lingüistica del español actualCarmen María Espino Mesa
 
Clases De Diccionarios
Clases De Diccionarios Clases De Diccionarios
Clases De Diccionarios Osmany Beltran
 
Contenidos mínimos 1º Bachillerato
Contenidos mínimos 1º BachilleratoContenidos mínimos 1º Bachillerato
Contenidos mínimos 1º BachilleratoAJuani ACruz Lengua
 
Presentación de la asignatura 1
Presentación de la asignatura 1Presentación de la asignatura 1
Presentación de la asignatura 1Irenecalvods
 
Presentación de la asignatura 1º
Presentación de la asignatura 1ºPresentación de la asignatura 1º
Presentación de la asignatura 1ºIrenecalvods
 
Presentación de la asignatura 2º
Presentación de la asignatura 2ºPresentación de la asignatura 2º
Presentación de la asignatura 2ºIrenecalvods
 

Similar a Córpora electrónicos (20)

Corpora m..
Corpora m..Corpora m..
Corpora m..
 
Corpora monolingües
Corpora monolingüesCorpora monolingües
Corpora monolingües
 
Corpora m..
Corpora m..Corpora m..
Corpora m..
 
Tipos de Corpus
Tipos de CorpusTipos de Corpus
Tipos de Corpus
 
Niveles Del Habla
Niveles Del HablaNiveles Del Habla
Niveles Del Habla
 
Lh 12
Lh 12Lh 12
Lh 12
 
Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5
Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5
Antolin castro gallardo_munto_rubio_serrano_power rae_grupo 5
 
Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.
Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.
Diapositivas sobre Reseña Crítica: Lingüística de Corpus- Giovanni Parodi.
 
Folleto gramática
Folleto gramáticaFolleto gramática
Folleto gramática
 
Historia de la Lengua Española (clase introducción) 2014.ppt
Historia de la Lengua Española (clase introducción) 2014.pptHistoria de la Lengua Española (clase introducción) 2014.ppt
Historia de la Lengua Española (clase introducción) 2014.ppt
 
Origen, actualidad del español. Las variedades de la lengua.
Origen, actualidad del español. Las variedades de la lengua.Origen, actualidad del español. Las variedades de la lengua.
Origen, actualidad del español. Las variedades de la lengua.
 
Multilinguismo en el perú
Multilinguismo en el perúMultilinguismo en el perú
Multilinguismo en el perú
 
NOCIONES LINGUISTICAS
NOCIONES LINGUISTICASNOCIONES LINGUISTICAS
NOCIONES LINGUISTICAS
 
La situación lingüistica del español actual
La situación lingüistica del español actualLa situación lingüistica del español actual
La situación lingüistica del español actual
 
Clases De Diccionarios
Clases De Diccionarios Clases De Diccionarios
Clases De Diccionarios
 
Antropología filosófica, el símbolo y el signo
Antropología filosófica, el símbolo y el signoAntropología filosófica, el símbolo y el signo
Antropología filosófica, el símbolo y el signo
 
Contenidos mínimos 1º Bachillerato
Contenidos mínimos 1º BachilleratoContenidos mínimos 1º Bachillerato
Contenidos mínimos 1º Bachillerato
 
Presentación de la asignatura 1
Presentación de la asignatura 1Presentación de la asignatura 1
Presentación de la asignatura 1
 
Presentación de la asignatura 1º
Presentación de la asignatura 1ºPresentación de la asignatura 1º
Presentación de la asignatura 1º
 
Presentación de la asignatura 2º
Presentación de la asignatura 2ºPresentación de la asignatura 2º
Presentación de la asignatura 2º
 

Más de Gisela Abad UE Valencia (20)

Aplicaciones móviles
Aplicaciones móvilesAplicaciones móviles
Aplicaciones móviles
 
Proz
ProzProz
Proz
 
Canales de vídeo
Canales de vídeoCanales de vídeo
Canales de vídeo
 
Twitter
TwitterTwitter
Twitter
 
Dirección General de Traducción
Dirección General de TraducciónDirección General de Traducción
Dirección General de Traducción
 
Translator's cafe
Translator's cafeTranslator's cafe
Translator's cafe
 
Google
GoogleGoogle
Google
 
Wikis
WikisWikis
Wikis
 
Pinterest
PinterestPinterest
Pinterest
 
Blogs de traducción
Blogs de traducciónBlogs de traducción
Blogs de traducción
 
Zotero
ZoteroZotero
Zotero
 
Evernote
EvernoteEvernote
Evernote
 
Marcadores sociales
Marcadores socialesMarcadores sociales
Marcadores sociales
 
Periódicos electrónicos
Periódicos electrónicosPeriódicos electrónicos
Periódicos electrónicos
 
Podcasts
PodcastsPodcasts
Podcasts
 
Wordpress
WordpressWordpress
Wordpress
 
CMapTools
CMapToolsCMapTools
CMapTools
 
Almacenamiento en la nube
Almacenamiento en la nubeAlmacenamiento en la nube
Almacenamiento en la nube
 
Revistas electrónicas
Revistas electrónicasRevistas electrónicas
Revistas electrónicas
 
Diccionarios electrónicos
Diccionarios electrónicosDiccionarios electrónicos
Diccionarios electrónicos
 

Último

Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 

Último (19)

Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 

Córpora electrónicos

  • 1. Los corpus electrónicos • Paloma Ibis Sorribes Miñana • Curso: 2º Traducción y Comunicación Intercultural • Asignatura: Traducción asistida por ordenador • Profesor/a: Gisela Abad
  • 2. 1. ¿Qué son? • Un corpus lingüístico es una colección más o menos extensa de textos o de fragmentos de ellos en soporte electrónico. • Su principal característica es la representatividad del estado o sector de la lengua seleccionado. • Su objetivo es constituirse en elementos de referencia para el estudio de una frase concreta o un cierto aspecto de una lengua (p.e.: los corpus textuales que facilitan el estudio del español en los dialectos latinoamericanos).
  • 3. 2. Tipos de corpus En general, los principales parámetros para clasificar los corpus se centran en: • La modalidad de la lengua: corpus orales, corpus textuales o corpus mixtos. • El número de lenguas a que pertenecen los textos: monolingües, bilingües o multilingües. • El tamaño o cantidad de textos que conforman el corpus: corpus grandes, equilibrados y piramidales. • Los límites del corpus : corpus cerrados o abiertos (también llamados corpus monitor). • La variedad lingüística o el grado de especialización de los textos:  Generales o especializados.  Genéricos o canónicos. • El período temporal que abarcan los textos:  Periódicos o cronológicos.  Diacrónicos o históricos (a través del tiempo), diferenciándose de los sincrónicos (presente). • El tratamiento aplicado al corpus:  Corpus simples.  Corpus verticales.  Corpus simplificados o anotados. De todos modos, debido al límite de tiempo, en esta exposición se va a tratar solamente tres tipos de corpus muy diferenciados entre sí según la modalidad utilizada (es decir, el primer criterio de clasificación de la lista).
  • 4. 3. Los corpus orales • Sirven para el estudio de una lengua desde un determinado aspecto (p.e., los dialectos). • Únicamente recogen muestras de lengua hablada. • El objetivo no es tanto el análisis de las características de tipo fonético, sino la obtención de una transcripción ortográfica de la lengua hablada.
  • 5. Algunos corpus orales • ACUAH: Análisis de la conversación de la Universidad de Alcalá de Henares. Cedido por la Universidad de Alcalá de Henares, Madrid. • ALFAL: Macrocorpus de la Norma Lingüística Culta de las Principales Ciudades del Mundo Hispánico. Cedido por la Asociación de Lingüística y Filología de América Latina. • The Bergen Corpus of London Teenage Language (COLT) es un corpus de medio millón de palabras cuyo objetivo fundamental es dar cuenta del dialecto de los adolescentes de Londres y, por tanto, servir como punto de referencia para estudios de índole lingüística. • Corpus Oral de Lenguaje Adolescente (COLA): características similares al COLT. • Corpus de Conversación Coloquial: también similar al COLT. • Grabaciones orales.
  • 6. 4. Los corpus textuales • Conjunto de datos, textos u otros materiales sobre determinadas materias que pueden servir de base para una investigación o trabajo. Están conformados exclusivamente por muestras de lengua escrita. • Son de gran ayuda para el uso de términos, lexicografía, neologismos… en las traducciones. • También se utilizan para otros fines, como la realización de análisis estadísticos o la validación de reglas lingüísticas dentro de un territorio específico de una lengua.
  • 7. Algunos corpus textuales • Thesaurus Linguae Graecae (sobre griego antiguo). • Eastern Armenian National Corpus (EANC) (110 millones palabras). • National Corpus of Polish. • German Reference Corpus (DeReKo) (más de 4 billones de palabras de alemán contemporáneo). • Corpus textual español (Molino de Ideas) (660 millones de palabras). • Turkish National Corpus [5]
  • 8. 5. Los corpus mixtos • Los corpus mixtos combinan ambas modalidades de lengua, aunque siempre favoreciendo la escrita, ya que su obtención es menos costosa que la de la lengua oral.
  • 9. Algunos corpus mixtos • El Corpus de Referencia del Español Actual (CREA) • El British National Corpus (BNC) • Afasia: Corpus mixto de lenguaje conversacional (libro), publicado por Carlos Hernández Sacristán, Enrique Serra Alegre y Montserrat Veyrat Rigat.
  • 10. Índice • 1. ¿Qué son? • 2. Tipos de corpus • 3. Los corpus orales • 4. Los corpus textuales • 5. Los corpus mixtos
  • 12. Observaciones • Personalmente para mí, la búsqueda de información sobre los corpus ha resultado ser una tarea nada fácil, ya que en la red no parece haber tanta información concreta sobre ellos como debería –definiciones de los mismos, objetivos, utilización–. • Tampocohe podido disponer de mucha información en los libros, ya que no disponía de obras escritas que hablaran sobre ellos al ser una herramienta de reciente aparición. • He hallado mucho ruido informativo en mi búsqueda en la red incluso con la utilización constante de buscadores booleanos, lo cual no ha contribuido tanto a la eficacia de mi búsqueda como yo hubiera deseado.