SlideShare una empresa de Scribd logo
1 de 10
Realizado por Rocío Magali Unzeta, alumna del Profesorado y Traductorado de Inglés.
TRADUCCIÓN AUTOMÁTICA (TA)………………………………….. Pág.2
Concepto…………………………………………………………………….. Pág.2
Historia……………………………………………………………………….. Pág.2 y 3
Clasificación de las Memorias de Traducción Asistida (MTA) Pág.3
Diferentes enfoques………………………………………….…………. Pág.3
Beneficios……………………………………………………………………. Pág.4
Obstáculos…………………………………………………………………… Pág.4
MEMORIA DE TRADUCCIÓN (MT)………………………………….. Pág.5
Concepto…………………………………………………………………….. Pág.5
¿Qué es un corpus lingüístico?.......................................... Pág.5
Usos……………………………………………………………………………. Págs.5 y 6
Beneficios……………………………………………………………………. Pág.6
Obstáculos…………………………………………………………………… Pág.6
TRADUCCIÓN ASISTIDA por ORDENADOR (TAO)……………. Pág.7
Concepto……………………………………………………………………... Pág.7
Características………………………………………………………………. Pág.7
CAT TOOLS………………………………………………………………….. Págs.8 y 9
1
La traducción automática (TA o MT, esta última del inglés machine
translation) es un área de la lingüística computacional que investiga el uso
de software para traducir texto o habla de un lenguaje natural a otro. 1
Aunque la aparición de las primeras concepciones de traducción
automática se remonta al siglo XVII, fue en la década de 1950 cuando la
investigación financiada por el gobierno de Estados Unidos potenció el interés
internacional por la investigación y la producción de sistemas de traducción
automática.
La primera demostración pública de un sistema de traducción automática,
que tradujo 250 palabras entre el ruso y el inglés, tuvo lugar en EE. UU. en 1954.
En ella se aplicó un enfoque centrado en la traducción literal. Esta arquitectura
de primera generación se basaba en diccionarios y trataba de que coincidiera el
texto de la lengua de partida con el de la lengua de destino palabra por palabra,
es decir, que traducía literalmente.
A finales de 1970 y principios de 1980, la investigación se centró más en
el enfoque de la transferencia. En esta arquitectura, el texto de partida se
analizaba a través de un diccionario de la lengua de origen y se transformaba en
una fórmula abstracta. Esta fórmula se traducía a otra fórmula abstracta del texto
de destino a través de un diccionario bilingüe y posteriormente se convertía en
un texto de destino final con un diccionario en la lengua final.
En los años 1990, las investigaciones dieron como resultado una tercera
generación de sistemas de traducción automática: las arquitecturas basadas en
corpus, concretamente los enfoques estadístico y basado en ejemplos. El
enfoque estadístico divide el texto de partida en segmentos que luego compara
con un corpus bilingüe alineado utilizando las probabilidades de evidencia
estadística y de distorsión con el fin de elegir la traducción más adecuada. El
enfoque basado en ejemplos imita las combinaciones de ejemplos de datos pre
traducidos en la base de datos. Para que este enfoque funcionara correctamente,
la base de datos debía contener concordancias que se aproximaran a las del
texto de partida. Este enfoque sienta las bases de las herramientas con
memorias de traducción asistida.
1
https://es.wikipedia.org/wiki/Traducci%C3%B3n_autom%C3%A1tica
2
Los últimos desarrollos en el área de la traducción automática han incluido
la incorporación de un aprendizaje profundo y de redes neuronales que permiten
aumentar la precisión. Los proveedores de servicios lingüísticos actualmente
ofrecen motores de traducción automática en los que además de incorporar la
terminología de un ámbito específico como, por ejemplo, las ciencias de la salud,
el sector turístico o la informática, el usuario puede cargar sus propios registros
de traducción para tratar de mejorar la precisión, el estilo y la calidad de los
resultados que se consiguen con la traducción automática.
El día 15 de noviembre 2016, Google anunció que iba a empezar a
emplear la traducción automática neural en su herramienta Google Translate. Ha
empezado a usarlo con un total de ocho combinaciones de idiomas, con el inglés
como lengua de partida y destino, combinado con francés, alemán, español,
portugués, chino, japonés, coreano y turco.2
 Traducción automática basada en reglas, ésta consiste en realizar
transformaciones a partir del original, reemplazando las palabras por su
equivalente más apropiado. Al conjunto de este tipo de transformaciones
del texto original se le llama predicción de textos.
 Traducción automática basada en corpus lingüístico, ésta se basa en el
análisis de muestras reales con sus respectivas traducciones.
 Traducción automática basada en el contexto, ésta utiliza técnicas
basadas en hallar la mejor traducción para una palabra fijándose en el
resto de palabras que la rodean, básicamente este método se basa en
tratar el texto en unidades de entre 4 y 8 palabras, de manera que se
traduce cada una de ellas por su traducción al idioma destino, y se
eliminan las traducciones que han generado una "frase" sin sentido.
Luego, se mueve la ventana una posición (palabra), retraduciendo la
mayoría de ellas de nuevo y volviendo a filtrar dejando sólo las frases
coherentes. Se repite dicho paso para todo el texto. Y luego se pasa a
concatenar los resultados de dichas ventanas de manera que se logre una
única traducción del texto.3
Como este diagrama muestra, se distinguen
típicamente tres enfoques principales: los
enfoques directos, los de interlingua y los
de transferencia. Esta pirámide se basa en
las diferencias de "longitudes relativas" de los
tres componentes de la traducción: análisis,
transferencia y síntesis o generación. 4
2 https://estudiotraductor.es/historia-de-traduccion-automatica/
3
https://es.wikipedia.org/wiki/Traducci%C3%B3n_autom%C3%A1tica#Tipos_de_traduc
ci%C3%B3n_autom%C3%A1tica
4
http://elies.rediris.es/elies9/3-2.htm
:
3
 Expansión rápida: se trata de un servicio que permite traducir contenidos
sencillos en poco tiempo. De esta forma aligera los trabajos de
traducción al combinarse el trabajo humano con el automático con el fin
último de lograr una comunicación global de calidad.
 Reducción de costos: favorece el control de los gastos, ya que supone
un ahorro frente a otros servicios de traducción.
 Incremento del volumen de traducciones: es una forma sencilla y barata
de que tu entidad financiera aumente su cantidad de contenido traducido
en distintos idiomas para poder llegar a los mercados elegidos y fomentar
el crecimiento internacional del negocio.
 Calidad: la traducción humana no es capaz de realizar traducciones
idénticas en dos idiomas distintos, mientras que la traducción automática
a veces no tiene sentido o es demasiado forzada. Por ello, lo que separado
puede suponer una pérdida de la calidad si se aúnan consiguen una
traducción rigurosa y de precisión semántica, gramatical y de sintaxis.
 Minimización del esfuerzo del cliente: se le ofrece un servicio
personalizado y adaptado al negocio con una atención individualizada.
 Mayor seguridad: cuando se trabaja con documentos financieros, de
investigación o de organigrama los datos suelen ser confidenciales y la
traducción automática preserva su confidencialidad al alojarse en un
entorno seguro. De esta manera es más fácil evitar el espionaje comercial.
 Se puede utilizar en ciertas combinaciones lingüísticas.
 Integración: es necesario adecuar las definiciones funcionales, los costes
y los esfuerzos.
 Siempre requiere pos edición humana: ya sea una revisión superficial o
una traducción rigurosa dependiendo del documento a traducir. La clave
es no prescindir de la calidad, ya que si se utiliza solo la traducción
automática pueden darse errores.
 Depende de un entrenamiento previo del motor de traducción.
 Los motores de traducción dependen del sector: por cada área se genera
un motor de traducción dado que las expresiones, conceptos y segmentos
son totalmente diferentes en cada campo.5
5
https://blog.linguaserve.com/ventajas-y-desventajas-de-la-traduccion-automatica
4
Una memoria de traducción es una conocida función de los sistemas de
traducción asistida por ordenador que facilita el proceso de traducción. Una
memoria de traducción es básicamente una pequeña o gran base de datos que
almacena información según va trabajando el traductor. Esta información se
basa en el concepto de frase fuente y frase meta.6
Un corpus lingüístico es un conjunto amplio y estructurado de ejemplos
reales de uso de la lengua. Estos ejemplos pueden ser textos (los más comunes),
o muestras orales (generalmente transcritas) . Un corpus lingüístico es un
conjunto de textos relativamente grande, creado independientemente de sus
posibles formas o usos. Es decir, en cuanto a su estructura, variedad y
complejidad, un corpus debe reflejar una lengua, o su modalidad, de la forma
más exacta posible; en cuanto a su uso, preocuparse de que su representación
sea real. Los corpus tienen similitudes con los textos porque están compuestos
por ellos, por otro lado, no son textos en sí, porque a diferencia de los mismos,
no tiene sentido analizarlos en su totalidad. Un texto tiene un principio y un fin, y
es cohesivo y coherente en mayor o menor grado, mientras que un corpus carece
de tales características por no poseer una estructura, sino sólo una composición.
Por esta razón conviene analizar un corpus recurriendo a herramientas y
metodología propias.
Debido a su tamaño, accesibilidad, información lingüística y
enciclopédica, muy alta fiabilidad y otras particularidades, la compilación de los
corpus ha llegado a ser uno de los principales, si no el principal, método e
instrumento de la investigación de la lengua en la lingüística general.7
Un traductor proporciona en primera instancia un texto fuente (el texto a
traducir) a la memoria de traducción. El programa analizará el texto e intentará
encontrar en su base de datos pares de segmentos en los que el texto coincida
con otros previamente traducidos. El programa presenta al traductor cualquier
coincidencia para que la revise. El traductor puede aceptar la propuesta,
rechazarla o modificarla y usar esa versión modificada. Es este caso, la versión
modificada se almacena en la base de datos.
6
https://pangeanic.es/conocimiento/que-es-una-memoria-de-traduccion/
7
https://es.wikipedia.org/wiki/Corpus_ling%C3%BC%C3%ADstico
5
Algunos sistemas de memorias de traducción solo buscan coincidencias
del 100 %, es decir, coincidencias exactas. Otros utilizan algoritmos de
coincidencias para obtener segmentos parecidos.
Los segmentos en los que no encuentran coincidencias deberán ser
traducidos manualmente. El resultado se almacenará en la base de datos para
ser usado por el programa en posteriores sesiones. El uso de memorias de
traducción es más útil en textos repetitivos como manuales técnicos. También
son útiles para hacer traducciones incrementales de documentos traducidos
anteriormente. Si un traductor de memoria se usa de forma consistente durante
un cierto tiempo puede ahorrar un trabajo considerable a los traductores.
 Aseguran que el documento es traducido en su totalidad (no se aceptan
segmentos vacíos).
 Aseguran que los documentos traducidos son coherentes, incluidas
definiciones comunes, fraseología y terminología. Esto es importante
cuando diferentes traductores trabajan en el mismo documento.
 Permiten a los traductores trabajar con una amplia variedad de formatos
sin tener que disponer de software requerido para procesar dichos
formatos.
 Aceleran el proceso global de la traducción. Puesto que «recuerdan»
material traducido anteriormente, los traductores solo tienen que traducirlo
una vez.
 El concepto de memoria de traducción se basa en la premisa de que las
frases traducidas pueden ser «recicladas». Sin embargo, un principio
fundamental de la traducción es que se debe traducir el mensaje
contenido en el texto, no las frases que lo componen.
 En la actualidad los MT no disponen de filtros para todos los formatos de
texto existentes.
 Hay una curva de aprendizaje asociada al uso de los gestores de MT y
los programas deben ser personalizados para una mayor eficacia.
 El mantenimiento de las bases de datos generadas sigue siendo un
proceso manual que requiere un trabajo constante. Las carencias en este
mantenimiento suponen una reducción del rendimiento, la usabilidad y las
prestaciones de la MT.
 La calidad del texto almacenado depende de la eficacia del traductor
humano. Un error en un determinado segmento se perpetuará hasta su
corrección apareciendo en cada texto traducido en que se incluya el
segmento.
 Las MT hacen surgir ciertos parecidos con el mundo industrial pues
facilitan la explotación de los traductores humanos reduciendo así la
calidad del producto final.8
8
https://es.wikipedia.org/wiki/Memoria_de_traducci%C3%B3n#Uso_de_las_memorias_
de_traducci%C3%B3n
6
La Traducción asistida por computadora (TAC), Traducción asistida por
ordenador (TAO) o CAT (del inglés computer-assisted translation) es el proceso
de reproducción de un texto en otra lengua (traducción) que lleva a cabo una
persona (el traductor) con la ayuda de software o programas de ordenador
desarrollados específicamente a tal fin. Este término abarca diferentes tipos de
herramientas o aplicaciones informáticas específicas como, por ejemplo, las que
crean y organizan memorias de traducción y los editores de recursos interactivos
de software de tipo textual, también llamados herramientas de localización.9
 Este tipo de software es una ayuda inestimable para no tener que traducir
dos veces una misma frase que siempre se repite en cierto tipo de
documentos, así como para mantener la coherencia terminológica.
 Ahorra tiempos y mantiene la calidad lingüística, terminológica y estilística
de los trabajos.10
 Facilita el proceso de traducción ya que segmenta el texto en segmentos
más pequeños y traducibles. Organiza estos segmentos de manera que
se facilita la traducción del texto de manera efectiva, y hace que el proceso
de traducción sea eficiente en el tiempo dado.
 La herramienta de traducción asistida por ordenador ha contribuido en
gran medida a la eficacia del proceso de traducción garantizando
traducciones de calidad. Es una herramienta esencial para los traductores
y compradores de servicios de traducción.11
9
https://es.wikipedia.org/wiki/Traducci%C3%B3n_asistida_por_computadora#Herramie
ntas_de_traducci%C3%B3n_asistida_por_ordenador
10
https://eltraductorenlasombra.com/2011/03/07/software-para-traductores-2-resena-
sobre-herramientas-tao/
11
https://pangeanic.es/conocimiento/que-es-una-herramienta-de-traduccion-asistida-
por-ordenador-cat/
7
Éste es el kit esencial para cualquier traductor profesional para un servicio
de traducción rápido y de calidad.
1. SOFTWARE DE MEMORIA DE TRADUCCIÓN
La más conocida de las herramientas de TAC o TAO es el software de memoria
de traducción. Divide los textos que se van a traducir en unidades llamadas
«segmentos». A medida que el traductor avanza en la traducción del documento,
el software almacena en una base de datos los segmentos ya traducidos.
Cuando el software reconoce que un nuevo segmento es similar a un segmento
ya traducido, se lo propone al traductor para que vuelva a utilizarlo. Algunos
programas de memoria de traducción no funcionan con bases de datos creadas
durante una traducción, sino con documentos de referencia precargados.
Unos softwares de memoria de traducción:
•Trados Workbench
•DéjàVuX, SDLX
•Star Transit
•MultiTrans
•Similis
•MetaTexis…
2. MOTORES DE BÚSQUEDA LINGÜÍSTICOS
Los motores de búsqueda lingüísticos funcionan de forma similar a la de los
motores de búsqueda tradicionales, excepto que no buscan resultados en
Internet, sino en un gran banco de datos de memoria de traducción. El objetivo
es encontrar, en esos bancos, fragmentos de textos previamente traducidos que
coincidan con el nuevo texto que se traducirá. Linguee, un diccionario contextual
multilingüe es uno de ellos.
3. SOFTWARE DE GESTIÓN TERMINOLÓGICA
Entre las herramientas de TAO, también hay los programas de gestión
terminológica. Con estos, el traductor tiene la posibilidad de buscar
automáticamente, en una base de datos, los términos que aparecen en el nuevo
documento. Algunos de estos sistemas permiten al traductor añadir, en la base
de datos, nuevos pares de palabras que concuerdan y verificar un texto mediante
varias funciones: el traductor puede entonces comprobar si tal o cual término se
tradujo correcta y coherentemente a lo largo de todo el proyecto. A continuación,
citaremos tres ejemplos de este tipo de software:
•SDL MultiTerm
•LogiTerm
•Termex.
8
4. SOFTWARE DE ALINEACIÓN
Los programas de alineación de textos permiten construir una memoria de
traducción a partir de la versión fuente y destino de un mismo texto: el software
divide los dos textos en segmentos e intenta determinar qué segmentos
concuerdan. El resultado de esta operación puede importarse en un software de
memoria de traducción para futuras traducciones. Cuatro softwares de
alineación:
•Bitext2
•Tmx Bligner
•YouAlign
•LF Aligner.
5. TRADUCCIÓN INTERACTIVA AUTOMÁTICA
La traducción interactiva automática se asemeja a los programas que usted
utiliza en su teléfono celular para escribir mensajes: el programa intenta predecir
cómo el traductor humano traducirá una frase o un fragmento de frase.12
….………………….
Firma
12 https://culturesconnection.com/es/5-herramientas-de-tac-que-cada-traductor-deberia-usar/
9

Más contenido relacionado

Similar a Traducción asistida

Patricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducciónPatricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducciónPatricia Losada
 
Patricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRicoPatricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRicoPatricia Losada
 
Practico 1 taller de software cat
Practico 1 taller de software catPractico 1 taller de software cat
Practico 1 taller de software catsaul
 
Fundamentos_teoricos_de_los_Paradigmas_d.pdf
Fundamentos_teoricos_de_los_Paradigmas_d.pdfFundamentos_teoricos_de_los_Paradigmas_d.pdf
Fundamentos_teoricos_de_los_Paradigmas_d.pdfJoseFeriaNarvaez1
 
Uso de traductores en línea residentes en memoria.
Uso de traductores en línea residentes en memoria.Uso de traductores en línea residentes en memoria.
Uso de traductores en línea residentes en memoria.carolina acosta
 
Tecnologias De La Traduccion
Tecnologias De La TraduccionTecnologias De La Traduccion
Tecnologias De La TraduccionCelia Rico
 
TEORIA_DE_LOS_LENGUAJES.pdf
TEORIA_DE_LOS_LENGUAJES.pdfTEORIA_DE_LOS_LENGUAJES.pdf
TEORIA_DE_LOS_LENGUAJES.pdfClaudia Naveda
 
Traducción Automática
Traducción AutomáticaTraducción Automática
Traducción AutomáticaAlbaRico2
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automáticaAlbaRico2
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automáticaAlbaRico2
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automáticaAlbaRico2
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automáticaAlbaRico2
 
Analisissemantico 110519213337-phpapp01
Analisissemantico 110519213337-phpapp01Analisissemantico 110519213337-phpapp01
Analisissemantico 110519213337-phpapp01stephani salazar
 
Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...
Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...
Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...eMadrid network
 

Similar a Traducción asistida (20)

Patricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducciónPatricia Losada: Corpus y memoria de traducción
Patricia Losada: Corpus y memoria de traducción
 
Patricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRicoPatricia Losada, Bloque Nº 2, Producto TeóRico
Patricia Losada, Bloque Nº 2, Producto TeóRico
 
Practico 1 taller de software cat
Practico 1 taller de software catPractico 1 taller de software cat
Practico 1 taller de software cat
 
Fundamentos_teoricos_de_los_Paradigmas_d.pdf
Fundamentos_teoricos_de_los_Paradigmas_d.pdfFundamentos_teoricos_de_los_Paradigmas_d.pdf
Fundamentos_teoricos_de_los_Paradigmas_d.pdf
 
Pln
PlnPln
Pln
 
Uso de traductores en línea residentes en memoria.
Uso de traductores en línea residentes en memoria.Uso de traductores en línea residentes en memoria.
Uso de traductores en línea residentes en memoria.
 
Tecnologias De La Traduccion
Tecnologias De La TraduccionTecnologias De La Traduccion
Tecnologias De La Traduccion
 
Tarea2.0
Tarea2.0Tarea2.0
Tarea2.0
 
Cii2
Cii2Cii2
Cii2
 
Natural language processing
Natural language processingNatural language processing
Natural language processing
 
TEORIA_DE_LOS_LENGUAJES.pdf
TEORIA_DE_LOS_LENGUAJES.pdfTEORIA_DE_LOS_LENGUAJES.pdf
TEORIA_DE_LOS_LENGUAJES.pdf
 
Traducción Automática
Traducción AutomáticaTraducción Automática
Traducción Automática
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automática
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automática
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automática
 
Traducción automática
Traducción automáticaTraducción automática
Traducción automática
 
Analisissemantico 110519213337-phpapp01
Analisissemantico 110519213337-phpapp01Analisissemantico 110519213337-phpapp01
Analisissemantico 110519213337-phpapp01
 
Herramientas wed 2.0
Herramientas wed 2.0Herramientas wed 2.0
Herramientas wed 2.0
 
NOLA ITZULI EDUKIAK? PISTAK ETA TRESNAK
NOLA ITZULI EDUKIAK? PISTAK ETA TRESNAKNOLA ITZULI EDUKIAK? PISTAK ETA TRESNAK
NOLA ITZULI EDUKIAK? PISTAK ETA TRESNAK
 
Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...
Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...
Seminario eMadrid sobre "Cloud Computing". Cloud computing en entornos Start-...
 

Más de RocioUnzeta

Traducción asistida
Traducción asistidaTraducción asistida
Traducción asistidaRocioUnzeta
 
Acronimos y abreviaturas
Acronimos y abreviaturasAcronimos y abreviaturas
Acronimos y abreviaturasRocioUnzeta
 
Tutorial de como utilizar "Babylon"
Tutorial de como utilizar "Babylon"Tutorial de como utilizar "Babylon"
Tutorial de como utilizar "Babylon"RocioUnzeta
 
Traductor "Babylon"
Traductor "Babylon"Traductor "Babylon"
Traductor "Babylon"RocioUnzeta
 

Más de RocioUnzeta (6)

Traducción asistida
Traducción asistidaTraducción asistida
Traducción asistida
 
Pp2 unzeta tra2
Pp2 unzeta tra2Pp2 unzeta tra2
Pp2 unzeta tra2
 
Agronomia
AgronomiaAgronomia
Agronomia
 
Acronimos y abreviaturas
Acronimos y abreviaturasAcronimos y abreviaturas
Acronimos y abreviaturas
 
Tutorial de como utilizar "Babylon"
Tutorial de como utilizar "Babylon"Tutorial de como utilizar "Babylon"
Tutorial de como utilizar "Babylon"
 
Traductor "Babylon"
Traductor "Babylon"Traductor "Babylon"
Traductor "Babylon"
 

Traducción asistida

  • 1. Realizado por Rocío Magali Unzeta, alumna del Profesorado y Traductorado de Inglés.
  • 2. TRADUCCIÓN AUTOMÁTICA (TA)………………………………….. Pág.2 Concepto…………………………………………………………………….. Pág.2 Historia……………………………………………………………………….. Pág.2 y 3 Clasificación de las Memorias de Traducción Asistida (MTA) Pág.3 Diferentes enfoques………………………………………….…………. Pág.3 Beneficios……………………………………………………………………. Pág.4 Obstáculos…………………………………………………………………… Pág.4 MEMORIA DE TRADUCCIÓN (MT)………………………………….. Pág.5 Concepto…………………………………………………………………….. Pág.5 ¿Qué es un corpus lingüístico?.......................................... Pág.5 Usos……………………………………………………………………………. Págs.5 y 6 Beneficios……………………………………………………………………. Pág.6 Obstáculos…………………………………………………………………… Pág.6 TRADUCCIÓN ASISTIDA por ORDENADOR (TAO)……………. Pág.7 Concepto……………………………………………………………………... Pág.7 Características………………………………………………………………. Pág.7 CAT TOOLS………………………………………………………………….. Págs.8 y 9 1
  • 3. La traducción automática (TA o MT, esta última del inglés machine translation) es un área de la lingüística computacional que investiga el uso de software para traducir texto o habla de un lenguaje natural a otro. 1 Aunque la aparición de las primeras concepciones de traducción automática se remonta al siglo XVII, fue en la década de 1950 cuando la investigación financiada por el gobierno de Estados Unidos potenció el interés internacional por la investigación y la producción de sistemas de traducción automática. La primera demostración pública de un sistema de traducción automática, que tradujo 250 palabras entre el ruso y el inglés, tuvo lugar en EE. UU. en 1954. En ella se aplicó un enfoque centrado en la traducción literal. Esta arquitectura de primera generación se basaba en diccionarios y trataba de que coincidiera el texto de la lengua de partida con el de la lengua de destino palabra por palabra, es decir, que traducía literalmente. A finales de 1970 y principios de 1980, la investigación se centró más en el enfoque de la transferencia. En esta arquitectura, el texto de partida se analizaba a través de un diccionario de la lengua de origen y se transformaba en una fórmula abstracta. Esta fórmula se traducía a otra fórmula abstracta del texto de destino a través de un diccionario bilingüe y posteriormente se convertía en un texto de destino final con un diccionario en la lengua final. En los años 1990, las investigaciones dieron como resultado una tercera generación de sistemas de traducción automática: las arquitecturas basadas en corpus, concretamente los enfoques estadístico y basado en ejemplos. El enfoque estadístico divide el texto de partida en segmentos que luego compara con un corpus bilingüe alineado utilizando las probabilidades de evidencia estadística y de distorsión con el fin de elegir la traducción más adecuada. El enfoque basado en ejemplos imita las combinaciones de ejemplos de datos pre traducidos en la base de datos. Para que este enfoque funcionara correctamente, la base de datos debía contener concordancias que se aproximaran a las del texto de partida. Este enfoque sienta las bases de las herramientas con memorias de traducción asistida. 1 https://es.wikipedia.org/wiki/Traducci%C3%B3n_autom%C3%A1tica 2
  • 4. Los últimos desarrollos en el área de la traducción automática han incluido la incorporación de un aprendizaje profundo y de redes neuronales que permiten aumentar la precisión. Los proveedores de servicios lingüísticos actualmente ofrecen motores de traducción automática en los que además de incorporar la terminología de un ámbito específico como, por ejemplo, las ciencias de la salud, el sector turístico o la informática, el usuario puede cargar sus propios registros de traducción para tratar de mejorar la precisión, el estilo y la calidad de los resultados que se consiguen con la traducción automática. El día 15 de noviembre 2016, Google anunció que iba a empezar a emplear la traducción automática neural en su herramienta Google Translate. Ha empezado a usarlo con un total de ocho combinaciones de idiomas, con el inglés como lengua de partida y destino, combinado con francés, alemán, español, portugués, chino, japonés, coreano y turco.2  Traducción automática basada en reglas, ésta consiste en realizar transformaciones a partir del original, reemplazando las palabras por su equivalente más apropiado. Al conjunto de este tipo de transformaciones del texto original se le llama predicción de textos.  Traducción automática basada en corpus lingüístico, ésta se basa en el análisis de muestras reales con sus respectivas traducciones.  Traducción automática basada en el contexto, ésta utiliza técnicas basadas en hallar la mejor traducción para una palabra fijándose en el resto de palabras que la rodean, básicamente este método se basa en tratar el texto en unidades de entre 4 y 8 palabras, de manera que se traduce cada una de ellas por su traducción al idioma destino, y se eliminan las traducciones que han generado una "frase" sin sentido. Luego, se mueve la ventana una posición (palabra), retraduciendo la mayoría de ellas de nuevo y volviendo a filtrar dejando sólo las frases coherentes. Se repite dicho paso para todo el texto. Y luego se pasa a concatenar los resultados de dichas ventanas de manera que se logre una única traducción del texto.3 Como este diagrama muestra, se distinguen típicamente tres enfoques principales: los enfoques directos, los de interlingua y los de transferencia. Esta pirámide se basa en las diferencias de "longitudes relativas" de los tres componentes de la traducción: análisis, transferencia y síntesis o generación. 4 2 https://estudiotraductor.es/historia-de-traduccion-automatica/ 3 https://es.wikipedia.org/wiki/Traducci%C3%B3n_autom%C3%A1tica#Tipos_de_traduc ci%C3%B3n_autom%C3%A1tica 4 http://elies.rediris.es/elies9/3-2.htm : 3
  • 5.  Expansión rápida: se trata de un servicio que permite traducir contenidos sencillos en poco tiempo. De esta forma aligera los trabajos de traducción al combinarse el trabajo humano con el automático con el fin último de lograr una comunicación global de calidad.  Reducción de costos: favorece el control de los gastos, ya que supone un ahorro frente a otros servicios de traducción.  Incremento del volumen de traducciones: es una forma sencilla y barata de que tu entidad financiera aumente su cantidad de contenido traducido en distintos idiomas para poder llegar a los mercados elegidos y fomentar el crecimiento internacional del negocio.  Calidad: la traducción humana no es capaz de realizar traducciones idénticas en dos idiomas distintos, mientras que la traducción automática a veces no tiene sentido o es demasiado forzada. Por ello, lo que separado puede suponer una pérdida de la calidad si se aúnan consiguen una traducción rigurosa y de precisión semántica, gramatical y de sintaxis.  Minimización del esfuerzo del cliente: se le ofrece un servicio personalizado y adaptado al negocio con una atención individualizada.  Mayor seguridad: cuando se trabaja con documentos financieros, de investigación o de organigrama los datos suelen ser confidenciales y la traducción automática preserva su confidencialidad al alojarse en un entorno seguro. De esta manera es más fácil evitar el espionaje comercial.  Se puede utilizar en ciertas combinaciones lingüísticas.  Integración: es necesario adecuar las definiciones funcionales, los costes y los esfuerzos.  Siempre requiere pos edición humana: ya sea una revisión superficial o una traducción rigurosa dependiendo del documento a traducir. La clave es no prescindir de la calidad, ya que si se utiliza solo la traducción automática pueden darse errores.  Depende de un entrenamiento previo del motor de traducción.  Los motores de traducción dependen del sector: por cada área se genera un motor de traducción dado que las expresiones, conceptos y segmentos son totalmente diferentes en cada campo.5 5 https://blog.linguaserve.com/ventajas-y-desventajas-de-la-traduccion-automatica 4
  • 6. Una memoria de traducción es una conocida función de los sistemas de traducción asistida por ordenador que facilita el proceso de traducción. Una memoria de traducción es básicamente una pequeña o gran base de datos que almacena información según va trabajando el traductor. Esta información se basa en el concepto de frase fuente y frase meta.6 Un corpus lingüístico es un conjunto amplio y estructurado de ejemplos reales de uso de la lengua. Estos ejemplos pueden ser textos (los más comunes), o muestras orales (generalmente transcritas) . Un corpus lingüístico es un conjunto de textos relativamente grande, creado independientemente de sus posibles formas o usos. Es decir, en cuanto a su estructura, variedad y complejidad, un corpus debe reflejar una lengua, o su modalidad, de la forma más exacta posible; en cuanto a su uso, preocuparse de que su representación sea real. Los corpus tienen similitudes con los textos porque están compuestos por ellos, por otro lado, no son textos en sí, porque a diferencia de los mismos, no tiene sentido analizarlos en su totalidad. Un texto tiene un principio y un fin, y es cohesivo y coherente en mayor o menor grado, mientras que un corpus carece de tales características por no poseer una estructura, sino sólo una composición. Por esta razón conviene analizar un corpus recurriendo a herramientas y metodología propias. Debido a su tamaño, accesibilidad, información lingüística y enciclopédica, muy alta fiabilidad y otras particularidades, la compilación de los corpus ha llegado a ser uno de los principales, si no el principal, método e instrumento de la investigación de la lengua en la lingüística general.7 Un traductor proporciona en primera instancia un texto fuente (el texto a traducir) a la memoria de traducción. El programa analizará el texto e intentará encontrar en su base de datos pares de segmentos en los que el texto coincida con otros previamente traducidos. El programa presenta al traductor cualquier coincidencia para que la revise. El traductor puede aceptar la propuesta, rechazarla o modificarla y usar esa versión modificada. Es este caso, la versión modificada se almacena en la base de datos. 6 https://pangeanic.es/conocimiento/que-es-una-memoria-de-traduccion/ 7 https://es.wikipedia.org/wiki/Corpus_ling%C3%BC%C3%ADstico 5
  • 7. Algunos sistemas de memorias de traducción solo buscan coincidencias del 100 %, es decir, coincidencias exactas. Otros utilizan algoritmos de coincidencias para obtener segmentos parecidos. Los segmentos en los que no encuentran coincidencias deberán ser traducidos manualmente. El resultado se almacenará en la base de datos para ser usado por el programa en posteriores sesiones. El uso de memorias de traducción es más útil en textos repetitivos como manuales técnicos. También son útiles para hacer traducciones incrementales de documentos traducidos anteriormente. Si un traductor de memoria se usa de forma consistente durante un cierto tiempo puede ahorrar un trabajo considerable a los traductores.  Aseguran que el documento es traducido en su totalidad (no se aceptan segmentos vacíos).  Aseguran que los documentos traducidos son coherentes, incluidas definiciones comunes, fraseología y terminología. Esto es importante cuando diferentes traductores trabajan en el mismo documento.  Permiten a los traductores trabajar con una amplia variedad de formatos sin tener que disponer de software requerido para procesar dichos formatos.  Aceleran el proceso global de la traducción. Puesto que «recuerdan» material traducido anteriormente, los traductores solo tienen que traducirlo una vez.  El concepto de memoria de traducción se basa en la premisa de que las frases traducidas pueden ser «recicladas». Sin embargo, un principio fundamental de la traducción es que se debe traducir el mensaje contenido en el texto, no las frases que lo componen.  En la actualidad los MT no disponen de filtros para todos los formatos de texto existentes.  Hay una curva de aprendizaje asociada al uso de los gestores de MT y los programas deben ser personalizados para una mayor eficacia.  El mantenimiento de las bases de datos generadas sigue siendo un proceso manual que requiere un trabajo constante. Las carencias en este mantenimiento suponen una reducción del rendimiento, la usabilidad y las prestaciones de la MT.  La calidad del texto almacenado depende de la eficacia del traductor humano. Un error en un determinado segmento se perpetuará hasta su corrección apareciendo en cada texto traducido en que se incluya el segmento.  Las MT hacen surgir ciertos parecidos con el mundo industrial pues facilitan la explotación de los traductores humanos reduciendo así la calidad del producto final.8 8 https://es.wikipedia.org/wiki/Memoria_de_traducci%C3%B3n#Uso_de_las_memorias_ de_traducci%C3%B3n 6
  • 8. La Traducción asistida por computadora (TAC), Traducción asistida por ordenador (TAO) o CAT (del inglés computer-assisted translation) es el proceso de reproducción de un texto en otra lengua (traducción) que lleva a cabo una persona (el traductor) con la ayuda de software o programas de ordenador desarrollados específicamente a tal fin. Este término abarca diferentes tipos de herramientas o aplicaciones informáticas específicas como, por ejemplo, las que crean y organizan memorias de traducción y los editores de recursos interactivos de software de tipo textual, también llamados herramientas de localización.9  Este tipo de software es una ayuda inestimable para no tener que traducir dos veces una misma frase que siempre se repite en cierto tipo de documentos, así como para mantener la coherencia terminológica.  Ahorra tiempos y mantiene la calidad lingüística, terminológica y estilística de los trabajos.10  Facilita el proceso de traducción ya que segmenta el texto en segmentos más pequeños y traducibles. Organiza estos segmentos de manera que se facilita la traducción del texto de manera efectiva, y hace que el proceso de traducción sea eficiente en el tiempo dado.  La herramienta de traducción asistida por ordenador ha contribuido en gran medida a la eficacia del proceso de traducción garantizando traducciones de calidad. Es una herramienta esencial para los traductores y compradores de servicios de traducción.11 9 https://es.wikipedia.org/wiki/Traducci%C3%B3n_asistida_por_computadora#Herramie ntas_de_traducci%C3%B3n_asistida_por_ordenador 10 https://eltraductorenlasombra.com/2011/03/07/software-para-traductores-2-resena- sobre-herramientas-tao/ 11 https://pangeanic.es/conocimiento/que-es-una-herramienta-de-traduccion-asistida- por-ordenador-cat/ 7
  • 9. Éste es el kit esencial para cualquier traductor profesional para un servicio de traducción rápido y de calidad. 1. SOFTWARE DE MEMORIA DE TRADUCCIÓN La más conocida de las herramientas de TAC o TAO es el software de memoria de traducción. Divide los textos que se van a traducir en unidades llamadas «segmentos». A medida que el traductor avanza en la traducción del documento, el software almacena en una base de datos los segmentos ya traducidos. Cuando el software reconoce que un nuevo segmento es similar a un segmento ya traducido, se lo propone al traductor para que vuelva a utilizarlo. Algunos programas de memoria de traducción no funcionan con bases de datos creadas durante una traducción, sino con documentos de referencia precargados. Unos softwares de memoria de traducción: •Trados Workbench •DéjàVuX, SDLX •Star Transit •MultiTrans •Similis •MetaTexis… 2. MOTORES DE BÚSQUEDA LINGÜÍSTICOS Los motores de búsqueda lingüísticos funcionan de forma similar a la de los motores de búsqueda tradicionales, excepto que no buscan resultados en Internet, sino en un gran banco de datos de memoria de traducción. El objetivo es encontrar, en esos bancos, fragmentos de textos previamente traducidos que coincidan con el nuevo texto que se traducirá. Linguee, un diccionario contextual multilingüe es uno de ellos. 3. SOFTWARE DE GESTIÓN TERMINOLÓGICA Entre las herramientas de TAO, también hay los programas de gestión terminológica. Con estos, el traductor tiene la posibilidad de buscar automáticamente, en una base de datos, los términos que aparecen en el nuevo documento. Algunos de estos sistemas permiten al traductor añadir, en la base de datos, nuevos pares de palabras que concuerdan y verificar un texto mediante varias funciones: el traductor puede entonces comprobar si tal o cual término se tradujo correcta y coherentemente a lo largo de todo el proyecto. A continuación, citaremos tres ejemplos de este tipo de software: •SDL MultiTerm •LogiTerm •Termex. 8
  • 10. 4. SOFTWARE DE ALINEACIÓN Los programas de alineación de textos permiten construir una memoria de traducción a partir de la versión fuente y destino de un mismo texto: el software divide los dos textos en segmentos e intenta determinar qué segmentos concuerdan. El resultado de esta operación puede importarse en un software de memoria de traducción para futuras traducciones. Cuatro softwares de alineación: •Bitext2 •Tmx Bligner •YouAlign •LF Aligner. 5. TRADUCCIÓN INTERACTIVA AUTOMÁTICA La traducción interactiva automática se asemeja a los programas que usted utiliza en su teléfono celular para escribir mensajes: el programa intenta predecir cómo el traductor humano traducirá una frase o un fragmento de frase.12 ….…………………. Firma 12 https://culturesconnection.com/es/5-herramientas-de-tac-que-cada-traductor-deberia-usar/ 9