www.tauyou.com
info@tauyou.com
Enjoy the world!
Communication is not a problem anymore
Human quality machine translation solutions
© 2009 Ta with you
Conferencia ProZ
Octubre 2009
© 2009 Ta with you Conferencia ProZ, Octubre 2009 2
Introducción
¿De dónde vengo?
¿Dónde estoy?
¿Adónde voy?
© 2009 Ta with you Conferencia ProZ, Octubre 2009 3
¿Para qué traducción automática?
Usuario final
Información web
Cliente corporativo
Documentación corporativa interna
Traductores
Herramienta de productividad (?)
© 2009 Ta with you Conferencia ProZ, Octubre 2009 4
Provocación
© 2009 Ta with you Conferencia ProZ, Octubre 2009 5
Pregunta
¿Cuántos quieren a la traducción automática?
¿Cuántos la odian?
Otras respuestas ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 6
Objetivos de la charla
Dar una perspectiva histórica de la TA
Explicar brevemente los sistemas más habituales
Generar discusión / ideas para mejorar
... aprender todos de todos ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 7
El problema esencial
Comprender el texto
(a veces también por causa del creador)
© 2009 Ta with you Conferencia ProZ, Octubre 2009 8
Con modestia
La traducción automática es complicada
Las máquinas no son personas
No es lucha persona contra máquina
Ayudarse y avanzar
Escuchemos a ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 9
Los inicios
Años 30: primeras patentes sistemas de reglas
1949: Informe de Warren Weaver
Años 50: Experimento Georgetown – IBM
Traducción 60 frases Ruso – Inglés
6 reglas + 250 unidades en vocabulario
En 5 años, problema resuelto ...
Reglas manuales + diccionarios bilingües
© 2009 Ta with you Conferencia ProZ, Octubre 2009 10
La realidad
Sistemas instalados
Objetivo: rapidez
Mejoras basadas en Chomsky
Lingüística generativa
Gramática transformacional
Pero las conclusiones es que nunca sería posible
Por la ambigüedad
Lo que lleva al ALPAC ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 11
Los años 60
Automatic Lang. Processing Advisory Committee
Creado en 1964, liderado por John R. Pierce
Informe en 1966
Conclusión básica
Investigar más en lingüística computacional
Dominios e idiomas limitados – herramientas
Consecuencia
Reducción de la inversión en TA
© 2009 Ta with you Conferencia ProZ, Octubre 2009 12
Un pequeño lapso
¡De sólo 10 años!
Con alguna excepción
1968: Systran para los EEUU y la UE
1970: Logos
1977: Méteo en Canada
Sistemas low cost
Para documentos técnicos y comerciales
Interlingua y transferencia
© 2009 Ta with you Conferencia ProZ, Octubre 2009 13
Finales de los 80 / principios de los 90
3 sistemas principales: Systran, Logos, Metal
Interés renovado por 3 motivos principales
Aumento de la capacidad computacional
Reducción del coste de hardware y software
Aparición de los modelos estadísticos (IBM)
Métodos basados en ejemplos
Principalmente en Japón
Proyecto de S2S: Verbmobil
© 2009 Ta with you Conferencia ProZ, Octubre 2009 14
Detalle proyecto Verbmobil
Traducción voz a voz en dominios controlados
8 años de investigación – década de los 90
86 millones de Euros invertidos
31 partners
Varias spin-offs lanzadas – casos de éxito
... pero Mariño os explicará más
© 2009 Ta with you Conferencia ProZ, Octubre 2009 15
¿Qué está pasando en 2009?
Plena efervescencia de sistemas
Reglas
Basados en ejemplos
Estadísticos
Basados en contexto
Alternativas: crowdsourcing
Importantes compañías involucradas
IBM, SAP, Google, Microsoft ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 16
Detalle de sistemas
Directa
Transferencia
Interlingua
Basados en ejemplos
En contexto
Estadísticos
© 2009 Ta with you Conferencia ProZ, Octubre 2009 17
Pregunta
¿Cuál es el objetivo de la traducción?
¿Cuál es el objetivo de la traducción automática?
© 2009 Ta with you Conferencia ProZ, Octubre 2009 18
El proceso es sencillo ...
Elegir las palabras adecuadas
Ordenarlas correctamente
Problemas
Gramática/sintaxis
Traducción literal
Terminología / palabras desconocidas
Adiciones / omisiones
Ortografía / puntuación / may. / min.
© 2009 Ta with you Conferencia ProZ, Octubre 2009 19
Traducción directa
De origen a destino
Mediante diccionarios y gramáticas
Proceso
Traducción palabra a palabra
Reglas de reordenación
Conclusión
Frases sin sentido
Puede ser útil en lenguaje controlado
© 2009 Ta with you Conferencia ProZ, Octubre 2009 20
Por transferencia (I)
Análisis morfológico
Categorización léxica
Transferencia léxica = traducción
Transferencia estructural
Generación morfológica
Exactitud cercana al 90% o superior ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 21
Por transferencia (II)
Fuente: Linguatec
© 2009 Ta with you Conferencia ProZ, Octubre 2009 22
Sistema basado en interlingua (I)
Análisis de los idiomas
Se crea una entidad común abstracta
Idioma pivote
A partir de ella, se genera la salida
Ventaja: No reglas uno a uno
Inconveniente: Creación interlingua (semántica)
DLT en Utrecht, Fujitsu ..
Antes METAL, Stanford ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 23
Sistema basado en interlingua (II)
Diccionarios, léxicos, reglas, gramáticas, ...
Sólo para lenguaje controlado o muy complicado
© 2009 Ta with you Conferencia ProZ, Octubre 2009 24
Traducción basada en ejemplos
Objetivo: obtener la traducción en base a previas
P.ej. memorias de traducción
Nació a mediados de los 80 en Japón
La clave
Combinación de segmentos
Técnicas optimizadas
Uso de patrones - reglas
© 2009 Ta with you Conferencia ProZ, Octubre 2009 25
Traducción basada en el contexto
Fuente: Meaningful Machines
© 2009 Ta with you Conferencia ProZ, Octubre 2009 26
Traducción estadística
Modelo más realista
Fuente: POSTECH, Intelligent Software Lab.
© 2009 Ta with you Conferencia ProZ, Octubre 2009 27
Más sobre la SMT
Ventajas
Rapidez de desarrollo de idiomas y dominios
Superioridad en aplicaciones acotadas
Alto volumen de texto multilingüe disponible
No necesita intervención lingüística
Inconvenientes
Metodología estadística
Cómo particularizar
© 2009 Ta with you Conferencia ProZ, Octubre 2009 28
Comparativa de métodos
tesaurusrepresentación
universal
otros
XXdatos
paralelos
Xanalizador
semántico
XXXparser
Xreglas de
transferencia
XXXdiccionarios
SMTEBMTInterlinguaTransferencia
© 2009 Ta with you Conferencia ProZ, Octubre 2009 29
¿Qué hacen bien las máquinas?
Ayudar al traductor
Corrección en dominios limitados
Amplitud de textos traducidos
Velocidad de traducción
Aprendizaje continuo
© 2009 Ta with you Conferencia ProZ, Octubre 2009 30
Pregunta
Dudas
Preguntas
Comentarios
¿Es útil combinar tecnología y lenguaje?
© 2009 Ta with you Conferencia ProZ, Octubre 2009 31
Y el futuro ...
Traducción clásica
Traducción automática
Traducción automática + postedición
Crowdsourcing
© 2009 Ta with you Conferencia ProZ, Octubre 2009 32
Retos de la traducción automática
Disponibilidad de corpus – lenguas minoritarias
Combinación sistemas estadísticos y por reglas
Unir de forma eficiente traductor y máquina
Evaluación de la calidad
© 2009 Ta with you Conferencia ProZ, Octubre 2009 33
Conclusiones
La TA es una herramienta útil para los traductores
Incremento productividad
Disminución costes y tiempos de entrega
También tiene inconvenientes
No sirve para todo
El futuro es híbrido y amplio
© 2009 Ta with you Conferencia ProZ, Octubre 2009 34
Crisis ... ¡pues innovemos!
© 2009 Ta with you Conferencia ProZ, Octubre 2009 35
¡ Gracias !
Diego Bartolomé, PhD
Director Ejecutivo, Ta with you
C/Ferrer de Blanes 25
08203 Sabadell
Tel. +34 937 11 29 96
Móvil +34 670 33 12 25
info@tauyou.com

2009 ProZ Conference Barcelona: Overview of Machine Translation

  • 1.
    www.tauyou.com info@tauyou.com Enjoy the world! Communicationis not a problem anymore Human quality machine translation solutions © 2009 Ta with you Conferencia ProZ Octubre 2009
  • 2.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 2 Introducción ¿De dónde vengo? ¿Dónde estoy? ¿Adónde voy?
  • 3.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 3 ¿Para qué traducción automática? Usuario final Información web Cliente corporativo Documentación corporativa interna Traductores Herramienta de productividad (?)
  • 4.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 4 Provocación
  • 5.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 5 Pregunta ¿Cuántos quieren a la traducción automática? ¿Cuántos la odian? Otras respuestas ...
  • 6.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 6 Objetivos de la charla Dar una perspectiva histórica de la TA Explicar brevemente los sistemas más habituales Generar discusión / ideas para mejorar ... aprender todos de todos ...
  • 7.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 7 El problema esencial Comprender el texto (a veces también por causa del creador)
  • 8.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 8 Con modestia La traducción automática es complicada Las máquinas no son personas No es lucha persona contra máquina Ayudarse y avanzar Escuchemos a ...
  • 9.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 9 Los inicios Años 30: primeras patentes sistemas de reglas 1949: Informe de Warren Weaver Años 50: Experimento Georgetown – IBM Traducción 60 frases Ruso – Inglés 6 reglas + 250 unidades en vocabulario En 5 años, problema resuelto ... Reglas manuales + diccionarios bilingües
  • 10.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 10 La realidad Sistemas instalados Objetivo: rapidez Mejoras basadas en Chomsky Lingüística generativa Gramática transformacional Pero las conclusiones es que nunca sería posible Por la ambigüedad Lo que lleva al ALPAC ...
  • 11.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 11 Los años 60 Automatic Lang. Processing Advisory Committee Creado en 1964, liderado por John R. Pierce Informe en 1966 Conclusión básica Investigar más en lingüística computacional Dominios e idiomas limitados – herramientas Consecuencia Reducción de la inversión en TA
  • 12.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 12 Un pequeño lapso ¡De sólo 10 años! Con alguna excepción 1968: Systran para los EEUU y la UE 1970: Logos 1977: Méteo en Canada Sistemas low cost Para documentos técnicos y comerciales Interlingua y transferencia
  • 13.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 13 Finales de los 80 / principios de los 90 3 sistemas principales: Systran, Logos, Metal Interés renovado por 3 motivos principales Aumento de la capacidad computacional Reducción del coste de hardware y software Aparición de los modelos estadísticos (IBM) Métodos basados en ejemplos Principalmente en Japón Proyecto de S2S: Verbmobil
  • 14.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 14 Detalle proyecto Verbmobil Traducción voz a voz en dominios controlados 8 años de investigación – década de los 90 86 millones de Euros invertidos 31 partners Varias spin-offs lanzadas – casos de éxito ... pero Mariño os explicará más
  • 15.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 15 ¿Qué está pasando en 2009? Plena efervescencia de sistemas Reglas Basados en ejemplos Estadísticos Basados en contexto Alternativas: crowdsourcing Importantes compañías involucradas IBM, SAP, Google, Microsoft ...
  • 16.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 16 Detalle de sistemas Directa Transferencia Interlingua Basados en ejemplos En contexto Estadísticos
  • 17.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 17 Pregunta ¿Cuál es el objetivo de la traducción? ¿Cuál es el objetivo de la traducción automática?
  • 18.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 18 El proceso es sencillo ... Elegir las palabras adecuadas Ordenarlas correctamente Problemas Gramática/sintaxis Traducción literal Terminología / palabras desconocidas Adiciones / omisiones Ortografía / puntuación / may. / min.
  • 19.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 19 Traducción directa De origen a destino Mediante diccionarios y gramáticas Proceso Traducción palabra a palabra Reglas de reordenación Conclusión Frases sin sentido Puede ser útil en lenguaje controlado
  • 20.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 20 Por transferencia (I) Análisis morfológico Categorización léxica Transferencia léxica = traducción Transferencia estructural Generación morfológica Exactitud cercana al 90% o superior ...
  • 21.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 21 Por transferencia (II) Fuente: Linguatec
  • 22.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 22 Sistema basado en interlingua (I) Análisis de los idiomas Se crea una entidad común abstracta Idioma pivote A partir de ella, se genera la salida Ventaja: No reglas uno a uno Inconveniente: Creación interlingua (semántica) DLT en Utrecht, Fujitsu .. Antes METAL, Stanford ...
  • 23.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 23 Sistema basado en interlingua (II) Diccionarios, léxicos, reglas, gramáticas, ... Sólo para lenguaje controlado o muy complicado
  • 24.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 24 Traducción basada en ejemplos Objetivo: obtener la traducción en base a previas P.ej. memorias de traducción Nació a mediados de los 80 en Japón La clave Combinación de segmentos Técnicas optimizadas Uso de patrones - reglas
  • 25.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 25 Traducción basada en el contexto Fuente: Meaningful Machines
  • 26.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 26 Traducción estadística Modelo más realista Fuente: POSTECH, Intelligent Software Lab.
  • 27.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 27 Más sobre la SMT Ventajas Rapidez de desarrollo de idiomas y dominios Superioridad en aplicaciones acotadas Alto volumen de texto multilingüe disponible No necesita intervención lingüística Inconvenientes Metodología estadística Cómo particularizar
  • 28.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 28 Comparativa de métodos tesaurusrepresentación universal otros XXdatos paralelos Xanalizador semántico XXXparser Xreglas de transferencia XXXdiccionarios SMTEBMTInterlinguaTransferencia
  • 29.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 29 ¿Qué hacen bien las máquinas? Ayudar al traductor Corrección en dominios limitados Amplitud de textos traducidos Velocidad de traducción Aprendizaje continuo
  • 30.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 30 Pregunta Dudas Preguntas Comentarios ¿Es útil combinar tecnología y lenguaje?
  • 31.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 31 Y el futuro ... Traducción clásica Traducción automática Traducción automática + postedición Crowdsourcing
  • 32.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 32 Retos de la traducción automática Disponibilidad de corpus – lenguas minoritarias Combinación sistemas estadísticos y por reglas Unir de forma eficiente traductor y máquina Evaluación de la calidad
  • 33.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 33 Conclusiones La TA es una herramienta útil para los traductores Incremento productividad Disminución costes y tiempos de entrega También tiene inconvenientes No sirve para todo El futuro es híbrido y amplio
  • 34.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 34 Crisis ... ¡pues innovemos!
  • 35.
    © 2009 Tawith you Conferencia ProZ, Octubre 2009 35 ¡ Gracias ! Diego Bartolomé, PhD Director Ejecutivo, Ta with you C/Ferrer de Blanes 25 08203 Sabadell Tel. +34 937 11 29 96 Móvil +34 670 33 12 25 info@tauyou.com