Escritura asistida de folletos de promoción turística en línea con tecnología XML
1. Victor M. Castel
Mayra A. Villar
Universidad Nacional de Cuyo
Mendoza, Argentina
2. Esquema de la presentación
1. Lingüística Sistémica Funcional y aplicaciones
computacionales
1.1. COMMUNAL
1.2. RedACTe
1.3. Genesys _IDE
2. Propósito de esta comunicación
3. Resultados
3.1. Red sistémica de la estructura de género
3.2. Impacto de esta red en la gramática del inglés
3.3. Componente de realización
3.4. Ejemplo de generación con la Mini-gramática de Cardiff
3. La preeminencia de la Lingüística Sistémica Funcional
(LSF; Halliday, 1982; Eggins, 1994; Hasan, 1996,
Halliday &Matthiessen, 1999; Martin, 2000; Thompson,
2000; Ventola, 2000; Halliday, 2004; Fawcett, 2008a)
como teoría lingüística se debe a su aplicabilidad a
distintos campos donde se requiere un modelo de
lenguaje para resolver problemas teóricos y prácticos.
Así, el potencial de la LSF para explicar la naturaleza de
los fenómenos lingüísticos y el uso del lenguaje ha sido
de especial interés para el Procesamiento de Lenguas
Naturales (PLN), disciplina orientada al diseño y
construcción de sistemas informáticos capaces de imitar
la capacidad humana de producir y entender mensajes
(Matthiessen & Bateman, 1991; Fawcett, 2000a, 2008a,
2008b, 2008c; Castel, 2004, 2006b, entre otros).
4. Al hablar de la implementación computacional de
gramáticas cabe destacar los proyectos COMMUNAL
(Fawcett 2008a, b, c, Fawcett & Castel 2006, Castel
2007) y KPML (Bateman, 1994). COMMUNAL es un
sistema orientado a la generación de textos en inglés
dentro del marco del modelo de mente comunicativa
desarrollado por la Léxico-gramática de Cardiff. KPML
es un entorno de desarrollo de gramáticas que, basado
en la perspectiva de Sídney, permite generar textos en
inglés, español, chino, ruso, checo, búlgaro y holandés.
5. También es importante mencionar el proyecto RedACTe
(Redacción Asistida por Computadora de Textos),
dirigido por el Dr. Víctor Castel (2004, 2005a, 2005c,
2005d, 2006b, 2006c, 2007c). A diferencia de
COMMUNAL y KPML, RedACTe está restringido a un
dominio específico, puesto que está orientado a la
generación de abstracts de artículos de investigación
científica en inglés a partir de una modelización que
correlaciona propiedades contextuales y lingüísticas con
el objetivo de usar la gramática textual subyacente
como recurso para asistir en la escritura de este tipo de
textos.
6. Con respecto al proyecto GeneSys_IDE, podemos decir
que su objetivo general es desarrollar un entorno integral
de desarrollo (IDE) de gramáticas sistémicofuncionales
orientadas a NLG en el marco del modelo de mente
comunicativa subyacente en la Gramática de Cardiff. Este
IDE deberá proveer al usuario, típicamente un lingüista, las
funcionalidades necesarias para la construcción,
evaluación, mantenimiento y utilización de sistemas de
NLG, preferentemente en dominios cognitivos restringidos.
7. En Castel 2006a, sobre la base de resultados teórico-
descriptivos del Proyecto RedACTe I-IV (Castel 2005a, b, 2006b),
se define un esquema XML para dar cuenta de propiedades
genéricas, lógicas y léxico-gramaticales del abstract del artículo
de investigación científica en inglés (AbAICI). Se muestra en
particular cómo generar interactivamente instancias de AbAICI
bien formadas y válidas de acuerdo con el esquema mediante
una funcionalidad de la herramienta XMLSPY adaptada en el
contexto de GeneSys_IDE, el generador del modelo de Cardiff.
En esta comunicación, exploramos la posibilidad de emular los
resultados de Castel 2006a en un género diferente: el folleto de
promoción turística en línea (FPTL). Nuestro propósito es
modelizar correlaciones sistemáticas entre el potencial de
estructura de género (PEG) y el potencial de propiedades
semánticas y de forma del FPTL (Villar, 2009). Estas
correlaciones, que resultan de observar una muestra de 60 FPTL
con los criterios sistémico-funcionales de la Gramática de Cardiff
(Fawcett 2000, 2008), son captadas en GeneSys IDE mediante
un esquema XML.
8. Este esquema XML entre otras cosas capta la
siguiente red sistémica que especifica los
constituyentes y sub-constituyentes del PEG, su
carácter obligatorio u optativo, el orden y la
recursividad de los mismos.
9. FPTL: Estructura de Género
PLACE PRESENTATION 100% with place presentation
→
0% without place presentation
FEATURES 100% with features
DESCRIPTION →
PLACE
TYPE → 0% without features
80% with place description LOCATION→100% with location proper
PLACE DESCRIPTION →
0% without location proper
HISTORICAL
BACKGROUND→
30% with historical b ackground
70% without historical background
20% without place description (sp2)
otg
ACTIVITIES 100% with activities
→
0% without activities
30% with transport
SERVICE OFFER 80% with service offer TRANSPORT →
→ 70% without transport
30% with hotels
HOTELS→
70% without hotels
20% without service offer
ADDITIONAL INFORMATION → 60% with additional information
40% without additional information
10. OTG en la figura 1 es el elemento raíz de un esquema
XML para las propiedades contextuales lógicas y
lingüísticas del FPTL (Villar, 2009). Esta figura define el
potencial de estructura de género del FPTL.
Como vemos en la figura 1, el constituyente de género
“Presentación del Lugar” será un elemento obligatorio en
las instancias de texto a generar, puesto que su
porcentaje de instanciación en la muestra observada es
de 100%. Este constituyente puede combinarse de
distintas maneras con los otros tres constituyente de
género (Descripción del Lugar, Ofrecimiento de Servicios
e Información Adicional) y sus respectivos sub-
constituyentes.
11. Para dar cuenta de todas las posibilidades de organización
textual a partir de una única red sistémica, se asignan
probabilidades a cada constituyente de género y se
establecen reglas de determinación de preferencia para una
misma pasada por la red sistémica.
La importancia de las reglas de determinación de
preferencia tiene que ver con la posibilidad de especificar
cambios que deben hacerse en una misma pasada a través
de la red sistémica, sin tener que desarrollar una nueva red.
Podemos tomar una decisión que puede alterar las
opciones disponibles en las pasadas sucesivas por la red
sistémica, y, así, nuestro sistema se convierte en un
fenómeno dinámico.
12. Por ejemplo, en la red sistémica para la estructura de
género (fig.1) cuando se elige el constituyente de género
“Presentación del Lugar” (obligatorio) pasamos al siguiente
constituyente de género “Descripción del Lugar”, y en el
rasgo [sin presentación de lugar] encontramos asociada la
siguiente regla de determinación de preferencia:
Sp2: If ‘without_place_description’, then for same pass
prefer (100% ‘with_service_offer’ / 0% ‘without_service
offer’).
Esta regla establece que deben cambiarse las
probabilidades para el siguiente sistema: Ofrecimiento de
servicios.
13. La regla sp2 asociada con el rasgo [sin descripción del
lugar] significa que si selecciona este rasgo, debe
asignarse una probabilidad de 100% al rasgo [con
ofrecimiento de servicios], porque el FPTL debe incluir ya
sea una descripción del lugar o bien, un ofrecimiento de
servicios. Por ello, cuando se selecciona el rasgo [sin
descripción del lugar] la ocurrencia del rasgo [con
ofrecimiento de servicios] es obligatoria.
14. Castel 2006a formaliza e implementa computacionalmente
correlaciones sistemáticas entre el potencial de estructura
genérica del AbAICI y los potenciales semántico y de forma
asociados, y da cuenta así de cómo ciertos patrones léxico-
gramaticales se distribuyen regularmente en espacios
textuales específicos .
En la muestra de FPTL también se observan correlaciones
entre el potencial de estructura genérica y los potenciales
semántico y de forma. Las generalizaciones descriptivas de
Villar (2009) acerca de los tipos de procesos que ocurren
en la realización del constituyente “Descripción del lugar”
nos permiten capturar las propiedades semánticas y de
forma esenciales de las cláusulas que llenan esta categoría
de género.
15. A modo de ilustración, el esquema XML especifica
cómo uno de estos constituyentes, “Descripción del
Lugar”, se asocia con el potencial semántico de los
distintos subtipos de transitividad relacional que
subyace en verbos tales como be, designate
(atributivo), remain, locate, surround (locativo), reach,
stretch (direccional), have, include, offer, provide, own,
give (posesivo), y blend, mix, combine (combinatorio).
Cabe destacar que la red sistémica de
TRANSITIVIDAD para el inglés en general propuesta
por Fawcett (En preparación) (Fawcett_Semantics.pdf)
experimentará una reconfiguración de probabilidades
asignadas a cada tipo de proceso en función de las
demandas del FPTL. Se trata de una predeterminación
de preferencia desde el género sobre la semántica.
17. Por otra parte, el esquema especifica cómo correlacionar
este potencial semántico con realizaciones como las
siguientes: York[S/Ca] is [Pro] a fantastic city[C/At], con
proceso atributivo, y Scotland [S/Ca] has [Pro] over 3,000
castles [C/Pos], con proceso posesivo, etc.
Por ejemplo, para generar la oración York is a fantastic city,
se recorre en primer lugar la red sistémica de género (fig.1)
para construir una selección de rasgos a nivel de género
(generic selection expression). Para cada categoría terminal
de esta expresión de selección genérica es necesario
generar una oración correspondiente. Para generar cada una
de esas oraciones ingresaremos luego a la red sistémica
semántica para obtener una expresión de selección
semántica que, eventualmente, activará las reglas de
realización que deberán aplicarse para construir la oración.
19. Ejemplo de generación de una oración con la Mini-
gramática de Cardiff
El siguiente grafo ha sido generado por GeneSys para la
oración York is a fantastic city.
El grafo capta las propiedades semánticas y de forma de
dicha oración.
De esta manera, esta comunicación demuestra cómo
generar instancias de FPTL bien formadas y válidas con el
generador de la mini-gramática de Cardiff.
Semántica subyacente en la oración generada
York_is_a_fantastic_city_Estructura_en_Sangría.txt y
reglas de realización que se aplicaron
CardiffMiniGrammar_Adjustment1_Functions_FPTL_Quality.txt
20.
21. MUCHAS GRACIAS por asistir a
esta presentación.
vcastel@lab.cricyt.edu.ar
mayra.aixa.villar@gmail.com