SlideShare una empresa de Scribd logo
1 de 76
Descargar para leer sin conexión
FrameNet Español:
Una red semántica de marcos conceptuales

[Carlos Subirats Rüggeberg. Universidad Autónoma de Barcelona]
Esquema de la presentación
1. Presentación
     1.1 referencias
     1.2¿qué es FrameNet?
     1.3¿qué se propone?
2. Marco teórico
     2.1 semántica cognitiva (Fillmore, 1985)
     2.2 semántica estructural vs. cognitiva
3. Argumentos semánticos
      3.1 criterios
      3.2 tipología
      3.3 clases conceptuales
4. Estructura
      4.1 corpus
      4.2 software
      4.3 base de datos
      4.4 usabilidad
5. Conclusiones
1. Presentación
1.1 Referencias



• Artículo: Cognición y percepción lingüísticas: Comunicaciones
   presentadas al VI Congreso Internacional de Lingüística Hispánica
   (Leipzig, 8-12 de octubre de 2003)
1.1 Referencias


• Artículo: Cognición y percepción lingüísticas: Comunicaciones
   presentadas al VI Congreso Internacional de Lingüística Hispánica
   (Leipzig, 8-12 de octubre de 2003)

• Editores: Enrique Serra y Gerd Wotjak. Universidad de Valencia, 2004.
1.1 Referencias

• Artículo: Cognición y percepción lingüísticas: Comunicaciones
   presentadas al VI Congreso Internacional de Lingüística Hispánica
   (Leipzig, 8-12 de octubre de 2003)

• Editores: Enrique Serra y Gerd Wotjak. Universidad de Valencia, 2004.
• Autor: Carlos Subirats, Catedrático UAB, actualmente trabaja y dirige el
   proyecto de invesigación FrameNet en el International Computer Science
   Institute Berkeley, California.
1.1 Referencias
 • Artículo: Cognición y percepción lingüísticas: Comunicaciones
    presentadas al VI Congreso Internacional de Lingüística Hispánica
    (Leipzig, 8-12 de octubre de 2003)

 • Editores: Enrique Serra y Gerd Wotjak. Universidad de Valencia, 2004.
 • Autor: Carlos Subirats, Catedrático UAB, actualmente trabaja y dirige el
    proyecto de invesigación FrameNet en el International Computer Science
    Institute Berkeley, California.

 • Se ha dedicado al estudio del léxico desde una perspectiva cognitiva al
    que ha aplicado la lingüística de corpus y el tratamiento automático del
    lenguaje
1.2 ¿Qué es FrameNet Español?
¿Qué es FrameNet Español?


  • “Es un proyecto de investigación de semántica cognitiva , cuyo
     objetivo es el estudio de la organización conceptual de la red de
     clases semánticas que configura semánticamente el léxico de
     predicados de la lengua española” [p.1]
¿Qué es FrameNet Español?

  • “Es un proyecto de investigación de semántica cognitiva , cuyo
     objetivo es el estudio de la organización conceptual de la red de
     clases semánticas que configura semánticamente el léxico de
     predicados de la lengua española” [p.1]

  • Enmarcado dentro de la propuesta de la semántica cognitiva
     conocida como frame semantics (Fillmore, 1985)
¿Qué es FrameNet Español?
  • “Es un proyecto de investigación de semántica cognitiva , cuyo
     objetivo es el estudio de la organización conceptual de la red de
     clases semánticas que configura semánticamente el léxico de
     predicados de la lengua española” [p.1]

  • Enmarcado dentro de la propuesta de la semántica cognitiva
     conocida como frame semantics (Fillmore, 1985)

  • Basado en los datos recopilados en un corpus
2.2 ¿Qué se propone?
¿Qué se propone?



 • Triple objetivo:
¿Qué se propone?



 • Triple objetivo:
    1. Identificar marcos semánticos (frame semantics)
¿Qué se propone?


 • Triple objetivo:
    1. Identificar marcos semánticos (frame semantics)

    2. Determinar los argumentos que los determinan (frame elements)
¿Qué se propone?

 • Triple objetivo:
    1. Identificar marcos semánticos (frame semantics)

    2. Determinar los argumentos que los determinan (frame elements)

    3. Anotar semántica y sintácticamente los predicados de dichos

    marcos
2. Marco teórico
2.1 Semántica cognitiva
Semántica cognitiva



  • Formas alternativas a la semántica estructural de entender
     cómo se organiza el léxico
Semántica cognitiva


  • Formas alternativas a la semántica estructural de entender
     cómo se organiza el léxico

  • El modelo de mayor influencia es el Fillmore: semántica de
     marcos (frame semantics)
Semántica cognitiva

  • Formas alternativas a la semántica estructural de entender
     cómo se organiza el léxico

  • El modelo de mayor influencia es el Fillmore: semántica de
     marcos (frame semantics)

  • No se trata solo de un modelo alternativo, es un
     replanteamiento básico de los objetivos de la semántica
Semántica cognitiva

  “Numerosos conceptos denotados por palabras
  concretas no pueden comprenderse al margen de las
  intenciones de los intervinientes o de las convenciones y
  los comportamientos sociales y culturales en los que se
  sitúa la acción, el estado o el objeto”



   [Croft (2004) Lingüística cognitiva. p.30]
2.2 Semántica estructural vs. cognitiva
Semántica estructural vs. cognitiva



• Criterio veritativo-condicional para la conceptualización:
   ej. [mujer > femenino, adulto, etc.]
Semántica estructural vs. cognitiva


• Criterio veritativo-condicional para la conceptualización:
   ej. [mujer > femenino, adulto, etc.]

• Existen asimetrías semánticas que no se explican con la teoría de los
   rasgos. El oyente evoca actitudes y comportamientos en el proceso de
   comprensión: semántica de la comprensión
Semántica estructural vs. cognitiva
• Criterio veritativo-condicional para la conceptualización:
    ej. [mujer > femenino, adulto, etc.]

• Existen asimetrías semánticas que no se explican con la teoría de los
    rasgos. El oyente evoca actitudes y comportamientos en el proceso de
    comprensión: semántica de la comprensión

• Fillmore entiende al marco como una región coherente del
    conocimiento humano y del espacio conceptual. Langacker lo llama
    base, Lakoff lo llama dominio (domain)
Semántica estructural vs. cognitiva

  • Ej. 1-Those are live lobsters/ those lobsters are alive
     2-Her manner is very alive/ She has a very alive manner
     3-His performance was live / He gave a live performance

  • En estas oraciones la diferencia entre live - alive sería
     inexplicable con la teoría de los rasgos

  • Los conceptos se asocian de manera diferente a tres marcos
     distintos: 1-vida, 2-personalidad, 3-modo de actuar
3. Argumentos semánticos

3.1 Criterios
3.2 Tipología
3.3 Clases conceptuales
3.1 Criterios




• ¿Cómo se determinan los argumentos semánticos?
3.1 Criterios



• ¿Cómo se determinan los argumentos semánticos?
  =Propiedades formales:
3.1 Criterios



• ¿Cómo se determinan los argumentos semánticos?
  =Propiedades formales:
  *Concordancia : nº y persona (1º argumentos)
3.1 Criterios


• ¿Cómo se determinan los argumentos semánticos?
  =Propiedades formales:
  *Concordancia : nº y persona (1º argumentos)
  *Pronombres clíticos de 3ªp (2º argumentos)
3.1 Criterios


• ¿Cómo se determinan los argumentos semánticos?
  =Propiedades formales:
  *Concordancia : nº y persona (1º argumentos)
  *Pronombres clíticos de 3ªp (2º argumentos)
  *Preposiciones (2º argumentos)
3.1 Criterios

• ¿Cómo se determinan los argumentos semánticos?
   =Propiedades formales:
   *Concordancia : nº y persona (1º argumentos)
   *Pronombres clíticos de 3ªp (2º argumentos)
   *Preposiciones (2º argumentos)

• Complementos adjuntos: no responden a esas propiedades formales
3.1 Criterios
• ¿Cómo se determinan los argumentos semánticos?
   =Propiedades formales:
   *Concordancia : nº y persona (1º argumentos)
   *Pronombres clíticos de 3ªp (2º argumentos)
   *Preposiciones (2º argumentos)

• Complementos adjuntos: no responden a esas propiedades formales
• Así se caracterizan los predicados del léxico y se estudia su
   proyección sintáctica como reflejo de la estructura conceptual
3.1 Criterios

 • Ej. Comentario > nombre predicativo >
    Juan le hizo un comentario a María (sobre X a través de X)
    1º argumento 2º argumento 1º compl. adj. 2º compl. adj.
    quién comenta a quién comenta     el tema        el medio
3.2 Tipología
3.2 Tipología



    • Externos: se manifiestan fuera del grupo analizado
       ej. [los políticos]ext decidieron bajar los impuestos
3.2 Tipología


    • Externos: se manifiestan fuera del grupo analizado
       ej. [los políticos]ext decidieron bajar los impuestos

    • Implícitos: están elididos, se utilizan etiquetas
       sintácticas para dar cuenta de la elisión
       ej. Ya no se estila ser ∅ galante con las mujeres
3.2 Tipología

    • Externos: se manifiestan fuera del grupo analizado
       ej. [los políticos]ext decidieron bajar los impuestos

    • Implícitos: están elididos, se utilizan etiquetas
       sintácticas para dar cuenta de la elisión
       ej. Ya no se estila ser ∅ galante con las mujeres

    • Incorporados: Se funden con el predicado
       ej. les ametrallaron [ametralladora+disparar]
3.3 Clases conceptuales



  • Son redes estructuradas conceptualmente que establecen
     relaciones de herencia con los argumentos
3.3 Clases conceptuales
  • Son redes estructuradas conceptualmente que establecen
     relaciones de herencia con los argumentos

  • Ej. empujar, cuyos argumentos nucleares son agente y tema
     pertenece a una clase semántica general: la de los verbos
     cuyos predicados son eventivos, de esta clase hereda los
     argumentos no nucleares temporales o locativos
3.3 Clases conceptuales

   “Las propiedades semánticas más generales, es
   decir, aquellas que afectan a múltiples clases
   semánticas, se pueden explicar por medio de las
   relaciones de herencia que se establecen en el marco
   de la red conceptual en al que se integran los
   predicados del léxico”
                          [p. 6]
4. Estructura

4.1 Corpus
4.2 Software
4.3 Base de datos
4.4 Usabilidad
4.1 Corpus
 • Consta de 350 millones de
    palabras:
    * 60% del español de
    América
    * 40% del español
    europeo

 • Base textual:
    * 31% textos periodísticos
    * 45% textos de
    divulgación de noticias
    *14% lengua oral
    *Otros: ensayos
    humanísticos, críticas de
    libros
4.1 Corpus: aplicaciones
    • Para la etiquetación, lematización y especificación
       morfológica: aplicación de transducción léxica a través de
       un diccionario electrónico expandido de 600 mil formas

    • Reconocimiento, control y extracción (identificar
       elementos léxicos que necesitan información sintáctica):
       ALIA (Algoritmo de intersección de autómatas)

    • Para las consultas de las palabras en concordancia:
       XKWIC
4.1 Corpus: aplicaciones
4.1 Corpus: aplicaciones



    • Para la etiquetación, lematización y especificación
       morfológica: aplicación de transducción léxica a través de
       un diccionario electrónico expandido de 600 mil formas
4.1 Corpus: aplicaciones

    • Para la etiquetación, lematización y especificación
       morfológica: aplicación de transducción léxica a través de
       un diccionario electrónico expandido de 600 mil formas

    • Reconocimiento, control y extracción (identificar
       elementos léxicos que necesitan información sintáctica):
       ALIA (Algoritmo de intersección de autómatas)
4.1 Corpus: aplicaciones
    • Para la etiquetación, lematización y especificación
       morfológica: aplicación de transducción léxica a través de
       un diccionario electrónico expandido de 600 mil formas

    • Reconocimiento, control y extracción (identificar
       elementos léxicos que necesitan información sintáctica):
       ALIA (Algoritmo de intersección de autómatas)

    • Para las consultas de las palabras en concordancia:
       XKWIC
4.2 Software
4.2 Software



    • Las elementos extraídos del corpus se anotarán
       semántica y sintácticamente: núcleo central del
       desarrollo del proyecto
4.2 Software

    • Las elementos extraídos del corpus se anotarán
       semántica y sintácticamente: núcleo central del
       desarrollo del proyecto

    • Para ello se utilizará la aplicación FNDesktop que lo
       realiza semiautomáticamente
4.2 Software
    • Las elementos extraídos del corpus se anotarán
         semántica y sintácticamente: núcleo central del
         desarrollo del proyecto

      • Para ello se utilizará la aplicación FNDesktop que lo
         realiza semiautomáticamente

      • Permite tres niveles de anotación que permiten
         especificar: el argumento semántico, su función
         sintáctica y el tipo de constituyente
4.3 Base de datos
4.3 Base de datos



    • Las oraciones extraídas del corpus y anotadas se
       importarán a una base de datos
4.3 Base de datos


    • Las oraciones extraídas del corpus y anotadas se
       importarán a una base de datos

    • Esa base estará en la plataforma MySQL (sistema de
       gestión de bases de datos relacional)
4.3 Base de datos

    • Las oraciones extraídas del corpus y anotadas se
       importarán a una base de datos

    • Esa base estará en la plataforma MySQL (sistema de
       gestión de bases de datos relacional)

    • Los datos se importarán en formato XML que
       pertenece al lenguaje de marcas (formato semántico)
4.4 Usabilidad: consultas
4.4 Usabilidad: consultas



    • Finalmente, la base de datos etiquetada se puede
       consultar con el programa FrameSQL
4.4 Usabilidad: consultas

    • Finalmente, la base de datos etiquetada se puede
       consultar con el programa FrameSQL

    • Permite consultar tanto la descripción de los marcos
       semánticos y sus argumentos como la visualización de
       la construcción sintáctica
4.4 Usabilidad: consultas
    • Finalmente, la base de datos etiquetada se puede
       consultar con el programa FrameSQL

    • Permite consultar tanto la descripción de los marcos
       semánticos y sus argumentos como la visualización de
       la construcción sintáctica

    • Consultas transversales: dentro de un marco semántico
       o de toda la base datos
4.4 Usabilidad: aplicaciones
4.4 Usabilidad: aplicaciones



    • La base de datos servirá como un diccionario semántico
       en línea
4.4 Usabilidad: aplicaciones


    • La base de datos servirá como un diccionario semántico
       en línea

    • También, como corpus de entrenamiento para
       aplicaciones de etiquetación semántica automática
4.4 Usabilidad: aplicaciones

    • La base de datos servirá como un diccionario semántico
       en línea

    • También, como corpus de entrenamiento para
       aplicaciones de etiquetación semántica automática

    • Además, al estar enlazada con otros corpus, actuará
       como nodo entre un conjunto de bases de datos
5. Conclusiones

5.1 Algunas críticas
5.2 Algunas sugerencias
5.3 Para finalizar
5.1 Algunas críticas



    • La interfaz es demasiado compleja
5.1 Algunas críticas


    • La interfaz es demasiado compleja
    • Las etiquetas deberían estar traducidas al español
5.1 Algunas críticas

    • La interfaz es demasiado compleja
    • Las etiquetas deberían estar traducidas al español
    • Los textos son mayoritariamente periodísticos, lengua
       [+formal], [+estándar]
5.1 Algunas críticas
    • La interfaz es demasiado compleja
    • Las etiquetas deberían estar traducidas al español
    • Los textos son mayoritariamente periodísticos, lengua
       [+formal], [+estándar]

    • El porcentaje de textos del español europeo y del
       español americano no es proporcionado (D 46)
5.1 Algunas críticas
    • La interfaz es demasiado compleja
    • Las etiquetas deberían estar traducidas al español
    • Los textos son mayoritariamente periodísticos, lengua
       [+formal], [+estándar]

    • El porcentaje de textos del español europeo y del
       español americano no es proporcionado
5.2 Algunas sugerencias

    • Mejorar la visibilidad de la interfaz para poder entender
       el concepto de red semántica

    • Unificar la lengua
    • Utilizar fuentes orales que presenten una sintaxis más
       laxa donde actúen factores pragmáticos
5.3 Para finalizar
    • El proyecto es muy interesante y ambicioso: hacer visibles
       las redes congnitivas de la conceptualización

    • Permite un tipo de consultas que pone de manifiesto la
       determinación mútua entre sintaxis y semántica

    • Gracias a la conjunción lingüísitica y tecnología puede
       crear un mapa virtual a base de datos reales que son prueba
       empírica de esquemas cognitivos
Bibliografía
• BAKER, Collin F.; FILLMORE, Charles; CRONIN, Beau. 2003. The Structure of the
   FrameNet Database. International Journal of Lexicography 16.3:281-296
   (http://www3.oup.co.uk/lexico/hdb/Volume_16/Issue_03/pdf/160281.pdf).

• CROFT, W. and CRUSE, A. 2004. Cognitive linguistics. Cambridge University Press
• FILLMORE, Charles J. 1985. Frames and the semantics of understanding. Quaderni
   di Semántica 6.2:222-254.

• FILLMORE, Charles J.; BAKER, Collin F.; SATO, Hiroaki. 2002. The FrameNet
   Database and Software Tools. In Proceedings of the Third International Conference
   on Language Resources and Evaluation (LREC). Las Palmas, pp. 1157-1160
   (http://framenet.icsi.berkeley.edu/~framenet/papers/demo4.pdf).

• SUBIRATS, Carlos; SATO, Hiroaki. 2004. Spanish FrameNet and FrameSQL 4th
   International Conference on Language Resources and Evaluation (LREC),
   14Workshop on Building Lexical Resources from Semantically Annotated Corpora,
   May 30, 2004. Lisboa
   (http://seneca.uab.es/csubirats/Subirats-Sato_LREC-2004.doc)

Más contenido relacionado

Similar a Frame netspanish

El uso de ontologías en la enseñanza de lenguas extranjeras
El uso de ontologías en la enseñanza de lenguas extranjerasEl uso de ontologías en la enseñanza de lenguas extranjeras
El uso de ontologías en la enseñanza de lenguas extranjeras
Atlas Uned
 
Comunicación y lenguaje
Comunicación y lenguajeComunicación y lenguaje
Comunicación y lenguaje
UTPL UTPL
 
La Dinamica Racional Del Discurso 2
La Dinamica Racional Del Discurso 2La Dinamica Racional Del Discurso 2
La Dinamica Racional Del Discurso 2
gueste94b3e
 

Similar a Frame netspanish (20)

Pragmática1
Pragmática1Pragmática1
Pragmática1
 
estructura-textual.ppt
estructura-textual.pptestructura-textual.ppt
estructura-textual.ppt
 
Análisis del discurso
Análisis del discursoAnálisis del discurso
Análisis del discurso
 
El Texto Expositivo.ppt
El Texto Expositivo.pptEl Texto Expositivo.ppt
El Texto Expositivo.ppt
 
El Texto Expositivo.ppt
El Texto Expositivo.pptEl Texto Expositivo.ppt
El Texto Expositivo.ppt
 
El%20Texto%20Expositivo.pptx
El%20Texto%20Expositivo.pptxEl%20Texto%20Expositivo.pptx
El%20Texto%20Expositivo.pptx
 
ANÁLISIS DEL DISCURSO. MAOP 2011, revulu11
ANÁLISIS DEL DISCURSO. MAOP 2011, revulu11ANÁLISIS DEL DISCURSO. MAOP 2011, revulu11
ANÁLISIS DEL DISCURSO. MAOP 2011, revulu11
 
3 . Representación del conocimiento y razonamiento
3 . Representación del conocimiento y razonamiento3 . Representación del conocimiento y razonamiento
3 . Representación del conocimiento y razonamiento
 
El uso de ontologías en la enseñanza de lenguas extranjeras
El uso de ontologías en la enseñanza de lenguas extranjerasEl uso de ontologías en la enseñanza de lenguas extranjeras
El uso de ontologías en la enseñanza de lenguas extranjeras
 
TEMA 4.pptx
TEMA 4.pptxTEMA 4.pptx
TEMA 4.pptx
 
Daniel cassany-escritura
Daniel cassany-escrituraDaniel cassany-escritura
Daniel cassany-escritura
 
Comunicación y lenguaje
Comunicación y lenguajeComunicación y lenguaje
Comunicación y lenguaje
 
Texto expositivo
Texto expositivoTexto expositivo
Texto expositivo
 
RESÚMENES DE LOS FASCÍCULOS_BRITNEY, GISELA, LURDES, EULER, ELENA Y DEIVIS.pptx
RESÚMENES DE LOS FASCÍCULOS_BRITNEY, GISELA, LURDES, EULER, ELENA Y DEIVIS.pptxRESÚMENES DE LOS FASCÍCULOS_BRITNEY, GISELA, LURDES, EULER, ELENA Y DEIVIS.pptx
RESÚMENES DE LOS FASCÍCULOS_BRITNEY, GISELA, LURDES, EULER, ELENA Y DEIVIS.pptx
 
La paraula dins de la gramàtica
La paraula dins de la gramàticaLa paraula dins de la gramàtica
La paraula dins de la gramàtica
 
Lh 2
Lh 2Lh 2
Lh 2
 
Pragmatica - modulo 1 .ppt
Pragmatica - modulo 1 .pptPragmatica - modulo 1 .ppt
Pragmatica - modulo 1 .ppt
 
La Dinamica Racional Del Discurso 2
La Dinamica Racional Del Discurso 2La Dinamica Racional Del Discurso 2
La Dinamica Racional Del Discurso 2
 
Clase lc 1 int (pp tminimizer)
Clase lc 1 int (pp tminimizer)Clase lc 1 int (pp tminimizer)
Clase lc 1 int (pp tminimizer)
 
Unidad 2 | Metodología de la investigación
Unidad 2 | Metodología de la investigaciónUnidad 2 | Metodología de la investigación
Unidad 2 | Metodología de la investigación
 

Más de Laura Menna (20)

Puntuación
PuntuaciónPuntuación
Puntuación
 
Cohesión
CohesiónCohesión
Cohesión
 
La desfocalizacion
La desfocalizacionLa desfocalizacion
La desfocalizacion
 
Párrafos
PárrafosPárrafos
Párrafos
 
Identidades en red: el #15M en twitter
Identidades en red: el #15M en twitterIdentidades en red: el #15M en twitter
Identidades en red: el #15M en twitter
 
1 clase
1 clase1 clase
1 clase
 
Yo quiero
Yo quieroYo quiero
Yo quiero
 
Me gusta (actividad)
Me gusta (actividad)Me gusta (actividad)
Me gusta (actividad)
 
Ropa colores
Ropa coloresRopa colores
Ropa colores
 
Unidad.2.1
Unidad.2.1Unidad.2.1
Unidad.2.1
 
Unidad.2
Unidad.2Unidad.2
Unidad.2
 
Quinta.clase
Quinta.claseQuinta.clase
Quinta.clase
 
Cuarta.clase
Cuarta.claseCuarta.clase
Cuarta.clase
 
3.clase
3.clase3.clase
3.clase
 
2 Clase Shruti
2 Clase Shruti2 Clase Shruti
2 Clase Shruti
 
Torres, a. fronteras
Torres, a. fronterasTorres, a. fronteras
Torres, a. fronteras
 
Eeuu2
Eeuu2Eeuu2
Eeuu2
 
Eeuu
EeuuEeuu
Eeuu
 
Sociolingüística vi
Sociolingüística viSociolingüística vi
Sociolingüística vi
 
Sociolingüística v
Sociolingüística vSociolingüística v
Sociolingüística v
 

Frame netspanish

  • 1. FrameNet Español: Una red semántica de marcos conceptuales [Carlos Subirats Rüggeberg. Universidad Autónoma de Barcelona]
  • 2. Esquema de la presentación
  • 3. 1. Presentación 1.1 referencias 1.2¿qué es FrameNet? 1.3¿qué se propone? 2. Marco teórico 2.1 semántica cognitiva (Fillmore, 1985) 2.2 semántica estructural vs. cognitiva 3. Argumentos semánticos 3.1 criterios 3.2 tipología 3.3 clases conceptuales 4. Estructura 4.1 corpus 4.2 software 4.3 base de datos 4.4 usabilidad 5. Conclusiones
  • 5. 1.1 Referencias • Artículo: Cognición y percepción lingüísticas: Comunicaciones presentadas al VI Congreso Internacional de Lingüística Hispánica (Leipzig, 8-12 de octubre de 2003)
  • 6. 1.1 Referencias • Artículo: Cognición y percepción lingüísticas: Comunicaciones presentadas al VI Congreso Internacional de Lingüística Hispánica (Leipzig, 8-12 de octubre de 2003) • Editores: Enrique Serra y Gerd Wotjak. Universidad de Valencia, 2004.
  • 7. 1.1 Referencias • Artículo: Cognición y percepción lingüísticas: Comunicaciones presentadas al VI Congreso Internacional de Lingüística Hispánica (Leipzig, 8-12 de octubre de 2003) • Editores: Enrique Serra y Gerd Wotjak. Universidad de Valencia, 2004. • Autor: Carlos Subirats, Catedrático UAB, actualmente trabaja y dirige el proyecto de invesigación FrameNet en el International Computer Science Institute Berkeley, California.
  • 8. 1.1 Referencias • Artículo: Cognición y percepción lingüísticas: Comunicaciones presentadas al VI Congreso Internacional de Lingüística Hispánica (Leipzig, 8-12 de octubre de 2003) • Editores: Enrique Serra y Gerd Wotjak. Universidad de Valencia, 2004. • Autor: Carlos Subirats, Catedrático UAB, actualmente trabaja y dirige el proyecto de invesigación FrameNet en el International Computer Science Institute Berkeley, California. • Se ha dedicado al estudio del léxico desde una perspectiva cognitiva al que ha aplicado la lingüística de corpus y el tratamiento automático del lenguaje
  • 9. 1.2 ¿Qué es FrameNet Español?
  • 10. ¿Qué es FrameNet Español? • “Es un proyecto de investigación de semántica cognitiva , cuyo objetivo es el estudio de la organización conceptual de la red de clases semánticas que configura semánticamente el léxico de predicados de la lengua española” [p.1]
  • 11. ¿Qué es FrameNet Español? • “Es un proyecto de investigación de semántica cognitiva , cuyo objetivo es el estudio de la organización conceptual de la red de clases semánticas que configura semánticamente el léxico de predicados de la lengua española” [p.1] • Enmarcado dentro de la propuesta de la semántica cognitiva conocida como frame semantics (Fillmore, 1985)
  • 12. ¿Qué es FrameNet Español? • “Es un proyecto de investigación de semántica cognitiva , cuyo objetivo es el estudio de la organización conceptual de la red de clases semánticas que configura semánticamente el léxico de predicados de la lengua española” [p.1] • Enmarcado dentro de la propuesta de la semántica cognitiva conocida como frame semantics (Fillmore, 1985) • Basado en los datos recopilados en un corpus
  • 13. 2.2 ¿Qué se propone?
  • 14. ¿Qué se propone? • Triple objetivo:
  • 15. ¿Qué se propone? • Triple objetivo: 1. Identificar marcos semánticos (frame semantics)
  • 16. ¿Qué se propone? • Triple objetivo: 1. Identificar marcos semánticos (frame semantics) 2. Determinar los argumentos que los determinan (frame elements)
  • 17. ¿Qué se propone? • Triple objetivo: 1. Identificar marcos semánticos (frame semantics) 2. Determinar los argumentos que los determinan (frame elements) 3. Anotar semántica y sintácticamente los predicados de dichos marcos
  • 20. Semántica cognitiva • Formas alternativas a la semántica estructural de entender cómo se organiza el léxico
  • 21. Semántica cognitiva • Formas alternativas a la semántica estructural de entender cómo se organiza el léxico • El modelo de mayor influencia es el Fillmore: semántica de marcos (frame semantics)
  • 22. Semántica cognitiva • Formas alternativas a la semántica estructural de entender cómo se organiza el léxico • El modelo de mayor influencia es el Fillmore: semántica de marcos (frame semantics) • No se trata solo de un modelo alternativo, es un replanteamiento básico de los objetivos de la semántica
  • 23. Semántica cognitiva “Numerosos conceptos denotados por palabras concretas no pueden comprenderse al margen de las intenciones de los intervinientes o de las convenciones y los comportamientos sociales y culturales en los que se sitúa la acción, el estado o el objeto” [Croft (2004) Lingüística cognitiva. p.30]
  • 24. 2.2 Semántica estructural vs. cognitiva
  • 25. Semántica estructural vs. cognitiva • Criterio veritativo-condicional para la conceptualización: ej. [mujer > femenino, adulto, etc.]
  • 26. Semántica estructural vs. cognitiva • Criterio veritativo-condicional para la conceptualización: ej. [mujer > femenino, adulto, etc.] • Existen asimetrías semánticas que no se explican con la teoría de los rasgos. El oyente evoca actitudes y comportamientos en el proceso de comprensión: semántica de la comprensión
  • 27. Semántica estructural vs. cognitiva • Criterio veritativo-condicional para la conceptualización: ej. [mujer > femenino, adulto, etc.] • Existen asimetrías semánticas que no se explican con la teoría de los rasgos. El oyente evoca actitudes y comportamientos en el proceso de comprensión: semántica de la comprensión • Fillmore entiende al marco como una región coherente del conocimiento humano y del espacio conceptual. Langacker lo llama base, Lakoff lo llama dominio (domain)
  • 28. Semántica estructural vs. cognitiva • Ej. 1-Those are live lobsters/ those lobsters are alive 2-Her manner is very alive/ She has a very alive manner 3-His performance was live / He gave a live performance • En estas oraciones la diferencia entre live - alive sería inexplicable con la teoría de los rasgos • Los conceptos se asocian de manera diferente a tres marcos distintos: 1-vida, 2-personalidad, 3-modo de actuar
  • 29. 3. Argumentos semánticos 3.1 Criterios 3.2 Tipología 3.3 Clases conceptuales
  • 30. 3.1 Criterios • ¿Cómo se determinan los argumentos semánticos?
  • 31. 3.1 Criterios • ¿Cómo se determinan los argumentos semánticos? =Propiedades formales:
  • 32. 3.1 Criterios • ¿Cómo se determinan los argumentos semánticos? =Propiedades formales: *Concordancia : nº y persona (1º argumentos)
  • 33. 3.1 Criterios • ¿Cómo se determinan los argumentos semánticos? =Propiedades formales: *Concordancia : nº y persona (1º argumentos) *Pronombres clíticos de 3ªp (2º argumentos)
  • 34. 3.1 Criterios • ¿Cómo se determinan los argumentos semánticos? =Propiedades formales: *Concordancia : nº y persona (1º argumentos) *Pronombres clíticos de 3ªp (2º argumentos) *Preposiciones (2º argumentos)
  • 35. 3.1 Criterios • ¿Cómo se determinan los argumentos semánticos? =Propiedades formales: *Concordancia : nº y persona (1º argumentos) *Pronombres clíticos de 3ªp (2º argumentos) *Preposiciones (2º argumentos) • Complementos adjuntos: no responden a esas propiedades formales
  • 36. 3.1 Criterios • ¿Cómo se determinan los argumentos semánticos? =Propiedades formales: *Concordancia : nº y persona (1º argumentos) *Pronombres clíticos de 3ªp (2º argumentos) *Preposiciones (2º argumentos) • Complementos adjuntos: no responden a esas propiedades formales • Así se caracterizan los predicados del léxico y se estudia su proyección sintáctica como reflejo de la estructura conceptual
  • 37. 3.1 Criterios • Ej. Comentario > nombre predicativo > Juan le hizo un comentario a María (sobre X a través de X) 1º argumento 2º argumento 1º compl. adj. 2º compl. adj. quién comenta a quién comenta el tema el medio
  • 39. 3.2 Tipología • Externos: se manifiestan fuera del grupo analizado ej. [los políticos]ext decidieron bajar los impuestos
  • 40. 3.2 Tipología • Externos: se manifiestan fuera del grupo analizado ej. [los políticos]ext decidieron bajar los impuestos • Implícitos: están elididos, se utilizan etiquetas sintácticas para dar cuenta de la elisión ej. Ya no se estila ser ∅ galante con las mujeres
  • 41. 3.2 Tipología • Externos: se manifiestan fuera del grupo analizado ej. [los políticos]ext decidieron bajar los impuestos • Implícitos: están elididos, se utilizan etiquetas sintácticas para dar cuenta de la elisión ej. Ya no se estila ser ∅ galante con las mujeres • Incorporados: Se funden con el predicado ej. les ametrallaron [ametralladora+disparar]
  • 42. 3.3 Clases conceptuales • Son redes estructuradas conceptualmente que establecen relaciones de herencia con los argumentos
  • 43. 3.3 Clases conceptuales • Son redes estructuradas conceptualmente que establecen relaciones de herencia con los argumentos • Ej. empujar, cuyos argumentos nucleares son agente y tema pertenece a una clase semántica general: la de los verbos cuyos predicados son eventivos, de esta clase hereda los argumentos no nucleares temporales o locativos
  • 44. 3.3 Clases conceptuales “Las propiedades semánticas más generales, es decir, aquellas que afectan a múltiples clases semánticas, se pueden explicar por medio de las relaciones de herencia que se establecen en el marco de la red conceptual en al que se integran los predicados del léxico” [p. 6]
  • 45. 4. Estructura 4.1 Corpus 4.2 Software 4.3 Base de datos 4.4 Usabilidad
  • 46. 4.1 Corpus • Consta de 350 millones de palabras: * 60% del español de América * 40% del español europeo • Base textual: * 31% textos periodísticos * 45% textos de divulgación de noticias *14% lengua oral *Otros: ensayos humanísticos, críticas de libros
  • 47. 4.1 Corpus: aplicaciones • Para la etiquetación, lematización y especificación morfológica: aplicación de transducción léxica a través de un diccionario electrónico expandido de 600 mil formas • Reconocimiento, control y extracción (identificar elementos léxicos que necesitan información sintáctica): ALIA (Algoritmo de intersección de autómatas) • Para las consultas de las palabras en concordancia: XKWIC
  • 49. 4.1 Corpus: aplicaciones • Para la etiquetación, lematización y especificación morfológica: aplicación de transducción léxica a través de un diccionario electrónico expandido de 600 mil formas
  • 50. 4.1 Corpus: aplicaciones • Para la etiquetación, lematización y especificación morfológica: aplicación de transducción léxica a través de un diccionario electrónico expandido de 600 mil formas • Reconocimiento, control y extracción (identificar elementos léxicos que necesitan información sintáctica): ALIA (Algoritmo de intersección de autómatas)
  • 51. 4.1 Corpus: aplicaciones • Para la etiquetación, lematización y especificación morfológica: aplicación de transducción léxica a través de un diccionario electrónico expandido de 600 mil formas • Reconocimiento, control y extracción (identificar elementos léxicos que necesitan información sintáctica): ALIA (Algoritmo de intersección de autómatas) • Para las consultas de las palabras en concordancia: XKWIC
  • 53. 4.2 Software • Las elementos extraídos del corpus se anotarán semántica y sintácticamente: núcleo central del desarrollo del proyecto
  • 54. 4.2 Software • Las elementos extraídos del corpus se anotarán semántica y sintácticamente: núcleo central del desarrollo del proyecto • Para ello se utilizará la aplicación FNDesktop que lo realiza semiautomáticamente
  • 55. 4.2 Software • Las elementos extraídos del corpus se anotarán semántica y sintácticamente: núcleo central del desarrollo del proyecto • Para ello se utilizará la aplicación FNDesktop que lo realiza semiautomáticamente • Permite tres niveles de anotación que permiten especificar: el argumento semántico, su función sintáctica y el tipo de constituyente
  • 56. 4.3 Base de datos
  • 57. 4.3 Base de datos • Las oraciones extraídas del corpus y anotadas se importarán a una base de datos
  • 58. 4.3 Base de datos • Las oraciones extraídas del corpus y anotadas se importarán a una base de datos • Esa base estará en la plataforma MySQL (sistema de gestión de bases de datos relacional)
  • 59. 4.3 Base de datos • Las oraciones extraídas del corpus y anotadas se importarán a una base de datos • Esa base estará en la plataforma MySQL (sistema de gestión de bases de datos relacional) • Los datos se importarán en formato XML que pertenece al lenguaje de marcas (formato semántico)
  • 61. 4.4 Usabilidad: consultas • Finalmente, la base de datos etiquetada se puede consultar con el programa FrameSQL
  • 62. 4.4 Usabilidad: consultas • Finalmente, la base de datos etiquetada se puede consultar con el programa FrameSQL • Permite consultar tanto la descripción de los marcos semánticos y sus argumentos como la visualización de la construcción sintáctica
  • 63. 4.4 Usabilidad: consultas • Finalmente, la base de datos etiquetada se puede consultar con el programa FrameSQL • Permite consultar tanto la descripción de los marcos semánticos y sus argumentos como la visualización de la construcción sintáctica • Consultas transversales: dentro de un marco semántico o de toda la base datos
  • 65. 4.4 Usabilidad: aplicaciones • La base de datos servirá como un diccionario semántico en línea
  • 66. 4.4 Usabilidad: aplicaciones • La base de datos servirá como un diccionario semántico en línea • También, como corpus de entrenamiento para aplicaciones de etiquetación semántica automática
  • 67. 4.4 Usabilidad: aplicaciones • La base de datos servirá como un diccionario semántico en línea • También, como corpus de entrenamiento para aplicaciones de etiquetación semántica automática • Además, al estar enlazada con otros corpus, actuará como nodo entre un conjunto de bases de datos
  • 68. 5. Conclusiones 5.1 Algunas críticas 5.2 Algunas sugerencias 5.3 Para finalizar
  • 69. 5.1 Algunas críticas • La interfaz es demasiado compleja
  • 70. 5.1 Algunas críticas • La interfaz es demasiado compleja • Las etiquetas deberían estar traducidas al español
  • 71. 5.1 Algunas críticas • La interfaz es demasiado compleja • Las etiquetas deberían estar traducidas al español • Los textos son mayoritariamente periodísticos, lengua [+formal], [+estándar]
  • 72. 5.1 Algunas críticas • La interfaz es demasiado compleja • Las etiquetas deberían estar traducidas al español • Los textos son mayoritariamente periodísticos, lengua [+formal], [+estándar] • El porcentaje de textos del español europeo y del español americano no es proporcionado (D 46)
  • 73. 5.1 Algunas críticas • La interfaz es demasiado compleja • Las etiquetas deberían estar traducidas al español • Los textos son mayoritariamente periodísticos, lengua [+formal], [+estándar] • El porcentaje de textos del español europeo y del español americano no es proporcionado
  • 74. 5.2 Algunas sugerencias • Mejorar la visibilidad de la interfaz para poder entender el concepto de red semántica • Unificar la lengua • Utilizar fuentes orales que presenten una sintaxis más laxa donde actúen factores pragmáticos
  • 75. 5.3 Para finalizar • El proyecto es muy interesante y ambicioso: hacer visibles las redes congnitivas de la conceptualización • Permite un tipo de consultas que pone de manifiesto la determinación mútua entre sintaxis y semántica • Gracias a la conjunción lingüísitica y tecnología puede crear un mapa virtual a base de datos reales que son prueba empírica de esquemas cognitivos
  • 76. Bibliografía • BAKER, Collin F.; FILLMORE, Charles; CRONIN, Beau. 2003. The Structure of the FrameNet Database. International Journal of Lexicography 16.3:281-296 (http://www3.oup.co.uk/lexico/hdb/Volume_16/Issue_03/pdf/160281.pdf). • CROFT, W. and CRUSE, A. 2004. Cognitive linguistics. Cambridge University Press • FILLMORE, Charles J. 1985. Frames and the semantics of understanding. Quaderni di Semántica 6.2:222-254. • FILLMORE, Charles J.; BAKER, Collin F.; SATO, Hiroaki. 2002. The FrameNet Database and Software Tools. In Proceedings of the Third International Conference on Language Resources and Evaluation (LREC). Las Palmas, pp. 1157-1160 (http://framenet.icsi.berkeley.edu/~framenet/papers/demo4.pdf). • SUBIRATS, Carlos; SATO, Hiroaki. 2004. Spanish FrameNet and FrameSQL 4th International Conference on Language Resources and Evaluation (LREC), 14Workshop on Building Lexical Resources from Semantically Annotated Corpora, May 30, 2004. Lisboa (http://seneca.uab.es/csubirats/Subirats-Sato_LREC-2004.doc)