SlideShare una empresa de Scribd logo
1 de 15
HG-1 Treebank demó



A funkcionális szerkezet jellemzői
1. bevezető megjegyzések


   általános elméleti keretünk a Lexikai-
    Funkcionális Grammatika (LFG)
   alternatív, nemtranszformációs generatív modell
   minden jólformált mondathoz két párhuzamos
    szintaktikai reprezentációt rendel (tehát
    reprezentációs és nem derivációs természetű)
       összetevős szerkezetet (ö-szerkezetet, vö. c-structure)
       funkcionális szerkezetet (f-szerkezetet, vö. f-structure)
2. bevezető megjegyzések

   az összetevős szerkezet a mondat „felszíni”, nyelvspecifikus
    jellemzőit ábrázolja: pl. a szórendi viszonyokat, a különböző
    frázisok elhelyezkedését
   a funkcionális szerkezet a mondat nyelvfüggetlen tulajdonságait
    ragadja meg: pl. az általános nyelvtani
    viszonyokat, legfőképpen a grammatikai funkciókat
    (alany, tárgy stb.)
   a következő dián egy egyszerű angol-magyar példa
    szemlélteti, hogy az ö-szerkezetek különbözősége ellenére
    (ugyanis az angolban elöljárószós, míg a magyarban névutós
    kifejezés található) a funkcionális jellemzőket ábrázoló f-
    szerkezet szintjén azonos reprezentáció szerepel
3. egy elöljárószós/névutós példa

       PP               különböző ö-szerkezetek           PP

Pr           NP                                   NP              Po

       Det          N                    Det             N

near   the        box                     a            doboz    mellett



              PRED      ‘near/mellett <(OBJ)>’

              OBJ       PRED    ‘box/doboz’
                        DEF     +
                        PERS    3                       azonos f-szerkezet
                        NUM     sg
4. leképezési kapcsolat a két szerkezet között

   a következő dia az előző magyar példa felhasználásával szemlélteti,
    hogy az ö-szerkezet és az f-szerkezet közötti megfeleltetési
    (leképezési) kapcsolatot az ö-szerkezetben található
    csomópontokhoz társított, legtöbbször egyenlőségekkel kifejezett
    funkcionális annotációk biztosítják
   a két alapvetően egyenlőségfajta a következő
   ↑=↓ -- ez a funkcionális fejet jelöli: azt kódolja, hogy az anya
    csomópont funkcionális jegyei megegyeznek az adott csomópont
    jegyeivel
   (↑GF)=↓ -- ez azt fejezi ki, hogy az anya összetevő funkcionális
    szerkezetében az adott csomópont milyen grammatikai funkciót tölt
    be, pl. a következő dián ez szerepel: (↑OBJ)=↓, és azt kódolja, hogy
    a PP funkcionális szerkezetében az NP tárgyi funkciójú
5. leképezési kapcsolat a két szerkezet között


                    PP                       PRED     ‘mellett <(OBJ)>’

       (↑OBJ)=↓                 ↑=↓          OBJ      PRED     ‘doboz’
          NP                     P                    PERS     3
                              (↑PRED) =
                                                      NUM      sg
 ↑=↓              ↑=↓    ‘mellett <(OBJ)>’
                                                      DEF      +
 Det               N
(↑DEF)=+    (↑PRED)=‘doboz’
            (↑PERS)=3                        további annotációk:
            (↑NUM)=sg                        (↑DEF)=+ a határozottság jegye
                                             (↑PRED)= ‘ … ’ a szó jelentése
  a            doboz          mellett        (↑PERS)=3 a harmadik személy jegye
                                             (↑NUM)=sg az egyes szám jegye
6. leképezési kapcsolat a két szerkezet között

   az előző diákon bemutatott funkcionális annotációk az LFG elméleti
    keretében végzett elemzésekben megjelennek egyrészt az ö-
    szerkezeteket létrehozó (ún. frázisstruktúra-szabályokban, más
    néven: újraíró szabályokban), másrészt az ö-szerkezeti
    reprezentációkban
   az LFG-nek az általunk alkalmazott implementációs platformján, az
    XLE-ben (Xerox Linguistic Environment = Xerox Nyelvészeti
    Környezet), az annotációk csak a frázisstruktúra-szabályokban
    vannak kódolva, és a jobb áttekinthetőség érdekében nincsenek
    külön feltüntetve az ö-szerkezetben is (ez tehát csupán egy
    megjelenítésbeli különbség mindenféle lényegi relevancia nélkül)
7. a funkcionális szerkezet alapvető jellemzői

a korábban ismertetetteken kívül az alábbi tulajdonságok a kiemelten
fontosak
 az f-szerkezeteket mindig szögletes zárójelek között ábrázoljuk

 ezek a szerkezetek lényegében attribútum—érték párokból álló
   mátrixok
 egy-egy ilyen párban mindig a bal oldali elem az attribútum és a
   jobb oldali az érték
 mivel az f-szerkezet nyelvtani relációkat kódol attribútum—érték
   párok mátrixaként, ezeknek a pároknak a sorrendje teljes
   mértékben tetszőleges: mindegy, hogy melyik van alul vagy felül
 egy attribútumnak lehet atomi értéke, pl. az 5. dián szereplő NUM,
   PERS és DEF attribútumoknak atomi értékeik vannak, rendre: sg,
   3 és +
8. a funkcionális szerkezet alapvető jellemzői

   más attribútumoknak komplex értékük van, ami azt jelenti, hogy
    adott érték maga egy vagy több újabb, „beágyazott” attribútum—
    érték pár, pl. az 5. dián ilyen az OBJ attribútum (a tárgyi funkció),
    amelynek értékében van egy PRED attribútum (értéke: a főnév
    jelentése), valamint az előző pontban említett három atomi értékű
    attribútum: NUM, PERS és DEF
   tekintettel arra, hogy a funkcionális fej jelölésnek (↑=↓) megfelelően
    az anya csomópontnak és a fej csomópontnak megegyeznek a
    funkcionális jegyei, a két elem f-szerkezete egybeesik, megegyezik,
    például az 5. dián az OBJ attribútum értéke (a négy attribútum—
    érték pár) a főnévi fejhez (N) és a teljes főnévi csoporthoz (NP) is
    tartozó f-szerkezetrész
9. a leggyakoribb attribútumok
egy predikátum által a vonzataihoz rendelt grammatikai
funkciók, amelyek a predikátum argumentumszerkezetében < és >
között vannak megadva: pl. az üt lexikai tétele: (PRED)=‘üt
<(SUBJ)(OBJ)>’

SUBJ           alany
OBJ            tárgy
OBL            határozói vonzat
XCOMP          jellegzetesen főnévi igenévvel kifejezett propozicionális
               argumentum funkciója
COMP           beágyazott, ragozott igék tartalmazó tagmondat
               funkciója
PREDLINK       a létige bizonyos, kétargumentumúnak felfogott
               használatában a második argumentum funkciója
POSS           a főnévi csoporton belül a birtokos összetevő funkciója
10. a leggyakoribb attribútumok
nem vonzatfunkciók

ADJUNCT adjunktum (=szabad módosító), jellegzetesen ilyen funkciójúak
        például a hely- és időviszonyokat kifejező összetevők
        tekintettel arra, hogy ilyen funkciójú összetevőkből elvileg
        tetszőlegesen sok lehet, az f-szerkezeti reprezentációkban
        halmazként szokás szerepeltetni őket egymás alatt, kapcsos
        zárójelek {…} között
FOCUS*    a fókusz diskurzusfunkció új információt hordoz, jellemzően
          valamilyen elem (kizáró) azonosítását fejezi ki
TOPIC*    a topik diskurzusfunkció ismert információt hordoz, a mondat
          „logikai alanyát” fejezi ki, amelyről a mondat állítása szól
          mivel egynél több topik is lehet egy mondatban, a topikok is
          kapcsos zárójelek közé kerülnek az f-szerkezetben
*megjegyzés: csak olyan összetevő kaphat diskurzusfunkciót, amelynek van
egyéb funkciója is (tehát vonzat vagy adjunktum)
11. a leggyakoribb attribútumok
ATTRIB       magyarázat          ATTRIB       magyarázat
NUM          szám                PRT-FORM     az igekötő alakja
CASE         eset                TENSE        igeidő
PERS         személy             NSEM         a főnév szemantikai
                                              jellemzője
PRED         jelentés            NSYN         a főnév szintaktikai
                                              jellemzője
NTYPE        főnévtípus          TNS-ASP      igeidő-aspektus
VTYPE        igetípus            MOOD         igemód
PRON-TYPE    névmástípus         CHECK        bizonyos jegy meglétének
                                              ellenőrzése
ADV-TYPE     határozószó-típus   COORD-FORM   mellérendelés esetében a
                                              kötőszó alakja
DEF          határozottság
12. általános megjegyzések

   a 14. dia bemutat egy XLE-s f-szerkezeti reprezentációt, amelyen a
    felsorolt attribútumok közül számos szerepel, ezen túlmenően az
    alábbi általános jellemzőket is szemlélteti
   a szögletes zárójelek előtti számok az adott f-szerkezetnek
    megfelelő ö-szerkezeti csomópontok számai – ily módon
    azonosítjuk, hogy mely csomóponthoz/frázishoz mely f-
    szerkezet(rész) tartozik
   a predikátumok argumentumszerkezetében a < és > között nem az
    argumentumok grammatikai funkciója van feltüntetve, hanem az
    adott argumentum számmal ellátott „feje”, és ugyanez a szám
    jelenik meg a releváns grammatikai funkció értékét jelölő szögletes
    zárójel előtt – pl. a 14. dián az iszik ige első argumentuma a 2:
    varjú, és a SUBJ attribútum értéke előtt ugyanez a szám szerepel,
    innen tudjuk, hogy a varjú az iszik alanya, ráadásul topik is
13. általános megjegyzések

   a 14. dián a SUBJ értékében a CASE nom, DEF +, NUM sg, PERS 3
    attribútum—érték párok egy sorban szerepelnek, de ez csupán a
    reprezentáció helytakarékosságát elősegítő XLE-s ábrázolási
    konvenció (egyébként az illető párokat egymás alá kellene írni)
   egy főnév(i csoport) lehet névmás is: ilyenkor a PRED ‘pro’ jelölés
    használandó
   a mellérendelt tagmondatokat is halmazként, kapcsos zárójelek
    között tüntetjük fel
   a 14. dián a második tagmondat igéjének az ábrázolása: el#repült –
    itt a # szimbólum azt jelzi, hogy a magyarban az igekötő és az ige a
    mondatban (ö-szerkezetben) különválhatnak egymástól (vö. a varjú
    nem repült tegnap el), de az XLE az f-szerkezetben „összefűzi” őket
14. egy f-szerkezeti minta

Más contenido relacionado

Destacado

Data fitting in Scilab - Tutorial
Data fitting in Scilab - TutorialData fitting in Scilab - Tutorial
Data fitting in Scilab - TutorialScilab
 
Modeling an ODE: 3 different approaches - Part 3
Modeling an ODE: 3 different approaches - Part 3Modeling an ODE: 3 different approaches - Part 3
Modeling an ODE: 3 different approaches - Part 3Scilab
 
3 instrumen-standar-komp-lulusan
3 instrumen-standar-komp-lulusan3 instrumen-standar-komp-lulusan
3 instrumen-standar-komp-lulusanMuhamad Anugrah
 
What to Expect: eCommerce 2017
What to Expect: eCommerce 2017What to Expect: eCommerce 2017
What to Expect: eCommerce 2017DFWSEM
 
Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016
Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016
Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016Everett Sizemore
 
Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»
Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»
Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»Mail.ru Group
 
2nd Annual M2M and IoT Strategies Summit - production-1-new brochure-2
2nd Annual M2M and IoT Strategies Summit - production-1-new brochure-22nd Annual M2M and IoT Strategies Summit - production-1-new brochure-2
2nd Annual M2M and IoT Strategies Summit - production-1-new brochure-2Jorge Rivero Sanchez
 

Destacado (9)

Frontend talk for backenders
Frontend talk for backendersFrontend talk for backenders
Frontend talk for backenders
 
Data fitting in Scilab - Tutorial
Data fitting in Scilab - TutorialData fitting in Scilab - Tutorial
Data fitting in Scilab - Tutorial
 
Modeling an ODE: 3 different approaches - Part 3
Modeling an ODE: 3 different approaches - Part 3Modeling an ODE: 3 different approaches - Part 3
Modeling an ODE: 3 different approaches - Part 3
 
3 instrumen-standar-komp-lulusan
3 instrumen-standar-komp-lulusan3 instrumen-standar-komp-lulusan
3 instrumen-standar-komp-lulusan
 
What to Expect: eCommerce 2017
What to Expect: eCommerce 2017What to Expect: eCommerce 2017
What to Expect: eCommerce 2017
 
Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016
Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016
Cut The Cruft - Everett Sizemore - MozTalk Denver - 2016
 
Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»
Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»
Руслан Ханов, «Контейнер сервисов — Что? Где? Когда?»
 
2nd Annual M2M and IoT Strategies Summit - production-1-new brochure-2
2nd Annual M2M and IoT Strategies Summit - production-1-new brochure-22nd Annual M2M and IoT Strategies Summit - production-1-new brochure-2
2nd Annual M2M and IoT Strategies Summit - production-1-new brochure-2
 
CAITLIN HEWLETT
CAITLIN HEWLETTCAITLIN HEWLETT
CAITLIN HEWLETT
 

HG-1 TREEBANK f-structure

  • 1. HG-1 Treebank demó A funkcionális szerkezet jellemzői
  • 2. 1. bevezető megjegyzések  általános elméleti keretünk a Lexikai- Funkcionális Grammatika (LFG)  alternatív, nemtranszformációs generatív modell  minden jólformált mondathoz két párhuzamos szintaktikai reprezentációt rendel (tehát reprezentációs és nem derivációs természetű)  összetevős szerkezetet (ö-szerkezetet, vö. c-structure)  funkcionális szerkezetet (f-szerkezetet, vö. f-structure)
  • 3. 2. bevezető megjegyzések  az összetevős szerkezet a mondat „felszíni”, nyelvspecifikus jellemzőit ábrázolja: pl. a szórendi viszonyokat, a különböző frázisok elhelyezkedését  a funkcionális szerkezet a mondat nyelvfüggetlen tulajdonságait ragadja meg: pl. az általános nyelvtani viszonyokat, legfőképpen a grammatikai funkciókat (alany, tárgy stb.)  a következő dián egy egyszerű angol-magyar példa szemlélteti, hogy az ö-szerkezetek különbözősége ellenére (ugyanis az angolban elöljárószós, míg a magyarban névutós kifejezés található) a funkcionális jellemzőket ábrázoló f- szerkezet szintjén azonos reprezentáció szerepel
  • 4. 3. egy elöljárószós/névutós példa PP különböző ö-szerkezetek PP Pr NP NP Po Det N Det N near the box a doboz mellett PRED ‘near/mellett <(OBJ)>’ OBJ PRED ‘box/doboz’ DEF + PERS 3 azonos f-szerkezet NUM sg
  • 5. 4. leképezési kapcsolat a két szerkezet között  a következő dia az előző magyar példa felhasználásával szemlélteti, hogy az ö-szerkezet és az f-szerkezet közötti megfeleltetési (leképezési) kapcsolatot az ö-szerkezetben található csomópontokhoz társított, legtöbbször egyenlőségekkel kifejezett funkcionális annotációk biztosítják  a két alapvetően egyenlőségfajta a következő  ↑=↓ -- ez a funkcionális fejet jelöli: azt kódolja, hogy az anya csomópont funkcionális jegyei megegyeznek az adott csomópont jegyeivel  (↑GF)=↓ -- ez azt fejezi ki, hogy az anya összetevő funkcionális szerkezetében az adott csomópont milyen grammatikai funkciót tölt be, pl. a következő dián ez szerepel: (↑OBJ)=↓, és azt kódolja, hogy a PP funkcionális szerkezetében az NP tárgyi funkciójú
  • 6. 5. leképezési kapcsolat a két szerkezet között PP PRED ‘mellett <(OBJ)>’ (↑OBJ)=↓ ↑=↓ OBJ PRED ‘doboz’ NP P PERS 3 (↑PRED) = NUM sg ↑=↓ ↑=↓ ‘mellett <(OBJ)>’ DEF + Det N (↑DEF)=+ (↑PRED)=‘doboz’ (↑PERS)=3 további annotációk: (↑NUM)=sg (↑DEF)=+ a határozottság jegye (↑PRED)= ‘ … ’ a szó jelentése a doboz mellett (↑PERS)=3 a harmadik személy jegye (↑NUM)=sg az egyes szám jegye
  • 7. 6. leképezési kapcsolat a két szerkezet között  az előző diákon bemutatott funkcionális annotációk az LFG elméleti keretében végzett elemzésekben megjelennek egyrészt az ö- szerkezeteket létrehozó (ún. frázisstruktúra-szabályokban, más néven: újraíró szabályokban), másrészt az ö-szerkezeti reprezentációkban  az LFG-nek az általunk alkalmazott implementációs platformján, az XLE-ben (Xerox Linguistic Environment = Xerox Nyelvészeti Környezet), az annotációk csak a frázisstruktúra-szabályokban vannak kódolva, és a jobb áttekinthetőség érdekében nincsenek külön feltüntetve az ö-szerkezetben is (ez tehát csupán egy megjelenítésbeli különbség mindenféle lényegi relevancia nélkül)
  • 8. 7. a funkcionális szerkezet alapvető jellemzői a korábban ismertetetteken kívül az alábbi tulajdonságok a kiemelten fontosak  az f-szerkezeteket mindig szögletes zárójelek között ábrázoljuk  ezek a szerkezetek lényegében attribútum—érték párokból álló mátrixok  egy-egy ilyen párban mindig a bal oldali elem az attribútum és a jobb oldali az érték  mivel az f-szerkezet nyelvtani relációkat kódol attribútum—érték párok mátrixaként, ezeknek a pároknak a sorrendje teljes mértékben tetszőleges: mindegy, hogy melyik van alul vagy felül  egy attribútumnak lehet atomi értéke, pl. az 5. dián szereplő NUM, PERS és DEF attribútumoknak atomi értékeik vannak, rendre: sg, 3 és +
  • 9. 8. a funkcionális szerkezet alapvető jellemzői  más attribútumoknak komplex értékük van, ami azt jelenti, hogy adott érték maga egy vagy több újabb, „beágyazott” attribútum— érték pár, pl. az 5. dián ilyen az OBJ attribútum (a tárgyi funkció), amelynek értékében van egy PRED attribútum (értéke: a főnév jelentése), valamint az előző pontban említett három atomi értékű attribútum: NUM, PERS és DEF  tekintettel arra, hogy a funkcionális fej jelölésnek (↑=↓) megfelelően az anya csomópontnak és a fej csomópontnak megegyeznek a funkcionális jegyei, a két elem f-szerkezete egybeesik, megegyezik, például az 5. dián az OBJ attribútum értéke (a négy attribútum— érték pár) a főnévi fejhez (N) és a teljes főnévi csoporthoz (NP) is tartozó f-szerkezetrész
  • 10. 9. a leggyakoribb attribútumok egy predikátum által a vonzataihoz rendelt grammatikai funkciók, amelyek a predikátum argumentumszerkezetében < és > között vannak megadva: pl. az üt lexikai tétele: (PRED)=‘üt <(SUBJ)(OBJ)>’ SUBJ alany OBJ tárgy OBL határozói vonzat XCOMP jellegzetesen főnévi igenévvel kifejezett propozicionális argumentum funkciója COMP beágyazott, ragozott igék tartalmazó tagmondat funkciója PREDLINK a létige bizonyos, kétargumentumúnak felfogott használatában a második argumentum funkciója POSS a főnévi csoporton belül a birtokos összetevő funkciója
  • 11. 10. a leggyakoribb attribútumok nem vonzatfunkciók ADJUNCT adjunktum (=szabad módosító), jellegzetesen ilyen funkciójúak például a hely- és időviszonyokat kifejező összetevők tekintettel arra, hogy ilyen funkciójú összetevőkből elvileg tetszőlegesen sok lehet, az f-szerkezeti reprezentációkban halmazként szokás szerepeltetni őket egymás alatt, kapcsos zárójelek {…} között FOCUS* a fókusz diskurzusfunkció új információt hordoz, jellemzően valamilyen elem (kizáró) azonosítását fejezi ki TOPIC* a topik diskurzusfunkció ismert információt hordoz, a mondat „logikai alanyát” fejezi ki, amelyről a mondat állítása szól mivel egynél több topik is lehet egy mondatban, a topikok is kapcsos zárójelek közé kerülnek az f-szerkezetben *megjegyzés: csak olyan összetevő kaphat diskurzusfunkciót, amelynek van egyéb funkciója is (tehát vonzat vagy adjunktum)
  • 12. 11. a leggyakoribb attribútumok ATTRIB magyarázat ATTRIB magyarázat NUM szám PRT-FORM az igekötő alakja CASE eset TENSE igeidő PERS személy NSEM a főnév szemantikai jellemzője PRED jelentés NSYN a főnév szintaktikai jellemzője NTYPE főnévtípus TNS-ASP igeidő-aspektus VTYPE igetípus MOOD igemód PRON-TYPE névmástípus CHECK bizonyos jegy meglétének ellenőrzése ADV-TYPE határozószó-típus COORD-FORM mellérendelés esetében a kötőszó alakja DEF határozottság
  • 13. 12. általános megjegyzések  a 14. dia bemutat egy XLE-s f-szerkezeti reprezentációt, amelyen a felsorolt attribútumok közül számos szerepel, ezen túlmenően az alábbi általános jellemzőket is szemlélteti  a szögletes zárójelek előtti számok az adott f-szerkezetnek megfelelő ö-szerkezeti csomópontok számai – ily módon azonosítjuk, hogy mely csomóponthoz/frázishoz mely f- szerkezet(rész) tartozik  a predikátumok argumentumszerkezetében a < és > között nem az argumentumok grammatikai funkciója van feltüntetve, hanem az adott argumentum számmal ellátott „feje”, és ugyanez a szám jelenik meg a releváns grammatikai funkció értékét jelölő szögletes zárójel előtt – pl. a 14. dián az iszik ige első argumentuma a 2: varjú, és a SUBJ attribútum értéke előtt ugyanez a szám szerepel, innen tudjuk, hogy a varjú az iszik alanya, ráadásul topik is
  • 14. 13. általános megjegyzések  a 14. dián a SUBJ értékében a CASE nom, DEF +, NUM sg, PERS 3 attribútum—érték párok egy sorban szerepelnek, de ez csupán a reprezentáció helytakarékosságát elősegítő XLE-s ábrázolási konvenció (egyébként az illető párokat egymás alá kellene írni)  egy főnév(i csoport) lehet névmás is: ilyenkor a PRED ‘pro’ jelölés használandó  a mellérendelt tagmondatokat is halmazként, kapcsos zárójelek között tüntetjük fel  a 14. dián a második tagmondat igéjének az ábrázolása: el#repült – itt a # szimbólum azt jelzi, hogy a magyarban az igekötő és az ige a mondatban (ö-szerkezetben) különválhatnak egymástól (vö. a varjú nem repült tegnap el), de az XLE az f-szerkezetben „összefűzi” őket