SlideShare una empresa de Scribd logo
1 de 21
Számítógépes szövegelemzés IT3-BT, 2007. május 11
Behatárolás ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Tézis ,[object Object],[object Object],[object Object],[object Object]
Kapcsolódó technológiák ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Szövegelérés és -előkészítés Tartalomelemzés A szövegben szereplő objektumok és fogalmak meghatározása, egyértelmű-sítése, tulajdonságaik és kapcsolataik megállapítása nyelvi, tematikus vagy ontológiai megközelítéssel A szöveg alapvető jelentéshordozó egységeinek meghatározása (fejezet, szakasz, bekezdés, mondat, szó, táblázat, lista stb.) Attól függően, hogy a szöveg XML-formátumú, RDBMS-hez integrált vagy metaadatokkal más módon jól jellemzett-e Információ- bővítés és  -integrálás Információ- átalakítás és  -megjelenítés Az egyes jelentési egységekből az elemi struktúrák kiemelése, elemi következtetések elvégzése és a kinyert és a háttérinformációk integrálása A szövegből kinyert és integrált információ további gépi vagy emberi használatra való elkészítése. Jelentési egységek Elemi jelentésstruktúrák Bővített jelentésstruktúra Kontextusinformáció taxonómia vagy ontológia formájában Háttérinformáció objektumokról struktúrált forrásokból A használati kontextus leírása taxonómia vagy ontológia formájában Szakontológiák 1 2 3 Szótárak, nyelvi ontológiák Morfológiai  elemzés Szintaktikai  elemzés Szemantikai  elemzés Tárolás, prezentáció
A tartalmi elemzés megközelítései ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
WordNet ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
EuroWordNet – a nyelvek összekapcsolása nyelvek közti megfeleltés (ILI) felső  szintű ontológia holland   wordnet hol- land BC alapfogalmak (BC) spanyol   wordnet spa- nyol BC … (bicicleta, velocipedo) hipernima (bicycle, bike) ekvivalens ekvivalens … (fiets, rijkwiel) hipernima
 
Lokális nyelvtanok ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Szövegelemzés (TA) és BI-technológiák ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Megjelenítés „önszervező háló”-val egy csoportot alkotó  dokumentumok határát  fekete  vonal jelzi dokumentumok összetartozásának mértékét színek mutatják: piros  – magas sárga  - közepes kék  - alacsony a dokumentumok csoportosítása jellemző szavaik szerint történik a dokumentumokat  fehér  pontok jelölik
Várható fejlődés integrálódás az üzleti intelligencia eszközeivel magyar szintaktikai elemző nyelvi tudású internetkereső szövegértő és tanuló rendszerek szövegelemzés mindennapi környezetben morfológiai elemzés WordNet  terjedőben nyelvi és  szakontológiák együttes alkalmazása speciális grammatikák vállalati használatban tematikus elemzés 2007 2012 2017
Számítógépes szövegértés felé belső rendszer moduláris feldolgozó alrendszer asszociatív memória-alrendszer külső  objektum jelsorozat kereső  modul vezérlő modul hosszú távú memória közbenső  memória rövid távú memória felismerő- generáló  modul érzékelő  modul tároló  modul elemző  modul jelentés ideiglenes kialakult
Technológiai tényezők Web 2.0  térhódítása Web, mint korpusz Webes keresés finomodása Szövegmennyiség   további növekedése Szövegelemzés fejlődése Tárolókapacitások növekedése Számítási  kapacitások növekedése Nyelvtechnológiák fejlődése Szemantikus Web – Adatintegráció   fejlődése Szakontológiák   stabilizálódása + OCR  fejlődése
Gazdasági tényezők Ügyfélkapcsolat kezelés  finomodása Szövegelemzés fejlődése Biztonsági kérdések előtérbe kerülése Élettudományok beépülése a  mindennapokba – Személyiségjogi aggályok  felmerülése Nemzetbiztonság, terrorelhárítás Bankbiztonság Réspiacok számának  növekedése Rendészeti  feladatok Globális szolgáltatási  igények Géntechnológia alkalmazása Gyógyászati  diagnosztika fejlődése
Társadalmi tényezők Szövegelemzés fejlődése Közszolgáltatások elektronizálása Internet  tömeges, aktív  használata – Innovációs készség hiánya Web 2.0   terjedése Sávszélesség jelentős  növekedése
Hatások ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Hazai szereplők ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Hazai fejlesztések ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Hazai tényezők és hatások ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Más contenido relacionado

Similar a It3 4 2 4 2 1

A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációbanA mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációbanCsaba KOLLAR (Dr. PhD.)
 
Szövegbányászat
SzövegbányászatSzövegbányászat
SzövegbányászatZoltan Varju
 
Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...
Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...
Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...Gábor Mikulás
 
Török Mátyás: Organizational knowledge extraction from business process models
Török Mátyás: Organizational knowledge extraction from business process modelsTörök Mátyás: Organizational knowledge extraction from business process models
Török Mátyás: Organizational knowledge extraction from business process modelsInformatikai Intézet
 
Adatbanyaszati technologiak
Adatbanyaszati technologiakAdatbanyaszati technologiak
Adatbanyaszati technologiakitp
 
Horváth Győző: Kutatási adatbázisok tervezése és eszközei
Horváth Győző: Kutatási adatbázisok tervezése és eszközeiHorváth Győző: Kutatási adatbázisok tervezése és eszközei
Horváth Győző: Kutatási adatbázisok tervezése és eszközeitarsadalominformatika
 
Digitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogjaDigitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogjaKiss Ágnes
 
Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...
Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...
Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...MKT Informatikai szakosztály
 
Lehetőségek és veszélyek a mesterséges intelligencia korában
Lehetőségek és veszélyek  a mesterséges intelligencia korábanLehetőségek és veszélyek  a mesterséges intelligencia korában
Lehetőségek és veszélyek a mesterséges intelligencia korábanCsaba KOLLAR (Dr. PhD.)
 
Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...
Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...
Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...MKT Informatikai szakosztály
 
Multimédia alapismeretek
Multimédia alapismeretekMultimédia alapismeretek
Multimédia alapismeretekfrigyikdora
 
Fehér Péter - Az üzleti és ICT architektúra kapcsolatáról
Fehér Péter - Az üzleti és ICT architektúra kapcsolatárólFehér Péter - Az üzleti és ICT architektúra kapcsolatáról
Fehér Péter - Az üzleti és ICT architektúra kapcsolatárólMKT Informatikai szakosztály
 
Dr. Kollár Csaba: Szervezeti információbiztonság a digitális korban
Dr. Kollár Csaba: Szervezeti információbiztonság a digitális korbanDr. Kollár Csaba: Szervezeti információbiztonság a digitális korban
Dr. Kollár Csaba: Szervezeti információbiztonság a digitális korbanCsaba KOLLAR (Dr. PhD.)
 
Tudásmenedzsment rendszerek
Tudásmenedzsment rendszerekTudásmenedzsment rendszerek
Tudásmenedzsment rendszerekBME
 
Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...
Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...
Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...Csaba KOLLAR (Dr. PhD.)
 
Dr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korában
Dr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korábanDr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korában
Dr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korábanCsaba KOLLAR (Dr. PhD.)
 

Similar a It3 4 2 4 2 1 (20)

A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációbanA mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
A mesterséges intelligencia lehetőségei az agilis szervezeti kommunikációban
 
It3 4 2 1 2 1
It3 4 2 1 2 1It3 4 2 1 2 1
It3 4 2 1 2 1
 
Szövegbányászat
SzövegbányászatSzövegbányászat
Szövegbányászat
 
Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...
Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...
Gondolatok a könyvtári intelligens rendszerek fejlődési lehetőségeiről - roko...
 
Török Mátyás: Organizational knowledge extraction from business process models
Török Mátyás: Organizational knowledge extraction from business process modelsTörök Mátyás: Organizational knowledge extraction from business process models
Török Mátyás: Organizational knowledge extraction from business process models
 
Adatbányászat
AdatbányászatAdatbányászat
Adatbányászat
 
Adatbanyaszati technologiak
Adatbanyaszati technologiakAdatbanyaszati technologiak
Adatbanyaszati technologiak
 
Horváth Győző: Kutatási adatbázisok tervezése és eszközei
Horváth Győző: Kutatási adatbázisok tervezése és eszközeiHorváth Győző: Kutatási adatbázisok tervezése és eszközei
Horváth Győző: Kutatási adatbázisok tervezése és eszközei
 
Digitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogjaDigitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogja
 
Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...
Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...
Hosznyák András - Sikerkritériumok az adattárház alapú üzleti intelligencia m...
 
Könyvtári statisztika
Könyvtári statisztikaKönyvtári statisztika
Könyvtári statisztika
 
Lehetőségek és veszélyek a mesterséges intelligencia korában
Lehetőségek és veszélyek  a mesterséges intelligencia korábanLehetőségek és veszélyek  a mesterséges intelligencia korában
Lehetőségek és veszélyek a mesterséges intelligencia korában
 
Mt kti 05
Mt kti 05Mt kti 05
Mt kti 05
 
Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...
Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...
Fehér Péter: Informatikai és kommunikációs architektúrák integrációjá...
 
Multimédia alapismeretek
Multimédia alapismeretekMultimédia alapismeretek
Multimédia alapismeretek
 
Fehér Péter - Az üzleti és ICT architektúra kapcsolatáról
Fehér Péter - Az üzleti és ICT architektúra kapcsolatárólFehér Péter - Az üzleti és ICT architektúra kapcsolatáról
Fehér Péter - Az üzleti és ICT architektúra kapcsolatáról
 
Dr. Kollár Csaba: Szervezeti információbiztonság a digitális korban
Dr. Kollár Csaba: Szervezeti információbiztonság a digitális korbanDr. Kollár Csaba: Szervezeti információbiztonság a digitális korban
Dr. Kollár Csaba: Szervezeti információbiztonság a digitális korban
 
Tudásmenedzsment rendszerek
Tudásmenedzsment rendszerekTudásmenedzsment rendszerek
Tudásmenedzsment rendszerek
 
Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...
Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...
Dr. Kollár Csaba PhD: A mesterséges intelligencia lehetőségei és kihívásai a ...
 
Dr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korában
Dr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korábanDr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korában
Dr. Kollár Csaba: Biztonság és technika a mesterséges intelligencia korában
 

Más de Project IT3 (20)

It3 4 4 7 2
It3 4 4 7 2It3 4 4 7 2
It3 4 4 7 2
 
It3 4 3 8 1
It3 4 3 8 1It3 4 3 8 1
It3 4 3 8 1
 
It3 4 4 2 1
It3 4 4 2 1It3 4 4 2 1
It3 4 4 2 1
 
It3 4 3 6 2
It3 4 3 6 2It3 4 3 6 2
It3 4 3 6 2
 
It3 4 4 1 1
It3 4 4 1 1It3 4 4 1 1
It3 4 4 1 1
 
It3 4 2 8 2
It3 4 2 8 2It3 4 2 8 2
It3 4 2 8 2
 
It3 4 4 3 1
It3 4 4 3 1It3 4 4 3 1
It3 4 4 3 1
 
It3 4 4 6 1
It3 4 4 6 1It3 4 4 6 1
It3 4 4 6 1
 
It3 4 2 3 2 1
It3 4 2 3 2 1It3 4 2 3 2 1
It3 4 2 3 2 1
 
It3 4 1 4 2 2
It3 4 1 4 2 2It3 4 1 4 2 2
It3 4 1 4 2 2
 
It3 4 4 6 1
It3 4 4 6 1It3 4 4 6 1
It3 4 4 6 1
 
It3 4 3 5 1
It3 4 3 5 1It3 4 3 5 1
It3 4 3 5 1
 
It3 4 4 4 3
It3 4 4 4 3It3 4 4 4 3
It3 4 4 4 3
 
It3 4 3 7 1
It3 4 3 7 1It3 4 3 7 1
It3 4 3 7 1
 
It3 4 2 9 2
It3 4 2 9 2It3 4 2 9 2
It3 4 2 9 2
 
It3 4 2 9 3
It3 4 2 9 3It3 4 2 9 3
It3 4 2 9 3
 
It3 4 2 9 1
It3 4 2 9 1It3 4 2 9 1
It3 4 2 9 1
 
It3 4 5 1 1
It3 4 5 1 1It3 4 5 1 1
It3 4 5 1 1
 
It3 4 4 7 1
It3 4 4 7 1It3 4 4 7 1
It3 4 4 7 1
 
It3 4 4 5 1
It3 4 4 5 1It3 4 4 5 1
It3 4 4 5 1
 

It3 4 2 4 2 1

  • 2.
  • 3.
  • 4.
  • 5. Szövegelérés és -előkészítés Tartalomelemzés A szövegben szereplő objektumok és fogalmak meghatározása, egyértelmű-sítése, tulajdonságaik és kapcsolataik megállapítása nyelvi, tematikus vagy ontológiai megközelítéssel A szöveg alapvető jelentéshordozó egységeinek meghatározása (fejezet, szakasz, bekezdés, mondat, szó, táblázat, lista stb.) Attól függően, hogy a szöveg XML-formátumú, RDBMS-hez integrált vagy metaadatokkal más módon jól jellemzett-e Információ- bővítés és -integrálás Információ- átalakítás és -megjelenítés Az egyes jelentési egységekből az elemi struktúrák kiemelése, elemi következtetések elvégzése és a kinyert és a háttérinformációk integrálása A szövegből kinyert és integrált információ további gépi vagy emberi használatra való elkészítése. Jelentési egységek Elemi jelentésstruktúrák Bővített jelentésstruktúra Kontextusinformáció taxonómia vagy ontológia formájában Háttérinformáció objektumokról struktúrált forrásokból A használati kontextus leírása taxonómia vagy ontológia formájában Szakontológiák 1 2 3 Szótárak, nyelvi ontológiák Morfológiai elemzés Szintaktikai elemzés Szemantikai elemzés Tárolás, prezentáció
  • 6.
  • 7.
  • 8. EuroWordNet – a nyelvek összekapcsolása nyelvek közti megfeleltés (ILI) felső szintű ontológia holland wordnet hol- land BC alapfogalmak (BC) spanyol wordnet spa- nyol BC … (bicicleta, velocipedo) hipernima (bicycle, bike) ekvivalens ekvivalens … (fiets, rijkwiel) hipernima
  • 9.  
  • 10.
  • 11.
  • 12. Megjelenítés „önszervező háló”-val egy csoportot alkotó dokumentumok határát fekete vonal jelzi dokumentumok összetartozásának mértékét színek mutatják: piros – magas sárga - közepes kék - alacsony a dokumentumok csoportosítása jellemző szavaik szerint történik a dokumentumokat fehér pontok jelölik
  • 13. Várható fejlődés integrálódás az üzleti intelligencia eszközeivel magyar szintaktikai elemző nyelvi tudású internetkereső szövegértő és tanuló rendszerek szövegelemzés mindennapi környezetben morfológiai elemzés WordNet terjedőben nyelvi és szakontológiák együttes alkalmazása speciális grammatikák vállalati használatban tematikus elemzés 2007 2012 2017
  • 14. Számítógépes szövegértés felé belső rendszer moduláris feldolgozó alrendszer asszociatív memória-alrendszer külső objektum jelsorozat kereső modul vezérlő modul hosszú távú memória közbenső memória rövid távú memória felismerő- generáló modul érzékelő modul tároló modul elemző modul jelentés ideiglenes kialakult
  • 15. Technológiai tényezők Web 2.0 térhódítása Web, mint korpusz Webes keresés finomodása Szövegmennyiség további növekedése Szövegelemzés fejlődése Tárolókapacitások növekedése Számítási kapacitások növekedése Nyelvtechnológiák fejlődése Szemantikus Web – Adatintegráció fejlődése Szakontológiák stabilizálódása + OCR fejlődése
  • 16. Gazdasági tényezők Ügyfélkapcsolat kezelés finomodása Szövegelemzés fejlődése Biztonsági kérdések előtérbe kerülése Élettudományok beépülése a mindennapokba – Személyiségjogi aggályok felmerülése Nemzetbiztonság, terrorelhárítás Bankbiztonság Réspiacok számának növekedése Rendészeti feladatok Globális szolgáltatási igények Géntechnológia alkalmazása Gyógyászati diagnosztika fejlődése
  • 17. Társadalmi tényezők Szövegelemzés fejlődése Közszolgáltatások elektronizálása Internet tömeges, aktív használata – Innovációs készség hiánya Web 2.0 terjedése Sávszélesség jelentős növekedése
  • 18.
  • 19.
  • 20.
  • 21.