SlideShare una empresa de Scribd logo
1 de 21
Descargar para leer sin conexión
Sächsische AufbauBank
Forschung und Entwicklung - Projektförderung
Projektnummer - 99457/2677
http://topic-s.de/
Martin Voigt, Michael Aleythe, Peter Wehner
Wer sind wir?
fink & PARTNER Media Services GmbH
Medien Management für Verlage
Einige Kunde
Lehrstuhl für Multimedia Technologie, TU Dresden
Forschungsfelder
Adaptive, komposite Rich Internet Applications
Semantisches Document Life Cycle Management
Friday, 14.06.2013 Topic/S Slide 1
Struktur
Motivation, Probleme und Ziele
Topic/S Workflow
Demo
Zusammenfassung
Montag, 23.09.2013 Topic/S @ LSWT Slide 2
Motivation
Newsroom
Montag, 23.09.2013 Topic/S @ LSWT Slide 3
Quelle: ringier.com
Problem
Überwältigende Datenmenge für den Redakteur
z.B. WAZ  5000 Artikel/Tag (Agenturen & in-house)
Montag, 23.09.2013 Topic/S @ LSWT
DPA
Reuters
KNA
Twitter
Facebook
Blogs
…
Nachrichtenagenturen
Web, Social Media
…
In-house Produktion
Archive
Online
Slide 4
Vision
Automatische Themenerkennung unter Verwendung
von Named Entities und anderen Stichworten
(SemItem)
Identifikation von Thementrends
Information-Push statt Pull
Montag, 23.09.2013 Topic/S @ LSWT Slide 5
Struktur
Motivation, Probleme und Ziele
Topic/S Workflow
Überblick
Informationsextraktion
Speicherung
Themenerkennung
Demo
Zusammenfassung
Montag, 23.09.2013 Topic/S @ LSWT Slide 6
Workflow
Montag, 23.09.2013 Topic/S @ LSWT Slide 7
Mehr in [Voigt2013]
Informationsextraktion
Montag, 23.09.2013 Topic/S @ LSWT
Spracherkennung (DE, EN)
Regelbasiert
Kategorisierung
Quellenabhängig
Slide 8
Source: onelanguageoneposter.com
Agentur Genauigkeit
KNA 80,3 %
DPA 94,4 %
EPD 80,3 %
Reuters 90,8 %
OTS 93,5 %
AFP 86 %
Informationsextraktion
Montag, 23.09.2013 Topic/S @ LSWT
Spracherkennung (DE, EN)
Regelbasiert
Kategorisierung
Quellenabhängig
Named Entity Recognition
Wortlisten- & Statistik-basiert
Disambiguierung
interne & externe Datenbasis
Slide 9
Source: onelanguageoneposter.com
Semantisches Model
Montag, 23.09.2013 Topic/S @ LSWT Slide 10
Media SemItemMatch SemItem
Quellen: freemake.com, samepage.io, free-vectors.com, trendwatching.com, viamusical.de
Semantische Fakten
Keine Wortlisten für NER!
preferred und alternative Namen vorgehalten
ID: http://www.topic-s.de/topics-facts/id/person/Rene_Muller
Namen: Rene Muller, Rene Müller, René Muller, René Müller
Triples ohne SemItems: 31,3 Mio.
Montag, 23.09.2013 Topic/S @ LSWT Slide 11
SemItem Anzahl (alternative Namen)
Person 1.504.341 (2.499.962)
Organization 63.332 (98.127)
Place 89.702 (95.178)
Keyword 1351
Speicherung
Oracle 11gR2
Benchmark von Triple Stores [Voigt2012]
Pros
Bereits im Unternehmen für große Datenmengen im Einsatz
Integrierte Anfrage an relationale und semantische Daten
Cons
Inferenz
Unvollständiger SPARQL 1.1 Support
Einsatz von eigenen Regeln kaum möglich
Montag, 23.09.2013 Topic/S @ LSWT Slide 12
Quelle: musingmonika.com
Themenerkennung
Montag, 23.09.2013 Topic/S @ LSWT
Clustering
hierarchisches, agglomeratives Verfahren
Grundlage: Artikel und deren Entitäten
Eigenimplementierung aufgrund spezieller Herausforderungen
Ausführung und Zusammenfassung im Intervall  Trend
Slide 13
Top-Cluster (vom 19.09.2013)
Themenerkennung
Montag, 23.09.2013 Topic/S @ LSWT
Artikel 5 wichtigsten SemItems HotTopic
68 Euro / Kind / Deutschland / Berlin / Bundeswehr Nein
52 Euro / Lufthansa / Milliarde / Boeing / Land Nordrhein-Westfalen Ja
44 Alternative für Deutschland / Partei / Umfrage / Bundestagswahl /
SPD
Ja
32 Federal Reserve System / US-Notenbank / Entscheidung / Dollar /
USA
Ja
28 SPD / Partei / CDU / Bundestagswahl / Wahlkampf Ja
26 Syrien / Vernichtung / Vereinte Nationen / USA / Washington Ja
22 Entschädigung / Euro / Bundesgerichtshof / Urteil / Kläger Ja
18 Präsident / Hassan Rowhani / USA / Regierung / Washington Ja
15 FDP / CDU / SPD / Berlin / Bundestagswahl Ja
Slide 14
Struktur
Motivation, Probleme und Ziele
Topic/S Workflow
Demo
Zusammenfassung
Montag, 23.09.2013 Topic/S @ LSWT Slide 15
Live Demo
Montag, 23.09.2013 Topic/S @ LSWT Slide 16
Struktur
Motivation, Probleme und Ziele
Topic/S Workflow
Demo
Zusammenfassung
Montag, 23.09.2013 Topic/S @ LSWT Slide 17
Sum it up!
Ergebnis
Themenerkennung und Präsentation
gegenüber dem Redakteur
Lessons learned
NER: Schlecht für Non-English,
Kombination notwendig
Stete Modeloptimierung hinsichtlich
der Anfragen
Spezielle UI notwendig
Mögliche, nächste Schritte
„Vorhersage“ von Themen aufgrund
von kausalen und temporalen
Beziehungen
Montag, 23.09.2013 Topic/S @ LSWT Slide 18
Quelle: ooltapulta.com
http://www.w3.org/community/swisig/
Sächsische AufbauBank
Forschung und Entwicklung - Projektförderung
Projektnummer - 99457/2677
http://topic-s.de/
Danke! Fragen?
http://topic-s.de/
Quellen
[Voigt2012] Voigt, M., Mitschick, A. & Schulz, J.: Yet Another Triple
Store Benchmark? Practical Experiences with Real-World Data
Proc. of. the 2nd International Workshop on Semantic Digital
Archives (SDA), 2012
[Voigt2013] Voigt, M., Aleythe, M. & Wehner, P.: Towards
Topics-based, Semantics-assisted News Search.
Proceedings of the 3rd International Conference on Web
Intelligence, Mining and Semantics (WIMS'13), ACM,2013
Montag, 23.09.2013 Topic/S @ LSWT Slide 20

Más contenido relacionado

Destacado

Autosde policevivelafrance
Autosde policevivelafranceAutosde policevivelafrance
Autosde policevivelafrancenouleke
 
If it were my home
If it were my homeIf it were my home
If it were my homesarahvoldeng
 
Veille numérique 2511
Veille numérique 2511Veille numérique 2511
Veille numérique 2511Agence Elan
 
An introduction to copyright and publisher policies for repository indexers
An introduction to copyright and publisher policies for repository indexersAn introduction to copyright and publisher policies for repository indexers
An introduction to copyright and publisher policies for repository indexersLouise Patterton
 
Christmas term 1st form
Christmas term   1st formChristmas term   1st form
Christmas term 1st formcapesociology
 
The Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawa
The Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawaThe Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawa
The Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawasympo2011
 
Valeant & Ackman vs Allergan
Valeant & Ackman vs AllerganValeant & Ackman vs Allergan
Valeant & Ackman vs AllerganDTCaccess
 
Presentacio ari
Presentacio ariPresentacio ari
Presentacio ariari333
 
Startup Weekend Paris
Startup Weekend ParisStartup Weekend Paris
Startup Weekend ParisPurpose4Good
 
Une introduction à l'interactivité dans les livres numériques
Une introduction à l'interactivité dans les livres numériquesUne introduction à l'interactivité dans les livres numériques
Une introduction à l'interactivité dans les livres numériquesCrossmedias
 
Femmes Militaires Leopol
Femmes Militaires LeopolFemmes Militaires Leopol
Femmes Militaires Leopolguest92257f
 
Trabajo marco conceptual marco conceptual
Trabajo marco conceptual marco conceptualTrabajo marco conceptual marco conceptual
Trabajo marco conceptual marco conceptualgisse89
 
GCPS1005 Library mini-lecture 2: Finding statistics
GCPS1005 Library mini-lecture 2: Finding statisticsGCPS1005 Library mini-lecture 2: Finding statistics
GCPS1005 Library mini-lecture 2: Finding statisticsHKBU Library
 

Destacado (19)

Valorisation
ValorisationValorisation
Valorisation
 
Σεμινάριο WoS
Σεμινάριο WoSΣεμινάριο WoS
Σεμινάριο WoS
 
Autosde policevivelafrance
Autosde policevivelafranceAutosde policevivelafrance
Autosde policevivelafrance
 
If it were my home
If it were my homeIf it were my home
If it were my home
 
Veille numérique 2511
Veille numérique 2511Veille numérique 2511
Veille numérique 2511
 
An introduction to copyright and publisher policies for repository indexers
An introduction to copyright and publisher policies for repository indexersAn introduction to copyright and publisher policies for repository indexers
An introduction to copyright and publisher policies for repository indexers
 
Christmas term 1st form
Christmas term   1st formChristmas term   1st form
Christmas term 1st form
 
The Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawa
The Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawaThe Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawa
The Study of the Izeki Takako Diary: Is It a Diary Litera-ture? - DaigoFurukawa
 
Puerto De Mogan
Puerto De MoganPuerto De Mogan
Puerto De Mogan
 
Valeant & Ackman vs Allergan
Valeant & Ackman vs AllerganValeant & Ackman vs Allergan
Valeant & Ackman vs Allergan
 
Primarysourcedocuments
PrimarysourcedocumentsPrimarysourcedocuments
Primarysourcedocuments
 
Presentacio ari
Presentacio ariPresentacio ari
Presentacio ari
 
Startup Weekend Paris
Startup Weekend ParisStartup Weekend Paris
Startup Weekend Paris
 
Une introduction à l'interactivité dans les livres numériques
Une introduction à l'interactivité dans les livres numériquesUne introduction à l'interactivité dans les livres numériques
Une introduction à l'interactivité dans les livres numériques
 
Femmes Militaires Leopol
Femmes Militaires LeopolFemmes Militaires Leopol
Femmes Militaires Leopol
 
BP
BPBP
BP
 
Trabajo marco conceptual marco conceptual
Trabajo marco conceptual marco conceptualTrabajo marco conceptual marco conceptual
Trabajo marco conceptual marco conceptual
 
GCPS1005 Library mini-lecture 2: Finding statistics
GCPS1005 Library mini-lecture 2: Finding statisticsGCPS1005 Library mini-lecture 2: Finding statistics
GCPS1005 Library mini-lecture 2: Finding statistics
 
Schiavon
SchiavonSchiavon
Schiavon
 

Similar a Themen- und Trenderkennung in Agenturmeldungen

Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...
Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...
Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...Clueda AG
 
Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...
Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...
Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...Jan Schmidt
 
Die Social Media Release. Oder: Agenda Setting im Social Web?
Die Social Media Release. Oder: Agenda Setting im Social Web?Die Social Media Release. Oder: Agenda Setting im Social Web?
Die Social Media Release. Oder: Agenda Setting im Social Web?Thomas Pleil
 
Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12Marco Jakob
 
Google Glass. zwischen Technikliebe und Angst um den Datentschutz
Google Glass. zwischen Technikliebe und Angst um den DatentschutzGoogle Glass. zwischen Technikliebe und Angst um den Datentschutz
Google Glass. zwischen Technikliebe und Angst um den DatentschutzChristine Fassnacht
 
Social Media Integration auf Marken Websites
Social Media Integration auf Marken Websites Social Media Integration auf Marken Websites
Social Media Integration auf Marken Websites Petra Koestinger
 
Social Media für Hilfsorganisationen
Social Media für HilfsorganisationenSocial Media für Hilfsorganisationen
Social Media für HilfsorganisationenChristiane Winter
 
DFKOM Social Media Circle
DFKOM Social Media CircleDFKOM Social Media Circle
DFKOM Social Media Circleviadoo GmbH
 
#Dkm2013 Beispielreport Social Media Monitoring & Analytics
#Dkm2013 Beispielreport Social Media Monitoring & Analytics#Dkm2013 Beispielreport Social Media Monitoring & Analytics
#Dkm2013 Beispielreport Social Media Monitoring & AnalyticsTalkwalker
 
Anreize für mehr Investitionen zur Digitalisierung des Mittelstands
Anreize für mehr Investitionen zur Digitalisierung des MittelstandsAnreize für mehr Investitionen zur Digitalisierung des Mittelstands
Anreize für mehr Investitionen zur Digitalisierung des MittelstandsKarsten Reuss
 
Gehört Twittern zum Handwerk?
Gehört Twittern zum Handwerk?Gehört Twittern zum Handwerk?
Gehört Twittern zum Handwerk?Seo Webworx
 
Open Data Vorlesung 2015: Data Journalism
Open Data Vorlesung 2015: Data JournalismOpen Data Vorlesung 2015: Data Journalism
Open Data Vorlesung 2015: Data JournalismMatthias Stürmer
 
UNM GRUPPE4 STEINBEIS
UNM GRUPPE4 STEINBEISUNM GRUPPE4 STEINBEIS
UNM GRUPPE4 STEINBEISguestc4d6cf
 
131007 social media seminar abp_slideshare
131007 social media  seminar abp_slideshare131007 social media  seminar abp_slideshare
131007 social media seminar abp_slideshareschalk&friends GmbH
 
8 Thesen für das Digitaljahr 2016 – Christoph Hess
8 Thesen für das Digitaljahr 2016 – Christoph Hess8 Thesen für das Digitaljahr 2016 – Christoph Hess
8 Thesen für das Digitaljahr 2016 – Christoph HessKuble AG
 
Daimler Mfg Twitter In Der Unternehmenskommunikation
Daimler Mfg Twitter In Der UnternehmenskommunikationDaimler Mfg Twitter In Der Unternehmenskommunikation
Daimler Mfg Twitter In Der UnternehmenskommunikationMFG Innovationsagentur
 
Möglichkeiten und Chancen von Social Media in der Personalarbeit
Möglichkeiten und Chancen von Social Media in der PersonalarbeitMöglichkeiten und Chancen von Social Media in der Personalarbeit
Möglichkeiten und Chancen von Social Media in der PersonalarbeitCommunity MINTsax.de
 

Similar a Themen- und Trenderkennung in Agenturmeldungen (20)

Themen- und Trenderkennung in Agenturmeldungen, LSWT2013
Themen- und Trenderkennung in Agenturmeldungen, LSWT2013Themen- und Trenderkennung in Agenturmeldungen, LSWT2013
Themen- und Trenderkennung in Agenturmeldungen, LSWT2013
 
Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...
Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...
Social Data: technische Herausforderungen, rechtliche Hürden und wirtschaftli...
 
Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...
Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...
Vernetzte Öffentlichkeiten 2013, Sitzung 10, "Vernetzte Öffentlichkeiten und ...
 
Die Social Media Release. Oder: Agenda Setting im Social Web?
Die Social Media Release. Oder: Agenda Setting im Social Web?Die Social Media Release. Oder: Agenda Setting im Social Web?
Die Social Media Release. Oder: Agenda Setting im Social Web?
 
Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12
 
Google Glass. zwischen Technikliebe und Angst um den Datentschutz
Google Glass. zwischen Technikliebe und Angst um den DatentschutzGoogle Glass. zwischen Technikliebe und Angst um den Datentschutz
Google Glass. zwischen Technikliebe und Angst um den Datentschutz
 
Social Media Integration auf Marken Websites
Social Media Integration auf Marken Websites Social Media Integration auf Marken Websites
Social Media Integration auf Marken Websites
 
Social Media für Hilfsorganisationen
Social Media für HilfsorganisationenSocial Media für Hilfsorganisationen
Social Media für Hilfsorganisationen
 
DFKOM Social Media Circle
DFKOM Social Media CircleDFKOM Social Media Circle
DFKOM Social Media Circle
 
#Dkm2013 Beispielreport Social Media Monitoring & Analytics
#Dkm2013 Beispielreport Social Media Monitoring & Analytics#Dkm2013 Beispielreport Social Media Monitoring & Analytics
#Dkm2013 Beispielreport Social Media Monitoring & Analytics
 
Anreize für mehr Investitionen zur Digitalisierung des Mittelstands
Anreize für mehr Investitionen zur Digitalisierung des MittelstandsAnreize für mehr Investitionen zur Digitalisierung des Mittelstands
Anreize für mehr Investitionen zur Digitalisierung des Mittelstands
 
Gehört Twittern zum Handwerk?
Gehört Twittern zum Handwerk?Gehört Twittern zum Handwerk?
Gehört Twittern zum Handwerk?
 
Open Data Vorlesung 2015: Data Journalism
Open Data Vorlesung 2015: Data JournalismOpen Data Vorlesung 2015: Data Journalism
Open Data Vorlesung 2015: Data Journalism
 
Twitter Cards
Twitter CardsTwitter Cards
Twitter Cards
 
UNM GRUPPE4 STEINBEIS
UNM GRUPPE4 STEINBEISUNM GRUPPE4 STEINBEIS
UNM GRUPPE4 STEINBEIS
 
121113 BIG Pressemitteilung_SME_FINAL.pdf
121113 BIG Pressemitteilung_SME_FINAL.pdf121113 BIG Pressemitteilung_SME_FINAL.pdf
121113 BIG Pressemitteilung_SME_FINAL.pdf
 
131007 social media seminar abp_slideshare
131007 social media  seminar abp_slideshare131007 social media  seminar abp_slideshare
131007 social media seminar abp_slideshare
 
8 Thesen für das Digitaljahr 2016 – Christoph Hess
8 Thesen für das Digitaljahr 2016 – Christoph Hess8 Thesen für das Digitaljahr 2016 – Christoph Hess
8 Thesen für das Digitaljahr 2016 – Christoph Hess
 
Daimler Mfg Twitter In Der Unternehmenskommunikation
Daimler Mfg Twitter In Der UnternehmenskommunikationDaimler Mfg Twitter In Der Unternehmenskommunikation
Daimler Mfg Twitter In Der Unternehmenskommunikation
 
Möglichkeiten und Chancen von Social Media in der Personalarbeit
Möglichkeiten und Chancen von Social Media in der PersonalarbeitMöglichkeiten und Chancen von Social Media in der Personalarbeit
Möglichkeiten und Chancen von Social Media in der Personalarbeit
 

Themen- und Trenderkennung in Agenturmeldungen

  • 1. Sächsische AufbauBank Forschung und Entwicklung - Projektförderung Projektnummer - 99457/2677 http://topic-s.de/ Martin Voigt, Michael Aleythe, Peter Wehner
  • 2. Wer sind wir? fink & PARTNER Media Services GmbH Medien Management für Verlage Einige Kunde Lehrstuhl für Multimedia Technologie, TU Dresden Forschungsfelder Adaptive, komposite Rich Internet Applications Semantisches Document Life Cycle Management Friday, 14.06.2013 Topic/S Slide 1
  • 3. Struktur Motivation, Probleme und Ziele Topic/S Workflow Demo Zusammenfassung Montag, 23.09.2013 Topic/S @ LSWT Slide 2
  • 4. Motivation Newsroom Montag, 23.09.2013 Topic/S @ LSWT Slide 3 Quelle: ringier.com
  • 5. Problem Überwältigende Datenmenge für den Redakteur z.B. WAZ  5000 Artikel/Tag (Agenturen & in-house) Montag, 23.09.2013 Topic/S @ LSWT DPA Reuters KNA Twitter Facebook Blogs … Nachrichtenagenturen Web, Social Media … In-house Produktion Archive Online Slide 4
  • 6. Vision Automatische Themenerkennung unter Verwendung von Named Entities und anderen Stichworten (SemItem) Identifikation von Thementrends Information-Push statt Pull Montag, 23.09.2013 Topic/S @ LSWT Slide 5
  • 7. Struktur Motivation, Probleme und Ziele Topic/S Workflow Überblick Informationsextraktion Speicherung Themenerkennung Demo Zusammenfassung Montag, 23.09.2013 Topic/S @ LSWT Slide 6
  • 8. Workflow Montag, 23.09.2013 Topic/S @ LSWT Slide 7 Mehr in [Voigt2013]
  • 9. Informationsextraktion Montag, 23.09.2013 Topic/S @ LSWT Spracherkennung (DE, EN) Regelbasiert Kategorisierung Quellenabhängig Slide 8 Source: onelanguageoneposter.com Agentur Genauigkeit KNA 80,3 % DPA 94,4 % EPD 80,3 % Reuters 90,8 % OTS 93,5 % AFP 86 %
  • 10. Informationsextraktion Montag, 23.09.2013 Topic/S @ LSWT Spracherkennung (DE, EN) Regelbasiert Kategorisierung Quellenabhängig Named Entity Recognition Wortlisten- & Statistik-basiert Disambiguierung interne & externe Datenbasis Slide 9 Source: onelanguageoneposter.com
  • 11. Semantisches Model Montag, 23.09.2013 Topic/S @ LSWT Slide 10 Media SemItemMatch SemItem Quellen: freemake.com, samepage.io, free-vectors.com, trendwatching.com, viamusical.de
  • 12. Semantische Fakten Keine Wortlisten für NER! preferred und alternative Namen vorgehalten ID: http://www.topic-s.de/topics-facts/id/person/Rene_Muller Namen: Rene Muller, Rene Müller, René Muller, René Müller Triples ohne SemItems: 31,3 Mio. Montag, 23.09.2013 Topic/S @ LSWT Slide 11 SemItem Anzahl (alternative Namen) Person 1.504.341 (2.499.962) Organization 63.332 (98.127) Place 89.702 (95.178) Keyword 1351
  • 13. Speicherung Oracle 11gR2 Benchmark von Triple Stores [Voigt2012] Pros Bereits im Unternehmen für große Datenmengen im Einsatz Integrierte Anfrage an relationale und semantische Daten Cons Inferenz Unvollständiger SPARQL 1.1 Support Einsatz von eigenen Regeln kaum möglich Montag, 23.09.2013 Topic/S @ LSWT Slide 12 Quelle: musingmonika.com
  • 14. Themenerkennung Montag, 23.09.2013 Topic/S @ LSWT Clustering hierarchisches, agglomeratives Verfahren Grundlage: Artikel und deren Entitäten Eigenimplementierung aufgrund spezieller Herausforderungen Ausführung und Zusammenfassung im Intervall  Trend Slide 13
  • 15. Top-Cluster (vom 19.09.2013) Themenerkennung Montag, 23.09.2013 Topic/S @ LSWT Artikel 5 wichtigsten SemItems HotTopic 68 Euro / Kind / Deutschland / Berlin / Bundeswehr Nein 52 Euro / Lufthansa / Milliarde / Boeing / Land Nordrhein-Westfalen Ja 44 Alternative für Deutschland / Partei / Umfrage / Bundestagswahl / SPD Ja 32 Federal Reserve System / US-Notenbank / Entscheidung / Dollar / USA Ja 28 SPD / Partei / CDU / Bundestagswahl / Wahlkampf Ja 26 Syrien / Vernichtung / Vereinte Nationen / USA / Washington Ja 22 Entschädigung / Euro / Bundesgerichtshof / Urteil / Kläger Ja 18 Präsident / Hassan Rowhani / USA / Regierung / Washington Ja 15 FDP / CDU / SPD / Berlin / Bundestagswahl Ja Slide 14
  • 16. Struktur Motivation, Probleme und Ziele Topic/S Workflow Demo Zusammenfassung Montag, 23.09.2013 Topic/S @ LSWT Slide 15
  • 17. Live Demo Montag, 23.09.2013 Topic/S @ LSWT Slide 16
  • 18. Struktur Motivation, Probleme und Ziele Topic/S Workflow Demo Zusammenfassung Montag, 23.09.2013 Topic/S @ LSWT Slide 17
  • 19. Sum it up! Ergebnis Themenerkennung und Präsentation gegenüber dem Redakteur Lessons learned NER: Schlecht für Non-English, Kombination notwendig Stete Modeloptimierung hinsichtlich der Anfragen Spezielle UI notwendig Mögliche, nächste Schritte „Vorhersage“ von Themen aufgrund von kausalen und temporalen Beziehungen Montag, 23.09.2013 Topic/S @ LSWT Slide 18 Quelle: ooltapulta.com http://www.w3.org/community/swisig/
  • 20. Sächsische AufbauBank Forschung und Entwicklung - Projektförderung Projektnummer - 99457/2677 http://topic-s.de/ Danke! Fragen? http://topic-s.de/
  • 21. Quellen [Voigt2012] Voigt, M., Mitschick, A. & Schulz, J.: Yet Another Triple Store Benchmark? Practical Experiences with Real-World Data Proc. of. the 2nd International Workshop on Semantic Digital Archives (SDA), 2012 [Voigt2013] Voigt, M., Aleythe, M. & Wehner, P.: Towards Topics-based, Semantics-assisted News Search. Proceedings of the 3rd International Conference on Web Intelligence, Mining and Semantics (WIMS'13), ACM,2013 Montag, 23.09.2013 Topic/S @ LSWT Slide 20