1. Things, not Strings
ADV Tagung - Suchstrategien für heute und morgen
12. November, 2014
Dr. Bernhard Haslhofer
Data Scientist
AIT - Austrian Institute of Technology
bernhard.haslhofer@ait.ac.at
22. Schritte / Probleme
• Named Entity Detection: “…EM-Qualifikation gegen
Russland: So geht Marcel Koller mit dem David Alaba-
Ausfall um…”
• Named Entity Disambiguation: “…Aufregendes Derby
lässt die Austria aufatmen…”
(Austria = Fußballverein/Land)?
• Named Entity Linkage/Resolution:
• David Alaba = http://dbpedia.org/resource/David_Alaba
• Austria = http://www.freebase.com/m/03mp37
22
23. Tools
• AlchemyAPI (http://www.alchemyapi.com/):
• identifiziert eine Vielzahl von Entitätstypen (Personen,
Orte, Ereignisse, etc.) in Dokumenten
• unterstützt DBPedia, Freebase
• DBPedia Spotlight (https://github.com/dbpedia-spotlight):
• annotiert DBPedia Entitäten in Dokumenten
• ….
23
25. • Heutige und zukünftige Suchstrategien basieren
auf Volltextsuche + Knowledge Graph
• Google Knowledge Graph
• Microsoft Bing Satori Knowledge Base
• …
25
26. • Identifikation, Extraktion und Verlinkung von Dingen
“Things” gewinnt zunehmend an Bedeutung
• Verfügbarkeit offener, strukturierter Daten ist
essentiell zum Aufbau von Knowledge Graphs
26
28. • Knowledge Base/Graph
• ist Voraussetzung für Question-Answering Systeme (z.b., IBM
Watson)
• bildet Basis für natürlichsprachige Suche
• ermöglicht Antizipation zukünftiger Suchanfragen
28