SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Downloaden Sie, um offline zu lesen
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 1 
"Enabling humanities research in the Linked Open Web” 
DM2E final event, 11.12.2014, Pisa 
Open Humanities Awards DM2E track: FinderApp WiTTFind 
Wittgensteins Nachlass: Computational linguistics and philosophy 
Max Hadersbeck, 
Roman Capsamun, Yuliya Kalasouskaya, Stefan Schweter 
Centrum für Informations- und Sprachverarbeitung (CIS), LMU, München,
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 2 
Ludwig Wittgenstein’s Nachlass 
Ludwig Wittgenstein (1889-1951) left 20,000 pages, Wittgenstein's Nachlass 
2000: Wittgenstein Archives, University Bergen (WAB): 
Nachlass CD-ROM edition, Bergen Electronic Edition (BEE) 
2009: WAB and net7 (Pisa) 5000 pages freely available on the web 
Wittgenstein Source, including standard search tools 
2010: WAB and CIS: “Wittgenstein in Co-Text”: 
computational linguistic Wittgenstein’s advanced search tools with web-frontend 
2011: first release: FinderApp WiTTFind 
Patrick Sahle: “We solve your problem !!??”
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 3 
our project connected to DM2E 
WiTTFind part of freely available tools, using DM2E project-data 
our project for the AWARD 
WiTTFind: fine-grained computational linguistic perspectives on editions 
open source, XML-Input Data, tools and knowledge configurable 
not like statistical indexing search machines 
like google books, Open Library project, apache Solr
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 4 
computational perspective of WiTTFind 
digital full-form lexicon 
with 46000 entries 
POS-Tagging, 
rule based access, 
local grammars, 
in sentence frames 
Wittenstein: Tractatus logico philosophicus [22, 3.3]: 
„Nur der Satz hat Sinn; nur im Zusammenhang des Satzes hat ein Name 
Bedeutung“.
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 5 
aims for our AWARD-project 
1. extending data to 5000 pages of Wittgenstein’s Nachlass 
2. finder openly available to other digital humanity projects 
defining APIs, a XML-TEI-P5 tagset 
3. OCR tools for facsimile-integration 
4. facsimile reader for multidoc 
5. tools to convert and insert edition-documents . 
6. interoperable distributed application (Linux, Macos, Windows) 
7. browser and devices independence 
8. software under git-server control
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 6 
FinderApp before the AWARD 
http://wittfind.cis.uni-muenchen.de 
Publications: 
35. Wittgenstein Symposium, Kirchberg am Wechsel, Austria, 5.-11. 08.2012, 
1. Digital Humanities im deutschsprachigen Raum, Passau, 25.-28.03.2014 
DATeCH 2014 – Digital Access to Textual Cultural Heritage, Madrid, 19.- 20.5.2014
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 7 
FinderApp for the AWARD (beta version) 
see http://wittfind15.cis.uni-muenchen.de
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
September work for our AWARD 
Team: Roman Capsamun, Yuliya Kalasouskaya and Stefan Schweter 
Extending Nachlass-data for FinderApp WiTTFind 
Visiting and meeting at WAB 
HD-scans from Cambridge/WAB 
Extending syntactic disambiguation 
Nachlass-Data, POS 
“ABBYY” or “Tesseract” for OCR 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 8
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
October work for our AWARD 
Open-source software development tools: gitlab, 
test driven development (TDD), 
continuous integration (CI), 
see : https://gitlab.cis.uni-muenchen.de 
Git-platform: Wittgenstein Advanced Search Tools (WAST) 
Feedback-app for errors and maintenance 
Interoperable software 
virtualization as docker-container, (see www.docker.com). 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 9
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
November work for our AWARD 
WEB-Design: University WEB-CI and “Nietzsche-Source” 
Redesign of WiTTFind WEB-frontend for “multidoc” 
Facsimile-reader for “multidoc” 
Browser and device independence: bootstrap, see: http://getbootstrap.com 
Video about git-activity, 
see: http://wast.cis.uni-muenchen.de/tutorial/gitlab-log/ 
Wrote a paper: 2. Digital Humanities im deutschsprachigen Raum, 
Graz, 23.-27.2.2015 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 10
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
November work for our AWARD 
Starting OCR tesseract facsimile highlighting 
typescript 
(rather good) 
manuscripts 
(very bad) 
Developing a multiuser-semiautomatic WEB-based correction-tool for OCR-Errors. 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 11
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
December work for our AWARD 
WiTTFind AWARD beta version, see: http://wittfind15.cis.uni-muenchen.de 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 12
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
FinderApp WiTTFind components 
Edition: 
xml-TEI-P5 texts 
<s n="Ts-213,i-r[7]_1" ana="facs:Ts-213,i-r abnr:7 satznr:15"> 
6)Man sagt: ein Wort verstehen heißt, wissen, wie es gebraucht wird.</s> 
facsimile HD-quality 
Wittgenstein Advanced Search Tools (WAST) - tools: 
fullform lexikon WiTTLex, (ca. 46000 entries) 
disambiguation: 
PartOfSpeech Tagging, treetagger, local grammars 
semantic search: 
lexical entries with disambiguations 
see: http://wittfind.cis.uni-muenchen.de (Hilfe-Seiten, Semantik Finding) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 13
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
git Server for WAST - tools 
see: https://gitlab.cis.uni-muenchen.de 
important git branches are: 
wf: rulebased finder 
multithreaded C++ programs 
wittfind-web: 
WEB-Page, bootstrap 
wittreader-coordinates-ocr 
wab2cis: facsimile, (WAB) 
xml programs, POS tagger 
wast-feedback 
erkenntnis: 
lexicon, syntax, semantic 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 14
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
next developments 
Video: WiTTFind tutorial (German, English) 
Hit scoring 
HD-facsimile integration 
More disambiguations 
More semantic (nouns, time, locations) 
Secret-writings of Wittgenstein 
Quadro- facsimile-reader 
Scope search (indexing) 
Word misspelling (Levenshtein) 
Lemmatized autosuggestion 
Symmetric index and autosuggestions SIS 
Daniel Bruder, (see: http://sis.cis.lmu.de) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 15
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
summary: WiTTFind 
http://wittfind15.cis.uni-muenchen.de 
multidoc DM2E texts 
simple sentence separated TEI-5 XML (CISWAB), 
electronical full-form lexcion (WiTTLex), 
word/phrase input and syntactically/semantically disambiguation with POS 
and local grammars, 
Highlighting of hits and facsimile display and –reader, 
git- based program development, 
browser independent (bootstrap), 
interoperable with virtualization (docker) 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 16
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Ludwig Wittgenstein states: 
"Wovon man nicht sprechen kann, darüber muss man schweigen." – 
Satz 7, Tractatus logico-philosophicus 
but 
The computational linguists can help to find the most hidden remarks in 
the Edition. 
Vielen Dank für Ihre Aufmerksamkeit – Molti grazie per gentile attentione 
Thank you for your attention 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 17
Centrum für Informations- und 
Sprachverarbeitung (CIS) 
Zusammenarbeit Computerlinguistik und Philosophie 
‚methodischer Brückenschlag oder "feindliche Übernahme"?‘ 
Philosoph Prof. Hrachovec(Wien): 
“Ein neues Rastermikroskop für den Steinbruch” 
FinderApp 
Ludwig Wittgenstein im Ms111,178: 
"Wenn ich etwas suche, so ist es wesentlich, daß ich das Finden 
ebenso ausführlich muß beschreiben können (ob es (je so) 
eintritt oder nicht) ehe der Gegenstand gefunden ist.“ 
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 18
Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 19

Weitere ähnliche Inhalte

Was ist angesagt?

Vernetzte welten v01
Vernetzte welten v01Vernetzte welten v01
Vernetzte welten v01walter koch
 
Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...
Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...
Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...Mareike König
 
Politische Unterstützung für Open Access
Politische Unterstützung für Open AccessPolitische Unterstützung für Open Access
Politische Unterstützung für Open Accessstabihh
 
Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...
Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...
Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...Ass.-Prof. Dr. Sandra Hofhues
 
Wissenschaftliches Publizieren mit Bibliotheken
Wissenschaftliches Publizieren mit BibliothekenWissenschaftliches Publizieren mit Bibliotheken
Wissenschaftliches Publizieren mit Bibliothekenstabihh
 
edu-sharing open-source for educational networks
edu-sharing open-source for educational networksedu-sharing open-source for educational networks
edu-sharing open-source for educational networksAnnett Zobel
 
Resource Discovery neu definiert
Resource Discovery neu definiertResource Discovery neu definiert
Resource Discovery neu definiertJens Mittelbach
 
Open Access im Akademienprogramm - Anwendung und Herausforderungen
Open Access im Akademienprogramm - Anwendung und HerausforderungenOpen Access im Akademienprogramm - Anwendung und Herausforderungen
Open Access im Akademienprogramm - Anwendung und HerausforderungenAlineDeicke
 
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur DokumentenserverMedienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur DokumentenserverRalf Claußnitzer
 

Was ist angesagt? (13)

Chardaloupa
ChardaloupaChardaloupa
Chardaloupa
 
Forschungsdaten und DSpace
Forschungsdaten und DSpaceForschungsdaten und DSpace
Forschungsdaten und DSpace
 
Vernetzte welten v01
Vernetzte welten v01Vernetzte welten v01
Vernetzte welten v01
 
Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...
Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...
Aspekte des geisteswissenschaftlichen Open Access-Publikationswesens in Frank...
 
Politische Unterstützung für Open Access
Politische Unterstützung für Open AccessPolitische Unterstützung für Open Access
Politische Unterstützung für Open Access
 
Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...
Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...
Laufende (Forschungs-)Projekte und moegliche Anker fuer Abschlussarbeiten (Wi...
 
Wissenschaftliches Publizieren mit Bibliotheken
Wissenschaftliches Publizieren mit BibliothekenWissenschaftliches Publizieren mit Bibliotheken
Wissenschaftliches Publizieren mit Bibliotheken
 
edu-sharing open-source for educational networks
edu-sharing open-source for educational networksedu-sharing open-source for educational networks
edu-sharing open-source for educational networks
 
Resource Discovery neu definiert
Resource Discovery neu definiertResource Discovery neu definiert
Resource Discovery neu definiert
 
Open Access im Akademienprogramm - Anwendung und Herausforderungen
Open Access im Akademienprogramm - Anwendung und HerausforderungenOpen Access im Akademienprogramm - Anwendung und Herausforderungen
Open Access im Akademienprogramm - Anwendung und Herausforderungen
 
RFID: Umstieg auf das Dänische Datenmodell und neue Selbstverbucher an TU und...
RFID: Umstieg auf das Dänische Datenmodell und neue Selbstverbucher an TU und...RFID: Umstieg auf das Dänische Datenmodell und neue Selbstverbucher an TU und...
RFID: Umstieg auf das Dänische Datenmodell und neue Selbstverbucher an TU und...
 
Infotreff: Persistent Identifier
Infotreff: Persistent IdentifierInfotreff: Persistent Identifier
Infotreff: Persistent Identifier
 
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur DokumentenserverMedienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
 

Andere mochten auch (13)

08a punditdm2efinaleventpisa2014 141212080409-conversion-gate01
08a punditdm2efinaleventpisa2014 141212080409-conversion-gate0108a punditdm2efinaleventpisa2014 141212080409-conversion-gate01
08a punditdm2efinaleventpisa2014 141212080409-conversion-gate01
 
01 welcome violeta_final_event_dm2_e_20141211
01 welcome violeta_final_event_dm2_e_2014121101 welcome violeta_final_event_dm2_e_20141211
01 welcome violeta_final_event_dm2_e_20141211
 
02 20141210 beyond_dm2_e_sustainable_digital_services_chambers_v2
02 20141210 beyond_dm2_e_sustainable_digital_services_chambers_v202 20141210 beyond_dm2_e_sustainable_digital_services_chambers_v2
02 20141210 beyond_dm2_e_sustainable_digital_services_chambers_v2
 
Virtual exhibition presentation pim
Virtual exhibition presentation pimVirtual exhibition presentation pim
Virtual exhibition presentation pim
 
05 piotrowski
05 piotrowski05 piotrowski
05 piotrowski
 
Pisa final all_wp_121214_wp1_dg
Pisa final all_wp_121214_wp1_dgPisa final all_wp_121214_wp1_dg
Pisa final all_wp_121214_wp1_dg
 
10 wp4 community building
10 wp4 community building10 wp4 community building
10 wp4 community building
 
06 dm2 e_pisa-wp2-no-anim
06 dm2 e_pisa-wp2-no-anim06 dm2 e_pisa-wp2-no-anim
06 dm2 e_pisa-wp2-no-anim
 
Wp4 results july dec 2014
Wp4 results july dec 2014Wp4 results july dec 2014
Wp4 results july dec 2014
 
03 isaac dm2-e14-full
03 isaac dm2-e14-full03 isaac dm2-e14-full
03 isaac dm2-e14-full
 
08b final event_experimente
08b final event_experimente08b final event_experimente
08b final event_experimente
 
SEA CHANGE @ DM2Efinal conference, Pisa, Dec 11
SEA CHANGE @ DM2Efinal conference, Pisa, Dec 11SEA CHANGE @ DM2Efinal conference, Pisa, Dec 11
SEA CHANGE @ DM2Efinal conference, Pisa, Dec 11
 
04 pisa final_event_111214_wp1_dg
04 pisa final_event_111214_wp1_dg04 pisa final_event_111214_wp1_dg
04 pisa final_event_111214_wp1_dg
 

Ähnlich wie 09 pisa finale

Kuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KIKuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KIGeorg Rehm
 
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Georg Rehm
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebKatrin Weller
 
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenDigitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliothekencneudecker
 
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenDigitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenGeorg Rehm
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTMax Kaiser
 
20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbestände20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbeständedatentaste
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Dennis Zielke
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Georg Rehm
 
"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14
"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14
"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14SabrinaHerbst
 
ISD2016_SolutionP_Nadia_Zürcher
ISD2016_SolutionP_Nadia_ZürcherISD2016_SolutionP_Nadia_Zürcher
ISD2016_SolutionP_Nadia_ZürcherInfoSocietyDays
 
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...Matthias Arnold
 
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...Dr. Achim Bonte
 
Lösungen für linguistische Ressourcen im Web — META-NET und META-SHARE
Lösungen für linguistische Ressourcen im Web — META-NET und META-SHARELösungen für linguistische Ressourcen im Web — META-NET und META-SHARE
Lösungen für linguistische Ressourcen im Web — META-NET und META-SHAREGeorg Rehm
 
Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Bernhard Krabina
 
Es gibt noch viele Chancen. Das Beispiel SLUB
Es gibt noch viele Chancen. Das Beispiel SLUBEs gibt noch viele Chancen. Das Beispiel SLUB
Es gibt noch viele Chancen. Das Beispiel SLUBDr. Achim Bonte
 

Ähnlich wie 09 pisa finale (20)

Kuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KIKuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KI
 
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
 
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenDigitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
 
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenDigitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
 
20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbestände20120608_Thematische Vernetzung heterogener Informationsbestände
20120608_Thematische Vernetzung heterogener Informationsbestände
 
Projektvorstellung DHVLab (22.11.2016)
Projektvorstellung DHVLab (22.11.2016)Projektvorstellung DHVLab (22.11.2016)
Projektvorstellung DHVLab (22.11.2016)
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
 
Meyer Project Introduction IMPACT Workshop MUC
Meyer Project Introduction IMPACT Workshop MUCMeyer Project Introduction IMPACT Workshop MUC
Meyer Project Introduction IMPACT Workshop MUC
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
 
"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14
"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14
"Von Infrastrukturen zu Möglichkeitsräumen" Vortrag #GMW14
 
ISD2016_SolutionP_Nadia_Zürcher
ISD2016_SolutionP_Nadia_ZürcherISD2016_SolutionP_Nadia_Zürcher
ISD2016_SolutionP_Nadia_Zürcher
 
Scholze gbv 5-9-12_final
Scholze gbv 5-9-12_finalScholze gbv 5-9-12_final
Scholze gbv 5-9-12_final
 
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
 
Das DFG-Pilotprojekt Virtuelles deutsches Urkundennetzwerk
Das DFG-Pilotprojekt Virtuelles deutsches UrkundennetzwerkDas DFG-Pilotprojekt Virtuelles deutsches Urkundennetzwerk
Das DFG-Pilotprojekt Virtuelles deutsches Urkundennetzwerk
 
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
Wirtschaftlichkeit von Open Access-Lösungen. Das mandantenfähige Repository Q...
 
Lösungen für linguistische Ressourcen im Web — META-NET und META-SHARE
Lösungen für linguistische Ressourcen im Web — META-NET und META-SHARELösungen für linguistische Ressourcen im Web — META-NET und META-SHARE
Lösungen für linguistische Ressourcen im Web — META-NET und META-SHARE
 
Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement
 
Es gibt noch viele Chancen. Das Beispiel SLUB
Es gibt noch viele Chancen. Das Beispiel SLUBEs gibt noch viele Chancen. Das Beispiel SLUB
Es gibt noch viele Chancen. Das Beispiel SLUB
 

Mehr von Digitised Manuscripts to Europeana

DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)
DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)
DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)Digitised Manuscripts to Europeana
 
DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...
DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...
DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...Digitised Manuscripts to Europeana
 

Mehr von Digitised Manuscripts to Europeana (18)

DM2E community building
DM2E community buildingDM2E community building
DM2E community building
 
Reasoning with Reasoning (STRiX 2014)
Reasoning with Reasoning (STRiX 2014)Reasoning with Reasoning (STRiX 2014)
Reasoning with Reasoning (STRiX 2014)
 
07 dm2 e_seachange
07 dm2 e_seachange07 dm2 e_seachange
07 dm2 e_seachange
 
Vienna 2014-11-18-dm2 e
Vienna 2014-11-18-dm2 eVienna 2014-11-18-dm2 e
Vienna 2014-11-18-dm2 e
 
Introduction to dm2 e final dg
Introduction to dm2 e final dgIntroduction to dm2 e final dg
Introduction to dm2 e final dg
 
Wp1 2014
Wp1 2014Wp1 2014
Wp1 2014
 
Dm2 e okfn-infoday_scholarly_activities_18_nov
Dm2 e okfn-infoday_scholarly_activities_18_novDm2 e okfn-infoday_scholarly_activities_18_nov
Dm2 e okfn-infoday_scholarly_activities_18_nov
 
The value of open data and the OpenGLAM network
The value of open data and the OpenGLAM networkThe value of open data and the OpenGLAM network
The value of open data and the OpenGLAM network
 
Dc 2014 baierer-droege
Dc 2014 baierer-droegeDc 2014 baierer-droege
Dc 2014 baierer-droege
 
Pundit2, DHAB meeting, 2 October 2014
Pundit2, DHAB meeting, 2 October 2014Pundit2, DHAB meeting, 2 October 2014
Pundit2, DHAB meeting, 2 October 2014
 
7 beat estermann 20140715_open_glam_satellite-event_input_ch
7 beat estermann 20140715_open_glam_satellite-event_input_ch7 beat estermann 20140715_open_glam_satellite-event_input_ch
7 beat estermann 20140715_open_glam_satellite-event_input_ch
 
5 helene hahn openglam workshop 2014 final
5 helene hahn openglam workshop 2014 final5 helene hahn openglam workshop 2014 final
5 helene hahn openglam workshop 2014 final
 
4 lydia pintscher wikidata @ ok_fest fringe event 2014-07-15
4 lydia pintscher wikidata @ ok_fest fringe event 2014-07-154 lydia pintscher wikidata @ ok_fest fringe event 2014-07-15
4 lydia pintscher wikidata @ ok_fest fringe event 2014-07-15
 
2 joris pekel rijksmuseumpaper-140717041443-phpapp01
2 joris pekel rijksmuseumpaper-140717041443-phpapp012 joris pekel rijksmuseumpaper-140717041443-phpapp01
2 joris pekel rijksmuseumpaper-140717041443-phpapp01
 
1 lieke ploeger open_glam intro ok_fest 2014
1 lieke ploeger open_glam intro ok_fest 20141 lieke ploeger open_glam intro ok_fest 2014
1 lieke ploeger open_glam intro ok_fest 2014
 
8 sanna marttila open_glam-workshop-berlin-sm-150714
8 sanna marttila open_glam-workshop-berlin-sm-1507148 sanna marttila open_glam-workshop-berlin-sm-150714
8 sanna marttila open_glam-workshop-berlin-sm-150714
 
DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)
DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)
DM2E Project meeting Bergen: WP3 Report on Task 3.4 (Steffen Hennicke)
 
DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...
DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...
DM2E Project meeting Bergen: WP2 RDF Validation, Kai Eckert (University of Ma...
 

09 pisa finale

  • 1. Centrum für Informations- und Sprachverarbeitung (CIS) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 1 "Enabling humanities research in the Linked Open Web” DM2E final event, 11.12.2014, Pisa Open Humanities Awards DM2E track: FinderApp WiTTFind Wittgensteins Nachlass: Computational linguistics and philosophy Max Hadersbeck, Roman Capsamun, Yuliya Kalasouskaya, Stefan Schweter Centrum für Informations- und Sprachverarbeitung (CIS), LMU, München,
  • 2. Centrum für Informations- und Sprachverarbeitung (CIS) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 2 Ludwig Wittgenstein’s Nachlass Ludwig Wittgenstein (1889-1951) left 20,000 pages, Wittgenstein's Nachlass 2000: Wittgenstein Archives, University Bergen (WAB): Nachlass CD-ROM edition, Bergen Electronic Edition (BEE) 2009: WAB and net7 (Pisa) 5000 pages freely available on the web Wittgenstein Source, including standard search tools 2010: WAB and CIS: “Wittgenstein in Co-Text”: computational linguistic Wittgenstein’s advanced search tools with web-frontend 2011: first release: FinderApp WiTTFind Patrick Sahle: “We solve your problem !!??”
  • 3. Centrum für Informations- und Sprachverarbeitung (CIS) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 3 our project connected to DM2E WiTTFind part of freely available tools, using DM2E project-data our project for the AWARD WiTTFind: fine-grained computational linguistic perspectives on editions open source, XML-Input Data, tools and knowledge configurable not like statistical indexing search machines like google books, Open Library project, apache Solr
  • 4. Centrum für Informations- und Sprachverarbeitung (CIS) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 4 computational perspective of WiTTFind digital full-form lexicon with 46000 entries POS-Tagging, rule based access, local grammars, in sentence frames Wittenstein: Tractatus logico philosophicus [22, 3.3]: „Nur der Satz hat Sinn; nur im Zusammenhang des Satzes hat ein Name Bedeutung“.
  • 5. Centrum für Informations- und Sprachverarbeitung (CIS) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 5 aims for our AWARD-project 1. extending data to 5000 pages of Wittgenstein’s Nachlass 2. finder openly available to other digital humanity projects defining APIs, a XML-TEI-P5 tagset 3. OCR tools for facsimile-integration 4. facsimile reader for multidoc 5. tools to convert and insert edition-documents . 6. interoperable distributed application (Linux, Macos, Windows) 7. browser and devices independence 8. software under git-server control
  • 6. Centrum für Informations- und Sprachverarbeitung (CIS) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 6 FinderApp before the AWARD http://wittfind.cis.uni-muenchen.de Publications: 35. Wittgenstein Symposium, Kirchberg am Wechsel, Austria, 5.-11. 08.2012, 1. Digital Humanities im deutschsprachigen Raum, Passau, 25.-28.03.2014 DATeCH 2014 – Digital Access to Textual Cultural Heritage, Madrid, 19.- 20.5.2014
  • 7. Centrum für Informations- und Sprachverarbeitung (CIS) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 7 FinderApp for the AWARD (beta version) see http://wittfind15.cis.uni-muenchen.de
  • 8. Centrum für Informations- und Sprachverarbeitung (CIS) September work for our AWARD Team: Roman Capsamun, Yuliya Kalasouskaya and Stefan Schweter Extending Nachlass-data for FinderApp WiTTFind Visiting and meeting at WAB HD-scans from Cambridge/WAB Extending syntactic disambiguation Nachlass-Data, POS “ABBYY” or “Tesseract” for OCR Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 8
  • 9. Centrum für Informations- und Sprachverarbeitung (CIS) October work for our AWARD Open-source software development tools: gitlab, test driven development (TDD), continuous integration (CI), see : https://gitlab.cis.uni-muenchen.de Git-platform: Wittgenstein Advanced Search Tools (WAST) Feedback-app for errors and maintenance Interoperable software virtualization as docker-container, (see www.docker.com). Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 9
  • 10. Centrum für Informations- und Sprachverarbeitung (CIS) November work for our AWARD WEB-Design: University WEB-CI and “Nietzsche-Source” Redesign of WiTTFind WEB-frontend for “multidoc” Facsimile-reader for “multidoc” Browser and device independence: bootstrap, see: http://getbootstrap.com Video about git-activity, see: http://wast.cis.uni-muenchen.de/tutorial/gitlab-log/ Wrote a paper: 2. Digital Humanities im deutschsprachigen Raum, Graz, 23.-27.2.2015 Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 10
  • 11. Centrum für Informations- und Sprachverarbeitung (CIS) November work for our AWARD Starting OCR tesseract facsimile highlighting typescript (rather good) manuscripts (very bad) Developing a multiuser-semiautomatic WEB-based correction-tool for OCR-Errors. Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 11
  • 12. Centrum für Informations- und Sprachverarbeitung (CIS) December work for our AWARD WiTTFind AWARD beta version, see: http://wittfind15.cis.uni-muenchen.de Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 12
  • 13. Centrum für Informations- und Sprachverarbeitung (CIS) FinderApp WiTTFind components Edition: xml-TEI-P5 texts <s n="Ts-213,i-r[7]_1" ana="facs:Ts-213,i-r abnr:7 satznr:15"> 6)Man sagt: ein Wort verstehen heißt, wissen, wie es gebraucht wird.</s> facsimile HD-quality Wittgenstein Advanced Search Tools (WAST) - tools: fullform lexikon WiTTLex, (ca. 46000 entries) disambiguation: PartOfSpeech Tagging, treetagger, local grammars semantic search: lexical entries with disambiguations see: http://wittfind.cis.uni-muenchen.de (Hilfe-Seiten, Semantik Finding) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 13
  • 14. Centrum für Informations- und Sprachverarbeitung (CIS) git Server for WAST - tools see: https://gitlab.cis.uni-muenchen.de important git branches are: wf: rulebased finder multithreaded C++ programs wittfind-web: WEB-Page, bootstrap wittreader-coordinates-ocr wab2cis: facsimile, (WAB) xml programs, POS tagger wast-feedback erkenntnis: lexicon, syntax, semantic Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 14
  • 15. Centrum für Informations- und Sprachverarbeitung (CIS) next developments Video: WiTTFind tutorial (German, English) Hit scoring HD-facsimile integration More disambiguations More semantic (nouns, time, locations) Secret-writings of Wittgenstein Quadro- facsimile-reader Scope search (indexing) Word misspelling (Levenshtein) Lemmatized autosuggestion Symmetric index and autosuggestions SIS Daniel Bruder, (see: http://sis.cis.lmu.de) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 15
  • 16. Centrum für Informations- und Sprachverarbeitung (CIS) summary: WiTTFind http://wittfind15.cis.uni-muenchen.de multidoc DM2E texts simple sentence separated TEI-5 XML (CISWAB), electronical full-form lexcion (WiTTLex), word/phrase input and syntactically/semantically disambiguation with POS and local grammars, Highlighting of hits and facsimile display and –reader, git- based program development, browser independent (bootstrap), interoperable with virtualization (docker) Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 16
  • 17. Centrum für Informations- und Sprachverarbeitung (CIS) Ludwig Wittgenstein states: "Wovon man nicht sprechen kann, darüber muss man schweigen." – Satz 7, Tractatus logico-philosophicus but The computational linguists can help to find the most hidden remarks in the Edition. Vielen Dank für Ihre Aufmerksamkeit – Molti grazie per gentile attentione Thank you for your attention Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 17
  • 18. Centrum für Informations- und Sprachverarbeitung (CIS) Zusammenarbeit Computerlinguistik und Philosophie ‚methodischer Brückenschlag oder "feindliche Übernahme"?‘ Philosoph Prof. Hrachovec(Wien): “Ein neues Rastermikroskop für den Steinbruch” FinderApp Ludwig Wittgenstein im Ms111,178: "Wenn ich etwas suche, so ist es wesentlich, daß ich das Finden ebenso ausführlich muß beschreiben können (ob es (je so) eintritt oder nicht) ehe der Gegenstand gefunden ist.“ Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 18
  • 19. Dr. Max Hadersbeck, DM2E AWARD, 2014 Pisa, 11.12.2014 # 19