SlideShare una empresa de Scribd logo
1 de 16
Descargar para leer sin conexión
Europeana Newspapers Projekt
Information Day DE, Berlin, 27.-28.2.2014
Hans-Jörg Lieder - Staatsbibliothek zu Berlin – Preußischer Kulturbesitz
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 2
Überblick
1. Warum Zeitungen?
2. Projektpartner
3. Arbeitspakete
4. Ergebnisse
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp
Herausforderungen……
Brüchiges Papier
• Fehlende Ausgaben
• Unvollständige Beilagen
• Bindung mit Textverlust
• Druckqualität
• Drucktypen
• Mengen an Material
• Rechtliche Unsicherheiten bei
quasi-zeitgenössischem
Material
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp
Nutzen
„Newspapers represent normal life in
its own native locality”
“the newspaper and the historian” Lucy
Maynard Salmon (1923)
„Die Zeitungen sind der
Sekundenzeiger der Geschichte.
Derselbe aber ist meistens nicht nur
von unedlerem Metalle als die beiden
anderen, sondern geht auch selten
richtig.“
(Arthur Schopenhauer)
Image: Nationaal Archief The Netherlands
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp
Nutzen
• Unmittelbarkeit und
Geschwindigkeit der
öffentlichen Debatte
• Thematisiert wird (fast)
alles (Politik, Kultur,
Sport, Wirtschaft,
Wissenschaft, Werbung,
etc.)
• Deshalb: großes,
interdisziplinäres,
spartenübergreifendes
Interesse
Image: Nationaal Archief The Netherlands
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp
Projektpartner
10. CCS Content Conversion
Specialists GmbH
11. Stichting LIBER, Netherlands
12. National Library of Latvia
13. National Library of Turkey
14. University Library of Belgrade
15. University of Innsbruck
16. State Library Dr. Friedrich
Tessmann, Italy
17. The British Library, UK
18. Europeana Foundation,
Netherlands
01. State Library Berlin, Germany
02. National Library of the
Netherlands
03. National Library of Estonia
04. National Library of Austria
05. National Library of Finland
06. State and University Library
Hamburg, Germany
07. National Library of France
08. National Library of Poland
09. University of Salford
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp
Projektpartner und Assoziierte Partner
12 content providers
2 networking partners
Blau – Daten
Gelb – Technik
Grün – Assoziierte
Partner
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 8
Europeana Newspapers: Kernaufgaben
Übersicht der Arbeitspakete
WP 1 Project Coordination and
Management
WP 2 Refinement of Digitized
Newspapers
WP 3 Evaluation and Quality
Assessment
WP 4 Aggregation and presentation of
digitized newspapers for
Europeana
WP 5 Metadata best practice
recommendations
WP 6 Dissemination and Exploitation
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 9
Europeana Newspapers: Arbeitspaket 2 (Refinement of
Digitized Newspapers)
1. Digitale Abbildungen liegen lokal vor
2. Erzeugung von Volltexten (OCR) für 8 Mio Seiten
3. Erzeugung von Volltexten und Layoutanalyse (OLR)
für 2 Mio Seiten
4. Named Entity Recognition (NER) für 2 Mio Seiten
(Niederländisch, Französisch, Deutsch)
5. Entwicklung einer zeitungsspezifischen S&R-
Umgebung bei The European Library für alle
entsprechenden Daten
6. Metadatennachweis in Europeana
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp
Who
12 content providers
2 networking partners
4 technology providers
1 aggregator
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 11
Europeana Newspapers: Arbeitspakete 3 und 5
WP 3 (Evaluation and Quality Assessment)
• Software-Ergebnisse ermöglichen eine a priori-
Evaluierung zu erwartender Ergebnisse durch OCR-
und OLR-Prozesse
• Mehr dazu morgen 9.30 Uhr
5 (Metadata best practice recommendations)
• Definition von Metadaten-Standards (Images,
Volltexte, Anreicherungen, Strukturdaten)
• Mehr dazu morgen 10 Uhr
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 12
Europeana Newspapers: Arbeitspaket 4 (Aggregation and
presentation of digitized newspapers for Europeana)
• Titel wurden von Bibliotheken ausgewählt (Kriterien: Verfügbarkeit der
Images, Qualität der Images, Bereitschaft Metadaten unter einer CC0-
Lizenz an Europeana zu liefern (vgl. Europeana Data Exchange Model),
Beachtung rechtlicher Einschränkungen, Relevanz für Nutzer)
• Bearbeitete Daten werden für TEL und Europeana aggregiert
• Bibliotheken ermöglichen verschiedene Zugänge zu den Materialien:
(1) Text und Image befinden sich bei TEL und werden angezeigt
(2) Wie (1), aber Text und Image befinden sich auf einem bibliothekseitigen Imageserver
(3) Snippet view: Nutzer sieht nur einen Ausschnitt des Images
(4) Wie (3), aber Text und Image befinden sich auf einem bibliothekseitigen Imageserver
(5) Plain text view: Der Nutzer sieht den Volltext, aber nicht das Image
(6) Nur Metadaten: Der Nutzer sieht lediglich deskriptive Metadaten und wird für die Ansicht
der Inhalte an eine lokale Website übergeben (ggf. fallen Gebühren an)
Weiterer Content: Metadaten aus europäischen Nationalbibliotheken und
anderen größeren Einrichtungen (European Registry of Digitized Newspapers)
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 13
Zeitungen im Überblick
20
Sprachen
ca. 950 Titel
ca. 10 Mio
Seiten
bearbeitet
8 Mio OCR
2 Mio OLR
2 Mio NER
Country Partner Titel
Startdate
(overall)
Enddate
(overall)
France BnF 80 1814 1944
Germany SBB 6 1872 1940
SUB-HH 16 1721 1945
Netherlands KB 203 1618 1900
Italy LFT 15 1813 1949
Estonia NLE 43 1852 1944
Finalnd NLF 11 1900 1910
Latvia NLL 117 1868 1955
Poland NLP 118 1914 1939
Turkey NLT 22 1818 1928
Austria ONB 275 1686 1945
Serbia UB 45 1830 1944
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 14
Europeana Newspapers: Arbeitspaket 4 (Aggregation and
presentation of digitized newspapers for Europeana)
• Entwicklung eines “European Newspapers Browsers”:
• Erste Entwicklungsstufe:
• Einfache Textsuche
• Ergebniseinschränkung (Zeit, Land, Zeitungstitel, Sprache, besitzende Institution)
• OCR-Ergebnisse werden dargestellt
• Images sind zoomfähig
• Aktive Links zwischen Images und Volltexten (wenn möglich)
• Link zur jeweiligen besitzenden Institution
• Zweite Entwicklungsstufe
• Zusätzliche Informationen über bestimmte Zeitungstitel
• Suche in Titeln (nicht ausschließlich in Texten)
• Weitere navigierbare Visualisierungen
• Suche / Stöbern nach automatisch erkannten Entitäten
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp 15
The European Newspapers Browser
This project is partially funded under the ICT Policy Support Programme (ICT PSP)
as part of the Competitiveness and Innovation Framework Programme by the
European Community http://ec.europa.eu/ict_psp
Contact:
hans-joerg.lieder@sbb.spk-berlin.de
ulrike.koelsch@europeana-newspapers.eu
For more information, please see:
www.europeana-newspapers.eu
Twitter (@eurnews)
Facebook: https://www.facebook.com/EuropeanaNewspapers

Más contenido relacionado

Destacado

The European(a) Newspapers Project
The European(a) Newspapers ProjectThe European(a) Newspapers Project
The European(a) Newspapers ProjectEuropeana Newspapers
 
ENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionEuropeana Newspapers
 
Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Europeana Newspapers
 
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja Europeana Newspapers
 
Europeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers
 
eluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspaperseluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspapersEuropeana Newspapers
 

Destacado (13)

On the two sides of the pond
On the two sides of the pondOn the two sides of the pond
On the two sides of the pond
 
The European(a) Newspapers Project
The European(a) Newspapers ProjectThe European(a) Newspapers Project
The European(a) Newspapers Project
 
ENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introduction
 
Web services uddi
Web services uddiWeb services uddi
Web services uddi
 
ENP Belgrade WS Metadata
ENP Belgrade WS MetadataENP Belgrade WS Metadata
ENP Belgrade WS Metadata
 
What is a named entity
What is a named entityWhat is a named entity
What is a named entity
 
Trtovac, dakic, september 2012
Trtovac, dakic, september 2012Trtovac, dakic, september 2012
Trtovac, dakic, september 2012
 
Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser
 
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
 
Europeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introduction
 
ENP_SEEDI_2013_UB
ENP_SEEDI_2013_UBENP_SEEDI_2013_UB
ENP_SEEDI_2013_UB
 
ENP Belgrade WS Introduction
ENP Belgrade WS IntroductionENP Belgrade WS Introduction
ENP Belgrade WS Introduction
 
eluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspaperseluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspapers
 

Similar a Europeana Newspapers Project - German infoday

Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newspapers
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTMax Kaiser
 
Europeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality AssessmentEuropeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality AssessmentEuropeana Newspapers
 
Europeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - MetadatenEuropeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - MetadatenMax Kaiser
 
2011 - Vorstellung des projektes Grenznetz
2011 - Vorstellung des projektes Grenznetz2011 - Vorstellung des projektes Grenznetz
2011 - Vorstellung des projektes GrenznetztrESS Network
 
Nachhaltige öffentliche Beschaffungen
Nachhaltige öffentliche BeschaffungenNachhaltige öffentliche Beschaffungen
Nachhaltige öffentliche BeschaffungenMatthias Stürmer
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Martin Kaltenböck
 
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Patrick Peiffer
 
BSB Demo Day - Balk-Pennington de Jongh - Centre of Competence
BSB Demo Day - Balk-Pennington de Jongh - Centre of CompetenceBSB Demo Day - Balk-Pennington de Jongh - Centre of Competence
BSB Demo Day - Balk-Pennington de Jongh - Centre of CompetenceIMPACT Centre of Competence
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATMartin Kaltenböck
 
Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)
Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)
Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)Agenda Europe 2035
 
Open Source Tagung in München
Open Source Tagung in MünchenOpen Source Tagung in München
Open Source Tagung in MünchenOPEN COMMONS LINZ
 
Berliner DH Rundgang
Berliner DH RundgangBerliner DH Rundgang
Berliner DH Rundgangcneudecker
 
Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)
Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)
Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)Open Data Portal Österreich
 
Eine (kleine) Übersicht über Geodaten-Quellen in der Schweiz
Eine (kleine) Übersicht über Geodaten-Quellen in der SchweizEine (kleine) Übersicht über Geodaten-Quellen in der Schweiz
Eine (kleine) Übersicht über Geodaten-Quellen in der SchweizStefan Keller
 
Peppol Präsentation E Gov Symposium Bern 2008
Peppol Präsentation E Gov Symposium Bern 2008Peppol Präsentation E Gov Symposium Bern 2008
Peppol Präsentation E Gov Symposium Bern 2008Bundesrechenzentrum
 

Similar a Europeana Newspapers Project - German infoday (20)

Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
 
Europeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality AssessmentEuropeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality Assessment
 
Europeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - MetadatenEuropeana: Status - Datenlieferungen - Metadaten
Europeana: Status - Datenlieferungen - Metadaten
 
2011 - Vorstellung des projektes Grenznetz
2011 - Vorstellung des projektes Grenznetz2011 - Vorstellung des projektes Grenznetz
2011 - Vorstellung des projektes Grenznetz
 
Meyer Project Introduction IMPACT Workshop MUC
Meyer Project Introduction IMPACT Workshop MUCMeyer Project Introduction IMPACT Workshop MUC
Meyer Project Introduction IMPACT Workshop MUC
 
Nachhaltige öffentliche Beschaffungen
Nachhaltige öffentliche BeschaffungenNachhaltige öffentliche Beschaffungen
Nachhaltige öffentliche Beschaffungen
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
 
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
 
BSB Demo Day - Balk-Pennington de Jongh - Centre of Competence
BSB Demo Day - Balk-Pennington de Jongh - Centre of CompetenceBSB Demo Day - Balk-Pennington de Jongh - Centre of Competence
BSB Demo Day - Balk-Pennington de Jongh - Centre of Competence
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
 
Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)
Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)
Dr. Harald Gruber (Leiter Digitale Infrastruktur EIB)
 
Open Source Tagung in München
Open Source Tagung in MünchenOpen Source Tagung in München
Open Source Tagung in München
 
Berliner DH Rundgang
Berliner DH RundgangBerliner DH Rundgang
Berliner DH Rundgang
 
BSB Demo Day - Bochow - Einführung
BSB Demo Day - Bochow - EinführungBSB Demo Day - Bochow - Einführung
BSB Demo Day - Bochow - Einführung
 
Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)
Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)
Rudolf Legat, Ein wichtiger Schritt zu mehr Umweltdemokratie (IGU)
 
BSB Demo Day - Skaric - Kollaborative Korrektur
BSB Demo Day - Skaric - Kollaborative KorrekturBSB Demo Day - Skaric - Kollaborative Korrektur
BSB Demo Day - Skaric - Kollaborative Korrektur
 
Eine (kleine) Übersicht über Geodaten-Quellen in der Schweiz
Eine (kleine) Übersicht über Geodaten-Quellen in der SchweizEine (kleine) Übersicht über Geodaten-Quellen in der Schweiz
Eine (kleine) Übersicht über Geodaten-Quellen in der Schweiz
 
Peppol Präsentation E Gov Symposium Bern 2008
Peppol Präsentation E Gov Symposium Bern 2008Peppol Präsentation E Gov Symposium Bern 2008
Peppol Präsentation E Gov Symposium Bern 2008
 

Más de Europeana Newspapers

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisEuropeana Newspapers
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayEuropeana Newspapers
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayEuropeana Newspapers
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayEuropeana Newspapers
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayEuropeana Newspapers
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayEuropeana Newspapers
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayEuropeana Newspapers
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers
 

Más de Europeana Newspapers (20)

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information Day
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday Genereux
 

Europeana Newspapers Project - German infoday

  • 1. Europeana Newspapers Projekt Information Day DE, Berlin, 27.-28.2.2014 Hans-Jörg Lieder - Staatsbibliothek zu Berlin – Preußischer Kulturbesitz
  • 2. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 2 Überblick 1. Warum Zeitungen? 2. Projektpartner 3. Arbeitspakete 4. Ergebnisse
  • 3. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Herausforderungen…… Brüchiges Papier • Fehlende Ausgaben • Unvollständige Beilagen • Bindung mit Textverlust • Druckqualität • Drucktypen • Mengen an Material • Rechtliche Unsicherheiten bei quasi-zeitgenössischem Material
  • 4. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Nutzen „Newspapers represent normal life in its own native locality” “the newspaper and the historian” Lucy Maynard Salmon (1923) „Die Zeitungen sind der Sekundenzeiger der Geschichte. Derselbe aber ist meistens nicht nur von unedlerem Metalle als die beiden anderen, sondern geht auch selten richtig.“ (Arthur Schopenhauer) Image: Nationaal Archief The Netherlands
  • 5. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Nutzen • Unmittelbarkeit und Geschwindigkeit der öffentlichen Debatte • Thematisiert wird (fast) alles (Politik, Kultur, Sport, Wirtschaft, Wissenschaft, Werbung, etc.) • Deshalb: großes, interdisziplinäres, spartenübergreifendes Interesse Image: Nationaal Archief The Netherlands
  • 6. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Projektpartner 10. CCS Content Conversion Specialists GmbH 11. Stichting LIBER, Netherlands 12. National Library of Latvia 13. National Library of Turkey 14. University Library of Belgrade 15. University of Innsbruck 16. State Library Dr. Friedrich Tessmann, Italy 17. The British Library, UK 18. Europeana Foundation, Netherlands 01. State Library Berlin, Germany 02. National Library of the Netherlands 03. National Library of Estonia 04. National Library of Austria 05. National Library of Finland 06. State and University Library Hamburg, Germany 07. National Library of France 08. National Library of Poland 09. University of Salford
  • 7. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Projektpartner und Assoziierte Partner 12 content providers 2 networking partners Blau – Daten Gelb – Technik Grün – Assoziierte Partner
  • 8. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 8 Europeana Newspapers: Kernaufgaben Übersicht der Arbeitspakete WP 1 Project Coordination and Management WP 2 Refinement of Digitized Newspapers WP 3 Evaluation and Quality Assessment WP 4 Aggregation and presentation of digitized newspapers for Europeana WP 5 Metadata best practice recommendations WP 6 Dissemination and Exploitation
  • 9. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 9 Europeana Newspapers: Arbeitspaket 2 (Refinement of Digitized Newspapers) 1. Digitale Abbildungen liegen lokal vor 2. Erzeugung von Volltexten (OCR) für 8 Mio Seiten 3. Erzeugung von Volltexten und Layoutanalyse (OLR) für 2 Mio Seiten 4. Named Entity Recognition (NER) für 2 Mio Seiten (Niederländisch, Französisch, Deutsch) 5. Entwicklung einer zeitungsspezifischen S&R- Umgebung bei The European Library für alle entsprechenden Daten 6. Metadatennachweis in Europeana
  • 10. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Who 12 content providers 2 networking partners 4 technology providers 1 aggregator
  • 11. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 11 Europeana Newspapers: Arbeitspakete 3 und 5 WP 3 (Evaluation and Quality Assessment) • Software-Ergebnisse ermöglichen eine a priori- Evaluierung zu erwartender Ergebnisse durch OCR- und OLR-Prozesse • Mehr dazu morgen 9.30 Uhr 5 (Metadata best practice recommendations) • Definition von Metadaten-Standards (Images, Volltexte, Anreicherungen, Strukturdaten) • Mehr dazu morgen 10 Uhr
  • 12. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 12 Europeana Newspapers: Arbeitspaket 4 (Aggregation and presentation of digitized newspapers for Europeana) • Titel wurden von Bibliotheken ausgewählt (Kriterien: Verfügbarkeit der Images, Qualität der Images, Bereitschaft Metadaten unter einer CC0- Lizenz an Europeana zu liefern (vgl. Europeana Data Exchange Model), Beachtung rechtlicher Einschränkungen, Relevanz für Nutzer) • Bearbeitete Daten werden für TEL und Europeana aggregiert • Bibliotheken ermöglichen verschiedene Zugänge zu den Materialien: (1) Text und Image befinden sich bei TEL und werden angezeigt (2) Wie (1), aber Text und Image befinden sich auf einem bibliothekseitigen Imageserver (3) Snippet view: Nutzer sieht nur einen Ausschnitt des Images (4) Wie (3), aber Text und Image befinden sich auf einem bibliothekseitigen Imageserver (5) Plain text view: Der Nutzer sieht den Volltext, aber nicht das Image (6) Nur Metadaten: Der Nutzer sieht lediglich deskriptive Metadaten und wird für die Ansicht der Inhalte an eine lokale Website übergeben (ggf. fallen Gebühren an) Weiterer Content: Metadaten aus europäischen Nationalbibliotheken und anderen größeren Einrichtungen (European Registry of Digitized Newspapers)
  • 13. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 13 Zeitungen im Überblick 20 Sprachen ca. 950 Titel ca. 10 Mio Seiten bearbeitet 8 Mio OCR 2 Mio OLR 2 Mio NER Country Partner Titel Startdate (overall) Enddate (overall) France BnF 80 1814 1944 Germany SBB 6 1872 1940 SUB-HH 16 1721 1945 Netherlands KB 203 1618 1900 Italy LFT 15 1813 1949 Estonia NLE 43 1852 1944 Finalnd NLF 11 1900 1910 Latvia NLL 117 1868 1955 Poland NLP 118 1914 1939 Turkey NLT 22 1818 1928 Austria ONB 275 1686 1945 Serbia UB 45 1830 1944
  • 14. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 14 Europeana Newspapers: Arbeitspaket 4 (Aggregation and presentation of digitized newspapers for Europeana) • Entwicklung eines “European Newspapers Browsers”: • Erste Entwicklungsstufe: • Einfache Textsuche • Ergebniseinschränkung (Zeit, Land, Zeitungstitel, Sprache, besitzende Institution) • OCR-Ergebnisse werden dargestellt • Images sind zoomfähig • Aktive Links zwischen Images und Volltexten (wenn möglich) • Link zur jeweiligen besitzenden Institution • Zweite Entwicklungsstufe • Zusätzliche Informationen über bestimmte Zeitungstitel • Suche in Titeln (nicht ausschließlich in Texten) • Weitere navigierbare Visualisierungen • Suche / Stöbern nach automatisch erkannten Entitäten
  • 15. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 15 The European Newspapers Browser
  • 16. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Contact: hans-joerg.lieder@sbb.spk-berlin.de ulrike.koelsch@europeana-newspapers.eu For more information, please see: www.europeana-newspapers.eu Twitter (@eurnews) Facebook: https://www.facebook.com/EuropeanaNewspapers