SlideShare une entreprise Scribd logo
1  sur  23
Pourquoi Europeana 
Newspapers ? 
L’apport de la BnF dans le projet
Car Europeana Newspapers nous permet… 
• L’agrégation de journaux européens libres de droits issus 
des grands titres de la presse européenne. 
• La visibilité et l’accessibilité sur le portail Europeana et 
sur le portail des bibliothèques partenaires. 
• L’amélioration des fonctionnalités de recherche pour ce 
contenu grâce à l’enrichissement sémantique des 
données et des métadonnées relatives aux corpus traités. 
Journée d’information 
27 novembre 2014
Car Europeana nous propose un point centralisé pour 
explorer la diversité européenne… 
• Garantir un meilleur accès aux collections numérisées de 
presse existantes. 
• Donner accès en ligne à 18 millions de pages via 
Europeana et TEL. 
• Optimiser les processus de numérisation, dont l’OCR, ainsi 
que les dispositifs de reconnaissance des articles de presse 
(OLR). 
Journée d’information 
27 novembre 2014
Partenaires 
Journée d’information 
27 novembre 2014
Contenus de la BnF 
La Bibliothèque nationale de France participe avec 
environ 3 millions de pages 
(environ 2,4 M traitées en OCR/OLR) 
Journée d’information 
27 novembre 2014
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
Reconnaissance optique de caractères (OCR) – 
Université d’Innsbruck, Autriche 
Recherche plein-texte sur corpus BnF sans OCR ou avec 
OCR non HQ (1,4 M pages)
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
Reconnaissance optique de la structuration et de la 
segmentation des articles (OLR) – CCS, Allemagne. 
Consultation en mode Articles (1 M pages)
OLR : 
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
• Identification/reconnaissance des colonnes 
• Segmentation au niveau d’article (titres, 
sous-titres...) 
• Reconnaissance de classes de page/contenu 
(publicités, petites annonces, tableaux, illustrations, 
légendes) 
• Outils d’assurance qualité et de correction des résultats
OLR
OLR
OLR
OLR
OLR
Traitements et fonctionnalités avancées dédiées 
à l’amélioration de la consultation 
Reconnaissance des entités nommées (REN) 
• Sous-tâche de l’activité d’extraction d’information dans des corpus 
documentaires : 
• Rechercher et identifier un certain nombre d’objets textuels 
(un mot ou un groupe de mots) présents dans des corpus 
documentaires. 
• Catégorisables dans des classes telles 
que noms de personnes, noms 
d'organisations (institutions, 
entreprises, sociétés…) et noms 
de lieux (pays, ville, site…). 
• Eventuellement alignés sur des 
référentiels d’autorités. 
Partenaires scientifiques et techniques : 
• KB (GE, NE) 
• UPMC/LIP6 pour le français
REN et Europeana Newspapers 
REN appliquée sur 100-500 K pages) 
• Concevoir, développer et appliquer un modèle pour la REN 
en français. 
• Réfléchir aux cas d’usage pour l’amélioration des 
fonctionnalités de consultation et de présentation à 
l’intention des usagers d’Europeana et des bibliothèques 
nationales : 
• Moteur de recherche sémantique 
• Web sémantique 
• Alignement avec des référentiels internationaux 
pour la recherche d’information multilingue
•16 
Entités nommées : comment les décrire ? 
• Format externe (BIO, bases 
de données) 
• TEI 
• METS 
• ALTO 
• Europeana Newspapers a 
choisi d’utiliser le mécanisme 
d’étiquetage disponible dans 
ALTO v2.1.
Le format METS/ALTO nous offre… 
• Données descriptives et techniques. 
• Informations sur le contenu et la disposition 
physique de la page (segmentation). 
ALTO 
METS 
• Description de la publication globale : MD 
bibliographiques, techniques, administratives. 
• Informations/description de la structure 
logique du fascicule (TDM). 
• Liens logiques entre TDM et blocs ALTO 
de texte/articles
Europeana Newspapers : un profil METS/ALTO 
dédié à la numérisation de la presse (ENMAP) 
• Articulation autour de trois concepts : section, élément de contenu 
(« article »), élément de structure. 
• Modèle adapté aux contenus presse. 
• Classification des types de contenu 
(information, opinion, divertissement, 
publicité, métadonnée). 
Alimenter la réflexion sur la problématique 
structuration minimale (article = titre + texte) vs. structuration riche
Europeana Newspapers : un profil METS/ALTO 
dédié à la numérisation de la presse (ENMAP) 
Outillé par : 
• la documentation du modèle, 
• une application de structuration 
(UIBK) : 
• test et validation d’un modèle 
de structuration (lancement 
de projets de numérisation), 
• visualisation de contenus (QA) 
• conversion entre formats 
• production pour projets 
de petite taille 
Publication finale du format en fin de projet (janvier 2015)
Europeana Newspapers : valorisation 
Améliorer la recherche et l’accès au contenu 
• Profiter de la structuration en articles individuels, avec table de 
navigation 
• Utiliser le typage des contenus pour affiner la recherche (filtres) 
• Valoriser les entités nommées via des outils sémantiques (data.bnf.fr, 
Exalead) ou d’autres services spécialisés 
Enjeux autour du format et valorisation des contenus 
• Le profil METS/ALTO ENMAP fournit un modèle viable pour le partage et 
l’échange de contenus de presse. 
• La structuration avancée qu’il autorise facilite la réexploitation des 
contenus pour d’autres usages ou vers d’autres formats.
Europeana Newspapers : valorisation 
www.theeuropeanlibrary.org/tel4/newspapers
Les bénéfices pour la BnF… 
• Améliorer l’OCR et utiliser des outils d’évaluation/correction : 
définition de nouvelles recommandations (futurs marchés). 
• Contribuer aux travaux de convergence vers l’utilisation 
du profil ENMAP METS/ALTO. 
• Enrichir les fonctionnalités de recherche et de consultation en 
mode texte/article pour les journaux sur Gallica. 
• Attirer plus de visiteurs sur Gallica avec des contenus enrichis et liés 
à d’autres corpus. 
• Alimenter d’autres vecteurs de diffusion avec ces contenus enrichis : 
data.bnf.fr
merci de votre attention!

Contenu connexe

Tendances

Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?AssociationAF
 
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...Phonothèque MMSH
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFAssociationAF
 
Les licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemandeLes licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemandeFrederic Blin
 
Journées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationaleJournées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationaleABES
 
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...ABES
 
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019ABES
 
Bibliographie
BibliographieBibliographie
BibliographieBobette
 
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Equipex Biblissima
 
éVolution noffre demande2010 jps
éVolution noffre demande2010 jpséVolution noffre demande2010 jps
éVolution noffre demande2010 jpsBibliolab
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Equipex Biblissima
 
Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015Université d'Angers
 

Tendances (18)

Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?
 
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
Présentation du projet Europeana Sounds au conseil scientifique de la MMSH, 2...
 
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOFOdile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF
 
Les licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemandeLes licences nationales : une vision de l'expérience allemande
Les licences nationales : une vision de l'expérience allemande
 
Journées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationaleJournées ABES 2014 - Focus sur BACON, base de connaissances nationale
Journées ABES 2014 - Focus sur BACON, base de connaissances nationale
 
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
 
L1 Anglais - recherche documentaire
L1 Anglais - recherche documentaireL1 Anglais - recherche documentaire
L1 Anglais - recherche documentaire
 
Istex presentation courte-2
Istex presentation courte-2Istex presentation courte-2
Istex presentation courte-2
 
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
 
M1 anglais 2015
M1 anglais 2015M1 anglais 2015
M1 anglais 2015
 
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, l...
 
Bibliographie
BibliographieBibliographie
Bibliographie
 
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
 
éVolution noffre demande2010 jps
éVolution noffre demande2010 jpséVolution noffre demande2010 jps
éVolution noffre demande2010 jps
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
 
Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015Licence 3 tourisme 2ème partie nov2015
Licence 3 tourisme 2ème partie nov2015
 
Le web sémantique - Sylvie Fayet
Le web sémantique - Sylvie FayetLe web sémantique - Sylvie Fayet
Le web sémantique - Sylvie Fayet
 
Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15
 

En vedette

Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayEuropeana Newspapers
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayEuropeana Newspapers
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayEuropeana Newspapers
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayEuropeana Newspapers
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayEuropeana Newspapers
 

En vedette (8)

DocWorks Demo
DocWorks DemoDocWorks Demo
DocWorks Demo
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
What is a named entity
What is a named entityWhat is a named entity
What is a named entity
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
ENP Belgrade WS Metadata
ENP Belgrade WS MetadataENP Belgrade WS Metadata
ENP Belgrade WS Metadata
 

Similaire à Presentation of Ioannis Anagnostopoulos at BnF Information Day

Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesDesconnets Jean-Christophe
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...ABES
 
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...ABES
 
04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdfAssociationAF
 
Structuration de données, recherche et édition
Structuration de données, recherche et éditionStructuration de données, recherche et édition
Structuration de données, recherche et éditionEquipex Biblissima
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimonialesABES
 
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016webassoc .fr
 
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"ABES
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeJulien Sicot
 
#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entreprise#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entrepriseVincent Biret
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeJulien Sicot
 
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Franck Cornu
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifiquelazoumi ouarfli
 
Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...Aproged
 
Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Guillaume Hatt
 
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...ABES
 
Présentation du portail Biblissima
Présentation du portail BiblissimaPrésentation du portail Biblissima
Présentation du portail BiblissimaEquipex Biblissima
 

Similaire à Presentation of Ioannis Anagnostopoulos at BnF Information Day (20)

Ppt msh def.
Ppt msh def.Ppt msh def.
Ppt msh def.
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
 
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
Jabes 2008 - Atelier 6 : vers un code international de catalogage. Présentati...
 
04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf
 
Structuration de données, recherche et édition
Structuration de données, recherche et éditionStructuration de données, recherche et édition
Structuration de données, recherche et édition
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
 
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
Cahier des charges (2/2) - Webassoc Lyon, le 24 mai 2016
 
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliotheque
 
#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entreprise#Collab365 L'importance des métadonnées pour votre entreprise
#Collab365 L'importance des métadonnées pour votre entreprise
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliotheque
 
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...Les technologies liées à la gestion de contenus professionnels, levier de la ...
Les technologies liées à la gestion de contenus professionnels, levier de la ...
 
Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006
 
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...JABES 2015 -  Convergences EAD : ourils, référentiels, interopérabilité / Jea...
JABES 2015 - Convergences EAD : ourils, référentiels, interopérabilité / Jea...
 
Présentation du portail Biblissima
Présentation du portail BiblissimaPrésentation du portail Biblissima
Présentation du portail Biblissima
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Erms partagé
Erms partagéErms partagé
Erms partagé
 

Plus de Europeana Newspapers

IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers
 

Plus de Europeana Newspapers (20)

IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday Genereux
 
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday Bolioli
 
ENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillemsENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillems
 
ENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilmsENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilms
 
ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen
 
ENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizingaENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizinga
 

Dernier

Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETMedBechir
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxrababouerdighi
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSKennel
 
Evaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxEvaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxAsmaa105193
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSKennel
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 37
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETMedBechir
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .Txaruka
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxmmatar2
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Gilles Le Page
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSKennel
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeXL Groupe
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSKennel
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Alain Marois
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsRajiAbdelghani
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSKennel
 

Dernier (20)

Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
DO PALÁCIO À ASSEMBLEIA .
DO PALÁCIO À ASSEMBLEIA                 .DO PALÁCIO À ASSEMBLEIA                 .
DO PALÁCIO À ASSEMBLEIA .
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptx
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
 
Evaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxEvaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. Marocpptx
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSET
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptx
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directe
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 temps
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
 

Presentation of Ioannis Anagnostopoulos at BnF Information Day

  • 1. Pourquoi Europeana Newspapers ? L’apport de la BnF dans le projet
  • 2. Car Europeana Newspapers nous permet… • L’agrégation de journaux européens libres de droits issus des grands titres de la presse européenne. • La visibilité et l’accessibilité sur le portail Europeana et sur le portail des bibliothèques partenaires. • L’amélioration des fonctionnalités de recherche pour ce contenu grâce à l’enrichissement sémantique des données et des métadonnées relatives aux corpus traités. Journée d’information 27 novembre 2014
  • 3. Car Europeana nous propose un point centralisé pour explorer la diversité européenne… • Garantir un meilleur accès aux collections numérisées de presse existantes. • Donner accès en ligne à 18 millions de pages via Europeana et TEL. • Optimiser les processus de numérisation, dont l’OCR, ainsi que les dispositifs de reconnaissance des articles de presse (OLR). Journée d’information 27 novembre 2014
  • 5. Contenus de la BnF La Bibliothèque nationale de France participe avec environ 3 millions de pages (environ 2,4 M traitées en OCR/OLR) Journée d’information 27 novembre 2014
  • 6. Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation Reconnaissance optique de caractères (OCR) – Université d’Innsbruck, Autriche Recherche plein-texte sur corpus BnF sans OCR ou avec OCR non HQ (1,4 M pages)
  • 7. Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation Reconnaissance optique de la structuration et de la segmentation des articles (OLR) – CCS, Allemagne. Consultation en mode Articles (1 M pages)
  • 8. OLR : Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation • Identification/reconnaissance des colonnes • Segmentation au niveau d’article (titres, sous-titres...) • Reconnaissance de classes de page/contenu (publicités, petites annonces, tableaux, illustrations, légendes) • Outils d’assurance qualité et de correction des résultats
  • 9. OLR
  • 10. OLR
  • 11. OLR
  • 12. OLR
  • 13. OLR
  • 14. Traitements et fonctionnalités avancées dédiées à l’amélioration de la consultation Reconnaissance des entités nommées (REN) • Sous-tâche de l’activité d’extraction d’information dans des corpus documentaires : • Rechercher et identifier un certain nombre d’objets textuels (un mot ou un groupe de mots) présents dans des corpus documentaires. • Catégorisables dans des classes telles que noms de personnes, noms d'organisations (institutions, entreprises, sociétés…) et noms de lieux (pays, ville, site…). • Eventuellement alignés sur des référentiels d’autorités. Partenaires scientifiques et techniques : • KB (GE, NE) • UPMC/LIP6 pour le français
  • 15. REN et Europeana Newspapers REN appliquée sur 100-500 K pages) • Concevoir, développer et appliquer un modèle pour la REN en français. • Réfléchir aux cas d’usage pour l’amélioration des fonctionnalités de consultation et de présentation à l’intention des usagers d’Europeana et des bibliothèques nationales : • Moteur de recherche sémantique • Web sémantique • Alignement avec des référentiels internationaux pour la recherche d’information multilingue
  • 16. •16 Entités nommées : comment les décrire ? • Format externe (BIO, bases de données) • TEI • METS • ALTO • Europeana Newspapers a choisi d’utiliser le mécanisme d’étiquetage disponible dans ALTO v2.1.
  • 17. Le format METS/ALTO nous offre… • Données descriptives et techniques. • Informations sur le contenu et la disposition physique de la page (segmentation). ALTO METS • Description de la publication globale : MD bibliographiques, techniques, administratives. • Informations/description de la structure logique du fascicule (TDM). • Liens logiques entre TDM et blocs ALTO de texte/articles
  • 18. Europeana Newspapers : un profil METS/ALTO dédié à la numérisation de la presse (ENMAP) • Articulation autour de trois concepts : section, élément de contenu (« article »), élément de structure. • Modèle adapté aux contenus presse. • Classification des types de contenu (information, opinion, divertissement, publicité, métadonnée). Alimenter la réflexion sur la problématique structuration minimale (article = titre + texte) vs. structuration riche
  • 19. Europeana Newspapers : un profil METS/ALTO dédié à la numérisation de la presse (ENMAP) Outillé par : • la documentation du modèle, • une application de structuration (UIBK) : • test et validation d’un modèle de structuration (lancement de projets de numérisation), • visualisation de contenus (QA) • conversion entre formats • production pour projets de petite taille Publication finale du format en fin de projet (janvier 2015)
  • 20. Europeana Newspapers : valorisation Améliorer la recherche et l’accès au contenu • Profiter de la structuration en articles individuels, avec table de navigation • Utiliser le typage des contenus pour affiner la recherche (filtres) • Valoriser les entités nommées via des outils sémantiques (data.bnf.fr, Exalead) ou d’autres services spécialisés Enjeux autour du format et valorisation des contenus • Le profil METS/ALTO ENMAP fournit un modèle viable pour le partage et l’échange de contenus de presse. • La structuration avancée qu’il autorise facilite la réexploitation des contenus pour d’autres usages ou vers d’autres formats.
  • 21. Europeana Newspapers : valorisation www.theeuropeanlibrary.org/tel4/newspapers
  • 22. Les bénéfices pour la BnF… • Améliorer l’OCR et utiliser des outils d’évaluation/correction : définition de nouvelles recommandations (futurs marchés). • Contribuer aux travaux de convergence vers l’utilisation du profil ENMAP METS/ALTO. • Enrichir les fonctionnalités de recherche et de consultation en mode texte/article pour les journaux sur Gallica. • Attirer plus de visiteurs sur Gallica avec des contenus enrichis et liés à d’autres corpus. • Alimenter d’autres vecteurs de diffusion avec ces contenus enrichis : data.bnf.fr
  • 23. merci de votre attention!