SlideShare una empresa de Scribd logo
1 de 16
Descargar para leer sin conexión
Metasuche mit pazpar2
Sven-S. Porst

Niedersächsische Staats- und
Universitätsbibliothek Göttingen
danke
selbst vorstellen
arbeite an der SUB, an Metasuche und virtuellen Fachbibliotheken
insbesondere Lib AAC, GEO-LEO, SUB Metasuche
Metasuche
• Was ist Metasuche?
• … hört sich an wie ein Albtraum
• … ist aber manchmal unvermeidlich
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Was: Metasuche / förderierte Suche / verteilte Suche
gleichzeitige Abfrage aus mehreren entfernten Datenquellen
gemeinsame Anzeige der Ergebnisse
Albtraum (Unvollständigkeit, Geschwindigkeit, Unzuverlässigkeit, Indexe/Möglichkeiten)

also: technisch problematisch + potentiell schlechte user experience

also: wenn möglich vermeiden + lokalen Index nutzen
Aber: schwierig, Daten dafür zu bekommen + Updates + hoher Aufwand
Schritte
1. Daten holen
2. Daten normalisieren
3. Ergebnisse verfügbar machen

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
1. Protokolle (Z39.50, SRU, Solr) / Abfragesprache (CCL/RPN, CQL, Solr) / Ergebnisformat (ISO
2709, XML)
2. Normalisieren (heterogene Eingabge → homogene Ausgabe) / MARC/DC/Solr → internes
Format / unterschiedlich: Detailtiefen, codierte Informationen (z.B. Medientyp, Sprache)
3. Verfügbar machen: wann (a/synchron)? Quellen mischen? Facetten? Exportformate? UX?
bisherige Lösungen
•
•
•

ohne Support (alt oder selbstgebaut)
monolithisch (feste Oberfläche)
an der SUB Göttingen Entscheidung für
pazpar2 als Ersatz

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
SUB früher: iPort + eigenes GEO-LEO
andere Lösungen, z.B. Metalib, i.d.R. in andere Produkte eingebunden
Entscheidung der SUB für: homogene Infrastruktur,
pazpar2
•
•
•
•

http://indexdata.com/pazpar2
open source
aktive Entwicklung durch Index Data
Daten, keine Nutzeroberfläche

•

als Dienst einbindbar

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Index Data: yaz + andere Projekte, viele Server beruhen auch auf yaz

… bieten Support an
»Dienst«: primär Schritte 1+2 für Daten: eigene Nutzeroberfläche wird benötigt
1. Daten holen
•

basiert auf yaz

•
•
•

Z39.50, SRU, Solr
… und zugehörige Abfragesprachen

liest XML und MARC 21 Daten

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
yaz: Standardbibliothek für bibliographische Verbindungen (Z39.50, SRU, Solr)

Liest XML und ISO 2709; NICHT MAB oder unstrukturierte Daten

tmarc?
liest Daten in 20er Schritten
2. XML Workflow
•

internes Datenformat ist XML
… mit frei definierbaren Feldern

•

Normalisierung durch XSLT

•

XSLTs verkett- und nachnutzbar

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
ISO 2709 wird in MARC XML oder tmarc konvertiert
XSL Beispiele: ISO 639-1 zu ISO 639-2/B Sprachcodes oder Fehlerbereinigung
Internes Datenformat
•

XSLT für MARC 21 enthalten

•
•
•

gibt ein gutes Datenformat vor

Facettierung pro Feld
Deduplizierung

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
MARC 21 gerne totgesagt, aber: weit verbreitet, Detailtiefe
tmarc.xsl gibt gutes Datenmodell + eigene Felder (language, multivolume-title, …)
Facetten: gute Normalisierung wichtig, ICU Filter anwendbar
Deduplizierung: recht einfaches Modell auf Feldbasis, + Merging (siehe Anschlußvortrag S.
Lohrum)
MARC 21 → pazpar2

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Datensatz aus OLC SSG-Geo, Artikel
Autoren in MARC 700
Sprache unbekannt
Artikeldetails in MARC 773
3. Abfrage
•
•

keine Weboberfläche
http/XML Schnittstelle

•
•

sessionbasiert: init / search / show
JavaScript zur Kommunikation: pz2.js

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
weitere Befehle: ping / bytarget / termlist / record / settings /
Anzeige
•
•

elementarer JavaScript Client dabei
erweitert für SUB Göttingen:

•
•
•
•

Interface auf Deutsch und Englisch
ZDB-JOP, Google Books und Maps
Exportformate
Nutzungsanalyse mit piwik

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Export RIS/BibTeX/COiNS
piwik: knapp 10% erweiterte Suche, detailanzeige ca 1:1 mit Suchen, gut 10% Facetten, Export
1%, Google Books 2%
Histogramm
Bemerkungen
•
•
•
•

Entwicklungen: Facettierung, Solr
Zugriffskontrolle mit pazpar2-access
TYPO3 Einbindung
Beispiele:

•
•

GEO-LEO: geo-leo.de
Lib AAC: aac.sub.uni-goettingen.de

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
auch:
Verbesserungsmöglichkeiten (Deduplizierung, Services abfragen, Protokoll)
Demo

http://geo-leo.de/bibtag

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Demo: Suche nach Solling

Treffer Artikel »Numerical Assessment …«, Vollanzeige + JOP

Facette Karte

Sonderblatt Waldfunktionenkarte + Google Maps

Histogramm
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Vielen Dank
•
•
•

http://github.com/ssp/pazpar2-all
porst@sub.uni-goettingen.de
Fragen?

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012

Más contenido relacionado

Destacado

Repository Manager - Die Diener der DAU ?
Repository Manager - Die Diener der DAU ?Repository Manager - Die Diener der DAU ?
Repository Manager - Die Diener der DAU ?Paul Vierkant
 
181939061 mac-u1-ea-luzl
181939061 mac-u1-ea-luzl181939061 mac-u1-ea-luzl
181939061 mac-u1-ea-luzlHeraclio Garcia
 
Küchenabluft und Komfortlüftung
Küchenabluft und KomfortlüftungKüchenabluft und Komfortlüftung
Küchenabluft und KomfortlüftungVorname Nachname
 
Allier
AllierAllier
AllierCCDH75
 
Presentaciones digitales
Presentaciones digitalesPresentaciones digitales
Presentaciones digitalesCarlos Arenas
 
Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...
Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...
Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...Vorname Nachname
 
Monitorización de marcas en espacios digitales
Monitorización de marcas en espacios digitalesMonitorización de marcas en espacios digitales
Monitorización de marcas en espacios digitalesZinkdo
 
Programas de-revision-2010
Programas de-revision-2010Programas de-revision-2010
Programas de-revision-2010luisitoramon
 
Vguidano
VguidanoVguidano
VguidanoCaropd
 
La sociedad de la información
La sociedad de la informaciónLa sociedad de la información
La sociedad de la informacióndhticerika
 
Eigenstromverbrauch, Photovoltaikbewertung und Gleichzeitigkeit
Eigenstromverbrauch, Photovoltaikbewertung und GleichzeitigkeitEigenstromverbrauch, Photovoltaikbewertung und Gleichzeitigkeit
Eigenstromverbrauch, Photovoltaikbewertung und GleichzeitigkeitVorname Nachname
 
Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)
Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)
Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)Vorname Nachname
 
Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...
Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...
Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...INOCENCIO MELÉNDEZ JULIO
 

Destacado (20)

Repository Manager - Die Diener der DAU ?
Repository Manager - Die Diener der DAU ?Repository Manager - Die Diener der DAU ?
Repository Manager - Die Diener der DAU ?
 
CE07 Bautista Marcos
CE07 Bautista MarcosCE07 Bautista Marcos
CE07 Bautista Marcos
 
181939061 mac-u1-ea-luzl
181939061 mac-u1-ea-luzl181939061 mac-u1-ea-luzl
181939061 mac-u1-ea-luzl
 
Küchenabluft und Komfortlüftung
Küchenabluft und KomfortlüftungKüchenabluft und Komfortlüftung
Küchenabluft und Komfortlüftung
 
Allier
AllierAllier
Allier
 
Datos básicos del proyecto 1
Datos básicos del proyecto 1Datos básicos del proyecto 1
Datos básicos del proyecto 1
 
Presentaciones digitales
Presentaciones digitalesPresentaciones digitales
Presentaciones digitales
 
Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...
Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...
Praxisbericht Raumlufthygiene: Gesunde und zufriedene Benutzer dank sauberen ...
 
Monitorización de marcas en espacios digitales
Monitorización de marcas en espacios digitalesMonitorización de marcas en espacios digitales
Monitorización de marcas en espacios digitales
 
Programas de-revision-2010
Programas de-revision-2010Programas de-revision-2010
Programas de-revision-2010
 
Blog (1)
Blog (1)Blog (1)
Blog (1)
 
Mi voki
Mi vokiMi voki
Mi voki
 
Vguidano
VguidanoVguidano
Vguidano
 
La sociedad de la información
La sociedad de la informaciónLa sociedad de la información
La sociedad de la información
 
Eigenstromverbrauch, Photovoltaikbewertung und Gleichzeitigkeit
Eigenstromverbrauch, Photovoltaikbewertung und GleichzeitigkeitEigenstromverbrauch, Photovoltaikbewertung und Gleichzeitigkeit
Eigenstromverbrauch, Photovoltaikbewertung und Gleichzeitigkeit
 
Autumn Seminar. Retos del gas no convencional. Dña. Marina Serrano
Autumn Seminar. Retos del gas no convencional. Dña. Marina SerranoAutumn Seminar. Retos del gas no convencional. Dña. Marina Serrano
Autumn Seminar. Retos del gas no convencional. Dña. Marina Serrano
 
Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)
Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)
Bessere Bauqualität mit dem Minergie Qualitätssystem (MQS)
 
Html
HtmlHtml
Html
 
Propuesta
PropuestaPropuesta
Propuesta
 
Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...
Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...
Inocencio meléndez julio. carrusel de la academia. herramientas para la comp...
 

Similar a Metasuche mit pazpar2

Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaBack to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaAndreas Jung
 
Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...
Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...
Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...Jakob .
 
Schweine latein-vortrag
Schweine latein-vortragSchweine latein-vortrag
Schweine latein-vortragRamon Wartala
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationMartin Blenkle
 
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...cneudecker
 
Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Martin Blenkle
 
Perl Renaissance Reloaded
Perl Renaissance ReloadedPerl Renaissance Reloaded
Perl Renaissance ReloadedGregor Goldbach
 
Django trifft Flutter
Django trifft FlutterDjango trifft Flutter
Django trifft Flutterroskakori
 
Überblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-DÜberblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-Dcneudecker
 
Seige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System ProjectSeige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System ProjectLeander Seige
 
ALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für VolltexteALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für Volltextecneudecker
 
Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...
Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...
Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...Georg Rehm
 
1114 sasaki-metadata
1114 sasaki-metadata1114 sasaki-metadata
1114 sasaki-metadataFelix Sasaki
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Dennis Zielke
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?KurtStockinger
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platformredsys
 
Swissbib lausanne
Swissbib lausanneSwissbib lausanne
Swissbib lausanneSchaad
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen KatalogesMartin Blenkle
 
Formate für Volltexte
Formate für VolltexteFormate für Volltexte
Formate für Volltextecneudecker
 

Similar a Metasuche mit pazpar2 (20)

Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaBack to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
 
Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...
Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...
Was gibt's wie und wo? Informationen zu Standorten, Exemplaren und Dienstleis...
 
Schweine latein-vortrag
Schweine latein-vortragSchweine latein-vortrag
Schweine latein-vortrag
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
 
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...
 
Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?
 
Perl Renaissance Reloaded
Perl Renaissance ReloadedPerl Renaissance Reloaded
Perl Renaissance Reloaded
 
Django trifft Flutter
Django trifft FlutterDjango trifft Flutter
Django trifft Flutter
 
Überblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-DÜberblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-D
 
Seige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System ProjectSeige finc 103. Bibliothekartag 2014 Discovery System Project
Seige finc 103. Bibliothekartag 2014 Discovery System Project
 
ALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für VolltexteALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für Volltexte
 
Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...
Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...
Hypertextsorten: Neuartige Möglichkeiten der Informationsrecherche im World W...
 
1114 sasaki-metadata
1114 sasaki-metadata1114 sasaki-metadata
1114 sasaki-metadata
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
 
Swissbib lausanne
Swissbib lausanneSwissbib lausanne
Swissbib lausanne
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
 
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
 
Formate für Volltexte
Formate für VolltexteFormate für Volltexte
Formate für Volltexte
 

Más de Sven-S. Porst

Más de Sven-S. Porst (7)

xmlinclude für DSpace
xmlinclude für DSpacexmlinclude für DSpace
xmlinclude für DSpace
 
CouchDB
CouchDBCouchDB
CouchDB
 
Gefällt mir?
Gefällt mir?Gefällt mir?
Gefällt mir?
 
Metasuche mit pazpar2
Metasuche mit pazpar2Metasuche mit pazpar2
Metasuche mit pazpar2
 
git Vorstellung
git Vorstellunggit Vorstellung
git Vorstellung
 
Germania Sacra Linked Data, SWIB13
Germania Sacra Linked Data, SWIB13Germania Sacra Linked Data, SWIB13
Germania Sacra Linked Data, SWIB13
 
xmlinclude
xmlincludexmlinclude
xmlinclude
 

Metasuche mit pazpar2

  • 1. Metasuche mit pazpar2 Sven-S. Porst Niedersächsische Staats- und Universitätsbibliothek Göttingen danke selbst vorstellen arbeite an der SUB, an Metasuche und virtuellen Fachbibliotheken insbesondere Lib AAC, GEO-LEO, SUB Metasuche
  • 2. Metasuche • Was ist Metasuche? • … hört sich an wie ein Albtraum • … ist aber manchmal unvermeidlich Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Was: Metasuche / förderierte Suche / verteilte Suche gleichzeitige Abfrage aus mehreren entfernten Datenquellen gemeinsame Anzeige der Ergebnisse Albtraum (Unvollständigkeit, Geschwindigkeit, Unzuverlässigkeit, Indexe/Möglichkeiten) also: technisch problematisch + potentiell schlechte user experience also: wenn möglich vermeiden + lokalen Index nutzen Aber: schwierig, Daten dafür zu bekommen + Updates + hoher Aufwand
  • 3. Schritte 1. Daten holen 2. Daten normalisieren 3. Ergebnisse verfügbar machen Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 1. Protokolle (Z39.50, SRU, Solr) / Abfragesprache (CCL/RPN, CQL, Solr) / Ergebnisformat (ISO 2709, XML) 2. Normalisieren (heterogene Eingabge → homogene Ausgabe) / MARC/DC/Solr → internes Format / unterschiedlich: Detailtiefen, codierte Informationen (z.B. Medientyp, Sprache) 3. Verfügbar machen: wann (a/synchron)? Quellen mischen? Facetten? Exportformate? UX?
  • 4. bisherige Lösungen • • • ohne Support (alt oder selbstgebaut) monolithisch (feste Oberfläche) an der SUB Göttingen Entscheidung für pazpar2 als Ersatz Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 SUB früher: iPort + eigenes GEO-LEO andere Lösungen, z.B. Metalib, i.d.R. in andere Produkte eingebunden Entscheidung der SUB für: homogene Infrastruktur,
  • 5. pazpar2 • • • • http://indexdata.com/pazpar2 open source aktive Entwicklung durch Index Data Daten, keine Nutzeroberfläche • als Dienst einbindbar Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Index Data: yaz + andere Projekte, viele Server beruhen auch auf yaz … bieten Support an »Dienst«: primär Schritte 1+2 für Daten: eigene Nutzeroberfläche wird benötigt
  • 6. 1. Daten holen • basiert auf yaz • • • Z39.50, SRU, Solr … und zugehörige Abfragesprachen liest XML und MARC 21 Daten Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 yaz: Standardbibliothek für bibliographische Verbindungen (Z39.50, SRU, Solr) Liest XML und ISO 2709; NICHT MAB oder unstrukturierte Daten tmarc? liest Daten in 20er Schritten
  • 7. 2. XML Workflow • internes Datenformat ist XML … mit frei definierbaren Feldern • Normalisierung durch XSLT • XSLTs verkett- und nachnutzbar Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 ISO 2709 wird in MARC XML oder tmarc konvertiert XSL Beispiele: ISO 639-1 zu ISO 639-2/B Sprachcodes oder Fehlerbereinigung
  • 8. Internes Datenformat • XSLT für MARC 21 enthalten • • • gibt ein gutes Datenformat vor Facettierung pro Feld Deduplizierung Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 MARC 21 gerne totgesagt, aber: weit verbreitet, Detailtiefe tmarc.xsl gibt gutes Datenmodell + eigene Felder (language, multivolume-title, …) Facetten: gute Normalisierung wichtig, ICU Filter anwendbar Deduplizierung: recht einfaches Modell auf Feldbasis, + Merging (siehe Anschlußvortrag S. Lohrum)
  • 9. MARC 21 → pazpar2 Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Datensatz aus OLC SSG-Geo, Artikel Autoren in MARC 700 Sprache unbekannt Artikeldetails in MARC 773
  • 10. 3. Abfrage • • keine Weboberfläche http/XML Schnittstelle • • sessionbasiert: init / search / show JavaScript zur Kommunikation: pz2.js Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 weitere Befehle: ping / bytarget / termlist / record / settings /
  • 11. Anzeige • • elementarer JavaScript Client dabei erweitert für SUB Göttingen: • • • • Interface auf Deutsch und Englisch ZDB-JOP, Google Books und Maps Exportformate Nutzungsanalyse mit piwik Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Export RIS/BibTeX/COiNS piwik: knapp 10% erweiterte Suche, detailanzeige ca 1:1 mit Suchen, gut 10% Facetten, Export 1%, Google Books 2% Histogramm
  • 12. Bemerkungen • • • • Entwicklungen: Facettierung, Solr Zugriffskontrolle mit pazpar2-access TYPO3 Einbindung Beispiele: • • GEO-LEO: geo-leo.de Lib AAC: aac.sub.uni-goettingen.de Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 auch: Verbesserungsmöglichkeiten (Deduplizierung, Services abfragen, Protokoll)
  • 13. Demo http://geo-leo.de/bibtag Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Demo: Suche nach Solling Treffer Artikel »Numerical Assessment …«, Vollanzeige + JOP Facette Karte Sonderblatt Waldfunktionenkarte + Google Maps Histogramm
  • 14. Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
  • 15. Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
  • 16. Vielen Dank • • • http://github.com/ssp/pazpar2-all porst@sub.uni-goettingen.de Fragen? Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012