1. Metasuche mit pazpar2
Sven-S. Porst
Niedersächsische Staats- und
Universitätsbibliothek Göttingen
danke
selbst vorstellen
arbeite an der SUB, an Metasuche und virtuellen Fachbibliotheken
insbesondere Lib AAC, GEO-LEO, SUB Metasuche
2. Metasuche
• Was ist Metasuche?
• … hört sich an wie ein Albtraum
• … ist aber manchmal unvermeidlich
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Was: Metasuche / förderierte Suche / verteilte Suche
gleichzeitige Abfrage aus mehreren entfernten Datenquellen
gemeinsame Anzeige der Ergebnisse
Albtraum (Unvollständigkeit, Geschwindigkeit, Unzuverlässigkeit, Indexe/Möglichkeiten)
also: technisch problematisch + potentiell schlechte user experience
also: wenn möglich vermeiden + lokalen Index nutzen
Aber: schwierig, Daten dafür zu bekommen + Updates + hoher Aufwand
4. bisherige Lösungen
•
•
•
ohne Support (alt oder selbstgebaut)
monolithisch (feste Oberfläche)
an der SUB Göttingen Entscheidung für
pazpar2 als Ersatz
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
SUB früher: iPort + eigenes GEO-LEO
andere Lösungen, z.B. Metalib, i.d.R. in andere Produkte eingebunden
Entscheidung der SUB für: homogene Infrastruktur,
5. pazpar2
•
•
•
•
http://indexdata.com/pazpar2
open source
aktive Entwicklung durch Index Data
Daten, keine Nutzeroberfläche
•
als Dienst einbindbar
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Index Data: yaz + andere Projekte, viele Server beruhen auch auf yaz
… bieten Support an
»Dienst«: primär Schritte 1+2 für Daten: eigene Nutzeroberfläche wird benötigt
6. 1. Daten holen
•
basiert auf yaz
•
•
•
Z39.50, SRU, Solr
… und zugehörige Abfragesprachen
liest XML und MARC 21 Daten
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
yaz: Standardbibliothek für bibliographische Verbindungen (Z39.50, SRU, Solr)
Liest XML und ISO 2709; NICHT MAB oder unstrukturierte Daten
tmarc?
liest Daten in 20er Schritten
7. 2. XML Workflow
•
internes Datenformat ist XML
… mit frei definierbaren Feldern
•
Normalisierung durch XSLT
•
XSLTs verkett- und nachnutzbar
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
ISO 2709 wird in MARC XML oder tmarc konvertiert
XSL Beispiele: ISO 639-1 zu ISO 639-2/B Sprachcodes oder Fehlerbereinigung
8. Internes Datenformat
•
XSLT für MARC 21 enthalten
•
•
•
gibt ein gutes Datenformat vor
Facettierung pro Feld
Deduplizierung
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
MARC 21 gerne totgesagt, aber: weit verbreitet, Detailtiefe
tmarc.xsl gibt gutes Datenmodell + eigene Felder (language, multivolume-title, …)
Facetten: gute Normalisierung wichtig, ICU Filter anwendbar
Deduplizierung: recht einfaches Modell auf Feldbasis, + Merging (siehe Anschlußvortrag S.
Lohrum)
9. MARC 21 → pazpar2
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Datensatz aus OLC SSG-Geo, Artikel
Autoren in MARC 700
Sprache unbekannt
Artikeldetails in MARC 773
10. 3. Abfrage
•
•
keine Weboberfläche
http/XML Schnittstelle
•
•
sessionbasiert: init / search / show
JavaScript zur Kommunikation: pz2.js
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
weitere Befehle: ping / bytarget / termlist / record / settings /
11. Anzeige
•
•
elementarer JavaScript Client dabei
erweitert für SUB Göttingen:
•
•
•
•
Interface auf Deutsch und Englisch
ZDB-JOP, Google Books und Maps
Exportformate
Nutzungsanalyse mit piwik
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Export RIS/BibTeX/COiNS
piwik: knapp 10% erweiterte Suche, detailanzeige ca 1:1 mit Suchen, gut 10% Facetten, Export
1%, Google Books 2%
Histogramm