SlideShare una empresa de Scribd logo
1 de 39
Descargar para leer sin conexión
Hochschule der Medien




                              Resource Discovery
                                  Systeme
                                     Chance oder Verhängnis
                                     für die bibliothekarische
Heidrun Wiesenmüller




                                          Erschließung?



                        01.08.2012       Jahrestagung der Gesellschaft für Klassifikation   Folie 1
Hoffnung RDS
Hochschule der Medien


                        „The challenge for academic libraries (...) is to offer an
                        experience that has the simplicity of Google – which users
                        expect – while searching the library’s rich digital and print
                        collections – which users need. (...)
                        Enter discovery, which is modeled on the Google-style
                        approach of building and then searching a unified index of
                        available resources, instead of searching each database
                        individually. While Google’s general index focuses on
Heidrun Wiesenmüller




                        publicly available web content, these new discovery tools
                        (...) provide unified indexes of the licensed scholarly
                        publications combined with locally held content (like the
                        catalog).“
                                Judy Luther / Maureen C. Kelly: Web scale discovery services.
                                                                In: Library journal 15.03.2011

                          01.08.2012         Jahrestagung der Gesellschaft für Klassifikation   Folie 2
Drei große RDS-Produkte
Hochschule der Medien




                        • Summon (Serial Solutions)
                          http://www.serialssolutions.com/en/services/summon




                        • Primo Central (ExLibris)
                          http://www.exlibrisgroup.com/de/category/Primo_Central
Heidrun Wiesenmüller




                        • EBSCO Discovery Service, EDS (EBSCO)
                          http://www.ebscohost.com/discovery/




                          01.08.2012          Jahrestagung der Gesellschaft für Klassifikation   Folie 3
Implementierungsvarianten
Hochschule der Medien


                        Suchoberfläche:
                        • Index und Suchoberfläche vom Anbieter
                          z.B. Konstanz (Summon); Saarbrücken (EDS);
                          Mannheim, FU und HU Berlin (Primo);
                          z.T. auch Indexierung der Katalogdaten durch Anbieter
                        • Index vom Anbieter, aber eigene Suchoberfläche
                          z.B. Freiburg (Eigenentwicklung + EDS);
                          Heidelberg (Eigenentwicklung + Summon)
Heidrun Wiesenmüller




                        Katalogdaten vs. RDS-Index:
                        • verschiedene Umsetzungen
                          - übergreifende vs. getrennte Suche
                          - was ist primär, was ist sekundär?


                          01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 4
UB Konstanz (Summon-Komplettsystem):
             eigentlich nur übergreifende Suche möglich
             (Einschränken auf „nur lokal vorhanden“ mög-
             lich, ergibt aber deutlich andere Ergebnisse als
             klassische OPAC-Recherche, dort 44 Treffer)
01.08.2012          Jahrestagung der Gesellschaft für Klassifikation   Folie 5
HU Berlin (Primo-Komplettsystem):
             übergreifende Suche als Default, Einschrän-
             kung auf Katalogdaten (plus edoc-Server)
             möglich
01.08.2012       Jahrestagung der Gesellschaft für Klassifikation   Folie 6
UB Freiburg (Eigenentwicklung + EDS):
             bewusst getrennte Recherche von Katalog
             und RDS-Index in parallelen Reitern
01.08.2012     Jahrestagung der Gesellschaft für Klassifikation   Folie 7
Datenbasis
Hochschule der Medien


                        derzeitige Situation:
                        • gewaltige Größenordnungen
                          mehrere 100 Mio. bis 1 Mrd. Datensätze;
                          nicht nur Metadaten, sondern vielfach auch Volltexte
                        • sehr heterogene Herkunft
                          insbesondere Verlage und Datenbankproduzenten
                        • Schwerpunkt: E-Zeitschriftenaufsätze
                          aber auch z.B. E-Books, Zeitungsartikel, Rezensionen,
Heidrun Wiesenmüller




                          Repositories, OA-Quellen
                        • deutscher Content bisher stark unterrepräsentiert
                          z.B. fehlen bisher auch die deutschen Verbundkataloge
                          (Ausnahme: Summon hat Vertrag mit GBV geschlossen)


                          01.08.2012     Jahrestagung der Gesellschaft für Klassifikation   Folie 8
Hochschule der Medien
                        Normierung
                        RDS-Index:
                        • häufig gar keine Normierung
                          z.B. vielfach freie Schlagwörter von Autoren
                        • Nebeneinander verschiedener Systeme
                          Heterogenität selbst bei Materialarten
                        • i.d.R. kein Einbezug von Verweisungsformen
                          bei normiertem Vokabular nur Ansetzungsform indexiert
                        Indexierung deutscher Katalogdaten:
Heidrun Wiesenmüller




                        • deutsche Sacherschließung teilweise unvollständig
                          z.B. Saarbrücken, Konstanz
                        • Anbieter haben noch keine Lösung für Verweisungen
                          Verweisungsformen derzeit nur in Primo-Systemen
                          (Anreicherung erfolgt lokal) sowie in Kombi-Systemen

                          01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 9
UB Mannheim
Hochschule der Medien
Heidrun Wiesenmüller




                                     Heterogenität in Schlagwortfacette:
                                     Recherche nach „financial crisis“: Synonyme,
                                     englisch vs. deutsch, Notationen aus DDC und
                                     JEL-Klassifikation (Journal of economic literature)
                        01.08.2012           Jahrestagung der Gesellschaft für Klassifikation                 Folie 10
UB Freiburg
                                         FU Berlin
Hochschule der Medien




                                                 Formfacetten:
Heidrun Wiesenmüller




                                                 Recherche nach „collection develop-
                                                 ment“: z.T. unplausibel oder unklar;
                                                 unterschiedliche Begriffe, die z.T.
                                                 dasselbe meinen



                        01.08.2012   Jahrestagung der Gesellschaft für Klassifikation            Folie 11
UB Freiburg
Hochschule der Medien
Heidrun Wiesenmüller




                                     fehlende Verweisungen im RDS-Index:
                                     dramatisch unterschiedliche Ergebnisse im
                                     RDS-Reiter bei „gorbatschow“ vs. „gorbatschev“
                                     (Unterschiede im Katalog-Reiter ergeben sich
                                     aufgrund Nationallizenzen und OA-Quellen)

                        01.08.2012          Jahrestagung der Gesellschaft für Klassifikation                 Folie 12
UB Mannheim
Hochschule der Medien




                                                                Beispiel für eine
                                                                gescheiterte Suche:
                                                                gewünschter Nature-
Heidrun Wiesenmüller




                                                                Aufsatz wird nicht
                                                                gefunden




                        01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 13
Hochschule der Medien




                                                    Des Rätsels Lösung: Autor
                                                    mit abgekürztem Vornamen
                                                    erfasst (Weglassen von
Heidrun Wiesenmüller




                                                    „Horst“ führt zum Ziel)




                        01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 14
Indexierung deutscher Katalogdaten:
                    Recherche „bertram inhaltserschließung“ findet
UB Konstanz         den gewünschten Treffer (Ansetzungsform)

       01.08.2012         Jahrestagung der Gesellschaft für Klassifikation   Folie 15
Recherche „bertram sacherschließung“
UB Konstanz
                    findet gewünschten Treffer nicht (Verweisung)

       01.08.2012         Jahrestagung der Gesellschaft für Klassifikation   Folie 16
hauseigene Systematik und RVK
UB Konstanz
                           bisher nicht indexiert
       01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 17
FU Berlin




             Indexierung deutscher Katalogdaten:
             in Primo kann Klassifikation ausgewertet werden;
             Problem: minimale Abdeckung (Recherche
             „semantic web“: 75 von 45.058 Treffern mit RVK)
01.08.2012          Jahrestagung der Gesellschaft für Klassifikation   Folie 18
Treffermengen
Hochschule der Medien


                        können enorme Größen erreichen:
                        • Datenpool erheblich größer als traditioneller Katalog
                          u.a. durch Einbezug von Aufsatzdaten
                        • „web-scale discovery“
                          auch Suche über den Bibliotheksbestand hinaus möglich
                        • Recherche häufig auch in Volltexten
                          nicht bei jedem Anbieter ausschaltbar; Volltext-Treffer
                          tauchen im Ranking oft erstaunlich weit vorne auf
Heidrun Wiesenmüller




                        • z.T. zusätzliche Suchmethoden
                          z.B. linguistische Methoden (Summon);
                          Titel, die nicht alle Suchbegriffe enthalten (Summon);
                          „SmartText“-Suche (EDS)



                          01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 19
Größenordnungen:
             162 Treffer in HEIDI (Katalogdaten)
             19.888 Treffer in BASE
             121.519 Treffer aus Summon (lokal verfügbar) ...
01.08.2012         Jahrestagung der Gesellschaft für Klassifikation   Folie 20
... 366.133 Treffer aus Summon
                          (web-scale)



01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 21
Known-item search (Sachtitel und
               Nachname) nach einem im Index nicht
               vorhandenen Werk

01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 22
Rezension des gesuchten Werkes
                    (andere Rezensionen auf Plätzen 8,
                    13, 17, 21, 25 und 26)




                 „metadata“: Titelwort
                 „digital“, „collection“: Haupttext
                 „Miller“: Literaturverzeichnis
01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 23
Feststellen, dass etwas nicht
                        vorhanden ist: geht verlässlich
                        nur über die erweiterte Suche


01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 24
Beispiele für rätselhafte Treffer
                          (Treffer 21 und 22)




01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 25
Hurra, doch noch gefunden!
             Treffer (web scale) führt zur Titelaufnahme
             im Katalog der australischen Parlaments-
             bibliothek (Hinweis: es gibt auch Aufnahmen
             im BVB, GBV und HBZ)



01.08.2012       Jahrestagung der Gesellschaft für Klassifikation   Folie 26
Titel zur sprachwissen-
schaftlichen Semantik
(ab Treffer 33)

                     Besondere Suchmethoden 1:
                     bei Suche „semantic web“ (lokal): auch
                     Treffer mit nur einem Suchwort


      01.08.2012     Jahrestagung der Gesellschaft für Klassifikation   Folie 27
„Hütter“ ergibt auch
                                               „Hüttl“, „Hütten“,
                                               „Schmelzhütte“ etc.



                          Besondere Suchmethoden 2:
                          linguistische Methoden

01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 28
Probleme bei Facetten
Hochschule der Medien


                        • Materialfacette meist wenig hilfreich
                          z.B. Filtern auf Aufsätze: immer noch riesige Treffermenge
                        • Fehlende Optionen zur fachlichen Grobgliederung
                          Fachfacette existiert derzeit nur bei Summon (wegen
                          geringer Abdeckung nur eingeschränkt angeboten);
                          Klassifikationsfacetten fehlen oder nur bedingt brauchbar
                        • Schlagwortfacetten
                          - Heterogenitätsproblem
Heidrun Wiesenmüller




                          - beruhen bei EDS und Primo nur auf kleiner Stichprobe
                            (nur Summon wertet die gesamte Treffermenge aus)
                          - zeigen zwangsläufig nur einen kleinen Ausschnitt
                        • Ländercode und ähnlich komplexe Facetten
                          lassen sich nur mit Bibliotheksdaten realisieren


                          01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 29
Recherche „owl“ (u.a. Eule vs. OWL):
                     73 Treffer in Katalogdaten
                     (diese Menge könnte man noch durchsehen)
UB Mannheim
        01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 30
brauchbare Schlagwortfacette
Hochschule der Medien

                                                    (beruht auf allen Treffern,
                                                    homogen, kontrolliert)


                                                    brauchbare Fachfacette
                                                    (beruht auf unterschiedlicher
                                                    klassifikatorischer Information,
                                                    vgl. Vortrag Frick von 2011)
Heidrun Wiesenmüller




                                                    Geofacette (beruht auf SWD-
                                                    Ländercodes) als Beispiel für
                                                    komplexere Auswertung von
                                                    Sacherschließungsdaten

                        01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 31
Recherche „owl“:
   17.342 Treffer in übergreifender Suche
   (kann man nicht mehr durchsehen;
   Formalfacetten bringen wenig)
01.08.2012     Jahrestagung der Gesellschaft für Klassifikation   Folie 32
• keine Fachfacette oder Klassifikation
Hochschule der Medien

                                       schnelle Differenzierung zwischen EDV
                                       und Biologie nicht möglich
                                     • Facetten „Sammlung“ und „Zeit-
                                       schrift“
                                       allenfalls bedingter Ersatz für Fach-
                                       facette
                                     • beruht jeweils nur auf Stichprobe
                                       Basis: Auswertung einiger hundert
                                       Treffer (zum Vergleich: bei EDS werden
Heidrun Wiesenmüller




                                       nur 125 Treffer ausgewertet und die 10
                                       häufigsten Schlagwörter angezeigt)




                        01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 33
Hochschule der Medien

                                                          einzige Möglichkeit:
                                                          nacheinander alle einschlägi-
                                                          gen Schlagwörter anklicken
                                                          und hoffen, damit tatsächlich
                                                          das Gros der relevanten
                                                          Treffer abgedeckt zu haben
Heidrun Wiesenmüller




                        01.08.2012   Jahrestagung der Gesellschaft für Klassifikation   Folie 34
Paradigmenwechsel?
Hochschule der Medien


                        • herkömmlicher OPAC:
                          Benutzer wird mit Null-Treffer-Ergebnis alleine gelassen
                        • Resource Discovery System:
                          Benutzer wird mit riesiger Treffermenge alleine gelassen;
                          ist dem vorgegebenen Ranking vollständig ausgeliefert
                        Zwingend nötig:
                        • prominent angebotene „Ausschalt-Optionen“
                          für Erweiterungsfunktionen wie Suche in Volltexten,
Heidrun Wiesenmüller




                          linguistische Methoden, nicht alle Suchbegriffe
                        • dynamisches, beeinflussbares Ranking und Filtern
                          z.B. Markieren von „guten“ oder „schlechten“ Treffern;
                          dann Umsortieren bzw. Ausfiltern


                          01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 35
Bibliotheksdaten im RDS
Hochschule der Medien


                        besondere Stärken von Bibliotheksdaten u.a.:
                        • überregionale, langfristig gültige Regeln
                          großer und homogener Datenbestand
                        • Verlässlichkeit
                          man weiß, was man erwarten kann (z.B. welche Daten-
                          elemente sind erfasst), ermöglicht zuverlässige known-
                          item search
                        • Zusammenführen und Unterscheiden
Heidrun Wiesenmüller




                          nicht nur etwas Passendes finden, sondern alles
                          Passende finden (z.B. alle Werke eines Verfassers)

                                  verlieren sich, wenn Bibliotheksdaten in einen
                                  riesigen Datenpool gesteckt werden, die diesen
                                  Prinzipien nicht folgen

                          01.08.2012       Jahrestagung der Gesellschaft für Klassifikation   Folie 36
Hochschule der Medien
                        Strategische Überlegungen
                        • getrenntes Anbieten der Katalogdaten
                          sinnvoll, aber als Strategie nicht ausreichend
                                ist eher eine Defensiv- als eine Offensivstrategie

                        Fragen, die wir uns stellen müssen:
                        • Können Bibliotheksdaten dazu verwendet werden,
                          um RDS-Daten zu verbessern?
                          Können wir mit unserer Datenqualität andere Daten
                          „anstecken“?
Heidrun Wiesenmüller




                        • Können wir die Heterogenität beherrschbar machen?
                          Zumindest eine Homogenität auf grober Ebene müsste
                          erreicht werden (z.B. brauchbare Materialfacetten, Grob-
                          Klassifikation für alle Materialien)


                          01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 37
Erste Ideen:
                        1. erweiterter Einsatz unserer Normdaten
Hochschule der Medien


                           Synonyme zuspielen entweder bereits bei Indexierung
                           oder erst bei Recherche (query expansion); vgl. Über-
                           legungen im Projekt „BSZ One Stop Search (BOSS)“
                        2. maschinelle Homogenisierung in großem Umfang
                           - große Datenmengen bieten auch große Chancen für
                             maschinelle Auswertungen (z.B. „Dubletten“ aus ver-
                             schiedenen Quellen)
                           - Bilden von Sacherschließungs-Clustern aus hetero-
Heidrun Wiesenmüller




                             gener verbaler und klassifikatorischer Erschließung
                        3. Bibliothekare verstärkt als „Metadatenmanager“
                           nicht mehr nur selbst erschließen, sondern Daten ande-
                           rer Hersteller für den RDS-Einsatz optimieren (Voraus-
                           setzung: Produzenten müssen uns an ihre Daten lassen)


                           01.08.2012     Jahrestagung der Gesellschaft für Klassifikation   Folie 38
Hochschule der Medien




                                        Vielen Dank für
                                     Ihre Aufmerksamkeit!

                                          Ich hoffe auf
                                       Ihre guten Ideen!
Heidrun Wiesenmüller




                        01.08.2012      Jahrestagung der Gesellschaft für Klassifikation   Folie 39

Más contenido relacionado

Destacado

AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

Destacado (20)

AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 

GfKl-Tagung 2012 LIS Wiesenmueller RDS

  • 1. Hochschule der Medien Resource Discovery Systeme Chance oder Verhängnis für die bibliothekarische Heidrun Wiesenmüller Erschließung? 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 1
  • 2. Hoffnung RDS Hochschule der Medien „The challenge for academic libraries (...) is to offer an experience that has the simplicity of Google – which users expect – while searching the library’s rich digital and print collections – which users need. (...) Enter discovery, which is modeled on the Google-style approach of building and then searching a unified index of available resources, instead of searching each database individually. While Google’s general index focuses on Heidrun Wiesenmüller publicly available web content, these new discovery tools (...) provide unified indexes of the licensed scholarly publications combined with locally held content (like the catalog).“ Judy Luther / Maureen C. Kelly: Web scale discovery services. In: Library journal 15.03.2011 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 2
  • 3. Drei große RDS-Produkte Hochschule der Medien • Summon (Serial Solutions) http://www.serialssolutions.com/en/services/summon • Primo Central (ExLibris) http://www.exlibrisgroup.com/de/category/Primo_Central Heidrun Wiesenmüller • EBSCO Discovery Service, EDS (EBSCO) http://www.ebscohost.com/discovery/ 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 3
  • 4. Implementierungsvarianten Hochschule der Medien Suchoberfläche: • Index und Suchoberfläche vom Anbieter z.B. Konstanz (Summon); Saarbrücken (EDS); Mannheim, FU und HU Berlin (Primo); z.T. auch Indexierung der Katalogdaten durch Anbieter • Index vom Anbieter, aber eigene Suchoberfläche z.B. Freiburg (Eigenentwicklung + EDS); Heidelberg (Eigenentwicklung + Summon) Heidrun Wiesenmüller Katalogdaten vs. RDS-Index: • verschiedene Umsetzungen - übergreifende vs. getrennte Suche - was ist primär, was ist sekundär? 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 4
  • 5. UB Konstanz (Summon-Komplettsystem): eigentlich nur übergreifende Suche möglich (Einschränken auf „nur lokal vorhanden“ mög- lich, ergibt aber deutlich andere Ergebnisse als klassische OPAC-Recherche, dort 44 Treffer) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 5
  • 6. HU Berlin (Primo-Komplettsystem): übergreifende Suche als Default, Einschrän- kung auf Katalogdaten (plus edoc-Server) möglich 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 6
  • 7. UB Freiburg (Eigenentwicklung + EDS): bewusst getrennte Recherche von Katalog und RDS-Index in parallelen Reitern 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 7
  • 8. Datenbasis Hochschule der Medien derzeitige Situation: • gewaltige Größenordnungen mehrere 100 Mio. bis 1 Mrd. Datensätze; nicht nur Metadaten, sondern vielfach auch Volltexte • sehr heterogene Herkunft insbesondere Verlage und Datenbankproduzenten • Schwerpunkt: E-Zeitschriftenaufsätze aber auch z.B. E-Books, Zeitungsartikel, Rezensionen, Heidrun Wiesenmüller Repositories, OA-Quellen • deutscher Content bisher stark unterrepräsentiert z.B. fehlen bisher auch die deutschen Verbundkataloge (Ausnahme: Summon hat Vertrag mit GBV geschlossen) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 8
  • 9. Hochschule der Medien Normierung RDS-Index: • häufig gar keine Normierung z.B. vielfach freie Schlagwörter von Autoren • Nebeneinander verschiedener Systeme Heterogenität selbst bei Materialarten • i.d.R. kein Einbezug von Verweisungsformen bei normiertem Vokabular nur Ansetzungsform indexiert Indexierung deutscher Katalogdaten: Heidrun Wiesenmüller • deutsche Sacherschließung teilweise unvollständig z.B. Saarbrücken, Konstanz • Anbieter haben noch keine Lösung für Verweisungen Verweisungsformen derzeit nur in Primo-Systemen (Anreicherung erfolgt lokal) sowie in Kombi-Systemen 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 9
  • 10. UB Mannheim Hochschule der Medien Heidrun Wiesenmüller Heterogenität in Schlagwortfacette: Recherche nach „financial crisis“: Synonyme, englisch vs. deutsch, Notationen aus DDC und JEL-Klassifikation (Journal of economic literature) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 10
  • 11. UB Freiburg FU Berlin Hochschule der Medien Formfacetten: Heidrun Wiesenmüller Recherche nach „collection develop- ment“: z.T. unplausibel oder unklar; unterschiedliche Begriffe, die z.T. dasselbe meinen 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 11
  • 12. UB Freiburg Hochschule der Medien Heidrun Wiesenmüller fehlende Verweisungen im RDS-Index: dramatisch unterschiedliche Ergebnisse im RDS-Reiter bei „gorbatschow“ vs. „gorbatschev“ (Unterschiede im Katalog-Reiter ergeben sich aufgrund Nationallizenzen und OA-Quellen) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 12
  • 13. UB Mannheim Hochschule der Medien Beispiel für eine gescheiterte Suche: gewünschter Nature- Heidrun Wiesenmüller Aufsatz wird nicht gefunden 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 13
  • 14. Hochschule der Medien Des Rätsels Lösung: Autor mit abgekürztem Vornamen erfasst (Weglassen von Heidrun Wiesenmüller „Horst“ führt zum Ziel) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 14
  • 15. Indexierung deutscher Katalogdaten: Recherche „bertram inhaltserschließung“ findet UB Konstanz den gewünschten Treffer (Ansetzungsform) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 15
  • 16. Recherche „bertram sacherschließung“ UB Konstanz findet gewünschten Treffer nicht (Verweisung) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 16
  • 17. hauseigene Systematik und RVK UB Konstanz bisher nicht indexiert 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 17
  • 18. FU Berlin Indexierung deutscher Katalogdaten: in Primo kann Klassifikation ausgewertet werden; Problem: minimale Abdeckung (Recherche „semantic web“: 75 von 45.058 Treffern mit RVK) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 18
  • 19. Treffermengen Hochschule der Medien können enorme Größen erreichen: • Datenpool erheblich größer als traditioneller Katalog u.a. durch Einbezug von Aufsatzdaten • „web-scale discovery“ auch Suche über den Bibliotheksbestand hinaus möglich • Recherche häufig auch in Volltexten nicht bei jedem Anbieter ausschaltbar; Volltext-Treffer tauchen im Ranking oft erstaunlich weit vorne auf Heidrun Wiesenmüller • z.T. zusätzliche Suchmethoden z.B. linguistische Methoden (Summon); Titel, die nicht alle Suchbegriffe enthalten (Summon); „SmartText“-Suche (EDS) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 19
  • 20. Größenordnungen: 162 Treffer in HEIDI (Katalogdaten) 19.888 Treffer in BASE 121.519 Treffer aus Summon (lokal verfügbar) ... 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 20
  • 21. ... 366.133 Treffer aus Summon (web-scale) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 21
  • 22. Known-item search (Sachtitel und Nachname) nach einem im Index nicht vorhandenen Werk 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 22
  • 23. Rezension des gesuchten Werkes (andere Rezensionen auf Plätzen 8, 13, 17, 21, 25 und 26) „metadata“: Titelwort „digital“, „collection“: Haupttext „Miller“: Literaturverzeichnis 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 23
  • 24. Feststellen, dass etwas nicht vorhanden ist: geht verlässlich nur über die erweiterte Suche 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 24
  • 25. Beispiele für rätselhafte Treffer (Treffer 21 und 22) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 25
  • 26. Hurra, doch noch gefunden! Treffer (web scale) führt zur Titelaufnahme im Katalog der australischen Parlaments- bibliothek (Hinweis: es gibt auch Aufnahmen im BVB, GBV und HBZ) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 26
  • 27. Titel zur sprachwissen- schaftlichen Semantik (ab Treffer 33) Besondere Suchmethoden 1: bei Suche „semantic web“ (lokal): auch Treffer mit nur einem Suchwort 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 27
  • 28. „Hütter“ ergibt auch „Hüttl“, „Hütten“, „Schmelzhütte“ etc. Besondere Suchmethoden 2: linguistische Methoden 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 28
  • 29. Probleme bei Facetten Hochschule der Medien • Materialfacette meist wenig hilfreich z.B. Filtern auf Aufsätze: immer noch riesige Treffermenge • Fehlende Optionen zur fachlichen Grobgliederung Fachfacette existiert derzeit nur bei Summon (wegen geringer Abdeckung nur eingeschränkt angeboten); Klassifikationsfacetten fehlen oder nur bedingt brauchbar • Schlagwortfacetten - Heterogenitätsproblem Heidrun Wiesenmüller - beruhen bei EDS und Primo nur auf kleiner Stichprobe (nur Summon wertet die gesamte Treffermenge aus) - zeigen zwangsläufig nur einen kleinen Ausschnitt • Ländercode und ähnlich komplexe Facetten lassen sich nur mit Bibliotheksdaten realisieren 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 29
  • 30. Recherche „owl“ (u.a. Eule vs. OWL): 73 Treffer in Katalogdaten (diese Menge könnte man noch durchsehen) UB Mannheim 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 30
  • 31. brauchbare Schlagwortfacette Hochschule der Medien (beruht auf allen Treffern, homogen, kontrolliert) brauchbare Fachfacette (beruht auf unterschiedlicher klassifikatorischer Information, vgl. Vortrag Frick von 2011) Heidrun Wiesenmüller Geofacette (beruht auf SWD- Ländercodes) als Beispiel für komplexere Auswertung von Sacherschließungsdaten 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 31
  • 32. Recherche „owl“: 17.342 Treffer in übergreifender Suche (kann man nicht mehr durchsehen; Formalfacetten bringen wenig) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 32
  • 33. • keine Fachfacette oder Klassifikation Hochschule der Medien schnelle Differenzierung zwischen EDV und Biologie nicht möglich • Facetten „Sammlung“ und „Zeit- schrift“ allenfalls bedingter Ersatz für Fach- facette • beruht jeweils nur auf Stichprobe Basis: Auswertung einiger hundert Treffer (zum Vergleich: bei EDS werden Heidrun Wiesenmüller nur 125 Treffer ausgewertet und die 10 häufigsten Schlagwörter angezeigt) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 33
  • 34. Hochschule der Medien einzige Möglichkeit: nacheinander alle einschlägi- gen Schlagwörter anklicken und hoffen, damit tatsächlich das Gros der relevanten Treffer abgedeckt zu haben Heidrun Wiesenmüller 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 34
  • 35. Paradigmenwechsel? Hochschule der Medien • herkömmlicher OPAC: Benutzer wird mit Null-Treffer-Ergebnis alleine gelassen • Resource Discovery System: Benutzer wird mit riesiger Treffermenge alleine gelassen; ist dem vorgegebenen Ranking vollständig ausgeliefert Zwingend nötig: • prominent angebotene „Ausschalt-Optionen“ für Erweiterungsfunktionen wie Suche in Volltexten, Heidrun Wiesenmüller linguistische Methoden, nicht alle Suchbegriffe • dynamisches, beeinflussbares Ranking und Filtern z.B. Markieren von „guten“ oder „schlechten“ Treffern; dann Umsortieren bzw. Ausfiltern 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 35
  • 36. Bibliotheksdaten im RDS Hochschule der Medien besondere Stärken von Bibliotheksdaten u.a.: • überregionale, langfristig gültige Regeln großer und homogener Datenbestand • Verlässlichkeit man weiß, was man erwarten kann (z.B. welche Daten- elemente sind erfasst), ermöglicht zuverlässige known- item search • Zusammenführen und Unterscheiden Heidrun Wiesenmüller nicht nur etwas Passendes finden, sondern alles Passende finden (z.B. alle Werke eines Verfassers) verlieren sich, wenn Bibliotheksdaten in einen riesigen Datenpool gesteckt werden, die diesen Prinzipien nicht folgen 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 36
  • 37. Hochschule der Medien Strategische Überlegungen • getrenntes Anbieten der Katalogdaten sinnvoll, aber als Strategie nicht ausreichend ist eher eine Defensiv- als eine Offensivstrategie Fragen, die wir uns stellen müssen: • Können Bibliotheksdaten dazu verwendet werden, um RDS-Daten zu verbessern? Können wir mit unserer Datenqualität andere Daten „anstecken“? Heidrun Wiesenmüller • Können wir die Heterogenität beherrschbar machen? Zumindest eine Homogenität auf grober Ebene müsste erreicht werden (z.B. brauchbare Materialfacetten, Grob- Klassifikation für alle Materialien) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 37
  • 38. Erste Ideen: 1. erweiterter Einsatz unserer Normdaten Hochschule der Medien Synonyme zuspielen entweder bereits bei Indexierung oder erst bei Recherche (query expansion); vgl. Über- legungen im Projekt „BSZ One Stop Search (BOSS)“ 2. maschinelle Homogenisierung in großem Umfang - große Datenmengen bieten auch große Chancen für maschinelle Auswertungen (z.B. „Dubletten“ aus ver- schiedenen Quellen) - Bilden von Sacherschließungs-Clustern aus hetero- Heidrun Wiesenmüller gener verbaler und klassifikatorischer Erschließung 3. Bibliothekare verstärkt als „Metadatenmanager“ nicht mehr nur selbst erschließen, sondern Daten ande- rer Hersteller für den RDS-Einsatz optimieren (Voraus- setzung: Produzenten müssen uns an ihre Daten lassen) 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 38
  • 39. Hochschule der Medien Vielen Dank für Ihre Aufmerksamkeit! Ich hoffe auf Ihre guten Ideen! Heidrun Wiesenmüller 01.08.2012 Jahrestagung der Gesellschaft für Klassifikation Folie 39