SlideShare una empresa de Scribd logo
1 de 16
Descargar para leer sin conexión
Relevanzranking als Erfolgsfaktor für
Discoverysysteme

                                              Elmar Haake
                Staats- und Universitätsbibliothek Bremen




             GBV-Verbundkonferenz Hannover 05.09.2012
                                                        1
Relevanzranking als Erfolgsfaktor für
Discoverysysteme

 Definition: Was ist Relevanzranking?
 Ausgangslage: Nutzergewohnheiten, Rankingverfahren in klassischen
 Bibliothekssystemen und Discoverystemen
 Neue Lösungsansätze beim Ranking in der E-LIB Bremen




                                                        Elmar Haake
                          Staats- und Universitätsbibliothek Bremen
                       GBV-Verbundkonferenz Hannover 05.09.2012
                                                                      2
// Definition Relevanzranking



Das Beste für mich zuerst! Relevante Titel bevorzugen!
Suchmaschinen: Textstatistik & linktopologisch
(PageRank: Popularität der Webseiten), Boostfaktoren
und nutzerspezifisches Ranking
Nutzergerechte Sortierung der Suchergebnisse in der
Reihenfolge absteigender Relevanz bezogen auf die
Sucheingabe.
Relevanz ist stets subjektiv, geringe Transparenz




                                                         3
Klassische Bibliothekskataloge:
  Expertenstrategie (Exact-Match, Boolesche Logik)
  weist nur einen Teil des Bibliotheksbestandes nach
  Chronologische Sortierung als Standard
       Ranking nach Zeit als relevantes Kriterium
       bei Known-Item-Suchanfragen hilfreich
       problematisch bei einfachen Suchanfragen bzw.
       hochfrequente Begriffen (große Treffermengen)
      Zeitschriften schwer auffindbar ohne Expertenretrieval
 Verschärfung der Sortierproblematik bei Ausweitung des
 Suchraumes
 „Mischen impossible“?
                                                               4
// Neue Online-Kataloge in wiss. Bibliotheken
Next Generation Catalogue       Katalog 2.0          Discovery System
   Hildreth, Charles R.:
   Beyond Boolean: Designing the next generation of online catalogs
   Library trends 35 (1987), S. 647-667




                                                                        5
// Neue Nutzergewohnheiten - einige Vermutungen & Thesen

Menschen werden von Internetstandards
(Amazon, Google etc.) vorgeprägt und...

haben geringe Retrievalkenntnisse
erwarten sinnvolles Ranking: wichtige Treffer zuerst!
Best-Match statt Exact-Match
mögen keine komplexe Expertenlogik
AND / OR / NOT und lesen keine Hilfeseiten...
verwenden keine bibliothekarische Eingabelogik
(sondern Copy&Paste)
erwarten Fehlertoleranz
möchten Inhalte online sofort nutzen
finden in Bibliothekskatalogen oft nicht
das passende Material



                                                              6
// Eigenschaften von Discoverysystemen:
    Großer Suchraum - Große Treffermengen
    Best-Match-Verfahren
    Relevanzranking über textstatistische Verfahren
    (u.a. Gewichtung von Termen im Dokument)
    Relevanzdifferenzierung schwierig bei Metadaten ,
    großen Treffermengen und hochfrequenten Begriffen
    Facettierung als ‚Notlösung‘, aufwändige Implementierung,
    Usability problematisch
    Differenzierung bei weiterhin identischen bzw. eng
    liegenden Relevanzwerten?
        Chronologische Sortierung?
        Zufällige Sortierung?
        Boosting durch Bevorzugung bestimmter Titel
        (Materialtyp : Online-
        Ressourcen, Zeitschriften, Lehrbücher oder lokaler
        Bestand)?
                                                                7
// Strategische Frage zur Katalogentwicklung


             Wie kann das Ranking nutzergerecht
                      weiter verbessert werden?
// Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen
Hilfsmittel: Suchhistorie der Nutzer in anonymisierter Form, Erfüllung der
Nutzererwartungen analysieren
Zieldefinition:
       Bevorzugung stark nachgefragter Titel bei gleicher Relevanz und
       ‚dezentere‘ Platzierung der Artikel mit vertretbarem Aufwand und
       möglichst geringer Komplexizität
Lösungsansatz:
       Zusätzliche Beeinflussung der Relevanzparameter durch Titelpopularität*
       als Ergänzung der textstatistischen Verfahren
           Beschaffungsverhalten
           Medieneigenschaften
           Nutzerverhalten
* D. Lewandowski, Ranking library materials. Library Hi Tech 27 (2009) 4, 584 - 593 - http://kurl.de/elib-lw




                                                                                                               9
// Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen



Beschaffungsverhalten
       Stark gefragte Titel werden häufig als Staffelexemplare von der
       Bibliothek beschafft:
       Exemplarzahl > 3 Exemplare als Indiz für
       Popularität, Relevanzaufschlag




                                                                          10
// Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen



Medieneigenschaften
       Stark gefragte Titel sind häufig im Buchhandel vergriffen und werden
       als Folgeauflagen neu aufgelegt:
       Auflagenzählung als weiteres Indiz für Popularität, Relevanzaufschlag




                                                                               11
// Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen



Nutzerverhalten
       Stark gefragte Titel werden in der Trefferliste häufig angeklickt
       Aktualität der Titel relevant, daher Auswertung der Klicks auf die
       letzten 2 Jahre beschränkt
       Klicks > 3 als weiteres Indiz für Popularität, Relevanzaufschlag




                                                                            12
// Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen


Keine Überkompensation der Textstatistik durch Titelpopularität
Grundlage: Textstatistische Berechnung der Relevanzwerte und Feinjustierung
durch Nutzung von Popularitätsfaktoren
Überblick:


  Popularitätstyp                                Relevanzaufschlag in %
  Beschaffungsverhalten                                       3
  Medieneigenschaften                                         3
  Nutzerverhalten                                             5




                                                                              13
// Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen

Weitere mögliche Beeinflussungsparameter
Popularität :
       Ausleihstatistik (beeinflusst nur ausleihbaren Bestand, keine Online-Ressourcen)
       Zitationsfrequenz (problematische Beschaffung des Datenmaterials)
       Nutzerbewertung (ausgeprägte Subjektivität?)
       Renommee der Autoren (Objektivierbarkeit?)
       Impact Factor der Zeitschrift bei Zeitschriftenartikel (Datenmaterialbeschaffung?)
Lokalität: eigenen Bestand bevorzugen, standortspezifische Sortierung
Medientyp : Lehrbücher für UB, Aufsätze für Virtuelle Fachportale, bei homogenem
Nutzertyp möglich




                                                                                            14
// Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen

Relevanzranking als Erfolgsfaktor: Titelpopularität zeigt:
  Vergleich der Trefferlisten mit/ohne
        Bessere Auffindbarkeit relevanter Titel mit hochfrequenten Begriffen
   Discoverysysteme können für die Mehrzahlauf Position 11, „Science“(1880)
        (gedruckte Zeitschriften „Die Zeit“(1946)
                                                   der Nutzer mit Textstatistik
   besser als klassische Kataloge ranken.
        auf Position 6) ohne Nutzung der Facettierung und Blättern
   Bei großen Treffermengen besteht jedochpositioniert,
         Aktuelle Klassiker werden prominenter ein weiterer
   Justierungsbedarf, der möglichst im Hinblick aufwerden sofort gefunden
         am Campus nachgefragte, gängige Lehrbücher die Erfüllung der
   Nutzererwartungen mit Hilfe von Popularitätsfaktoren eingestellt
         Reduktion der Artikellastigkeit
   werden kann.
        Optimale Unterstützung von Known-Item-Suchanfragen bei
   Kontinuierlicher Überprüfungsbedarf, unterschiedliche
        Autoren mit hoher Publikationsfrequenz
   Nutzererwartungen, keine vollständige Objektivierbarkeit, schwierige
   Evaluierbarkeit




                                                                                  15
Relevanzranking als Erfolgsfaktor für
Discoverysysteme

                                              Elmar Haake
                Staats- und Universitätsbibliothek Bremen




             GBV-Verbundkonferenz Hannover 05.09.2012
                                                        16

Más contenido relacionado

Destacado

Discovery study detailed results 20140728
Discovery study detailed results 20140728Discovery study detailed results 20140728
Discovery study detailed results 20140728Michael Levine-Clark
 
Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013
Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013
Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013Dörte Böhner
 
Discovery Systeme - Fluch oder Segen für BibliothekarInnen?
Discovery Systeme - Fluch oder Segen für BibliothekarInnen? Discovery Systeme - Fluch oder Segen für BibliothekarInnen?
Discovery Systeme - Fluch oder Segen für BibliothekarInnen? Dörte Böhner
 
Planificacion proyecto tics 1
Planificacion proyecto tics 1Planificacion proyecto tics 1
Planificacion proyecto tics 1Evelyn Soria
 
Como insertar una imagen en tu blogger
Como insertar una imagen en tu bloggerComo insertar una imagen en tu blogger
Como insertar una imagen en tu bloggervianeyjajajaja
 
Politica educativa rocio
Politica educativa rocioPolitica educativa rocio
Politica educativa rociorosvela94
 
Presentacion de eleinis manjarrez
Presentacion de eleinis manjarrezPresentacion de eleinis manjarrez
Presentacion de eleinis manjarrez1065593214
 
Blogbeiträge individuell optimiert und zeitversetzt auf XING posten
Blogbeiträge individuell optimiert und zeitversetzt auf XING postenBlogbeiträge individuell optimiert und zeitversetzt auf XING posten
Blogbeiträge individuell optimiert und zeitversetzt auf XING postenADENION GmbH
 
La construcción de la propia imagen
La construcción de la propia imagenLa construcción de la propia imagen
La construcción de la propia imagenmartamagisterio
 
Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...
Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...
Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...danielmarkgraf
 
Pao tatis
Pao tatisPao tatis
Pao tatispao_15
 
Estudio de mercado
Estudio de mercadoEstudio de mercado
Estudio de mercadonguerrerol
 
Content Marketing für Versicherer und Finanzdienstleister
Content Marketing für Versicherer und FinanzdienstleisterContent Marketing für Versicherer und Finanzdienstleister
Content Marketing für Versicherer und FinanzdienstleisterADENION GmbH
 
Tensión superficial
Tensión superficialTensión superficial
Tensión superficialconnyrecabal
 

Destacado (20)

Discovery study detailed results 20140728
Discovery study detailed results 20140728Discovery study detailed results 20140728
Discovery study detailed results 20140728
 
Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013
Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013
Verbessern Discovery Systeme die Informationskompetenz: Giessen, 2013
 
Discovery Systeme - Fluch oder Segen für BibliothekarInnen?
Discovery Systeme - Fluch oder Segen für BibliothekarInnen? Discovery Systeme - Fluch oder Segen für BibliothekarInnen?
Discovery Systeme - Fluch oder Segen für BibliothekarInnen?
 
seguridad informatica
seguridad  informaticaseguridad  informatica
seguridad informatica
 
Planificacion proyecto tics 1
Planificacion proyecto tics 1Planificacion proyecto tics 1
Planificacion proyecto tics 1
 
Como insertar una imagen en tu blogger
Como insertar una imagen en tu bloggerComo insertar una imagen en tu blogger
Como insertar una imagen en tu blogger
 
Sesion
SesionSesion
Sesion
 
Politica educativa rocio
Politica educativa rocioPolitica educativa rocio
Politica educativa rocio
 
SEXI
SEXISEXI
SEXI
 
Presentacion de eleinis manjarrez
Presentacion de eleinis manjarrezPresentacion de eleinis manjarrez
Presentacion de eleinis manjarrez
 
Blogbeiträge individuell optimiert und zeitversetzt auf XING posten
Blogbeiträge individuell optimiert und zeitversetzt auf XING postenBlogbeiträge individuell optimiert und zeitversetzt auf XING posten
Blogbeiträge individuell optimiert und zeitversetzt auf XING posten
 
La construcción de la propia imagen
La construcción de la propia imagenLa construcción de la propia imagen
La construcción de la propia imagen
 
Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...
Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...
Herausforderung Selbständigkeit: Gründungspotential ausländischer Akademiker ...
 
Pao tatis
Pao tatisPao tatis
Pao tatis
 
Estudio de mercado
Estudio de mercadoEstudio de mercado
Estudio de mercado
 
Yoga Therapie
Yoga TherapieYoga Therapie
Yoga Therapie
 
Content Marketing für Versicherer und Finanzdienstleister
Content Marketing für Versicherer und FinanzdienstleisterContent Marketing für Versicherer und Finanzdienstleister
Content Marketing für Versicherer und Finanzdienstleister
 
Ayurveda Kongress 2014
Ayurveda Kongress 2014Ayurveda Kongress 2014
Ayurveda Kongress 2014
 
22 Al27 Defebrero2010
22 Al27 Defebrero201022 Al27 Defebrero2010
22 Al27 Defebrero2010
 
Tensión superficial
Tensión superficialTensión superficial
Tensión superficial
 

Similar a Relevanzranking als Erfolgsfaktor für Discoverysysteme

E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...Martin Blenkle
 
Arbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat NaturwissenschaftenArbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat NaturwissenschaftenHaake
 
Rankingfaktoren für Bibliothekssysteme
Rankingfaktoren für BibliothekssystemeRankingfaktoren für Bibliothekssysteme
Rankingfaktoren für BibliothekssystemeChristiane Behnert
 
Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Martin Blenkle
 
Statistiken für Repositories
Statistiken für RepositoriesStatistiken für Repositories
Statistiken für Repositoriesuherb
 
Moennichspieringbibtip
MoennichspieringbibtipMoennichspieringbibtip
MoennichspieringbibtipUBKA
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen KatalogesMartin Blenkle
 
beluga: Schaufenster zur Baustelle, März 2009
beluga: Schaufenster zur Baustelle, März 2009beluga: Schaufenster zur Baustelle, März 2009
beluga: Schaufenster zur Baustelle, März 2009Anne Christensen
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationMartin Blenkle
 
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012Haake
 
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open DataDer Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open DataAnne Christensen
 
Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...
Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...
Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...TIB Hannover
 
beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...
beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...
beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...Anne Christensen
 
Ausgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheDirk Lewandowski
 
E-Books verändern Bibliotheken
E-Books verändern BibliothekenE-Books verändern Bibliotheken
E-Books verändern BibliothekenRudolf Mumenthaler
 

Similar a Relevanzranking als Erfolgsfaktor für Discoverysysteme (20)

E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
 
Arbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat NaturwissenschaftenArbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat Naturwissenschaften
 
Der beratende Katalog
Der beratende KatalogDer beratende Katalog
Der beratende Katalog
 
Rankingfaktoren für Bibliothekssysteme
Rankingfaktoren für BibliothekssystemeRankingfaktoren für Bibliothekssysteme
Rankingfaktoren für Bibliothekssysteme
 
Suchmaschinen vs. OPAC
Suchmaschinen vs. OPACSuchmaschinen vs. OPAC
Suchmaschinen vs. OPAC
 
Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?
 
Statistiken für Repositories
Statistiken für RepositoriesStatistiken für Repositories
Statistiken für Repositories
 
Moennichspieringbibtip
MoennichspieringbibtipMoennichspieringbibtip
Moennichspieringbibtip
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
 
beluga: Schaufenster zur Baustelle, März 2009
beluga: Schaufenster zur Baustelle, März 2009beluga: Schaufenster zur Baustelle, März 2009
beluga: Schaufenster zur Baustelle, März 2009
 
Ce jourfixe20100429
Ce jourfixe20100429Ce jourfixe20100429
Ce jourfixe20100429
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
 
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012
 
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open DataDer Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
 
Not our patrons
Not our patronsNot our patrons
Not our patrons
 
Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...
Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...
Green Road 2.0? Selbstarchivierung als integrierte Funktion von Social-Networ...
 
beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...
beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...
beluga - Die Hamburger Rechercheplattform zur Literaturversorgung virtueller ...
 
Ausgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich Suche
 
E-Books verändern Bibliotheken
E-Books verändern BibliothekenE-Books verändern Bibliotheken
E-Books verändern Bibliotheken
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
 

Último

Ein Telefongespräch. Ein Telefongespräch. Ein Telefongespräch
Ein Telefongespräch. Ein Telefongespräch. Ein TelefongesprächEin Telefongespräch. Ein Telefongespräch. Ein Telefongespräch
Ein Telefongespräch. Ein Telefongespräch. Ein TelefongesprächOlenaKarlsTkachenko
 
Presentation Endstation Dingden, Razzia von Rotterdam
Presentation Endstation Dingden, Razzia von RotterdamPresentation Endstation Dingden, Razzia von Rotterdam
Presentation Endstation Dingden, Razzia von RotterdamEus van Hove
 
Konjunktiv II - Theorie undd Beispiele - DaF mit Power
Konjunktiv II - Theorie undd Beispiele - DaF mit PowerKonjunktiv II - Theorie undd Beispiele - DaF mit Power
Konjunktiv II - Theorie undd Beispiele - DaF mit PowerMaria Vaz König
 
Kurzbeschreibung Schreibtools für die Toolbox.pdf
Kurzbeschreibung Schreibtools für die Toolbox.pdfKurzbeschreibung Schreibtools für die Toolbox.pdf
Kurzbeschreibung Schreibtools für die Toolbox.pdfHenning Urs
 
Stadt Popasna.Stadt PopasnaStadt Popasna
Stadt Popasna.Stadt PopasnaStadt PopasnaStadt Popasna.Stadt PopasnaStadt Popasna
Stadt Popasna.Stadt PopasnaStadt PopasnaOlenaKarlsTkachenko
 

Último (6)

Díptic PFI pfi pfi pfi pfi pfi pfi pf.pdf
Díptic PFI pfi pfi pfi pfi pfi pfi pf.pdfDíptic PFI pfi pfi pfi pfi pfi pfi pf.pdf
Díptic PFI pfi pfi pfi pfi pfi pfi pf.pdf
 
Ein Telefongespräch. Ein Telefongespräch. Ein Telefongespräch
Ein Telefongespräch. Ein Telefongespräch. Ein TelefongesprächEin Telefongespräch. Ein Telefongespräch. Ein Telefongespräch
Ein Telefongespräch. Ein Telefongespräch. Ein Telefongespräch
 
Presentation Endstation Dingden, Razzia von Rotterdam
Presentation Endstation Dingden, Razzia von RotterdamPresentation Endstation Dingden, Razzia von Rotterdam
Presentation Endstation Dingden, Razzia von Rotterdam
 
Konjunktiv II - Theorie undd Beispiele - DaF mit Power
Konjunktiv II - Theorie undd Beispiele - DaF mit PowerKonjunktiv II - Theorie undd Beispiele - DaF mit Power
Konjunktiv II - Theorie undd Beispiele - DaF mit Power
 
Kurzbeschreibung Schreibtools für die Toolbox.pdf
Kurzbeschreibung Schreibtools für die Toolbox.pdfKurzbeschreibung Schreibtools für die Toolbox.pdf
Kurzbeschreibung Schreibtools für die Toolbox.pdf
 
Stadt Popasna.Stadt PopasnaStadt Popasna
Stadt Popasna.Stadt PopasnaStadt PopasnaStadt Popasna.Stadt PopasnaStadt Popasna
Stadt Popasna.Stadt PopasnaStadt Popasna
 

Relevanzranking als Erfolgsfaktor für Discoverysysteme

  • 1. Relevanzranking als Erfolgsfaktor für Discoverysysteme Elmar Haake Staats- und Universitätsbibliothek Bremen GBV-Verbundkonferenz Hannover 05.09.2012 1
  • 2. Relevanzranking als Erfolgsfaktor für Discoverysysteme Definition: Was ist Relevanzranking? Ausgangslage: Nutzergewohnheiten, Rankingverfahren in klassischen Bibliothekssystemen und Discoverystemen Neue Lösungsansätze beim Ranking in der E-LIB Bremen Elmar Haake Staats- und Universitätsbibliothek Bremen GBV-Verbundkonferenz Hannover 05.09.2012 2
  • 3. // Definition Relevanzranking Das Beste für mich zuerst! Relevante Titel bevorzugen! Suchmaschinen: Textstatistik & linktopologisch (PageRank: Popularität der Webseiten), Boostfaktoren und nutzerspezifisches Ranking Nutzergerechte Sortierung der Suchergebnisse in der Reihenfolge absteigender Relevanz bezogen auf die Sucheingabe. Relevanz ist stets subjektiv, geringe Transparenz 3
  • 4. Klassische Bibliothekskataloge: Expertenstrategie (Exact-Match, Boolesche Logik) weist nur einen Teil des Bibliotheksbestandes nach Chronologische Sortierung als Standard Ranking nach Zeit als relevantes Kriterium bei Known-Item-Suchanfragen hilfreich problematisch bei einfachen Suchanfragen bzw. hochfrequente Begriffen (große Treffermengen) Zeitschriften schwer auffindbar ohne Expertenretrieval Verschärfung der Sortierproblematik bei Ausweitung des Suchraumes „Mischen impossible“? 4
  • 5. // Neue Online-Kataloge in wiss. Bibliotheken Next Generation Catalogue Katalog 2.0 Discovery System Hildreth, Charles R.: Beyond Boolean: Designing the next generation of online catalogs Library trends 35 (1987), S. 647-667 5
  • 6. // Neue Nutzergewohnheiten - einige Vermutungen & Thesen Menschen werden von Internetstandards (Amazon, Google etc.) vorgeprägt und... haben geringe Retrievalkenntnisse erwarten sinnvolles Ranking: wichtige Treffer zuerst! Best-Match statt Exact-Match mögen keine komplexe Expertenlogik AND / OR / NOT und lesen keine Hilfeseiten... verwenden keine bibliothekarische Eingabelogik (sondern Copy&Paste) erwarten Fehlertoleranz möchten Inhalte online sofort nutzen finden in Bibliothekskatalogen oft nicht das passende Material 6
  • 7. // Eigenschaften von Discoverysystemen: Großer Suchraum - Große Treffermengen Best-Match-Verfahren Relevanzranking über textstatistische Verfahren (u.a. Gewichtung von Termen im Dokument) Relevanzdifferenzierung schwierig bei Metadaten , großen Treffermengen und hochfrequenten Begriffen Facettierung als ‚Notlösung‘, aufwändige Implementierung, Usability problematisch Differenzierung bei weiterhin identischen bzw. eng liegenden Relevanzwerten? Chronologische Sortierung? Zufällige Sortierung? Boosting durch Bevorzugung bestimmter Titel (Materialtyp : Online- Ressourcen, Zeitschriften, Lehrbücher oder lokaler Bestand)? 7
  • 8. // Strategische Frage zur Katalogentwicklung Wie kann das Ranking nutzergerecht weiter verbessert werden?
  • 9. // Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen Hilfsmittel: Suchhistorie der Nutzer in anonymisierter Form, Erfüllung der Nutzererwartungen analysieren Zieldefinition: Bevorzugung stark nachgefragter Titel bei gleicher Relevanz und ‚dezentere‘ Platzierung der Artikel mit vertretbarem Aufwand und möglichst geringer Komplexizität Lösungsansatz: Zusätzliche Beeinflussung der Relevanzparameter durch Titelpopularität* als Ergänzung der textstatistischen Verfahren Beschaffungsverhalten Medieneigenschaften Nutzerverhalten * D. Lewandowski, Ranking library materials. Library Hi Tech 27 (2009) 4, 584 - 593 - http://kurl.de/elib-lw 9
  • 10. // Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen Beschaffungsverhalten Stark gefragte Titel werden häufig als Staffelexemplare von der Bibliothek beschafft: Exemplarzahl > 3 Exemplare als Indiz für Popularität, Relevanzaufschlag 10
  • 11. // Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen Medieneigenschaften Stark gefragte Titel sind häufig im Buchhandel vergriffen und werden als Folgeauflagen neu aufgelegt: Auflagenzählung als weiteres Indiz für Popularität, Relevanzaufschlag 11
  • 12. // Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen Nutzerverhalten Stark gefragte Titel werden in der Trefferliste häufig angeklickt Aktualität der Titel relevant, daher Auswertung der Klicks auf die letzten 2 Jahre beschränkt Klicks > 3 als weiteres Indiz für Popularität, Relevanzaufschlag 12
  • 13. // Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen Keine Überkompensation der Textstatistik durch Titelpopularität Grundlage: Textstatistische Berechnung der Relevanzwerte und Feinjustierung durch Nutzung von Popularitätsfaktoren Überblick: Popularitätstyp Relevanzaufschlag in % Beschaffungsverhalten 3 Medieneigenschaften 3 Nutzerverhalten 5 13
  • 14. // Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen Weitere mögliche Beeinflussungsparameter Popularität : Ausleihstatistik (beeinflusst nur ausleihbaren Bestand, keine Online-Ressourcen) Zitationsfrequenz (problematische Beschaffung des Datenmaterials) Nutzerbewertung (ausgeprägte Subjektivität?) Renommee der Autoren (Objektivierbarkeit?) Impact Factor der Zeitschrift bei Zeitschriftenartikel (Datenmaterialbeschaffung?) Lokalität: eigenen Bestand bevorzugen, standortspezifische Sortierung Medientyp : Lehrbücher für UB, Aufsätze für Virtuelle Fachportale, bei homogenem Nutzertyp möglich 14
  • 15. // Relevanzranking: Modifikation über Titelpopularität in der E-LIB Bremen Relevanzranking als Erfolgsfaktor: Titelpopularität zeigt: Vergleich der Trefferlisten mit/ohne Bessere Auffindbarkeit relevanter Titel mit hochfrequenten Begriffen Discoverysysteme können für die Mehrzahlauf Position 11, „Science“(1880) (gedruckte Zeitschriften „Die Zeit“(1946) der Nutzer mit Textstatistik besser als klassische Kataloge ranken. auf Position 6) ohne Nutzung der Facettierung und Blättern Bei großen Treffermengen besteht jedochpositioniert, Aktuelle Klassiker werden prominenter ein weiterer Justierungsbedarf, der möglichst im Hinblick aufwerden sofort gefunden am Campus nachgefragte, gängige Lehrbücher die Erfüllung der Nutzererwartungen mit Hilfe von Popularitätsfaktoren eingestellt Reduktion der Artikellastigkeit werden kann. Optimale Unterstützung von Known-Item-Suchanfragen bei Kontinuierlicher Überprüfungsbedarf, unterschiedliche Autoren mit hoher Publikationsfrequenz Nutzererwartungen, keine vollständige Objektivierbarkeit, schwierige Evaluierbarkeit 15
  • 16. Relevanzranking als Erfolgsfaktor für Discoverysysteme Elmar Haake Staats- und Universitätsbibliothek Bremen GBV-Verbundkonferenz Hannover 05.09.2012 16