Mit Apache Solr können Website-Betreiber mit überschaubarem Aufwand eine relevantere und performantere Suche implementieren als dies bspw. mit MySQL Full-Text Search möglich ist.
Unsere Präsentation gibt einen kurzen Einblick in die Kernfunktionen und zeigt verschiedene Beispiele.
6. Einführung – Was ist Solr?
• Enterprise Suchmaschine
• Ursprung bei CNET Networks Inc.
• seit 2004 in Entwicklung, aktive Community
• Open Source > kostenlos
• Multi-Plattform dank Java
• Apache Lizenz
8. Funktionen – Was kann Solr? (1)
• Volltext-Suche
• Ranking und Relevanz
• Faceted Search => vielfältige Kategorisierung
• Stammworterkennung / Rechtstrunkierung
• Filterung mit regulären Ausdrücken, phonetische Filter
• „Meinten Sie...?“ => Rechtschreibvorschläge
9. Funktionen – Was kann Solr? (2)
• Unterstützung von Synonymen, Stop-Wortlisten
• Auto-Vervollständigung
• Hervorheben des Suchbegriffs in Ergebnissen
• Verfeinerung des Suchergebnisses durch Filter, Sortierung
• Vorschläge für ähnliche Treffer
• Indizierung von Inhalten in Dokumenten (Word, PDF, ... mit Tika)
10. Funktionen – Was kann Solr? (3)
• Schnell, schneller, am schnellsten bei vielen Zugriffen (Caching)
• Skalierbar durch verteilte Indizes auf mehreren Rechnern
• Mehr Performance, ausfallsicher
• Flexibel erweiterbar durch Plugins
• Schnittstellen (RESTful API) zur Eingabe / Ausgabe von Daten
• Administrationsober äche
11. Funktionen – Was kann Solr? (4)
• Monitoring, Logging von Suchanfragen
• Kon guration über XML-Dateien
• Multiple Daten-Schemas
• numerisch, Datum, dynamisch, eindeutiger Schlüssel (UUID)
• Daten-Import Handler
• CSV, URL, Dateien, ...
26. Abschließend...
• Mehr über uns:
• http://compuccino.com
• Fragen:
• of ce@compuccino.com
• T: 030 247 24 000
Notas del editor
compuccino wurde 2007 von Klas Roggenkamp & Nader Cserny gegründet
Organisch auf 15 Mitarbeiter gewachsen
Spezialisierung auf Entwicklung und Design von komplexen Inhalten
Cnet: Medien-Unternehmen aus den USA
Multi-Plattform: Windows, Mac, Linux
Apache Lizenz: frei verwenden, Änderungen müssen nicht veröffentlicht werden
Faceted: Kategorisierung nach Autor, Kategorie, Datum, Inhaltstyp, etc.
Ranking: relevante Faktoren flexibel konfigurierbar
Stammworterkennung: Haus findet Häuser, Porter-/Snowball-Stemmer für versch. Sprachen
Meinten Sie: Korrektur von „schwäbich“ zu „schwäbisch“
Synonyme: Fahrzeug = Auto, Computer = PC
Hervorheben mit CSS-Attributen
Verfeinerung durch Auswahl von Parametern
Flexibel, ...: Suchfunktionalitäten mit Plugins erweiterbar
Caching: je mehr Suchanfragen umso schneller => Zwischenspeicher
Daten-Import Handler: CSV, URLs, Files
Faceted Search => Filterungsoptionen
Sortierung nach Relevanz, Titel, ..., Datum auf-/absteigend
Kategorien: Product Reviews, Downloads, News & Photos, Videos
Darstellung des Suchergebnisses frei wählbar
Narrow your results
Auto-Vervollständigung bei Eingabe des Suchbegriffs
„Michael“ findet „Michael Jackson“, „Michael Jackson Music Videos“ auf Basis der häufigsten Suchbegriff-Nennung
Suche in Videos per Auto-Vervollständigung
„Surprise Me“ wählt zufälliges Suchergebnis aus und leitet direkt auf die Produktseite
„Toy Story“ findet den aktuellsten Film „Toy Story 3“
Erweiterte Suche: Datum von/bis, Autor, etc.
Foto: Direkte Anzeige von anderen Inhaltstypen
DB Import: Felder definiert, Inhalte & Dokumente geparsed, etc.
Initialer Import hat ca. 10 Stunden gedauert
Bereits mit der Standardinstallation erzielt man bessere Suchergebnisse als mit MySQL Full-Text Search