Дмитрий Жлобо, Ruby and Rails Developer в Twinslash
«Использование Elasticsearch для организации поиска по сайту»
Организация качественного поиска на сайте – сложная и нетривиальная задача. В своем докладе Дмитрий расскажет о том, как ее решить с помощью Elasticsearch.
Будет рассмотрено, как Elasticsearch работает с текстом или другими данными: от анализа и индексации документов до поиска и агрегации. По шагам и на примерах будет показано, как настроить поиск, учитывающий, например, морфологию и фонетику русского языка. Также Дмитрий расскажет, как все это использовать в приложениях на Ruby, как организовать добавление документов в индекс и др.
8. usual approach
● SELECT * FROM posts WHERE `body`
LIKE '%query%'
● gem 'thinking-sphinx'
…
Article.search(params[:q])
9. usual approach
● SELECT * FROM posts WHERE `body`
LIKE '%query%'
● gem 'thinking-sphinx'
…
Article.search(params[:q])
10. how search works?
● document 1:
flexible and powerful open source, distributed real-
time search and analytics engine for the cloud...
● document 2:
Apache Mahout has implementations of a wide
range of machine learning and data mining...
● document 3:
Our core algorithms for clustering, classification and
batch based collaborative filtering are implemented
on top of Apache Hadoop using the MapReduce...
77. random facts
● bulk operations
● real time
● highlights
● geo types and geo distance facets
● attachments
● “did you mean?” and completions
● common terms
● filters and caching
● river