Este documento introduce los conceptos básicos de los motores de búsqueda, Lucene y Solr. Explica que Lucene es una biblioteca de búsqueda de texto escrita en Java que usa un índice invertido, mientras que Solr es una plataforma de búsqueda empresarial de código abierto que utiliza Lucene como núcleo y agrega características como APIs REST, configuración externa y escalabilidad a través de replicación y particionamiento. También describe conceptos clave como documentos, campos, términos y
85. Extensible mediante plug-insSimplifica el análisis, highlighting, faceting, spell-checking, integración con bases de datos, extracción de contenido de documentoscomo word, pdf, etc
101. Extensible mediante plug-insEs simple de usardesde cualquieraplicaciónescrita en cualquierlenguaje. No es necesario saber Java parausarlo. Desacopla la búsqueda de la aplicación.
120. Conceptualmente, es lo que el usuariova a buscar en la aplicación. Porejemplo, en Google, un documentoseríaunapágina web, en unabiblioteca, podría ser un libro, etc. Se define dependiendo del negocio de la aplicación.
125. Algunasdefiniciones... Documents, Fields y Terms id: 12345 Album: The Dark Side of the Moon Artist: Pink Floyd Genere: Progressive Rock Release_Date: March 1973 Un campo o Field
126. Algunasdefiniciones... Documents, Fields y Terms id: 12345 Album: The Dark Side of the Moon Artist: Pink Floyd Genere: Progressive Rock Release_Date: March 1973 Un Término o “Term”
134. Un ejemplo... Analysis Searching with Solr Tokenization Searching with Solr Lowercase Filter searching with solr
135. Un ejemplo... Analysis Searching with Solr Tokenization Searching with Solr Lowercase Filter searching with solr Steming Filter search with solr
136. Un ejemplo... Analysis Searching with Solr Tokenization Searching with Solr Lowercase Filter searching with solr Steming Filter search with solr Stop Filter search solr
137. Un ejemplo... Analysis Searching with Solr Tokenization Searching with Solr Lowercase Filter Analysis searching with solr Steming Filter search with solr Stop Filter search solr
141. El Proceso en unaaplicación de búsqueda Adquirir Contenido Interfaz de Usuario Construir Documento Construir Query Armar Resultados Analizar Documento Ejecutar la Query Indexar Documento Índice
142. El Proceso en unaaplicación de búsqueda Interfaz de Usuario Realizar Búsquedas: El objetivo Construir Query Armar Resultados Ejecutar la Query Índice
143. El Proceso en unaaplicación de búsqueda Adquirir Contenido Construir Documento Indexar: El mal necesario Analizar Documento Indexar Documento Índice
171. Escalabilidad Replicación Cuando la cantidad de queries porsegundocrece Updates Index Server (Master) Search Servers (Slaves) Queries Queries Queries
172. Escalabilidad Sharing Updates Updates Unamitad del Índice La otramitad del Índice Podríapartirse el índice en N partes
173. Escalabilidad Sharing Updates Updates Queries Queries Queries Solr se encarga de que las consultas vayan a todos los “shards” que se le indican y de “mergear” los resultados luego
174. Escalabilidad Sharing Una Query Distribuida q q q Resultadosparciales Merge resultados Resultado Final