8. • El atributo name, solamente determina
un identificador, el atributo class y
los demás determinan el
comportamiento real del fieldType.
• Dentro de Solr todos los fieldTypes son
implementados por una clase de Java.
• Cuando el atributo class comienza con
“solr” se refiere a las clases de java
del paquete:
org.apache.solr.schema.
!
9. Solr provee varios tipos de datos nativos
para manejar datos estructurados
(números,fechas,geo-localización,texto
sinanalizar,etc).
14. yyyy = 2012
MM = 05
dd = 22
HH = 09 (24-hr clock)
mm = 30
ss = 22
Z = UTC Timezone (Z is for Zulu)
Siseenvíaenotroformatoseobtendráuna
excepcióndevalidación
26. CopyFields
Con Solr, podemos copiar varios
campos hacia uno solo, creando
una especie de campo “catch-
all”. Muy útil cuando se desea
tener un prompt de búsqueda
sobre todo el esquema.
32. TokenizadoresdeSolr
• WhiteSpaceTokenizer: Genera
tokens a partir de los espacios
presentes.
• StandardTokenizer: Parsea de
forma inteligente el texto, generando
tokens en espacios, signos de
puntuación y es capaz de generar URLs,
acrónimos y dirección de email.
• KeywordTokenizer: Produce un
único token con todo el contenido.
33. Filters
• Transformación: Realiza cambios en el
token, tales como llevarlo a minúsculas,
hayar la raíz, etc.
• Inyección de Token: Se añaden nuevos
tokens al stream (sinónimos).
• Eliminación de Token: Se eliminan
algunos tokens del stream (stopwords).
34. FiltersdeSolr
• StopFilterFactory: Elimina las
stopwords (palabras sin significado).
• SynonymFilterFactory: Permite
añadir sinónimos por términos.
• LowerCaseFilterFactory:
Transforma todos los términos en
minúsculas.
• PorterStemFilterFactory: Aplica
un algoritmo de stemming (obtiene la
raíz de los términos).