SlideShare una empresa de Scribd logo
Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com
cosicas que sí deberías saber ya buscador ligero y rápido fácil de integrar en rails gracias a thinking sphinx permite búsquedas por texto libre permite usar comodines permite buscar y ordenar por atributos permite usar grupos y facetas permite buscar por geoposición
cosicas que voy a contar (por encima) ciclo de indexado / ciclo de búsqueda spa / spi / sph / spd / spm / spp búsquedas extendidas, pesos y ordenaciones  excerpts charsets, stemmers, stopwords, excepciones  deltas / index merge / indexar en tiempo real indexando ficheros (texto y xml) performance: extern / hitless/ distribuir el índice modificando thinking sphinx
indexado / búsqueda sql_query_pre sql_query sql_query_post sql_query_post_index sql_ranged_throttle sql_query_info
ficheros spa:  attributes spd:  doc ID <=> word ID sph:  headers  spi:  word <=> word ID spk:  kill list spm:  MVA spp:  hits sps:  string attributes
extended search OR | val AND & val NOT !val  -val field @name val relaxed @@relaxed field pos @name[p] val multifield @(n1,n2) val all fields @* val phrase “hello world” proximity “end world”~5 near val1 NEAR/3 val2 quorum “val val2 val3”/2 exact form =val before val1 << val2 field start ^val field end val$ sentence val SENTENCE val2 paragraph val PARAGRAPH val2
sorting SPH_SORT_RELEVANCE SPH_SORT_ATTR_DESC / SPH_SORT_ATTR_ASC SPH_SORT_TIME_SEGMENTS SPH_SORT_EXTENDED (@id, @weight, @random) SPH_SORT_EXPR  &quot;@weight + ( user_karma + ln(pageviews) )*0.1&quot;
excerpts
words words words charsets stemmers stopwords wordforms exceptions
Delta, MERGE,  Real Time INDEX deltas  index merge  indexar en tiempo real
XML & TEXfILES sql_file_field xmlpipe2
Performance extern storage (attributes) hitless words (positions) distributed indexes
Thinking Sphinx thinking sphinx vendor/riddle riddle gem
Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com

Más contenido relacionado

Destacado

Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1
Irfan Aiman
 
4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus
pablomendez_01
 
Presentation1 rootabaga stories original
Presentation1 rootabaga stories originalPresentation1 rootabaga stories original
Presentation1 rootabaga stories original
kylea11
 
项目二 完成稿
项目二  完成稿项目二  完成稿
项目二 完成稿
shangziying
 
Act Embutidos Y Grasas
Act Embutidos Y GrasasAct Embutidos Y Grasas
Act Embutidos Y Grasas
ciudadania0910
 

Destacado (20)

Test grafik kvadratne funkcije
Test   grafik kvadratne funkcijeTest   grafik kvadratne funkcije
Test grafik kvadratne funkcije
 
Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1
 
Rebe Ciudadania
Rebe CiudadaniaRebe Ciudadania
Rebe Ciudadania
 
Blog by s_f
Blog by s_fBlog by s_f
Blog by s_f
 
Vult 2011
Vult 2011Vult 2011
Vult 2011
 
Menjadi pemenang
Menjadi pemenangMenjadi pemenang
Menjadi pemenang
 
4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus
 
Presentation1 rootabaga stories original
Presentation1 rootabaga stories originalPresentation1 rootabaga stories original
Presentation1 rootabaga stories original
 
项目二 完成稿
项目二  完成稿项目二  完成稿
项目二 完成稿
 
Tadevosyan anush
Tadevosyan anushTadevosyan anush
Tadevosyan anush
 
Aproximaciones culturales del TDAH Uziel Morales Amaya
Aproximaciones culturales del TDAH  Uziel Morales AmayaAproximaciones culturales del TDAH  Uziel Morales Amaya
Aproximaciones culturales del TDAH Uziel Morales Amaya
 
Ripensare la scuola
Ripensare la scuolaRipensare la scuola
Ripensare la scuola
 
Barcino
BarcinoBarcino
Barcino
 
Dinks
DinksDinks
Dinks
 
Act Embutidos Y Grasas
Act Embutidos Y GrasasAct Embutidos Y Grasas
Act Embutidos Y Grasas
 
Presentacion melisa
Presentacion melisaPresentacion melisa
Presentacion melisa
 
Comunicar ondas1
Comunicar ondas1Comunicar ondas1
Comunicar ondas1
 
Maicol ruiz franco cruzi escalera y preguntas 11[1]
Maicol ruiz franco cruzi escalera y preguntas 11[1]Maicol ruiz franco cruzi escalera y preguntas 11[1]
Maicol ruiz franco cruzi escalera y preguntas 11[1]
 
16º EDTED
16º EDTED16º EDTED
16º EDTED
 
Canvi climàtic
Canvi climàticCanvi climàtic
Canvi climàtic
 

Similar a cosicas de sphinx que lo mismo no sabías

Servicios Rest con Jersey
Servicios Rest con Jersey Servicios Rest con Jersey
Servicios Rest con Jersey
Vortexbird
 
Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02
Antonio Meléndez
 
Java script teoria
Java script teoriaJava script teoria
Java script teoria
ssxdan
 
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
Oscar V
 
informacion sobre blog datos y sql
informacion sobre blog datos y sqlinformacion sobre blog datos y sql
informacion sobre blog datos y sql
danie12angie
 
PresentacióN 4
PresentacióN 4PresentacióN 4
PresentacióN 4
pokerpc
 

Similar a cosicas de sphinx que lo mismo no sabías (20)

Tutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtimeTutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtime
 
Scala en proyectos de vinculación Ancap-UR - 2013-03
Scala en proyectos de vinculación Ancap-UR - 2013-03Scala en proyectos de vinculación Ancap-UR - 2013-03
Scala en proyectos de vinculación Ancap-UR - 2013-03
 
Servicios Rest con Jersey
Servicios Rest con Jersey Servicios Rest con Jersey
Servicios Rest con Jersey
 
Compilacion Perl
Compilacion PerlCompilacion Perl
Compilacion Perl
 
Java script operaciones
Java script operacionesJava script operaciones
Java script operaciones
 
SQL(DQL).pdf
SQL(DQL).pdfSQL(DQL).pdf
SQL(DQL).pdf
 
Tutorial de php
Tutorial de phpTutorial de php
Tutorial de php
 
Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02
 
Formación apache Solr
Formación apache SolrFormación apache Solr
Formación apache Solr
 
Javascript Básico
Javascript BásicoJavascript Básico
Javascript Básico
 
Java script teoria
Java script teoriaJava script teoria
Java script teoria
 
Java 7- Java Day Guatemala
Java 7- Java Day GuatemalaJava 7- Java Day Guatemala
Java 7- Java Day Guatemala
 
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
 
Script
ScriptScript
Script
 
Curso php y_mysql
Curso php y_mysqlCurso php y_mysql
Curso php y_mysql
 
Kelly
KellyKelly
Kelly
 
Comandos de Raptor, Java y C# Sharp
Comandos de Raptor, Java y C# SharpComandos de Raptor, Java y C# Sharp
Comandos de Raptor, Java y C# Sharp
 
informacion sobre blog datos y sql
informacion sobre blog datos y sqlinformacion sobre blog datos y sql
informacion sobre blog datos y sql
 
PresentacióN 4
PresentacióN 4PresentacióN 4
PresentacióN 4
 
Cagando Datos con APEX_DATA_PARSER
Cagando Datos con APEX_DATA_PARSERCagando Datos con APEX_DATA_PARSER
Cagando Datos con APEX_DATA_PARSER
 

Más de javier ramirez

Más de javier ramirez (20)

¿Se puede vivir del open source? T3chfest
¿Se puede vivir del open source? T3chfest¿Se puede vivir del open source? T3chfest
¿Se puede vivir del open source? T3chfest
 
QuestDB: The building blocks of a fast open-source time-series database
QuestDB: The building blocks of a fast open-source time-series databaseQuestDB: The building blocks of a fast open-source time-series database
QuestDB: The building blocks of a fast open-source time-series database
 
Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...
Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...
Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...
 
Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...
Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...
Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...
 
Deduplicating and analysing time-series data with Apache Beam and QuestDB
Deduplicating and analysing time-series data with Apache Beam and QuestDBDeduplicating and analysing time-series data with Apache Beam and QuestDB
Deduplicating and analysing time-series data with Apache Beam and QuestDB
 
Your Database Cannot Do this (well)
Your Database Cannot Do this (well)Your Database Cannot Do this (well)
Your Database Cannot Do this (well)
 
Your Timestamps Deserve Better than a Generic Database
Your Timestamps Deserve Better than a Generic DatabaseYour Timestamps Deserve Better than a Generic Database
Your Timestamps Deserve Better than a Generic Database
 
Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...
Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...
Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...
 
QuestDB-Community-Call-20220728
QuestDB-Community-Call-20220728QuestDB-Community-Call-20220728
QuestDB-Community-Call-20220728
 
Processing and analysing streaming data with Python. Pycon Italy 2022
Processing and analysing streaming  data with Python. Pycon Italy 2022Processing and analysing streaming  data with Python. Pycon Italy 2022
Processing and analysing streaming data with Python. Pycon Italy 2022
 
QuestDB: ingesting a million time series per second on a single instance. Big...
QuestDB: ingesting a million time series per second on a single instance. Big...QuestDB: ingesting a million time series per second on a single instance. Big...
QuestDB: ingesting a million time series per second on a single instance. Big...
 
Servicios e infraestructura de AWS y la próxima región en Aragón
Servicios e infraestructura de AWS y la próxima región en AragónServicios e infraestructura de AWS y la próxima región en Aragón
Servicios e infraestructura de AWS y la próxima región en Aragón
 
Primeros pasos en desarrollo serverless
Primeros pasos en desarrollo serverlessPrimeros pasos en desarrollo serverless
Primeros pasos en desarrollo serverless
 
How AWS is reinventing the cloud
How AWS is reinventing the cloudHow AWS is reinventing the cloud
How AWS is reinventing the cloud
 
Analitica de datos en tiempo real con Apache Flink y Apache BEAM
Analitica de datos en tiempo real con Apache Flink y Apache BEAMAnalitica de datos en tiempo real con Apache Flink y Apache BEAM
Analitica de datos en tiempo real con Apache Flink y Apache BEAM
 
Getting started with streaming analytics
Getting started with streaming analyticsGetting started with streaming analytics
Getting started with streaming analytics
 
Getting started with streaming analytics: Setting up a pipeline
Getting started with streaming analytics: Setting up a pipelineGetting started with streaming analytics: Setting up a pipeline
Getting started with streaming analytics: Setting up a pipeline
 
Getting started with streaming analytics: Deep Dive
Getting started with streaming analytics: Deep DiveGetting started with streaming analytics: Deep Dive
Getting started with streaming analytics: Deep Dive
 
Getting started with streaming analytics: streaming basics (1 of 3)
Getting started with streaming analytics: streaming basics (1 of 3)Getting started with streaming analytics: streaming basics (1 of 3)
Getting started with streaming analytics: streaming basics (1 of 3)
 
Monitorización de seguridad y detección de amenazas con AWS
Monitorización de seguridad y detección de amenazas con AWSMonitorización de seguridad y detección de amenazas con AWS
Monitorización de seguridad y detección de amenazas con AWS
 

Último

editorial de informática de los sueños.docx
editorial de informática de los sueños.docxeditorial de informática de los sueños.docx
editorial de informática de los sueños.docx
ssusere34b451
 
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docxPRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
encinasm992
 

Último (20)

HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
 
Gestión de concurrencia y bloqueos en SQL Server
Gestión de concurrencia y bloqueos en SQL ServerGestión de concurrencia y bloqueos en SQL Server
Gestión de concurrencia y bloqueos en SQL Server
 
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
 
taller de tablas en word para estudiantes de secundaria
taller de tablas en word para estudiantes de secundariataller de tablas en word para estudiantes de secundaria
taller de tablas en word para estudiantes de secundaria
 
lenguaje algebraico.pptx álgebra, trigonometria
lenguaje algebraico.pptx álgebra, trigonometrialenguaje algebraico.pptx álgebra, trigonometria
lenguaje algebraico.pptx álgebra, trigonometria
 
Licencias para el Uso y el Desarrollo de Software
Licencias para el Uso y el Desarrollo de SoftwareLicencias para el Uso y el Desarrollo de Software
Licencias para el Uso y el Desarrollo de Software
 
Inteligencia Artificial para usuarios nivel inicial
Inteligencia Artificial para usuarios nivel inicialInteligencia Artificial para usuarios nivel inicial
Inteligencia Artificial para usuarios nivel inicial
 
manual-de-oleohidraulica-industrial-vickers.pdf
manual-de-oleohidraulica-industrial-vickers.pdfmanual-de-oleohidraulica-industrial-vickers.pdf
manual-de-oleohidraulica-industrial-vickers.pdf
 
editorial de informática de los sueños.docx
editorial de informática de los sueños.docxeditorial de informática de los sueños.docx
editorial de informática de los sueños.docx
 
NIVEL DE MADUREZ TECNOLÓGICA (TRL).pptx
NIVEL DE  MADUREZ TECNOLÓGICA (TRL).pptxNIVEL DE  MADUREZ TECNOLÓGICA (TRL).pptx
NIVEL DE MADUREZ TECNOLÓGICA (TRL).pptx
 
3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx
3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx
3°ð_¦_â_¾ï¸_S34 PLAN DARUKEL DIDÃ_CTICA 23-24.docx
 
herramientas informaticas mas utilizadas
herramientas informaticas mas utilizadasherramientas informaticas mas utilizadas
herramientas informaticas mas utilizadas
 
Herramientas informáticas. Sara Torres R.
Herramientas informáticas. Sara Torres R.Herramientas informáticas. Sara Torres R.
Herramientas informáticas. Sara Torres R.
 
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUALJORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
 
Estudio de la geometría analitica. Pptx.
Estudio de la geometría analitica. Pptx.Estudio de la geometría analitica. Pptx.
Estudio de la geometría analitica. Pptx.
 
Uso de las TIC en la vida cotidiana .
Uso de las TIC en la vida cotidiana       .Uso de las TIC en la vida cotidiana       .
Uso de las TIC en la vida cotidiana .
 
Introducción a la robótica con arduino..pptx
Introducción a la robótica con arduino..pptxIntroducción a la robótica con arduino..pptx
Introducción a la robótica con arduino..pptx
 
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docxPRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
PRÁCTICAS DEL MÓDULO I Y II DE EDUCACIÓN Y SOCIEDAD.docx
 
Bloque 1 _ Lectura base - Sistemas Distribuidos
Bloque 1 _ Lectura base - Sistemas DistribuidosBloque 1 _ Lectura base - Sistemas Distribuidos
Bloque 1 _ Lectura base - Sistemas Distribuidos
 
Pons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdf
Pons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdfPons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdf
Pons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdf
 

cosicas de sphinx que lo mismo no sabías

  • 1. Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com
  • 2. cosicas que sí deberías saber ya buscador ligero y rápido fácil de integrar en rails gracias a thinking sphinx permite búsquedas por texto libre permite usar comodines permite buscar y ordenar por atributos permite usar grupos y facetas permite buscar por geoposición
  • 3. cosicas que voy a contar (por encima) ciclo de indexado / ciclo de búsqueda spa / spi / sph / spd / spm / spp búsquedas extendidas, pesos y ordenaciones excerpts charsets, stemmers, stopwords, excepciones deltas / index merge / indexar en tiempo real indexando ficheros (texto y xml) performance: extern / hitless/ distribuir el índice modificando thinking sphinx
  • 4. indexado / búsqueda sql_query_pre sql_query sql_query_post sql_query_post_index sql_ranged_throttle sql_query_info
  • 5. ficheros spa: attributes spd: doc ID <=> word ID sph: headers spi: word <=> word ID spk: kill list spm: MVA spp: hits sps: string attributes
  • 6. extended search OR | val AND & val NOT !val -val field @name val relaxed @@relaxed field pos @name[p] val multifield @(n1,n2) val all fields @* val phrase “hello world” proximity “end world”~5 near val1 NEAR/3 val2 quorum “val val2 val3”/2 exact form =val before val1 << val2 field start ^val field end val$ sentence val SENTENCE val2 paragraph val PARAGRAPH val2
  • 7. sorting SPH_SORT_RELEVANCE SPH_SORT_ATTR_DESC / SPH_SORT_ATTR_ASC SPH_SORT_TIME_SEGMENTS SPH_SORT_EXTENDED (@id, @weight, @random) SPH_SORT_EXPR &quot;@weight + ( user_karma + ln(pageviews) )*0.1&quot;
  • 9. words words words charsets stemmers stopwords wordforms exceptions
  • 10. Delta, MERGE, Real Time INDEX deltas index merge indexar en tiempo real
  • 11. XML & TEXfILES sql_file_field xmlpipe2
  • 12. Performance extern storage (attributes) hitless words (positions) distributed indexes
  • 13. Thinking Sphinx thinking sphinx vendor/riddle riddle gem
  • 14. Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com