Cap 2: Aplicaci´n Pr´ctica
                o    a

Tutores: Luis Antonio Chamba Eras
 Edison Leonardo Coronel Romero

     Carrera de Ingenier´ en Sistemas
                        ıa
      Universidad Nacional de Loja


            Octubre 2012




                                        1 / 18
B´squeda de Texto - Antecedentes
 u

    • Un problema habitual en la Web y otros repositorios de texto
      es el siguiente:




                                                                     2 / 18
B´squeda de Texto - Antecedentes
 u

    • Un problema habitual en la Web y otros repositorios de texto
      es el siguiente:
    • ”Dado un conjunto de palabras, determinar todos los documen-
      tos que contengan una de dicha palabras (o todas)”.




                                                                     3 / 18
B´squeda de Texto - Antecedentes
 u

    • Un problema habitual en la Web y otros repositorios de texto
      es el siguiente:
    • ”Dado un conjunto de palabras, determinar todos los documen-
      tos que contengan una de dicha palabras (o todas)”.
    • Un motor de b´squeda, utiliza una tecnolog´ concreta conocida
                   u                            ıa
      como ”´ ındices invertidos”, en la que para cada palabra que
      aparece en la Web existen 100000000 de palabras diferentes, se
      almacena una lista de todos los lugares donde aparecen dicha
      palabra, servidores mantienen disponibles la informaci´n.
                                                            o




                                                                       4 / 18
B´squeda de Texto - Antecedentes
 u

    • Un problema habitual en la Web y otros repositorios de texto
      es el siguiente:
    • ”Dado un conjunto de palabras, determinar todos los documen-
      tos que contengan una de dicha palabras (o todas)”.
    • Un motor de b´squeda, utiliza una tecnolog´ concreta conocida
                   u                            ıa
      como ”´ ındices invertidos”, en la que para cada palabra que
      aparece en la Web existen 100000000 de palabras diferentes, se
      almacena una lista de todos los lugares donde aparecen dicha
      palabra, servidores mantienen disponibles la informaci´n.
                                                            o
    • Las t´cnicas de ´
           e          ındices invertidos no emplean aut´matas finitos,
                                                       o
      los agentes de b´squeda invierten mucho tiempo en el proceso.
                      u




                                                                        5 / 18
B´squeda de Texto - Antecedentes
 u

    • Un problema habitual en la Web y otros repositorios de texto
      es el siguiente:
    • ”Dado un conjunto de palabras, determinar todos los documen-
      tos que contengan una de dicha palabras (o todas)”.
    • Un motor de b´squeda, utiliza una tecnolog´ concreta conocida
                   u                            ıa
      como ”´ ındices invertidos”, en la que para cada palabra que
      aparece en la Web existen 100000000 de palabras diferentes, se
      almacena una lista de todos los lugares donde aparecen dicha
      palabra, servidores mantienen disponibles la informaci´n.
                                                            o
    • Las t´cnicas de ´
           e          ındices invertidos no emplean aut´matas finitos,
                                                       o
      los agentes de b´squeda invierten mucho tiempo en el proceso.
                      u
    • Existen t´cnicas de b´squeda que utilizan aut´matas, para ello
               e           u                       o
      se necesita cumplir las siguientes caracter´
                                                 ısticas:

                                                                        6 / 18
B´squeda de Texto - Antecedentes
 u




    • El repositorio cambia r´pidamente:noticias al d´ rastreadores
                             a                       ıa,
      Web.




                                                                      7 / 18
B´squeda de Texto - Antecedentes
 u




    • El repositorio cambia r´pidamente:noticias al d´ rastreadores
                             a                       ıa,
      Web.
    • Documentos no clasificados, p´ginas sobre la marcha en res-
                                  a
      puesta a consultas.




                                                                      8 / 18
B´squeda de Texto - Antecedentes
 u




    • El repositorio cambia r´pidamente:noticias al d´ rastreadores
                             a                       ıa,
      Web.
    • Documentos no clasificados, p´ginas sobre la marcha en res-
                                  a
      puesta a consultas.




                                                                      9 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o

    • Conjunto de palabras denominadas ”palabras clave ”, deseamos
      encontrar las apariciones de cualquiera de estas palabras, lo m´s
                                                                     a
      util es dise˜ar un AFND que indique mediante un estado de
      ´           n
      aceptaci´n que se ha encontrado una de las ”palabras clave”,
               o
      el texto de un documento se introduce car´cter por car´cter en
                                                  a            a
      el AFND que permitir´ reconocer las apariciones de las palabras
                            a
      claves en el texto.




                                                                          10 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o

    • Conjunto de palabras denominadas ”palabras clave ”, deseamos
      encontrar las apariciones de cualquiera de estas palabras, lo m´s
                                                                     a
      util es dise˜ar un AFND que indique mediante un estado de
      ´           n
      aceptaci´n que se ha encontrado una de las ”palabras clave”,
               o
      el texto de un documento se introduce car´cter por car´cter en
                                                  a            a
      el AFND que permitir´ reconocer las apariciones de las palabras
                            a
      claves en el texto.
    • Estado inicial con una transici´n a s´ mismo para cada uno de los
                                     o     ı
      s´
       ımbolos de entrada, por ejemplo el alfabeto ASCII, ´ste estado
                                                          e
      inicial representa una conjetura de que no se ha detectado una
      palabra clave, incluso aunque hayamos encontrado algunas de
      las letras de una de esas palabras.



                                                                          11 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o

    • Conjunto de palabras denominadas ”palabras clave ”, deseamos
      encontrar las apariciones de cualquiera de estas palabras, lo m´s
                                                                     a
      util es dise˜ar un AFND que indique mediante un estado de
      ´           n
      aceptaci´n que se ha encontrado una de las ”palabras clave”,
               o
      el texto de un documento se introduce car´cter por car´cter en
                                                  a            a
      el AFND que permitir´ reconocer las apariciones de las palabras
                            a
      claves en el texto.
    • Estado inicial con una transici´n a s´ mismo para cada uno de los
                                     o     ı
      s´
       ımbolos de entrada, por ejemplo el alfabeto ASCII, ´ste estado
                                                          e
      inicial representa una conjetura de que no se ha detectado una
      palabra clave, incluso aunque hayamos encontrado algunas de
      las letras de una de esas palabras.
    • Para cada palabra a1a2...ak hay k estados, q1,q2,...,qk.


                                                                          12 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o



    • Existe una transici´n desde el estado inicial a q1 para a1, una
                         o
      transici´n desde q1 a q2 para a2..., el estado qk es un estado
              o
      de aceptaci´n que indica que se ha encontrado la palabra clave
                  o
      a1a2...ak.




                                                                        13 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o



    • Existe una transici´n desde el estado inicial a q1 para a1, una
                         o
      transici´n desde q1 a q2 para a2..., el estado qk es un estado
              o
      de aceptaci´n que indica que se ha encontrado la palabra clave
                  o
      a1a2...ak.
    • Google.




                                                                        14 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o



    • Existe una transici´n desde el estado inicial a q1 para a1, una
                         o
      transici´n desde q1 a q2 para a2..., el estado qk es un estado
              o
      de aceptaci´n que indica que se ha encontrado la palabra clave
                  o
      a1a2...ak.
    • Google.
    • Amazon.




                                                                        15 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o



    • Existe una transici´n desde el estado inicial a q1 para a1, una
                         o
      transici´n desde q1 a q2 para a2..., el estado qk es un estado
              o
      de aceptaci´n que indica que se ha encontrado la palabra clave
                  o
      a1a2...ak.
    • Google.
    • Amazon.
    • AFND.




                                                                        16 / 18
B´squeda de Texto - Aut´matas Finitos No Deterministas
 u                     o



    • Existe una transici´n desde el estado inicial a q1 para a1, una
                         o
      transici´n desde q1 a q2 para a2..., el estado qk es un estado
              o
      de aceptaci´n que indica que se ha encontrado la palabra clave
                  o
      a1a2...ak.
    • Google.
    • Amazon.
    • AFND.
    • AFD.




                                                                        17 / 18
Bibliograf´
          ıa




  [1]   John E. Hopcroft, Rajeev Motwani y Jeffrey D. Ullman
        Teor´ de Aut´matas, lenguajes y computaci´n
            ıa       o                           o
        Pearson, 2008.




                                                              18 / 18

Capitulo 2: Aplicación Práctica de Autómatas Finitos

  • 1.
    Cap 2: Aplicaci´nPr´ctica o a Tutores: Luis Antonio Chamba Eras Edison Leonardo Coronel Romero Carrera de Ingenier´ en Sistemas ıa Universidad Nacional de Loja Octubre 2012 1 / 18
  • 2.
    B´squeda de Texto- Antecedentes u • Un problema habitual en la Web y otros repositorios de texto es el siguiente: 2 / 18
  • 3.
    B´squeda de Texto- Antecedentes u • Un problema habitual en la Web y otros repositorios de texto es el siguiente: • ”Dado un conjunto de palabras, determinar todos los documen- tos que contengan una de dicha palabras (o todas)”. 3 / 18
  • 4.
    B´squeda de Texto- Antecedentes u • Un problema habitual en la Web y otros repositorios de texto es el siguiente: • ”Dado un conjunto de palabras, determinar todos los documen- tos que contengan una de dicha palabras (o todas)”. • Un motor de b´squeda, utiliza una tecnolog´ concreta conocida u ıa como ”´ ındices invertidos”, en la que para cada palabra que aparece en la Web existen 100000000 de palabras diferentes, se almacena una lista de todos los lugares donde aparecen dicha palabra, servidores mantienen disponibles la informaci´n. o 4 / 18
  • 5.
    B´squeda de Texto- Antecedentes u • Un problema habitual en la Web y otros repositorios de texto es el siguiente: • ”Dado un conjunto de palabras, determinar todos los documen- tos que contengan una de dicha palabras (o todas)”. • Un motor de b´squeda, utiliza una tecnolog´ concreta conocida u ıa como ”´ ındices invertidos”, en la que para cada palabra que aparece en la Web existen 100000000 de palabras diferentes, se almacena una lista de todos los lugares donde aparecen dicha palabra, servidores mantienen disponibles la informaci´n. o • Las t´cnicas de ´ e ındices invertidos no emplean aut´matas finitos, o los agentes de b´squeda invierten mucho tiempo en el proceso. u 5 / 18
  • 6.
    B´squeda de Texto- Antecedentes u • Un problema habitual en la Web y otros repositorios de texto es el siguiente: • ”Dado un conjunto de palabras, determinar todos los documen- tos que contengan una de dicha palabras (o todas)”. • Un motor de b´squeda, utiliza una tecnolog´ concreta conocida u ıa como ”´ ındices invertidos”, en la que para cada palabra que aparece en la Web existen 100000000 de palabras diferentes, se almacena una lista de todos los lugares donde aparecen dicha palabra, servidores mantienen disponibles la informaci´n. o • Las t´cnicas de ´ e ındices invertidos no emplean aut´matas finitos, o los agentes de b´squeda invierten mucho tiempo en el proceso. u • Existen t´cnicas de b´squeda que utilizan aut´matas, para ello e u o se necesita cumplir las siguientes caracter´ ısticas: 6 / 18
  • 7.
    B´squeda de Texto- Antecedentes u • El repositorio cambia r´pidamente:noticias al d´ rastreadores a ıa, Web. 7 / 18
  • 8.
    B´squeda de Texto- Antecedentes u • El repositorio cambia r´pidamente:noticias al d´ rastreadores a ıa, Web. • Documentos no clasificados, p´ginas sobre la marcha en res- a puesta a consultas. 8 / 18
  • 9.
    B´squeda de Texto- Antecedentes u • El repositorio cambia r´pidamente:noticias al d´ rastreadores a ıa, Web. • Documentos no clasificados, p´ginas sobre la marcha en res- a puesta a consultas. 9 / 18
  • 10.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Conjunto de palabras denominadas ”palabras clave ”, deseamos encontrar las apariciones de cualquiera de estas palabras, lo m´s a util es dise˜ar un AFND que indique mediante un estado de ´ n aceptaci´n que se ha encontrado una de las ”palabras clave”, o el texto de un documento se introduce car´cter por car´cter en a a el AFND que permitir´ reconocer las apariciones de las palabras a claves en el texto. 10 / 18
  • 11.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Conjunto de palabras denominadas ”palabras clave ”, deseamos encontrar las apariciones de cualquiera de estas palabras, lo m´s a util es dise˜ar un AFND que indique mediante un estado de ´ n aceptaci´n que se ha encontrado una de las ”palabras clave”, o el texto de un documento se introduce car´cter por car´cter en a a el AFND que permitir´ reconocer las apariciones de las palabras a claves en el texto. • Estado inicial con una transici´n a s´ mismo para cada uno de los o ı s´ ımbolos de entrada, por ejemplo el alfabeto ASCII, ´ste estado e inicial representa una conjetura de que no se ha detectado una palabra clave, incluso aunque hayamos encontrado algunas de las letras de una de esas palabras. 11 / 18
  • 12.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Conjunto de palabras denominadas ”palabras clave ”, deseamos encontrar las apariciones de cualquiera de estas palabras, lo m´s a util es dise˜ar un AFND que indique mediante un estado de ´ n aceptaci´n que se ha encontrado una de las ”palabras clave”, o el texto de un documento se introduce car´cter por car´cter en a a el AFND que permitir´ reconocer las apariciones de las palabras a claves en el texto. • Estado inicial con una transici´n a s´ mismo para cada uno de los o ı s´ ımbolos de entrada, por ejemplo el alfabeto ASCII, ´ste estado e inicial representa una conjetura de que no se ha detectado una palabra clave, incluso aunque hayamos encontrado algunas de las letras de una de esas palabras. • Para cada palabra a1a2...ak hay k estados, q1,q2,...,qk. 12 / 18
  • 13.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Existe una transici´n desde el estado inicial a q1 para a1, una o transici´n desde q1 a q2 para a2..., el estado qk es un estado o de aceptaci´n que indica que se ha encontrado la palabra clave o a1a2...ak. 13 / 18
  • 14.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Existe una transici´n desde el estado inicial a q1 para a1, una o transici´n desde q1 a q2 para a2..., el estado qk es un estado o de aceptaci´n que indica que se ha encontrado la palabra clave o a1a2...ak. • Google. 14 / 18
  • 15.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Existe una transici´n desde el estado inicial a q1 para a1, una o transici´n desde q1 a q2 para a2..., el estado qk es un estado o de aceptaci´n que indica que se ha encontrado la palabra clave o a1a2...ak. • Google. • Amazon. 15 / 18
  • 16.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Existe una transici´n desde el estado inicial a q1 para a1, una o transici´n desde q1 a q2 para a2..., el estado qk es un estado o de aceptaci´n que indica que se ha encontrado la palabra clave o a1a2...ak. • Google. • Amazon. • AFND. 16 / 18
  • 17.
    B´squeda de Texto- Aut´matas Finitos No Deterministas u o • Existe una transici´n desde el estado inicial a q1 para a1, una o transici´n desde q1 a q2 para a2..., el estado qk es un estado o de aceptaci´n que indica que se ha encontrado la palabra clave o a1a2...ak. • Google. • Amazon. • AFND. • AFD. 17 / 18
  • 18.
    Bibliograf´ ıa [1] John E. Hopcroft, Rajeev Motwani y Jeffrey D. Ullman Teor´ de Aut´matas, lenguajes y computaci´n ıa o o Pearson, 2008. 18 / 18