4. Hay muchos estudios previos de la minería en patrones secuenciales de manera eficiente. La mayoría enfocados al principio A priori que se basa en el método de generación y reducción; la primera exploración trata de encontrar todos las frecuencias, como una secuencia que es ensamblada para generar la segunda secuencia de candidatos. Aquellos candidatos que no cumplan el soporte mínimo se reducirán en el proceso; esto se repetirá hasta que no se generen más candidatos.请加入标题
5.
6. Genera un conjunto enorme de candidatos de una secuencia de base de datos.
7. Poca eficiencia del tiempo debido a múltiples exploraciones de la secuencia base de datos.
8. Con el algoritmo que se desarrollara en este trabajo se busca terminar con los problemas generados con otros métodos.请加入标题
9. OBJETIVOS El Algoritmo Ágil tiene como objetivos reducir los tiempos de exploración, reducir el espacio de búsqueda y el mínimo requisito de la memoria para buscar secuencias frecuentes, y también obtener el máximo número de secuencias frecuentes en la ejecución a través de un algoritmo basado en la estructura de látice.
10.
11.
12.
13. En el primer pase todos los ítems simples (1-secuencias) son contados para encontrar cuales son frecuentes. A partir de los ítems frecuentes, un conjunto de 2-secuencias candidatas es formado y su soporte es contado en el otro pase por la base de datos y este proceso es repetido hasta que no se encuentren nuevas secuencias frecuentes.
14. El algoritmo GSP presenta como desventaja la gran cantidad de secuencias candidatas que genera, unido a los múltiples pases que necesita realizar por la base de datos, lo cual resulta ineficiente para la minería de largos patrones secuenciales.请加入标题
15.
16. Usa una lista de identificadores con formato vertical, sobre esta lista pueden ser enumeradas todas las secuencias frecuentes mediante simples uniones temporales. Utiliza un enfoque de látice, para descomponer el espacio de búsqueda original en clases pequeñas.
17. SPADE se base en listas que contienen información sobre la localización de los patrones en las secuencias y las repeticiones consecutivas conllevan a un desfavorable crecimiento del tamaño de estas litas de ocurrencia y por lo tanto aumenta el tiempo total de extracción.请加入标题
20. La ventaja de PrefixSpan es el uso de bases de datos proyectadas, para así lograr bases de datos mucho más pequeños en el próximo nivel, que el algoritmo pueda procesar con mayor rapidez, pero la construcción de bases de datos proyectadas es de mayor costo, en cuanto a tiempo y espacio, de este algoritmo.请加入标题