El documento describe las fases y tareas del proceso CRISP-DM para minería de datos. Estas incluyen la comprensión del negocio y los objetivos, la comprensión y preparación de los datos, el modelado, la evaluación de resultados y la implantación de los modelos en el negocio. El proceso itera a través de estas fases para lograr los objetivos del proyecto de minería de datos.
El documento describe las fases y tareas del proceso CRISP-DM para minería de datos. Estas incluyen la comprensión del negocio y los datos, la preparación de datos, el modelado, la evaluación y el despliegue de los resultados. Cada fase consiste en varias tareas genéricas como la limpieza, transformación y selección de datos para su análisis. El objetivo es extraer conocimiento de los datos que ayude a alcanzar los objetivos de negocio.
Este documento describe una estrategia genérica, aplicable a cualquier plataforma para la implementación y administración de DataWarehouse, cuyo principal objetivo es lograr el éxito, sustentabilidad y adaptabilidad del proyecto tanto a corto como largo plazo. La estrategia está enfocada principalmente en proyectos complejos, sin embargo puede emplearse en proyectos de cualquier envergadura.
Para asegurar el éxito de la solución, esta estrategia considera experiencias y elementos que en diversos proyectos han sido factores de fracaso o estanco, principalmente los relacionados a satisfacer nuevos requerimientos de los usuarios finales, en términos de calidad y confiabilidad de la información, agilidad en la adaptación a los cambios, facilidad en la creación de informes y cuadros de mando, rapidez en los tiempos de respuesta de las consultas y costo de la administración de la infraestructura, entre otros.
Finalmente, esta estrategia desarrolla conceptos claves, tales como la adaptación a los cambios, administración de procesos (Jobs), control de errores y mallas de procesos, elementos que son centrales en la estrategia EIAD y que han sido olvidados en la mayoría de la literatura relacionada a DataWarehouse, centradas principalmente en metodologías de administración de proyectos, creación de cubos y/o algunos procesos de carga.
Este documento discute el modelado de datos en un entorno de data warehouse. Explica las estructuras de datos, los modelos estrella y de copo de nieve, y las tres fases del diseño: modelo de negocios, modelo dimensional y modelo físico. También cubre temas como particionamiento, indexado y optimización de consultas.
Analisis Y DiseñO De Sistemas De Informacionguestf49df7
El documento describe los pasos iniciales para iniciar un proyecto de análisis y diseño de sistemas de información. Explica que un proyecto busca resolver un problema u oportunidad y puede surgir de gerentes, ejecutivos u otros grupos. Luego, detalla las etapas de factibilidad, planeación, control de actividades y pasos iniciales como la recolección de datos y el análisis de la información para desarrollar un modelo del sistema.
El documento presenta una agenda para una sesión sobre los fundamentos de un data warehouse. La sesión incluye introducciones, una discusión sobre los conocimientos y expectativas de los asistentes, y presentaciones sobre los fundamentos de un DWH como su arquitectura, modelado de datos, esquemas en estrella, procesos de carga y herramientas de integración y reporting.
El documento describe los conceptos fundamentales de Business Intelligence (BI). BI se enfoca en crear inteligencia a partir de los datos operativos de un negocio para facilitar la toma de decisiones. Una solución de BI integra y analiza datos de múltiples fuentes para generar informes y análisis que ayuden a los usuarios a comprender el negocio.
Este documento introduce el tema de la optimización y sus motivos de estudio. Explica que la optimización busca optimizar índices que miden el desempeño de sistemas a través de variables algebraicas, con el objetivo de maximizar ganancias o beneficios, o minimizar costos o pérdidas. También describe los supuestos básicos de la programación lineal, como herramienta importante de la optimización, y provee ejemplos de su formulación y aplicación.
Este documento describe la inteligencia de negocios y cómo puede usarse para resolver problemas comerciales. Explica el proceso de extracción, transformación y carga de datos, la creación de un almacén de datos, y el análisis de datos a través de consultas, OLAP, y minería de datos. También proporciona ejemplos de cómo se ha aplicado la inteligencia de negocios en áreas como el gobierno, la investigación espacial y los clubes deportivos.
El documento describe las fases y tareas del proceso CRISP-DM para minería de datos. Estas incluyen la comprensión del negocio y los datos, la preparación de datos, el modelado, la evaluación y el despliegue de los resultados. Cada fase consiste en varias tareas genéricas como la limpieza, transformación y selección de datos para su análisis. El objetivo es extraer conocimiento de los datos que ayude a alcanzar los objetivos de negocio.
Este documento describe una estrategia genérica, aplicable a cualquier plataforma para la implementación y administración de DataWarehouse, cuyo principal objetivo es lograr el éxito, sustentabilidad y adaptabilidad del proyecto tanto a corto como largo plazo. La estrategia está enfocada principalmente en proyectos complejos, sin embargo puede emplearse en proyectos de cualquier envergadura.
Para asegurar el éxito de la solución, esta estrategia considera experiencias y elementos que en diversos proyectos han sido factores de fracaso o estanco, principalmente los relacionados a satisfacer nuevos requerimientos de los usuarios finales, en términos de calidad y confiabilidad de la información, agilidad en la adaptación a los cambios, facilidad en la creación de informes y cuadros de mando, rapidez en los tiempos de respuesta de las consultas y costo de la administración de la infraestructura, entre otros.
Finalmente, esta estrategia desarrolla conceptos claves, tales como la adaptación a los cambios, administración de procesos (Jobs), control de errores y mallas de procesos, elementos que son centrales en la estrategia EIAD y que han sido olvidados en la mayoría de la literatura relacionada a DataWarehouse, centradas principalmente en metodologías de administración de proyectos, creación de cubos y/o algunos procesos de carga.
Este documento discute el modelado de datos en un entorno de data warehouse. Explica las estructuras de datos, los modelos estrella y de copo de nieve, y las tres fases del diseño: modelo de negocios, modelo dimensional y modelo físico. También cubre temas como particionamiento, indexado y optimización de consultas.
Analisis Y DiseñO De Sistemas De Informacionguestf49df7
El documento describe los pasos iniciales para iniciar un proyecto de análisis y diseño de sistemas de información. Explica que un proyecto busca resolver un problema u oportunidad y puede surgir de gerentes, ejecutivos u otros grupos. Luego, detalla las etapas de factibilidad, planeación, control de actividades y pasos iniciales como la recolección de datos y el análisis de la información para desarrollar un modelo del sistema.
El documento presenta una agenda para una sesión sobre los fundamentos de un data warehouse. La sesión incluye introducciones, una discusión sobre los conocimientos y expectativas de los asistentes, y presentaciones sobre los fundamentos de un DWH como su arquitectura, modelado de datos, esquemas en estrella, procesos de carga y herramientas de integración y reporting.
El documento describe los conceptos fundamentales de Business Intelligence (BI). BI se enfoca en crear inteligencia a partir de los datos operativos de un negocio para facilitar la toma de decisiones. Una solución de BI integra y analiza datos de múltiples fuentes para generar informes y análisis que ayuden a los usuarios a comprender el negocio.
Este documento introduce el tema de la optimización y sus motivos de estudio. Explica que la optimización busca optimizar índices que miden el desempeño de sistemas a través de variables algebraicas, con el objetivo de maximizar ganancias o beneficios, o minimizar costos o pérdidas. También describe los supuestos básicos de la programación lineal, como herramienta importante de la optimización, y provee ejemplos de su formulación y aplicación.
Este documento describe la inteligencia de negocios y cómo puede usarse para resolver problemas comerciales. Explica el proceso de extracción, transformación y carga de datos, la creación de un almacén de datos, y el análisis de datos a través de consultas, OLAP, y minería de datos. También proporciona ejemplos de cómo se ha aplicado la inteligencia de negocios en áreas como el gobierno, la investigación espacial y los clubes deportivos.
O documento discute o aquecimento global e seus impactos ambientais. Apresenta dados sobre as emissões de gases do efeito estufa pela humanidade e seus principais causadores, como o uso de combustíveis fósseis. Também mostra que as mudanças climáticas já observadas incluem aumento das temperaturas globais e níveis do mar, ameaçando ecossistemas como a Amazônia e regiões costeiras.
El documento resume los orígenes del Carnaval, explicando que proviene de una mezcla de varias fiestas romanas antiguas como las Lupercales, las Bacanales y las Saturnales. Las Lupercales se celebraban el 15 de febrero en honor a Rómulo y Remo y consistían en sacrificios y azotes purificadores. Las Bacanales honraban a Baco con fiestas de la vendimia que dieron origen al teatro. Y las Saturnales eran fiestas relacionadas con las cosechas donde los roles sociales se invertían.
Este documento describe los factores que determinan la infiltración del agua, incluyendo el clima, la permeabilidad del suelo, la pendiente y la vegetación. Explica que el agua infiltrada circula a través de las rocas porosas subterráneas llamadas acuíferos hasta alcanzar la zona saturada impermeable. Las aguas subterráneas se desplazan lentamente a través de los acuíferos y salen a la superficie en fuentes y lagunas, y pueden extraerse mediante pozos perforados
Mary Leakey descubrió en la década de 1970 huellas de pisadas de homínidos de hace 3.6 millones de años en cenizas volcánicas en Laetoli, Tanzania. Estas son las huellas más antiguas de homínidos y pertenecen a tres individuos que caminaban erguidos, marcando uno de los primeros pasos hacia el bipedismo humano. El documento conmemora el 100 aniversario del nacimiento de Mary Leakey y su importante descubrimiento que arrojó luz sobre la evolución temprana de
Apresentação dos alunos vencedores do Senai SP da Olimpíada do Conhecimento. Saiba mais em: http://bit.ly/9EqQHO
Confira também as fotos: http://bit.ly/ai14qh
14.02.09. Lanzamiento operación niños de navidadFundación Cognos
El documento describe las actividades de un plan de desarrollo barrial que incluyen reuniones de seguimiento, una tarde de juegos para jóvenes y niños, y la entrega de regalos de un programa llamado Christmas Child en febrero de 2014.
A Estanislao Training & Solution oferece soluções analíticas em 4 etapas: formação analítica, consultoria, desenvolvimento comportamental e de conhecimento, e desenvolvimento de rede. Eles fornecem treinamentos, consultoria, gestão estratégica, compartilhamento de conhecimento e eventos de rede para ajudar profissionais que trabalham com métodos estatísticos.
El mar se mueve debido a las olas, mareas y corrientes. El mar actúa como un agente de transporte y puede producir residuos en la costa como resultado de la erosión o depósitos, incluyendo arcos naturales, islotes costeros, barras, flechas, tómbolos y albuferas.
O documento descreve os diferenciais e casos de sucesso da empresa Mobint. Os principais diferenciais são a excelência na experiência do usuário, agilidade, versatilidade e experiência no mercado editorial. Vários casos de sucesso são apresentados envolvendo grandes empresas em diferentes setores.
AGENDA DE TEMAS, PROBLEMÁTICAS, POLOS Y PERITOSvirgastaldi
Este documento presenta una agenda de temas, problemáticas, polos y peritos para abordar en un pueblo. La agenda incluye categorías desde A hasta Z que cubren diversas áreas como autoridades, bibliotecas, demografía, ecología, economía, educación, familias, historia, religión, salud, seguridad, transporte y más. El documento también propone realizar trabajo de campo con instrumentos breves para consultar a la ciudadanía sobre estos temas.
Este documento describe el modelo CRISP-DM (Cross Industry Standard Process for Data Mining), uno de los modelos más utilizados para el desarrollo de proyectos de minería de datos. CRISP-DM consta de 6 fases: comprensión del negocio, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. El documento explica cada una de estas fases y las tareas involucradas en ellas.
El documento presenta una sesión sobre métodos para el análisis de datos. Explica la metodología CRISP-DM, que incluye fases como el entendimiento del negocio y los datos, la preparación de datos, el modelado, la evaluación y el desarrollo. La metodología provee un enfoque estructurado para proyectos de análisis de datos mediante la descripción de tareas clave en cada fase y cómo se relacionan.
O documento discute o aquecimento global e seus impactos ambientais. Apresenta dados sobre as emissões de gases do efeito estufa pela humanidade e seus principais causadores, como o uso de combustíveis fósseis. Também mostra que as mudanças climáticas já observadas incluem aumento das temperaturas globais e níveis do mar, ameaçando ecossistemas como a Amazônia e regiões costeiras.
El documento resume los orígenes del Carnaval, explicando que proviene de una mezcla de varias fiestas romanas antiguas como las Lupercales, las Bacanales y las Saturnales. Las Lupercales se celebraban el 15 de febrero en honor a Rómulo y Remo y consistían en sacrificios y azotes purificadores. Las Bacanales honraban a Baco con fiestas de la vendimia que dieron origen al teatro. Y las Saturnales eran fiestas relacionadas con las cosechas donde los roles sociales se invertían.
Este documento describe los factores que determinan la infiltración del agua, incluyendo el clima, la permeabilidad del suelo, la pendiente y la vegetación. Explica que el agua infiltrada circula a través de las rocas porosas subterráneas llamadas acuíferos hasta alcanzar la zona saturada impermeable. Las aguas subterráneas se desplazan lentamente a través de los acuíferos y salen a la superficie en fuentes y lagunas, y pueden extraerse mediante pozos perforados
Mary Leakey descubrió en la década de 1970 huellas de pisadas de homínidos de hace 3.6 millones de años en cenizas volcánicas en Laetoli, Tanzania. Estas son las huellas más antiguas de homínidos y pertenecen a tres individuos que caminaban erguidos, marcando uno de los primeros pasos hacia el bipedismo humano. El documento conmemora el 100 aniversario del nacimiento de Mary Leakey y su importante descubrimiento que arrojó luz sobre la evolución temprana de
Apresentação dos alunos vencedores do Senai SP da Olimpíada do Conhecimento. Saiba mais em: http://bit.ly/9EqQHO
Confira também as fotos: http://bit.ly/ai14qh
14.02.09. Lanzamiento operación niños de navidadFundación Cognos
El documento describe las actividades de un plan de desarrollo barrial que incluyen reuniones de seguimiento, una tarde de juegos para jóvenes y niños, y la entrega de regalos de un programa llamado Christmas Child en febrero de 2014.
A Estanislao Training & Solution oferece soluções analíticas em 4 etapas: formação analítica, consultoria, desenvolvimento comportamental e de conhecimento, e desenvolvimento de rede. Eles fornecem treinamentos, consultoria, gestão estratégica, compartilhamento de conhecimento e eventos de rede para ajudar profissionais que trabalham com métodos estatísticos.
El mar se mueve debido a las olas, mareas y corrientes. El mar actúa como un agente de transporte y puede producir residuos en la costa como resultado de la erosión o depósitos, incluyendo arcos naturales, islotes costeros, barras, flechas, tómbolos y albuferas.
O documento descreve os diferenciais e casos de sucesso da empresa Mobint. Os principais diferenciais são a excelência na experiência do usuário, agilidade, versatilidade e experiência no mercado editorial. Vários casos de sucesso são apresentados envolvendo grandes empresas em diferentes setores.
AGENDA DE TEMAS, PROBLEMÁTICAS, POLOS Y PERITOSvirgastaldi
Este documento presenta una agenda de temas, problemáticas, polos y peritos para abordar en un pueblo. La agenda incluye categorías desde A hasta Z que cubren diversas áreas como autoridades, bibliotecas, demografía, ecología, economía, educación, familias, historia, religión, salud, seguridad, transporte y más. El documento también propone realizar trabajo de campo con instrumentos breves para consultar a la ciudadanía sobre estos temas.
Este documento describe el modelo CRISP-DM (Cross Industry Standard Process for Data Mining), uno de los modelos más utilizados para el desarrollo de proyectos de minería de datos. CRISP-DM consta de 6 fases: comprensión del negocio, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. El documento explica cada una de estas fases y las tareas involucradas en ellas.
El documento presenta una sesión sobre métodos para el análisis de datos. Explica la metodología CRISP-DM, que incluye fases como el entendimiento del negocio y los datos, la preparación de datos, el modelado, la evaluación y el desarrollo. La metodología provee un enfoque estructurado para proyectos de análisis de datos mediante la descripción de tareas clave en cada fase y cómo se relacionan.
La metodología CRISP-DM (CRoss-Industry Standard Process for Data Mining) fue creada en 1996 por tres líderes de la industria para proporcionar un proceso estándar para proyectos de minería de datos. CRISP-DM describe el ciclo de vida de un proyecto de minería de datos a través de seis fases principales: comprensión del negocio, comprensión de los datos, preparación de datos, modelado, evaluación y despliegue. La metodología ha sido adoptada por muchas organizaciones y proporcion
Este documento describe los pasos clave en el proceso de comprensión del negocio y preparación de datos para un proyecto de minería de datos. Primero, se deben determinar los objetivos de negocio y de minería de datos. Luego, se evalúa la situación actual, se inventarian los recursos disponibles y se exploran los datos. Finalmente, los datos se seleccionan, limpian y transforman para cumplir con los objetivos del proyecto y las necesidades del modelo. El objetivo general es comprender el negocio y preparar los datos de manera que
El documento presenta una metodología de implementación de soluciones de Business Intelligence (BI) que sigue estándares mundiales pero adaptados al contexto local. La metodología incluye etapas de planificación, análisis de requerimientos, modelado de datos, extracción inicial de datos y actualización periódica. Cada etapa contiene actividades específicas como identificar áreas de oportunidad, diseñar diagramas funcionales con variables y métricas, y desarrollar procesos de carga de datos iniciales y periódicos.
Em bi un repaso por la metodología de implementaciónEdison_Medina
Este documento presenta una metodología probada para la implementación exitosa de proyectos de Business Intelligence. La metodología incluye etapas clave como la planificación, el análisis de requerimientos, el modelado de datos, la carga inicial y periódica de datos, y la explotación de datos. Cada etapa contiene actividades específicas como la identificación de áreas de oportunidad, la selección de tecnología, reuniones con usuarios para definir variables y métricas clave, y la creación de prototipos
El documento describe los conceptos de Data Warehouse, Datamart y Cuadro de Mando Integral. Un Data Warehouse almacena datos integrados de múltiples fuentes para su análisis. Un Datamart es un tipo específico de Data Warehouse que almacena datos de un área particular de la empresa. Un Cuadro de Mando Integral utiliza indicadores financieros y no financieros para medir el progreso de la estrategia de una empresa según perspectivas como la financiera, clientes, procesos internos y aprendizaje/crecimiento.
Este documento describe los conceptos básicos de minería de datos, incluyendo los seis pasos del proceso de minería de datos: 1) definir el problema, 2) preparar los datos, 3) explorar los datos, 4) generar modelos, 5) explorar y validar los modelos, y 6) implementar y actualizar los modelos. Explica cada paso del proceso y las herramientas de SQL Server que se pueden usar para completar cada uno.
El documento trata sobre herramientas para el análisis de negocios como la minería y modelado de datos. Explica que la minería de datos es el proceso de analizar grandes cantidades de datos para descubrir patrones y relaciones útiles. También describe los elementos clave de la minería de datos como la preparación de datos, técnicas de modelado y la implementación de los modelos. Por otro lado, explica que el modelado de datos crea representaciones de las entidades y relaciones de datos de un negocio.
El documento describe los conceptos clave de minería de datos e incluye las siguientes secciones: (1) definición de minería de datos, (2) proceso de minería de datos, (3) características principales, (4) aplicaciones, (5) extracción de conocimiento en bases de datos (KDD), (6) técnicas como clasificación, agrupamiento, asociación, y (7) herramientas de software como Weka.
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...Metriplica
Este documento introduce el concepto de un Modelo de Datos como una hoja de cálculo que sirve como guía para controlar y registrar la calidad de los datos recolectados mediante herramientas de análisis digital. Explica que el Modelo de Datos permite tener un registro centralizado de la configuración y mediciones, haciendo la implementación y mantenimiento más transparente. Además, describe las características clave de un Modelo de Datos efectivo y proporciona ejemplos de cómo completar las hojas para Pageviews, Eventos, Dimensiones y Mé
Este documento presenta una introducción al concepto de Inteligencia de Negocios y Software de Gestión. Explica el proceso de Data Mining, incluyendo definiciones, herramientas, técnicas, ventajas y aplicaciones. Describe las etapas del proceso de Data Mining, que incluyen determinar objetivos, analizar datos, transformar datos, analizar resultados e interpretarlos. El documento concluye que el Data Mining puede ayudar a las organizaciones a desarrollar estrategias mediante el análisis de grandes cantidades de datos para obtener
El documento habla sobre data warehousing y business intelligence. Explica que el data warehousing permite almacenar y resumir datos transaccionales para facilitar el análisis gerencial. Describe los componentes clave como las fuentes de datos, herramientas ETL para limpieza y carga de datos, y herramientas de análisis como OLAP y data mining. También cubre temas como el modelado dimensional, métricas, dimensiones y jerarquías.
La inteligencia de negocios (BI) implica el análisis de datos de una organización para apoyar la toma de decisiones. BI incluye herramientas para el acceso a información, análisis de datos y presentación de informes. La minería de datos es una técnica de BI que se utiliza para encontrar patrones y relaciones ocultas en grandes conjuntos de datos que pueden usarse para predecir resultados.
La inteligencia de negocios (BI) implica el análisis de datos de una organización para obtener conocimientos útiles. BI incluye herramientas para el acceso a la información, el apoyo a la toma de decisiones y la orientación al usuario final. La minería de datos es una herramienta de BI que se utiliza para encontrar patrones ocultos en los datos que pueden usarse para predecir resultados futuros u obtener otros conocimientos.
El documento habla sobre los conceptos de inteligencia de negocios, data warehouse y data marts. Explica que un data warehouse es una estructura de datos diseñada para consultas analíticas que integra datos históricos de varios sistemas operativos. Los data marts son repositorios de datos enfocados en una temática específica. También compara las metodologías de Kimball y Inmon para el desarrollo de data warehouses, señalando que Kimball se enfoca en modelos estrella y copo de nieve basados en hechos y dimensiones.
Trabajo grupal flavio cosme eldin juniorJunior Diaz
Este documento describe las etapas del ciclo de vida de una aplicación de bases de datos, incluyendo la planificación del proyecto, definición del sistema, recolección de requisitos, diseño de la base de datos, selección del software de gestión de bases de datos, diseño de la aplicación, prototipado, implementación, conversión de datos, pruebas y mantenimiento. También discute el diseño de transacciones y interfaces de usuario.
Trabajo grupal flavio cosme eldin juniorJunior Diaz
Este documento describe las etapas del ciclo de vida de una aplicación de bases de datos, incluyendo la planificación del proyecto, definición del sistema, recolección de requisitos, diseño de la base de datos, selección del software de gestión de bases de datos, diseño de la aplicación, prototipado, implementación, prueba y mantenimiento. También discute el diseño de transacciones y de interfaces de usuario.
Este documento describe las fases para la creación de una base de datos, incluyendo el análisis de requisitos, diseño conceptual, diseño lógico y diseño físico. Explica que el diseño conceptual crea un esquema conceptual independiente del software gestor, mientras que el diseño lógico se ajusta al modelo del SGBD específico. El diseño físico traduce el diseño lógico en una solución implementable.
En la ciudad de Pasto, estamos revolucionando el acceso a microcréditos y la formalización de microempresarios informales con nuestra aplicación CrediAvanza. Nuestro objetivo es empoderar a los emprendedores locales proporcionándoles una plataforma integral que facilite el acceso a servicios financieros y asesoría profesional.
ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...JAVIER SOLIS NOYOLA
El Mtro. JAVIER SOLIS NOYOLA crea y desarrolla el “DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARIS”. Esta actividad de aprendizaje propone el reto de descubrir el la secuencia números para abrir un candado, el cual destaca la percepción geométrica y conceptual. La intención de esta actividad de aprendizaje lúdico es, promover los pensamientos lógico (convergente) y creativo (divergente o lateral), mediante modelos mentales de: atención, memoria, imaginación, percepción (Geométrica y conceptual), perspicacia, inferencia y viso-espacialidad. Didácticamente, ésta actividad de aprendizaje es transversal, y que integra áreas del conocimiento: matemático, Lenguaje, artístico y las neurociencias. Acertijo dedicado a los Juegos Olímpicos de París 2024.
Ofrecemos herramientas y metodologías para que las personas con ideas de negocio desarrollen un prototipo que pueda ser probado en un entorno real.
Cada miembro puede crear su perfil de acuerdo a sus intereses, habilidades y así montar sus proyectos de ideas de negocio, para recibir mentorías .
José Luis Jiménez Rodríguez
Junio 2024.
“La pedagogía es la metodología de la educación. Constituye una problemática de medios y fines, y en esa problemática estudia las situaciones educativas, las selecciona y luego organiza y asegura su explotación situacional”. Louis Not. 1993.
1. Diapositiva 1 <br />DaimlerChrysler (entonces Daimler-Benz) estaba ya delante de la mayoría de las organizaciones industriales y comerciales en la aplicación de la minería de datos en sus operaciones de negocios. <br />SPSS (entonces ISL) había estado proporcionando servicios basados en Minería de datos desde 1990 y había lanzado la primer herramienta de trabajo comercial de Minería de Datos Clementine en 1994. <br />NCR, como parte de su objetivo para entregar valor adicional a su Teradata ® Almacén de datos (data warehouse), habían establecido los equipos consultores de minería de datos y especialistas de tecnología para atender las exigencias de sus clientes.<br />Diapositiva 4<br />En el nivel superior, el proceso de minería de datos es organizado en un número de fases; cada fase consiste de varias tareas genéricas de segundo nivel. <br />Este segundo nivel lo llaman genérico porque esta destinado a ser bastante general para cubrir todas las situaciones posibles de minería de datos. Las tareas genéricas están destinadas a ser tan completas y estables como sea posible. Completo significa que cubre tanto al proceso entero de minería de datos y todas las aplicaciones de minería de datos posibles. Estable significa que el modelo debería ser válido para acontecimientos normales y aún para desarrollos imprevistos como técnicas de modelado nuevo.<br />El tercer nivel, el nivel de tarea especializado, es el lugar para describir como las acciones en las tareas genéricas deberían ser realizadas en ciertas situaciones específicas. Por ejemplo, en el segundo nivel podría haber una tarea genérica llamada limpieza de datos. El tercer nivel describe como esta tarea se diferencia en situaciones diferentes, como la limpieza de valores numéricos contra la limpieza de valores categóricos, o si el tipo de problema es agrupamiento o el modelado predictivo.<br />La descripción de fases y tareas como pasos discretos realizados en un orden específico representa una secuencia idealizada de eventos.<br />En la práctica, muchas de las tareas pueden ser realizadas en una orden diferente, y esto a menudo será necesario volver a hacer tareas anteriores repetidamente y repetir ciertas acciones. Nuestro modelo de proceso no intenta capturar todas estas posibles rutas del proceso de la minería de datos porque esto requeriría un modelo de proceso demasiado complejo.<br />El cuarto nivel, la instancia de proceso, es un registro de las acciones, decisiones, y de los resultados de una minería de datos real contratada.<br />Diapositiva 5<br />Comprensión del negocio<br />Esta fase inicial se enfoca en la comprensión de los objetivos de proyecto y exigencias desde una perspectiva de negocio, luego convirtiendo este conocimiento de los datos en la definición de un problema de minería de datos y en un plan preliminar diseñado para alcanzar los objetivos.<br />Comprensión de los datos<br />La fase de entendimiento de datos comienza con la colección de datos inicial y continua con las actividades que le permiten familiarizar primero con los datos, identificar los problemas de calidad de datos, descubrir los primeros conocimientos en los datos, y/o descubrir subconjuntos interesantes para formar hipótesis en cuanto a la información oculta.<br />Preparación de datos<br />La fase de preparación de datos cubre todas las actividades necesarias para construir el conjunto de datos final [los datos que serán provistos en las herramientas de modelado] de los datos en brutos iniciales. Las tareas de preparación de datos probablemente van a ser realizadas muchas veces y no en cualquier orden prescripto. Las tareas incluyen la selección de tablas, registros, y atributos, así como la transformación y la limpieza de datos para las herramientas que modelan.<br />Modelado<br />En esta fase de CRISP-DM, se seleccionan las técnicas de modelado más apropiadas para el<br />proyecto de Data Mining específico. Las técnicas a utilizar en esta fase se eligen en función de<br />los siguientes criterios:<br />o Ser apropiada al problema.<br />o Disponer de datos adecuados.<br />o Cumplir los requisitos del problema.<br />o Tiempo adecuado para obtener un modelo.<br />o Conocimiento de la técnica.<br />Evaluación<br />En esta etapa en el proyecto, usted ha construido un modelo (o modelos) que parece tener la alta calidad de una perspectiva de análisis de datos.<br />Antes del proceder al despliegue final del modelo, es importante evaluar a fondo ello y la revisión de los pasos ejecutados para crearlo, para comparar el modelo correctamente obtenido con los objetivos de negocio. Un objetivo clave es determinar si hay alguna cuestión importante de negocio que no ha sido suficientemente considerada. En el final de esta fase, una decisión en el uso de los resultados de minería de datos debería ser obtenida.<br />Desarrollo<br />La creación del modelo no es generalmente el final del proyecto. Incluso si el objetivo del modelo es de aumentar el conocimiento de los datos, el conocimiento ganado tendrá que ser organizado y presentado en el modo en el que el cliente pueda usarlo. Ello a menudo implica la aplicación de modelos quot;
vivosquot;
dentro de un proceso de toma de decisiones de una organización, por ejemplo, en tiempo real la personalización de página Web o la repetida obtención de bases de datos de mercadeo. Dependiendo de los requerimientos, la fase de desarrollo puede ser tan simple como la generación de un informe o tan compleja como la realización repetida de un proceso cruzado de minería de datos a través de la empresa. En muchos casos, es el cliente, no el analista de datos, quien lleva el paso de desarrollo. Sin embargo, incluso si el analista realizara el esfuerzo de despliegue, esto es importante para el cliente para entender de frente que acciones necesita para ser ejecutadas en orden para hacer uso de los modelos creados actualmente.<br />Diapositiva 6 comprension del negocio <br />Determinación de objetivos de negocio<br />El primer objetivo del analista de datos para un contexto es entender, desde una perspectiva de negocio, lo que el cliente realmente quiere lograr. A menudo el cliente tiene muchos objetivos que compiten y restricciones que deben ser correctamente equilibrados. El objetivo del analista debe mostrar (destapar) factores importantes, en el principio, esto puede influir en el resultado del proyecto. Una consecuencia posible de la negligencia de este paso es gastar un gran esfuerzo produciendo respuestas correctas a preguntas incorrectas o erradas.<br />Evaluación de la situación<br />Esta tarea implica la investigación más detallada sobre todos los recursos, restricciones, presunciones, y otros factores que deberían ser considerados en la determinación del objetivo de análisis de datos y el plan de proyecto. En la tarea anterior, su objetivo es para ponerse rápidamente al quid de la situación. Aquí, usted quiere ampliarse sobre los detalles.<br />Determinación de los objetivos de la minería de datos<br />Un objetivo de negocio declara objetivos en la terminología de negocio. Un objetivo de minería de datos declara objetivos de proyecto en términos técnicos. Por ejemplo, el objetivo de negocio podría ser “Aumentar catálogos de ventas a clientes existentes.” Un objetivo de minería de datos podrían ser “Predecir cuantas baratijas un cliente comprará, obteniendo datos de sus compras de tres años pasados, información demográfica (edad, sueldo, ciudad, etc.), y el precio del artículo.<br />Producir el plan del proyecto<br />Describir el plan intencionado para alcanzar los objetivos de minería de datos y así alcanzar los objetivos de negocio.<br />El plan debería especificar los pasos para ser realizados durante el resto del proyecto, incluyendo la selección inicial de herramientas y técnicas.<br />Diapositiva 7 comprension de los datos <br />Recolección de datos iniciales<br />Adquiera en el proyecto los datos (o el acceso a los datos) listados en los recursos del proyecto. Esta colección inicial incluye carga de datos, si es necesario para la comprensión de los datos. Por ejemplo, si usted usa un instrumento específico para la comprensión de los datos, esto perfectamente se entiende para abrir sus datos en esta herramienta. Este esfuerzo posiblemente conduce a los pasos iniciales de preparación de datos.<br />Note: si usted adquiere datos de múltiples fuentes, la integración es una cuestión adicional, aquí o mas tarde en las fases de preparación de datos más.<br />Describir los datos<br />. Después de adquiridos los datos iniciales, estos deben ser descritos.Este proceso involucra establecer volúmenes de datos (número de registros y campos por registro), su identificación, el significado de cada campo y la descripción del formato inicial.<br />Explorar los datos<br />Esta tarea dirige interrogantes de minería de datos usando preguntas, visualización, y técnicas de reporte. Estos incluyen la distribución de atributos claves (por ejemplo, el atributo objetivo de una tarea de predicción) relacionados entre pares o pequeños números de atributos, los resultados de simples agregaciones, las propiedades de las subpoblaciones significativas, y análisis estadísticos simples. Estos análisis directamente pueden dirigir los objetivos de minería de datos; ellos también pueden contribuir o refinar la descripción de datos e informes de calidad, y alimentar en la transformación y otros pasos de preparación de datos necesarios para análisis futuros.<br />Verificación de la calidad de los datos<br />. En esta tarea, se efectúan verificaciones sobre los datos, para determinar la consistencia de los valores individuales de los campos, la cantidad y distribución de los valores nulos, y para encontrar valores fuera de rango, los cuales pueden constituirse en ruido para el proceso. La idea en este punto, es asegurar la completitud y corrección de los datos.<br />Diapositiva 8 preparacion de los datos <br />Selección de datos<br />Decidir que datos serán usados para el análisis. Los criterios incluyen la importancia a los objetivos de la minería de datos, la calidad, y las restricciones técnicas como límites sobre el volumen de datos o los tipos de datos. Note que la selección de datos cubre la selección de atributos (columnas) así como la selección de registros (filas) en una tabla.<br />Limpieza de datos<br />Elevar la calidad de los datos al nivel requerido por las técnicas de análisis seleccionadas. Esto puede implicar la selección de los subconjuntos de datos limpios, la inserción de datos por defectos adecuados, o técnicas más ambiciosas tales como la estimación de datos faltantes mediante modelado.<br />Construir datos<br />Esta tarea incluye la construcción de operaciones de preparación de datos tales como la producción de atributos derivados o el ingreso de nuevos registros, o la transformación de valores para atributos existentes.<br />Integrar datos<br />Estos son los métodos por el cual la información es combinada de múltiples tablas o registros para crear nuevos registros o valores.<br />Formatear datos<br />Formateando transformaciones se refiere a modificaciones principalmente sintácticas hechas a los datos que no cambian su significado, pero podría ser requerido por la herramienta de modelado.<br />Diapositiva 9 modelado <br />Selección de la técnica de modelado<br />Como primer paso en modelado, seleccionar la técnica de modelado real que está por ser usado. Aunque usted haya podido seleccionar una herramienta durante la fase de Comprensión del negocio, esta tarea se refiere a la técnica de modelado específico, por ejemplo, un árbol decisión construido con C4.5, o la generación de red neuronales Back-Propagación. Si múltiples técnicas son aplicadas, se realizan esta tarea separadamente para cada técnica.<br />Generación de la prueba de diseño<br />Antes de que nosotros en realidad construyamos un modelo, tenemos que generar un procedimiento o el mecanismo para probar la calidad y validez del modelo. Por ejemplo, en tareas de minería de datos supervisados como la clasificación, esto es común usar tasas de errores como medida de calidad para modelos de minería de datos. Por lo tanto, típicamente separamos el conjunto de datos en una serie y en un conjunto de prueba, construimos el modelo sobre el conjunto de series, y estimamos su calidad sobre el conjunto de prueba separado.<br />Construcción del modelo<br />Ejecutar la herramienta de modelado sobre el conjunto de datos preparados para crear uno o más modelos.<br />Evaluación del modelo<br />El ingeniero de minería de datos interpreta los modelos según su conocimiento de dominio, los criterios de éxitos de minería de datos, y el diseño de prueba deseado. El ingeniero de minería de datos juzga el éxito de la aplicación del modelado y descubre técnicas mas técnicamente; él se pone en contacto con analistas de negocio y expertos en el dominio luego para hablar de los resultados de la minería de datos en el contexto de negocio. Por favor note que esta tarea sólo se considera modelos, mientras que la fase de evaluación también toma en cuenta todos los otros resultados que fueron producidos en el curso del proyecto.<br />El ingeniero de minería de datos intenta clasificar los modelos. Él evalúa los modelos según los criterios de evaluación. Tanto como es posible, él también tiene en cuenta objetivos del negocio y criterios de éxito de negocio. En los grandes proyectos de minería de datos, el ingeniero de minería de datos aplica una sola técnica más de una vez, o genera resultados de minería de datos con varias técnicas diferentes. En esta tarea, él también compara todos los resultados según los criterios de evaluación.<br />Diapositiva 10 evaluacion <br />Evaluación de los resultados<br />Los pasos de la evaluación anterior trata con factores como la exactitud y la generalidad del modelo. Este paso evalúa el grado al que el modelo responde (encuentra) los objetivos de negocio y procura determinar si hay alguna decisión de negocio por el que este modelo es deficiente. Otra opción de evaluación es probar el/los modelo/s sobre aplicaciones de prueba en la aplicación real, si el tiempo y las restricciones de presupuesto lo permiten.<br />Además, la evaluación también verifica otros resultados generados por la minería de datos. Los resultados de la minería de datos implican modelos que necesariamente son relacionados con los objetivos originales de negocio y todas los otros descubrimientos que no son relacionados necesariamente con los objetivos originales de negocio, pero también podría revelar desafíos adicionales, información, o insinuaciones para futuras direcciones.<br />Proceso de revisión<br />En este punto, los modelos resultantes pasan a ser satisfactorios y a satisfacer las necesidades de negocio. Ahora es apropiado hacer una revisión más cuidadosa de los compromisos de la minería de datos para determinar si hay cualquier factor importante o tarea que de algún modo ha sido pasada por alto. Esta revisión también cubre cuestiones de calidad -por ejemplo: ¿Construimos correctamente el modelo? ¿Usamos sólo los atributos que nos permitieron usar y que están disponibles para análisis futuros?<br />Determinación de los próximos pasos<br />Según los resultados de la evaluación y la revisión de proceso, el equipo de proyecto decide como proceder. El equipo decide si hay que terminar este proyecto y tomar medidas sobre el desarrollo si es apropiado, tanto iniciar más iteraciones, o comenzar nuevos proyectos de minería de datos. Esta tarea incluye los análisis de recursos restantes y del presupuesto, que puede influir en las decisiones.<br />Diapositiva 11 implantacion <br />Desarrollo del plan<br />De acuerdo al desarrollo de los resultados de minería de datos en el negocio, esta tarea toma los resultados de la evaluación y determina una estrategia para el desarrollo. Si un procedimiento general ha sido identificado para crear el/los modelo/s relevante/s, este procedimiento es documentado aquí para el desarrollo posterior.<br />Plan de supervisión y mantenimiento<br />La supervisión y el mantenimiento son cuestiones importantes si los resultados de minería de datos son parte del negocio cotidiano y de su ambiente. La preparación cuidadosa de una estrategia de mantenimiento ayuda evitar largos periodos innecesarios de uso incorrecto de resultados de minería de datos. Para supervisar el desarrollo de los resultados de la minería de datos, el proyecto necesita un plan detallado de proceso de supervisión. Este plan tiene en cuenta el tipo específico de desarrollo.<br />Informe definitivo de producto<br />En el final del proyecto, el líder del proyecto y su equipo sobrescribe un informe final. Según el plan de desarrollo, este informe puede ser sólo un resumen del proyecto y sus experiencias (si estas aún no han sido documentadas como una actividad en curso) o esto puede ser una presentación final y comprensiva de los resultados de minería de datos.<br />Revisión del proyecto<br />Evaluar lo que fue correcto y lo que se equivocó, lo que fue bien hecho y lo que necesita para ser mejorado.<br />