Diego García, joven investigador de a Universidad de Cantabria en proyectos de minería de datos en ambientes de aprendizaje e-learning, repasó los algoritmos de minería de datos y alternativas de software libre para abordar proyectos de Data Mining.
Knime es una plataforma de minería de datos que permite el desarrollo de modelos en un entorno visual y amigable. Su desarrollo está bajo licencia GPL y está programado sobre la plataforma Eclipse y Java.En la charla se mostrará cómo realizar un proyecto de minería de datos y análisis con algoritmos conocidos para clasificación, asociación o predicción de datos empresariales.
Presentado por Diego García :
Ingeniero informático e investigador en la Universidad de Cantabria. Profesor de asignaturas del grado en informática de DataMining, Inteligencia Artificial y Algoritmia. En el campo de la investigación busca detectar patrones de comportamiento en plataformas E-learning para mejorar la docencia.
Knime es una plataforma de minería de datos que permite el desarrollo de modelos en un entorno visual y amigable. Su desarrollo está bajo licencia GPL y está programado sobre la plataforma Eclipse y Java.En la charla se mostrará cómo realizar un proyecto de minería de datos y análisis con algoritmos conocidos para clasificación, asociación o predicción de datos empresariales.
Presentado por Diego García :
Ingeniero informático e investigador en la Universidad de Cantabria. Profesor de asignaturas del grado en informática de DataMining, Inteligencia Artificial y Algoritmia. En el campo de la investigación busca detectar patrones de comportamiento en plataformas E-learning para mejorar la docencia.
Es aquí donde se introduce la minería de datos. Ésta, una tecnología cuyo objetivo es mirar los
datos más allá de consultarlos; se analizan, se emplean variadas técnicas para ver que comportamientos tienen
un subgrupo de éstos, grandes o pequeños, y se descubre nueva información, generando así nuevo conocimiento el cual puede ser de vital utilidad para el negocio y para sus tomas de decisiones.
Entérese de las actividades a llevar a cabo para obtener un modelo de minería de datos a partir de un caso del dominio público. En la sesión se describe y trabaja el caso "Insurance". Por medio de herramientas de modelado de Md se obtienen modelos de clasificación y se lleva a cabo el post proceso en Excel para obtener la conclusión comercial del modelo.
Se describen actividades posteriores para la extrapolación de los resultados de la muestra a una campaña con un mayor número de clientes potenciales.
El asistente a la sesión virtual se enterará de:
a) Qué es la minería de datos y porqué las técnicas son importantes en este momento de "Big Data".
b) Qué son los modelos de clasificación.
c) Cómo aplicarlos a un caso de campaña con costo de promoción y utilidad al hacer "hit".
3ª Sesión Técnica del Ciclo de Conferencias sobre BI, celebrada el 12 de junio. Fue conducida por Julio Iglesias, Director del Departamento de Business Intelligence en IFR Group, experto especializado en proyectos de este tipo, y profesor asociado de nuestra Escuela Universitaria
¿Qué significa realmente la minería de datos? ,¿Cómo se engloba en un proyecto de BI?, ¿Puede mi empresa con los datos que genera hacer proyectos de este tipo? Y ¿Dónde está el límite para abordar proyectos de este tipo?
Bancos, hospitales, empresas de retail y páginas web son algunos de los sectores que utilizan esta tecnología. A lo largo de la sesión se analizó qué significa y qué implica la minería de datos: concepto y definición, casos, algoritmos de utilización… y de forma práctica se vieron un par de proyectos de ejemplo de las posibilidades que ofrece esta tecnología tan aplicada en la actualidad. Los asistentes tuvieron la oportunidad de ver de primera mano cómo las empresas utilizan los datos y la estadística para crear ofertas personalizadas.
¿Qué es un modelo predictivo y para qué vale?Scoremind
Los modelos predictivos permiten estimar cual es el comportamiento esperado del cliente utilizando los datos de uso de los servicios.
Para el desarrollo de los modelos se utilizan técnicas analíticas (data mining).
Aplicación de aprendizaje automático en minería de datosmajitol
Esta presentación contiene información de la utilización de algoritmos como JRIP, RIDOR y J48 en minería de datos, específicamente en la predicción de la tendencia del uso de servicios excequiales de la funeraria "La Esperanza", con el fin de determinar si se implentan o no las características con mayor preferencia y si se crea una nueva sucursal, conclusiones que se presentan al final de esta presentación.
Es aquí donde se introduce la minería de datos. Ésta, una tecnología cuyo objetivo es mirar los
datos más allá de consultarlos; se analizan, se emplean variadas técnicas para ver que comportamientos tienen
un subgrupo de éstos, grandes o pequeños, y se descubre nueva información, generando así nuevo conocimiento el cual puede ser de vital utilidad para el negocio y para sus tomas de decisiones.
Entérese de las actividades a llevar a cabo para obtener un modelo de minería de datos a partir de un caso del dominio público. En la sesión se describe y trabaja el caso "Insurance". Por medio de herramientas de modelado de Md se obtienen modelos de clasificación y se lleva a cabo el post proceso en Excel para obtener la conclusión comercial del modelo.
Se describen actividades posteriores para la extrapolación de los resultados de la muestra a una campaña con un mayor número de clientes potenciales.
El asistente a la sesión virtual se enterará de:
a) Qué es la minería de datos y porqué las técnicas son importantes en este momento de "Big Data".
b) Qué son los modelos de clasificación.
c) Cómo aplicarlos a un caso de campaña con costo de promoción y utilidad al hacer "hit".
3ª Sesión Técnica del Ciclo de Conferencias sobre BI, celebrada el 12 de junio. Fue conducida por Julio Iglesias, Director del Departamento de Business Intelligence en IFR Group, experto especializado en proyectos de este tipo, y profesor asociado de nuestra Escuela Universitaria
¿Qué significa realmente la minería de datos? ,¿Cómo se engloba en un proyecto de BI?, ¿Puede mi empresa con los datos que genera hacer proyectos de este tipo? Y ¿Dónde está el límite para abordar proyectos de este tipo?
Bancos, hospitales, empresas de retail y páginas web son algunos de los sectores que utilizan esta tecnología. A lo largo de la sesión se analizó qué significa y qué implica la minería de datos: concepto y definición, casos, algoritmos de utilización… y de forma práctica se vieron un par de proyectos de ejemplo de las posibilidades que ofrece esta tecnología tan aplicada en la actualidad. Los asistentes tuvieron la oportunidad de ver de primera mano cómo las empresas utilizan los datos y la estadística para crear ofertas personalizadas.
¿Qué es un modelo predictivo y para qué vale?Scoremind
Los modelos predictivos permiten estimar cual es el comportamiento esperado del cliente utilizando los datos de uso de los servicios.
Para el desarrollo de los modelos se utilizan técnicas analíticas (data mining).
Aplicación de aprendizaje automático en minería de datosmajitol
Esta presentación contiene información de la utilización de algoritmos como JRIP, RIDOR y J48 en minería de datos, específicamente en la predicción de la tendencia del uso de servicios excequiales de la funeraria "La Esperanza", con el fin de determinar si se implentan o no las características con mayor preferencia y si se crea una nueva sucursal, conclusiones que se presentan al final de esta presentación.
Esta conferencia se inicia con una introducción al fenómeno de los datos masivos en la sociedad digital actual, haciendo hincapié en las diferencias entre datos, información y conocimiento, el concepto de ‘data lake’ y los resultados que se pueden esperar tras analizar un conjunto de datos: predicción, pronóstico, prescripción… y sus diferentes matices. También se esboza una aproximación ingenua al fenómeno del ‘Big Data’. En segundo lugar, se aborda el aprovechamiento inteligente de esta valiosa materia prima, comenzando con el papel del ‘Científico de Datos’ y mostrando un mapa de las técnicas de Inteligencia Artificial y Aprendizaje Automático orientadas a tal propósito, junto con una descripción de la adecuación de estos métodos a los diferentes tipos de situaciones de análisis. Por último, se presentan los nuevos retos de este aprovechamiento de los datos masivos, sobre todo en lo que concierne a la búsqueda y acceso a la información y el análisis inteligente de textos con diversos propósitos.
Cómo aplicar el análisis predictivo en la empresaNexolution
El análisis predictivo permite a su organización estimar escenarios posibles que permitan planificar y llevar a cabo estrategias que mejoren la toma de decisiones.
La mayoría de las corporaciones logra convertir sus datos en información para realizar un análisis estadístico de lo que ha sucedido, pero muy pocas de éstas logran usar la información para pronosticar o predecir, para encontrar agrupaciones o relaciones entre datos que permitan transformar dicha información en conocimiento.
Con el análisis predictivo es posible modelar grandes volúmenes de datos que lleven al descubrimiento de patrones de información desconocida acerca de lo que sucede dentro del negocio que ayudará a crear e implementar estrategias que permitan a la empresa ser más competitivos al mejorar la calidad de sus productos y servicios.
En ésta presentación usted conocerá en qué áreas de negocio es posible implementar el análisis predictivo como por ejemplo:
• Qué valor tiene el análisis predictivo para las áreas de negocio
• Mantenimiento predictivo de los activos de la empresa
• Antes de diseñar una campaña de marketing ¿Cómo analizar el comportamiento de nuestro clientes?
• ¿Cómo pronosticar la demanda de tus clientes? Evitando así el sobre inventario en el almacén y la optimización en el servicio al cliente
• Conocer qué opinan los clientes
Presentador: José Mondragon
Información de las soluciones de Business Analytics: informacion@nexolution.com
Javier Lahoz. Arquitecto Big Data actualmente trabajando en una entidad financiera en el diseño e implantación de soluciones Big Data para el tratamiento analítico de la información bancaria.
CustomeR Life Value - CLV
El valor de vida del cliente (CLV) está ganando cada vez más importancia como una métrica de marketing. El CLV una herramienta para gestionar y medir el éxito de su negocio.
Manuel Perez
zerep.manuel@gmail.com
Carlos Ortega
cof@qualityexcellence.es
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...OpenAnalytics Spain
Recopilación, limpieza y organización, análisis y visualización. Estas cuatro fases conforman el proceso de realización del periodismo de datos y en todas ellas las herramientas open source pueden servirnos de gran ayuda. A partir de dos ejemplos prácticos (mapa de paro municipal y The Migrants Files) mostraremos las utilidades de cinco aplicaciones en el desarrollo, análisis y tratamiento de grandes cantidades de datos: Detective.io (organización), Open Refine (limpieza), OpenOffice (análisis), QGIS (tratamiento geoespacial) y CartoDB (visualización cartográfica).
Daniele Grasso (@danielegrasso) aterrizó en Madrid en 2009, después de una licenciatura en Filología Española en Milán. Ha empezado sus primeros pasos como periodista en el mundo freelance, escribiendo para diferentes diarios mientras cursaba un Máster en Periodismo en la Universidad Complutense de Madrid. Después de una etapa en un pequeño periódico digital, trabajó como corresponsal para una agencia y un periódico transalpinos. En Septiembre de 2012 empezó a cursar el Máster en Periodismo de Investigación, Datos y Visualización de la Universidad Rey Juan Carlos y la Escuela de Periodismo de Unidad Editorial. Actualmente mezcla números y palabras en el periódico El Confidencial.
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...OpenAnalytics Spain
Partiendo de un modelo de datos existente de la red social GPMESS se contará como con el procesamiento de tecnologías BigData se ha realizado:
La extracción y agrupación de los temas relevantes (identificación de las palabras más importantes).
El análisis de crowded place, identificación y aviso automático de zonas en las que de repente se empiezan a crear yipis.
El análisis de información para saber sitios populares.
Open Analytics 2014 - Pedro Alves - Innovation though Open SourceOpenAnalytics Spain
Delivering the Future of Analytics: Innovation through Open Source Pentaho was born out of the desire to achieve positive, disruptive change in the business analytics market, dominated by bureaucratic megavendors offering expensive heavy-weight products built on outdated technology platforms. Pentaho’s open, embeddable data integration and analytics platform was developed with a strong open source heritage. This provided Pentaho a first-mover advantage to engage early with adopters of big data technologies and solve the difficult challenges of integrating both established and emerging data types to drive analytics. Continued technology innovations to support the big data ecosystem, have kept customers ahead of the big data curve. With the ability to drastically reduce the time to design, develop and deploy big data solutions, Pentaho counts numerous big data customers, both large and small, across the financial services, retail, travel, healthcare and government industries around the world.
Open Analytics 2014 - Emilio Arias - Intro evento + Business AnalyticsOpenAnalytics Spain
Durante la charla se comentará la situación actual del Business Intelligence, sus aplicaciones actuales y el futuro que depara al sector, con la aplicación de nuevas tendencias como Social Intelligence, Big Data, Análisis, Predictivo, Open Source, Open Data…..
Son muchas las herramientas de ETLs existentes en el mercado, pero pocas que estén al nivel de Talend. En esta charla se mostrará la herramienta Talend y un proceso ETL a Facebook. Por Eduardo Fernández. Experto en creación y desarollo de procesos ETL de Stratebi.
OpenAnalytics - Smartcities y Software libre por Ignacio BustilloOpenAnalytics Spain
Coordinador de proyectos I+D en Stratebi, empresa de analítica de datos, mostró el punto de vista de las SmartCities en el mundo Open Source y cómo el BigData aporta soluciones a este tipo de proyectos.
Desarrollador en el proyecto EspañaEnLlamas.com, caso de éxito de proyecto de Periodismo de datos, el cual busca visualizar y navegar por datos inéditos de todos los incendios forestales de 100 hectáreas o más ocurridos en España.
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto AbellaOpenAnalytics Spain
Alberto Abella, presidente de la Open Knowledge Foundation de España, fundación del conocimiento abierto, repasó los beneficios que tiene el Open Data y su uso en los entornos empresariales y públicos para la toma de decisiones.
Iván del Prado, CEO de Datasalt y uno de los creadores de Pangool Hadoop API y Splout SQL repasó las necesidades de usar tecnologías y procesos BigData y las alternativas libres para abordar proyectos de diversa índole.
Open Analytics - Data Quality por Diego Martínez de EquifaxOpenAnalytics Spain
Diego Martínez, IT Project Manager de Data Quality de Equifax repasó cómo han abordado desde Equifax la integración de datos en el sector crediticio con herramientas Open Source como Pentaho Data Integration.
Emilio Arias, profesor asociado en la Universidad Oberta de Cataluña y creador del blog de referencia de Business Intelligence "Todobi.com" repasó en el evento las nuevas tecnologías y corrientes de análisis de datos de Business Intelligence.
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...AMADO SALVADOR
El catálogo general de electrodomésticos Teka presenta una amplia gama de productos de alta calidad y diseño innovador. Como distribuidor oficial Teka, Amado Salvador ofrece soluciones en electrodomésticos Teka que destacan por su tecnología avanzada y durabilidad. Este catálogo incluye una selección exhaustiva de productos Teka que cumplen con los más altos estándares del mercado, consolidando a Amado Salvador como el distribuidor oficial Teka.
Explora las diversas categorías de electrodomésticos Teka en este catálogo, cada una diseñada para satisfacer las necesidades de cualquier hogar. Amado Salvador, como distribuidor oficial Teka, garantiza que cada producto de Teka se distingue por su excelente calidad y diseño moderno.
Amado Salvador, distribuidor oficial Teka en Valencia. La calidad y el diseño de los electrodomésticos Teka se reflejan en cada página del catálogo, ofreciendo opciones que van desde hornos, placas de cocina, campanas extractoras hasta frigoríficos y lavavajillas. Este catálogo es una herramienta esencial para inspirarse y encontrar electrodomésticos de alta calidad que se adaptan a cualquier proyecto de diseño.
En Amado Salvador somos distribuidor oficial Teka en Valencia y ponemos atu disposición acceso directo a los mejores productos de Teka. Explora este catálogo y encuentra la inspiración y los electrodomésticos necesarios para equipar tu hogar con la garantía y calidad que solo un distribuidor oficial Teka puede ofrecer.
Catalogo general Ariston Amado Salvador distribuidor oficial ValenciaAMADO SALVADOR
Distribuidor Oficial Ariston en Valencia: Amado Salvador distribuidor autorizado de Ariston, una marca líder en soluciones de calefacción y agua caliente sanitaria. Amado Salvador pone a tu disposición el catálogo completo de Ariston, encontrarás una amplia gama de productos diseñados para satisfacer las necesidades de hogares y empresas.
Calderas de condensación: Ofrecemos calderas de alta eficiencia energética que aprovechan al máximo el calor residual. Estas calderas Ariston son ideales para reducir el consumo de gas y minimizar las emisiones de CO2.
Bombas de calor: Las bombas de calor Ariston son una opción sostenible para la producción de agua caliente. Utilizan energía renovable del aire o el suelo para calentar el agua, lo que las convierte en una alternativa ecológica.
Termos eléctricos: Los termos eléctricos, como el modelo VELIS TECH DRY (sustito de los modelos Duo de Fleck), ofrecen diseño moderno y conectividad WIFI. Son ideales para hogares donde se necesita agua caliente de forma rápida y eficiente.
Aerotermia: Si buscas una solución aún más sostenible, considera la aerotermia. Esta tecnología extrae energía del aire exterior para calentar tu hogar y agua. Además, puede ser elegible para subvenciones locales.
Amado Salvador es el distribuidor oficial de Ariston en Valencia. Explora el catálogo y descubre cómo mejorar la comodidad y la eficiencia en tu hogar o negocio.
En este documento analizamos ciertos conceptos relacionados con la ficha 1 y 2. Y concluimos, dando el porque es importante desarrollar nuestras habilidades de pensamiento.
Sara Sofia Bedoya Montezuma.
9-1.
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...espinozaernesto427
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta intensidad son un tipo de lámpara eléctrica de descarga de gas que produce luz por medio de un arco eléctrico entre electrodos de tungsteno alojados dentro de un tubo de alúmina o cuarzo moldeado translúcido o transparente.
lámparas más eficientes del mercado, debido a su menor consumo y por la cantidad de luz que emiten. Adquieren una vida útil de hasta 50.000 horas y no generan calor alguna. Si quieres cambiar la iluminación de tu hogar para hacerla mucho más eficiente, ¡esta es tu mejor opción!
Las nuevas lámparas de descarga de alta intensidad producen más luz visible por unidad de energía eléctrica consumida que las lámparas fluorescentes e incandescentes, ya que una mayor proporción de su radiación es luz visible, en contraste con la infrarroja. Sin embargo, la salida de lúmenes de la iluminación HID puede deteriorarse hasta en un 70% durante 10,000 horas de funcionamiento.
Muchos vehículos modernos usan bombillas HID para los principales sistemas de iluminación, aunque algunas aplicaciones ahora están pasando de bombillas HID a tecnología LED y láser.1 Modelos de lámparas van desde las típicas lámparas de 35 a 100 W de los autos, a las de más de 15 kW que se utilizan en los proyectores de cines IMAX.
Esta tecnología HID no es nueva y fue demostrada por primera vez por Francis Hauksbee en 1705. Lámpara de Nernst.
Lámpara incandescente.
Lámpara de descarga. Lámpara fluorescente. Lámpara fluorescente compacta. Lámpara de haluro metálico. Lámpara de vapor de sodio. Lámpara de vapor de mercurio. Lámpara de neón. Lámpara de deuterio. Lámpara xenón.
Lámpara LED.
Lámpara de plasma.
Flash (fotografía) Las lámparas de descarga de alta intensidad (HID) son un tipo de lámparas de descarga de gas muy utilizadas en la industria de la iluminación. Estas lámparas producen luz creando un arco eléctrico entre dos electrodos a través de un gas ionizado. Las lámparas HID son conocidas por su gran eficacia a la hora de convertir la electricidad en luz y por su larga vida útil.
A diferencia de las luces fluorescentes, que necesitan un recubrimiento de fósforo para emitir luz visible, las lámparas HID no necesitan ningún recubrimiento en el interior de sus tubos. El propio arco eléctrico emite luz visible. Sin embargo, algunas lámparas de halogenuros metálicos y muchas lámparas de vapor de mercurio tienen un recubrimiento de fósforo en el interior de la bombilla para mejorar el espectro luminoso y reproducción cromática. Las lámparas HID están disponibles en varias potencias, que van desde los 25 vatios de las lámparas de halogenuros metálicos autobalastradas y los 35 vatios de las lámparas de vapor de sodio de alta intensidad hasta los 1.000 vatios de las lámparas de vapor de mercurio y vapor de sodio de alta intensidad, e incluso hasta los 1.500 vatios de las lámparas de halogenuros metálicos.
Las lámparas HID requieren un equipo de control especial llamado balasto para funcionar
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial ValenciaAMADO SALVADOR
Descubra el catálogo completo de buzones BTV, una marca líder en la fabricación de buzones y cajas fuertes para los sectores de ferretería, bricolaje y seguridad. Como distribuidor oficial de BTV, Amado Salvador se enorgullece de presentar esta amplia selección de productos diseñados para satisfacer las necesidades de seguridad y funcionalidad en cualquier entorno.
Descubra una variedad de buzones residenciales, comerciales y corporativos, cada uno construido con los más altos estándares de calidad y durabilidad. Desde modelos clásicos hasta diseños modernos, los buzones BTV ofrecen una combinación perfecta de estilo y resistencia, garantizando la protección de su correspondencia en todo momento.
Amado Salvador, se compromete a ofrecer productos de primera clase respaldados por un servicio excepcional al cliente. Como distribuidor oficial de BTV, entendemos la importancia de la seguridad y la tranquilidad para nuestros clientes. Por eso, trabajamos en colaboración con BTV para brindarle acceso a los mejores productos del mercado.
Explore el catálogo de buzones ahora y encuentre la solución perfecta para sus necesidades de correo y seguridad. Confíe en Amado Salvador y BTV para proporcionarle buzones de calidad excepcional que cumplan y superen sus expectativas.
Estructuras básicas_ conceptos básicos de programación.pdf
OpenAnalytics - Minería de datos por Diego García (Unican)
1. Introducción a la Minería de Datos
Diego García Saiz
Grupo de Lenguajes y Sistemas Informáticos
Departamento de Matemáticas, Estadística y Computación
Universidad de Cantabria
2. Estructura de la presentación
• Una pequeña introducción al contexto.
• Qué es Minería de Datos…
– … y qué no es Minería de Datos.
• No sólo se trata de modelar: CRISP-DM.
• Los 3 grandes pilares: ejemplos en el mundo real.
– Agrupación (clustering).
– Reglas de Asociación.
– Predicción: clasificación.
• Herramientas de uso libre: Weka, RapidMiner y Knime.
3. Introducción al contexto
•
Gran cantidad de datos almacenados.
– Por parte de empresas: marketing, hipermercados, servicios, banca,
etc.
– Redes Sociales: Facebook, Twitter, Tuenti, LinkedIn y otras muchas.
– Y en muchos otros ámbitos: educativo (cursos online), institucional
(gobierno), médico, etc.
•
¿Qué hacer con todos esos datos?.
– Podríamos utilizarlos para extraer información relevante con el objeto
de ayudar a la toma de decisiones en el negocio, el gobierno, la
sanidad, la educación, las ventas, etc.
– Para esto tenemos la Minería de Datos.
4. ¿Minería de datos?. Definición formal
• El datamining (minería de datos), es el conjunto de
técnicas y tecnologías que permiten explotar grandes
cantidades de datos, de forma automática o
semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado
contexto.
Más simple: La minería de datos es un
proceso consistente en entender y
extraer información relevante para el
desarrollo del negocio, que no podría
extraerse de otra forma.
5. Qué es y qué no es Minería de Datos
• Extracción de los datos de una Base de Datos.
• Preparación de los datos para extraer
información.
• Generación de gráficos estadísticos de los
datos.
• Extracción del conocimiento “oculto” en los
datos.
6. No sólo de extraer patrones viven los
“datamineros”: CRIPS-DM
7. Los 3 grandes pilares
• Reglas de asociación.
• Agrupamiento (clustering).
• Predicción: clasificación.
8. Reglas de asociación
• Conjunto de técnicas que retornan todos los patrones encontrados
en el conjunto de datos que cumplan los parámetros de entrada.
• Usado cuando no se tiene un objetivo específico sobre la
información que se busca.
• Algunos de los algoritmos más conocidos:
• Apriori
• PredictiveApriori
• Tertitus
• Yacaree
9. Reglas de asociación: Ejemplo
• Cesta de la compra (problema típico de marketing y ventas): ¿qué
productos se compran usualmente juntos?.
• El conjunto de datos contiene, por cada compra de un cliente,
que productos adquirió y cual fue el precio final de su compra.
• Ejemplo de productos:
• Comestibles (pan, agua, fruta…)
• Consumibles electrónicos (tóners, baterías…)
• Electrodomésticos (lavadoras, laptops, reproductores…)
• …
10. Reglas de asociación: Ejemplo
• Resultado parcial de aplicar el algoritmo Apriori con una restricción
de las reglas de un 70% en confianza.
• baking needs & biscuits & cheese & fruit & vegetables ==>
bread and cake confianza: 90%
• fruit & potatoes ==> vegetables
confianza: 89%
• milk-cream & beef & vegetables ==> fruit
confianza: 78%
11. Agrupamiento (clustering)
• Conjunto de técnicas de Minería de Datos que determinan y
asignan a los individuos a grupos de similares características.
• Ejemplo: Perfil de los alumnos en un curso online según la actividad
que desarrollan.
• Como datos, tenemos su actividad en el curso medida en:
•
Tiempo dedicado
• Número de sesiones
• Mensajes leídos y escritos en el foro
• Etc.
12. Agrupamiento: Ejemplo
• Resultado de aplicar el algoritmo Kmeans:
Attribute
Nº of students
Age
Gender
Total Time
Number of Sessions
Full Data
(resumen)
67
22
Man
1138
74
Cluster
(Grupo) 1
21
22
Man
1394
94
●
Cluster
(Grupo) 2
31
23
Woman
104
8
Cluster
(Grupo) 3
15
19
Man
2917
180
…
13. Predicción: Clasificación
• Consiste en la clasificación de individuos en una determinada clase
según sus características, para poder inferir predicciones en un
futuro.
• Ejemplos: conocer si…
• … un cliente realizará una hipoteca con el banco.
• … las acciones de una empresa subirán o bajarán en un
momento determinado.
• … un fruto del bosque o una seta es comestible o venenosa.
• … un alumno aprobará o suspenderá una asignatura.
• … un paciente tiene una enfermedad concreta según sus
síntomas y datos personales.
• … una campaña de marketing tendrá éxito.
•
14. Clasificación: Ejemplo 1
• Doctor, ¿tengo hipertiroidismo?
• Conjunto de datos: contiene la información de pacientes
reales con sus síntomas, niveles de hormonas y diagnóstico.
• Resultados (algoritmo Jrip):
(tumor = t) and (T3level >= 2.9) and (TT4level <= 147) => class=goitre
(T3level >= 3.3) and (age >= 54) and (TT4level <= 142) and (age <= 63) and (T4Ulevel >=
0.95) => class=t3toxic
(FTIlevel >= 168) and (T3level >= 3.5) => class=hyperthyroid
…
(FTIlevel >= 209) and (age <= 41) => class=hyperthyroid
=> class=negative
15. Clasificación: Ejemplo 2
• Campaña de marketing telefónico de un banco portugués para
atraer clientes de depósitos
• Conjunto de datos: contiene información personal de los
clientes, incluida información bancaria.
• Estado civil (soltero, casado, viudo)
• Sexo
• Edad
• Mes de la llamada
• Hipotecas del cliente en el banco
• Créditos del cliente en el banco
• Y muchos otros…
16. Clasificación: Ejemplo 2 (2)
• Resultados (algoritmo C4.5)
Duration
> 645
<= 211
> 211 and <=645
Married
NO
Age
> 60
NO
yes
no
…
…
Credit
yes
YES
no
…
17. Herramientas libres
•
Weka
•
•
Multitud de algoritmos.
•
•
Pionera en su género.
http://www.cs.waikato.ac.nz/ml/weka/
RapidMiner
•
•
Hace uso de todos los algoritmos ofrecidos por Weka y de los suyos propios.
•
•
Interfaz Gráfica sencilla de utilizar.
http://rapid-i.com/content/view/181/190/
KNIME
•
Herramienta joven. Interfaz Gráfico de uso sencillo.
•
Implementada como plugin en Eclipse. Fácil de extender con nuevos
algoritmos “ad hoc”.
•
http://www.knime.org/