SlideShare una empresa de Scribd logo
AGRUPACION DE EMPLEADOS 
La empresa de software para Internet “Memolum Web” quiere extraer tipologías de 
empleados, con el objetivo de hacer una política de personal más fundamentada y 
seleccionar a qué grupos incentivar. Las variables que se recogen de las fichas de 
los 15 empleados de la empresa en 1999 son: 
· Sueldo: sueldo anual en euros. 
· Casado: si está casado o no. 
· Coche: si viene en coche a trabajar (o al menos si lo aparca en el parking de la 
empresa). 
· Hijos: si tiene hijos. 
· Alq/Prop: si vive en una casa alquilada o propia. 
· Sindic.: si pertenece al sindicato revolucionario de Internet 
· Bajas/Año: media del nº de bajas por año 
· Antigüedad: antigüedad en la empresa 
· Sexo: H: hombre, M: mujer.
RESOLUCION DEL PROBLEMA AGRUPACION DE EMPLEADOS 
1. En primer lugar vamos a leer los datos de los empleados para lo cual 
procederemos a ir al programa clementine 12.0 ya ubicados en nuestra área de 
trabajo procedernos a agregar un var.file en nuestra área de trabajo que se 
localiza en la parte inferior como se indica 
a) ya agregado el var. File procederemos a dar doble click sobre el para cargar los 
datos como de muestra en la imagen inferior
b) ubicaremos el archivo de Empleados4.csv que contiene los datos con los cuales 
se trabajara a lo largo de esta práctica el cual seleccionaremos y presionaremos el 
botón abrir. 
c) posteriormente de abrir el archivo cvs se cargaran los datos como se muestra a 
continuación, se aplicaran los cambios y los datos se cargaran al var.file.
2) Ahora añadiremos un nodo tabla el cual encontraremos en la parte inferior de la 
interface de clementina y lo conectaremos, para esto posicionaremos el más sobre 
el var.file pulsaremos clic derecho y seleccionaremos la opción conect con el clic 
izquierdo sobre la tabla realizaremos la conexión con el nodo var.File, como se ve 
en la siguiente figura: 
a) Se procederá a dar doble click sobre la tabla para verificar aparecerá una 
pantalla en la cual presionaremos el botón ejecute.
b) aparecerá una tabla en la cual estarán los datos de lo contrario regrese a los 
pasos anteriores y verifique que no salteo ningún paso asi se vera la tabla. 
c) A continuación añadimos un nodo “Type” y lo enganchamos. Todos los atributos 
deberían estar IN exceptuando el número de ejemplo, que es irrelevante y 
pondremos NONE, como se muestra en lasiguiente figura:
d) Ahora vamos a utilizar un algoritmo de clustering para obtener grupos sobre esta 
población. En primer lugar vamos a probar con tres grupos. Para ello añadimos un 
nodo Kmeans, lo enganchamos al nodo Type y modificamos el campo “Number of 
clusters” a 3, como se ve en la siguiente figura: 
c) Ahora podemos ejecutar el stream, obteniendo un nodo diamante Kmeans. Lo 
podemos añadir y conectaremos al nodo Type, como se muestra en la siguiente 
figura:
d) ahora añadimos una tabla a la salida del nodo diamante Kmeans podemos 
observar qué ejemplos exactamente han caído en qué clúster como se muestra en 
la siguente imagen 
3) procederemos a la agrupación de empleados con datos errones o fatlantes La 
empresa de software para internet “Memolum Web” ha aumentado 
vertiginosamente su plantilla en los últimos años, debido principalmente a una 
absorción de la compañía “Intelligent Stones” y quiere ver si las tipologías de 
empleados existentes siguen valiendo. Las variables que se recogen de las fichas 
de los 40 empleados actuales de la empresa son: 
· Sueldo: sueldo anual en euros. 
· Casado: si está casado o no. 
· Coche: si viene en coche a trabajar (o al menos si lo aparca en el parking de la 
empresa). 
· Hijos: si tiene hijos. 
· Alq/Prop: si vive en una casa alquilada o propia. 
· Sindic.: si pertenece al sindicato revolucionario de Internet 
· Bajas/Año: media del nº de bajas por año 
· Antigüedad: antigüedad en la empresa 
· Sexo: H: hombre, M: mujer.
a) si corremos nuestra tabla conectada al var.file podremos observar los datos 
faltantes así como los erróneos que en los siguientes pasos se realizara el correcto 
análisis en la imagen inferior se muestra la tabla con los campos los cuales están 
sin contenido. 
b) Ahora vamos a realizar ciertas gráficas para detectar datos anómalos. Nos 
interesa ver los datos numéricos, ya que en estos casos es más fácil detectar 
outliers. Para ello podemos añadir ciertos nodos “Plot” para comparar diferentes 
valores. Por ejemplo, podemos querer visualizar la antigüedad respecto al sueldo y 
además mostrando los estudios. Añadimos un nodo “Plot” y lo enganchamos con la 
fuente de datos. Si lo editamos podemos especificar que el campo X será “Sueldo”, 
el campo Y será “Antigüedad” y el campo de overlay será “Estudios”:
Si lo ejecutamos tendremos la siguiente gráfica: 
Parece destacar un dato cerca de los 400000€ de sueldo que parece ser un dato 
anómalo, dadas las características de la empresa. 
c) De modo similar podemos añadir y conectar otro nodo Plot para intentar 
relacionar el número de Hijos con las Bajas mostrando el Sexo como overlay. El 
resultado es el siguiente.
de momento, no nos aporta demasiada información, aparte que la antiguedad 
parece estar relacionada con estar casado. Elige una interpretación para esta 
relación: 
a) Los jóvenes van saltando de una empresa a otra, con lo que no obtienen 
antigüedad. 
b) La edad y el estado civil están relacionados en el total de la población por lo 
que esto no es más que una muestra de ello, ya que para estar más de 10 años 
en la empresa hay que tener por lo menos 30 años. 
c) Casarse envejece. 
d) Todas las anteriores. 
El stream que llevamos hasta el momento es el que se muestra en la siguiente 
figura:
4) Siguiendo con nuestro problema, hemos identificado dos campos con valores 
faltantes y dos registros anómalos. Ya que tenemos 40 empleados, lo más 
conveniente en este caso es eliminar los dos registros anómalos, pues los 
resultados con 38 empleados van a ser similares que con 40 (además más fiables 
al haber eliminado registros dudosos). 
a)Para eliminarlos, iremos al archivo cvs y los elimaneros guardaremos cambios y 
se cargara de nuevo la base de datos en var.file ejecutamos el nodo “Table” y 
pinchamos sobre los datos anómalos: en este caso 
El sueldo del registro 16 y los hijos del registro 18, como se muestra en la 
siguiente figura.
Posteior mente correremos la tabla, como podemos observar los datos anomalos 
ya no se encuentran que era el renglon 16 y 18 
Pulsando en el menú “Generate”, pulsamos la opción “Select Node (“or”)”: el cual 
nos creara un generated en la superficie de trabajo como se muetra a 
continuación. 
Nos ha generado un nodo select con el nombre “Generated”. Enganchamos el 
nodo fuente con él y lo editamos, para comprobar que las condiciones se han
generado bien y para modificar el modo a y para modificar el modo a “Discard” 
(porque son los que queremos eliminar), como se muestra en la siguiente figura: 
Para combrobar que los datos anómalos se han eliminado aregaremos una tabla 
nueva y la conectaremos con el nodo créate y procederos a ejecutarla para 
sersiorarnos que los datos anómalos se han eliminado como podemos observar 
en la imagen inferior.
Podemos añadir un nodo “Table” y engancharlo con el nodo “generated” para 
comprobar que realmente elimina esos dos registros, resultando en 38 registros de 
datos.Una vez resuelto el tema de los datos anómalos vamos a ocuparnos de los 
datos faltantes. En primer lugar vamos a abordar el campo “Estudios”. Según se 
tiene conocimiento de la manera de adquirir este dato (en el momento de 
contratación en la empresa) es muy posible que la ausencia de valor en este 
campo pueda significar que el contratado no tenía estudios aparte de los 
elementales, 
Dejando en blanco este campo. Por tanto, vamos a suponer que aquellos registros 
sin estudios van a ser realmente “Estudios obligatorios”. Para arreglarlo, y 
siguiendo este criterio, vamos a añadir un nodo “Filler”. Previamente debemos 
añadir un nodo “Type” y conectarlo al nodo“generated”, como se muestra a 
continuación 
Ahora pinchamos en el checkbox “defibe blancks”, para que nos reconozca los 
valores en blanco, como se muestra en la siguiente figura:
Ahora ya sólo nos queda abordar los blancos en “Alq/Prop”. Al haber tres casos 
con nulo en este atributo, no parece aconsejable eliminar tres registros, ya que su 
información puede ser valiosa. La idea es intentar rellenarlos con algún valor 
relativamente razonable. Una idea sería ver qué valor es más frecuente y rellenar 
con ese valor, pero en este caso prácticamente los dos valores tienen una 
frecuencia similar. Otra opción sería predecir ese valor faltante. Eso es lo que 
vamos a hacer. Para ello vamos a crear un clasificador para obtener este valor. En 
primer lugar, vamos a eliminar (momentáneamente) los tres valores blancos. Para 
ello, ejecutamos el último nodo “table” yseleccionamos uno de los campos que 
estén en blanco. Pulsamos en el menú “Generate” como se muestra a 
constinuacion en el diagrama:
Nos ha generado un nodo “Generated” que enganchamos al nodo “filler”. Editamos 
el nodo “Generated” para que excluya estos registros nulos: 
Ahora añadimos un nodo “Type” a este nodo “generated” y vamos a señalar el 
campo “Alq/Prop” como campo de salida (OUT):
Ahora añadimos un nodo de clasificación, por ejemplo, un “C&r tree” y lo 
enganchamos al nodo Type como se muestra en la siguiente figura: 
Ahora ejecutamos el stream y obtenemos un modelo en el área de trabajo derecha 
del Clementine. El cual conectaremos a nuestro nodo type como se muestra en la 
siguiente imgen:
Añadimos un nodo “analysis", se conectara nuestro crt alq/prop como se muestra 
en la siguiente figura: 
Podemos evaluar la calidad del modelo ejecutando el nodo “analysis": el cual nos 
dará un 100% de correct lo cual es un muy porcentaje. 
Este modelo es lo suficientemente aceptable para substituirnos los valores blancos 
que teníamos en ese campo. Para ello, volvemos a copiar el modelo en la zona de 
trabajo de la izquierda y lo enganchamos a través de un nuevo nodo Type con el 
filler y añadimos un nodo “Table”:
Si ejecutamos la tabla, vemos que el modelo genera valores para Alq/Prop en un 
nuevo campo “RAlq/Prop”:
Por último, el campo “Estudios” sería interesante que fuera numérico en vez de 
simbólico. Es decir, que fuera una escala. Para ello añadimos un nodo “Derive”. Lo 
conectamos al nodo diamante “Alq/Prop” de arriba y lo editamos, poniendo como 
nombre “Vestudios” y de tipo “Set”, 
Ponemos el primer valor current 1 con la condición (Estudios == ‘Obl’) y le damos 
al botón “Add”. Así lo vamos haciendo con todos los valores siguientes, como se 
muestra en la siguiente tabla:como se muestra en la figura:
Podemos observar el resultado añadiendo un nodo “Table”: 
Por último, ya sólo nos falta quedarnos con las columnas válidas. En este caso, se 
trata de quedarnos con la columna Vestudios y no la vieja Estudios y en el caso de 
Alq/Prop con la derivada y no con la original, que tiene blancos. Para eso 
simplemente añadimos un nodo Filter que enganchamos con el nodo “VEstudios" 
y lo editamos de la siguiente manera:
Ahora ya podemos examinar mejor los datos y realizar múltiples gráficas y tablas 
para analizar losdatos, p.ej. los plots que ya vimos, nuevos histogramas, tablas 
“Matriz”, etc:Para esto agragaremos tres plots y los conectaremos al ultimo filter tal 
como se muestra en la figura 
Ahora vamos a añadir un nodo “Type” que lo enganchamos a continuación de 
“filter” y ponemos la dirección de todos los campos a IN menos el campo “#Ej” que 
ponemos NONE. 
Además, para pode utilizar bien los datos, vamos a cambiar el tipo de VEstudios, 
que lo habíamos generado como Set y vamos a cambiarlo a Integer Value 
utilizando un nodo Type adicional, como se muestra en la siguiente figura:
Agregaremos un nodo kemens para obtener los datos deseados después de 
aplicar los filtros en el nodo filter 
A continuación procederemos a ejecutar nuestro nodo kemens para extraer los 
datos el cual obtendremos un diamante k-mens el cual aparecerá en la parte 
superior derecha del programa lo conectaremos a nustro nodo type.
Procederemos a agregar una table la cual conectaremos al diamante k-mens para 
observar los datos filtrados que nos aparesera como cluster se muestra en la 
siguente figura 
A continuación procederemos a agregar un nodo región el cual nos alludara a 
establecer la regiones de los clustering de el k-mens previamente configurado
A continuación agregaremos un nuevo nodo k-mens el cual conectaremos a el nodo 
región para clustericar los datos deseados. 
Procederemos a ejecutar el nodo kmens el cual clusterisara nuestros datos 
posteriormente etraeremos el diamante k-mens el cual contendrá los datos de 
clostering.
Agregaremos una tabla nueva para ver los datos clasificados por regiones el cual 
la tabla la conectaremos de nuestro nodo región. 
Procedemos a ejecutar nustra tabla para ver los datos clustering cargados por 
región.
Por ultmio crearemos un nodo k-mens para cargar un nuevo grupos de datos 
obteniendo otra dimencion y filtro el cual se conectara a nustro nodo región. 
Procederemos a ejecutar nuestro nodo k-means para obtener el diamante k-mens 
el cual lo conectaremos a nuestro nodo región.
Para comporbar la closterisacion correcta de nuestro k-mens agregaremos una 
tabla la cual conectaremos a nuestro k-mens 
Procederemos a ejecutar nuestra tabla la cual nos dara como resultado nuestra 
tabla de empledos clasificados por clusterin deseados

Más contenido relacionado

La actualidad más candente

Listas doblemente enlazadas
Listas doblemente enlazadasListas doblemente enlazadas
Listas doblemente enlazadas
DĴäîřo Lêmä
 
Árboles Multicamino, B y B+
Árboles Multicamino, B y B+Árboles Multicamino, B y B+
Árboles Multicamino, B y B+
Alvaro Enrique Ruano
 
Algoritmo ricart y Agrawala
Algoritmo ricart y AgrawalaAlgoritmo ricart y Agrawala
Algoritmo ricart y Agrawala
JackBryan3
 
Big Data: megatendencias digitales
Big Data: megatendencias digitalesBig Data: megatendencias digitales
Big Data: megatendencias digitales
Edison Coimbra G.
 
Pilas estáticas. IESIT
Pilas estáticas. IESITPilas estáticas. IESIT
Pilas estáticas. IESIT
Blanca Elia Jiménez Guzmán
 
Arquitectura de cliente-servidor de tres capas
Arquitectura de cliente-servidor de tres capasArquitectura de cliente-servidor de tres capas
Arquitectura de cliente-servidor de tres capas
anibalsmit
 
Distribución y fragmentación de datos
Distribución y fragmentación  de datosDistribución y fragmentación  de datos
Distribución y fragmentación de datosJosé Mendoza
 
VPNs sobre MPLS con Tecnología Cisco
VPNs sobre MPLS con Tecnología CiscoVPNs sobre MPLS con Tecnología Cisco
VPNs sobre MPLS con Tecnología Cisco
Francisco Javier Novoa de Manuel
 
Administración de Base de Datos
Administración de Base de DatosAdministración de Base de Datos
Administración de Base de DatosAxel Mérida
 
Mapa Conceptual TCP IP
Mapa Conceptual TCP IPMapa Conceptual TCP IP
Mapa Conceptual TCP IP
José Alexis Cruz Solar
 
Protocolos usados por ad ds
Protocolos usados por ad dsProtocolos usados por ad ds
Protocolos usados por ad ds
Jesus Garcia Guevara
 
arboles-b
arboles-barboles-b
Inserción,borrado y búsqueda en Arboles Binarios(Java)
Inserción,borrado y búsqueda en Arboles Binarios(Java)Inserción,borrado y búsqueda en Arboles Binarios(Java)
Inserción,borrado y búsqueda en Arboles Binarios(Java)
Stalin Eduardo Tusa Vitar
 
Pilas como estructura de datos..
Pilas como estructura de datos..Pilas como estructura de datos..
Pilas como estructura de datos..
NANO-06
 
Guia n7 lenguaje de definicion de datos en sql server 2012
Guia n7 lenguaje de definicion de datos en sql server 2012Guia n7 lenguaje de definicion de datos en sql server 2012
Guia n7 lenguaje de definicion de datos en sql server 2012
Johan Silva Cueva
 
Capa de Red del modelo OSI
Capa de Red del modelo OSICapa de Red del modelo OSI
Capa de Red del modelo OSINeryEdaly
 

La actualidad más candente (20)

Arquitectura integra 2
Arquitectura integra 2Arquitectura integra 2
Arquitectura integra 2
 
Listas doblemente enlazadas
Listas doblemente enlazadasListas doblemente enlazadas
Listas doblemente enlazadas
 
Árboles Multicamino, B y B+
Árboles Multicamino, B y B+Árboles Multicamino, B y B+
Árboles Multicamino, B y B+
 
Algoritmo ricart y Agrawala
Algoritmo ricart y AgrawalaAlgoritmo ricart y Agrawala
Algoritmo ricart y Agrawala
 
Big Data: megatendencias digitales
Big Data: megatendencias digitalesBig Data: megatendencias digitales
Big Data: megatendencias digitales
 
Pilas estáticas. IESIT
Pilas estáticas. IESITPilas estáticas. IESIT
Pilas estáticas. IESIT
 
Versiones de sql
Versiones de sqlVersiones de sql
Versiones de sql
 
Arquitectura de cliente-servidor de tres capas
Arquitectura de cliente-servidor de tres capasArquitectura de cliente-servidor de tres capas
Arquitectura de cliente-servidor de tres capas
 
Distribución y fragmentación de datos
Distribución y fragmentación  de datosDistribución y fragmentación  de datos
Distribución y fragmentación de datos
 
VPNs sobre MPLS con Tecnología Cisco
VPNs sobre MPLS con Tecnología CiscoVPNs sobre MPLS con Tecnología Cisco
VPNs sobre MPLS con Tecnología Cisco
 
Administración de Base de Datos
Administración de Base de DatosAdministración de Base de Datos
Administración de Base de Datos
 
Mapa Conceptual TCP IP
Mapa Conceptual TCP IPMapa Conceptual TCP IP
Mapa Conceptual TCP IP
 
Protocolos usados por ad ds
Protocolos usados por ad dsProtocolos usados por ad ds
Protocolos usados por ad ds
 
arboles-b
arboles-barboles-b
arboles-b
 
Inserción,borrado y búsqueda en Arboles Binarios(Java)
Inserción,borrado y búsqueda en Arboles Binarios(Java)Inserción,borrado y búsqueda en Arboles Binarios(Java)
Inserción,borrado y búsqueda en Arboles Binarios(Java)
 
Concurrencia
ConcurrenciaConcurrencia
Concurrencia
 
Pilas como estructura de datos..
Pilas como estructura de datos..Pilas como estructura de datos..
Pilas como estructura de datos..
 
Arboles multicamino
Arboles  multicaminoArboles  multicamino
Arboles multicamino
 
Guia n7 lenguaje de definicion de datos en sql server 2012
Guia n7 lenguaje de definicion de datos en sql server 2012Guia n7 lenguaje de definicion de datos en sql server 2012
Guia n7 lenguaje de definicion de datos en sql server 2012
 
Capa de Red del modelo OSI
Capa de Red del modelo OSICapa de Red del modelo OSI
Capa de Red del modelo OSI
 

Similar a Practica de clementine 12.0

Documentacion olap
Documentacion olapDocumentacion olap
Documentacion olapITSL
 
Manual
ManualManual
Manual de la conexion de gambas a la base de datos de postgres
Manual de la conexion de gambas a la base de datos de postgresManual de la conexion de gambas a la base de datos de postgres
Manual de la conexion de gambas a la base de datos de postgres
nose tamok se
 
X nuevo trabajo de word
X nuevo trabajo de wordX nuevo trabajo de word
X nuevo trabajo de word
michael ortiz arango
 
Base de datos access michael tutorial completo
Base de datos access michael tutorial completoBase de datos access michael tutorial completo
Base de datos access michael tutorial completo
michael ortiz arango
 
Base de datos y reportes
Base de datos y reportesBase de datos y reportes
Base de datos y reportes
Cisne Criollo
 
Clase Access
Clase AccessClase Access
Clase Access
javier martin
 
Guia laboratorio 02
Guia laboratorio 02Guia laboratorio 02
Guia laboratorio 02dalinlinlefa
 
Ejemplo práctico con power bi desktop
Ejemplo práctico con power bi desktopEjemplo práctico con power bi desktop
Ejemplo práctico con power bi desktop
SamRivasplata
 
Cómo hacer un gráfico que cambia de color automáticamente
Cómo hacer un gráfico que cambia de color automáticamenteCómo hacer un gráfico que cambia de color automáticamente
Cómo hacer un gráfico que cambia de color automáticamente
Funcionarios Eficientes
 
Openofficecalc1
Openofficecalc1Openofficecalc1
Openofficecalc1
Manuel Scorza
 
Ejemplo Access - Excel.pdf
Ejemplo Access - Excel.pdfEjemplo Access - Excel.pdf
Ejemplo Access - Excel.pdf
DouglasCordero5
 
Trabajo programcion
Trabajo programcionTrabajo programcion
Trabajo programcion
Cisne Criollo
 
Creando graficas en una celda
Creando graficas en una celdaCreando graficas en una celda
Creando graficas en una celda
Fidel Hernandez
 
Diagrama de pareto en excel 11 1
Diagrama de pareto en excel 11 1Diagrama de pareto en excel 11 1
Diagrama de pareto en excel 11 1
Jaxzar
 

Similar a Practica de clementine 12.0 (20)

Tp basedatos
Tp basedatosTp basedatos
Tp basedatos
 
Documentacion olap
Documentacion olapDocumentacion olap
Documentacion olap
 
Manual
ManualManual
Manual
 
Manual de la conexion de gambas a la base de datos de postgres
Manual de la conexion de gambas a la base de datos de postgresManual de la conexion de gambas a la base de datos de postgres
Manual de la conexion de gambas a la base de datos de postgres
 
X nuevo trabajo de word
X nuevo trabajo de wordX nuevo trabajo de word
X nuevo trabajo de word
 
Cubo Olap
Cubo OlapCubo Olap
Cubo Olap
 
Base de datos access michael tutorial completo
Base de datos access michael tutorial completoBase de datos access michael tutorial completo
Base de datos access michael tutorial completo
 
Base de datos y reportes
Base de datos y reportesBase de datos y reportes
Base de datos y reportes
 
Conexiondinamica
ConexiondinamicaConexiondinamica
Conexiondinamica
 
Conexiondinamica
ConexiondinamicaConexiondinamica
Conexiondinamica
 
Clase Access
Clase AccessClase Access
Clase Access
 
Guia laboratorio 02
Guia laboratorio 02Guia laboratorio 02
Guia laboratorio 02
 
Ejemplo práctico con power bi desktop
Ejemplo práctico con power bi desktopEjemplo práctico con power bi desktop
Ejemplo práctico con power bi desktop
 
Cómo hacer un gráfico que cambia de color automáticamente
Cómo hacer un gráfico que cambia de color automáticamenteCómo hacer un gráfico que cambia de color automáticamente
Cómo hacer un gráfico que cambia de color automáticamente
 
Hoja de calculo
Hoja de calculoHoja de calculo
Hoja de calculo
 
Openofficecalc1
Openofficecalc1Openofficecalc1
Openofficecalc1
 
Ejemplo Access - Excel.pdf
Ejemplo Access - Excel.pdfEjemplo Access - Excel.pdf
Ejemplo Access - Excel.pdf
 
Trabajo programcion
Trabajo programcionTrabajo programcion
Trabajo programcion
 
Creando graficas en una celda
Creando graficas en una celdaCreando graficas en una celda
Creando graficas en una celda
 
Diagrama de pareto en excel 11 1
Diagrama de pareto en excel 11 1Diagrama de pareto en excel 11 1
Diagrama de pareto en excel 11 1
 

Último

Presidencias radicales (1916 – 1930) (1) (1).pdf
Presidencias radicales (1916 – 1930) (1) (1).pdfPresidencias radicales (1916 – 1930) (1) (1).pdf
Presidencias radicales (1916 – 1930) (1) (1).pdf
MARIANA110300
 
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdfINFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
Alejandrogarciapanta
 
Tema 3-3 Métodos anticonceptivos y ETS 2024
Tema 3-3 Métodos anticonceptivos y ETS 2024Tema 3-3 Métodos anticonceptivos y ETS 2024
Tema 3-3 Métodos anticonceptivos y ETS 2024
IES Vicent Andres Estelles
 
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
20minutos
 
El ensayo mexicano en el siglo XX LITERATURA
El ensayo mexicano en el siglo XX LITERATURAEl ensayo mexicano en el siglo XX LITERATURA
El ensayo mexicano en el siglo XX LITERATURA
Armando920824
 
Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptxSemana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
LorenaCovarrubias12
 
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de MadridHorarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
20minutos
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
JAVIER SOLIS NOYOLA
 
el pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdfel pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdf
almitamtz00
 
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLMExamen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Juan Martín Martín
 
6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx
6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx
6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx
DanielaBurgosnazario
 
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdfGuia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Demetrio Ccesa Rayme
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
pablomarin116
 
UNA VISITA A SAN PEDRO EN EL VATICANO.pdf
UNA VISITA A SAN PEDRO EN EL VATICANO.pdfUNA VISITA A SAN PEDRO EN EL VATICANO.pdf
UNA VISITA A SAN PEDRO EN EL VATICANO.pdf
Joan Ribes Gallén
 
225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf
225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf
225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf
ReivajZetinebAvlis
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
Distea V región
 
JOSÉ MARÍA ARGUEDAS cuentos breves para secundaria
JOSÉ MARÍA ARGUEDAS cuentos breves para secundariaJOSÉ MARÍA ARGUEDAS cuentos breves para secundaria
JOSÉ MARÍA ARGUEDAS cuentos breves para secundaria
alegrialesliemarlene
 
Las Tecnologias Digitales en los Aprendizajesdel Siglo XXI UNESCO Ccesa007.pdf
Las Tecnologias Digitales en los Aprendizajesdel Siglo XXI  UNESCO Ccesa007.pdfLas Tecnologias Digitales en los Aprendizajesdel Siglo XXI  UNESCO Ccesa007.pdf
Las Tecnologias Digitales en los Aprendizajesdel Siglo XXI UNESCO Ccesa007.pdf
Demetrio Ccesa Rayme
 
El espiritismo desenmascarado.pdf. Lec. 10
El espiritismo desenmascarado.pdf. Lec. 10El espiritismo desenmascarado.pdf. Lec. 10
El espiritismo desenmascarado.pdf. Lec. 10
Alejandrino Halire Ccahuana
 
EVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptx
EVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptxEVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptx
EVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptx
Victor Elizalde P
 

Último (20)

Presidencias radicales (1916 – 1930) (1) (1).pdf
Presidencias radicales (1916 – 1930) (1) (1).pdfPresidencias radicales (1916 – 1930) (1) (1).pdf
Presidencias radicales (1916 – 1930) (1) (1).pdf
 
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdfINFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
 
Tema 3-3 Métodos anticonceptivos y ETS 2024
Tema 3-3 Métodos anticonceptivos y ETS 2024Tema 3-3 Métodos anticonceptivos y ETS 2024
Tema 3-3 Métodos anticonceptivos y ETS 2024
 
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
 
El ensayo mexicano en el siglo XX LITERATURA
El ensayo mexicano en el siglo XX LITERATURAEl ensayo mexicano en el siglo XX LITERATURA
El ensayo mexicano en el siglo XX LITERATURA
 
Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptxSemana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
 
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de MadridHorarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
 
el pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdfel pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdf
 
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLMExamen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
 
6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx
6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx
6° GRADO UNIDAD DE APRENDIZAJE 3 JUNIO.docx
 
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdfGuia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
 
UNA VISITA A SAN PEDRO EN EL VATICANO.pdf
UNA VISITA A SAN PEDRO EN EL VATICANO.pdfUNA VISITA A SAN PEDRO EN EL VATICANO.pdf
UNA VISITA A SAN PEDRO EN EL VATICANO.pdf
 
225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf
225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf
225189039-Jornada-de-Errores-Medicos-Rafael-Olivera-Figueroa.pdf
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
 
JOSÉ MARÍA ARGUEDAS cuentos breves para secundaria
JOSÉ MARÍA ARGUEDAS cuentos breves para secundariaJOSÉ MARÍA ARGUEDAS cuentos breves para secundaria
JOSÉ MARÍA ARGUEDAS cuentos breves para secundaria
 
Las Tecnologias Digitales en los Aprendizajesdel Siglo XXI UNESCO Ccesa007.pdf
Las Tecnologias Digitales en los Aprendizajesdel Siglo XXI  UNESCO Ccesa007.pdfLas Tecnologias Digitales en los Aprendizajesdel Siglo XXI  UNESCO Ccesa007.pdf
Las Tecnologias Digitales en los Aprendizajesdel Siglo XXI UNESCO Ccesa007.pdf
 
El espiritismo desenmascarado.pdf. Lec. 10
El espiritismo desenmascarado.pdf. Lec. 10El espiritismo desenmascarado.pdf. Lec. 10
El espiritismo desenmascarado.pdf. Lec. 10
 
EVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptx
EVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptxEVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptx
EVALUACION ESTUDIANTIL 2023-2024 Ecuador - Costa.pptx
 

Practica de clementine 12.0

  • 1.
  • 2. AGRUPACION DE EMPLEADOS La empresa de software para Internet “Memolum Web” quiere extraer tipologías de empleados, con el objetivo de hacer una política de personal más fundamentada y seleccionar a qué grupos incentivar. Las variables que se recogen de las fichas de los 15 empleados de la empresa en 1999 son: · Sueldo: sueldo anual en euros. · Casado: si está casado o no. · Coche: si viene en coche a trabajar (o al menos si lo aparca en el parking de la empresa). · Hijos: si tiene hijos. · Alq/Prop: si vive en una casa alquilada o propia. · Sindic.: si pertenece al sindicato revolucionario de Internet · Bajas/Año: media del nº de bajas por año · Antigüedad: antigüedad en la empresa · Sexo: H: hombre, M: mujer.
  • 3. RESOLUCION DEL PROBLEMA AGRUPACION DE EMPLEADOS 1. En primer lugar vamos a leer los datos de los empleados para lo cual procederemos a ir al programa clementine 12.0 ya ubicados en nuestra área de trabajo procedernos a agregar un var.file en nuestra área de trabajo que se localiza en la parte inferior como se indica a) ya agregado el var. File procederemos a dar doble click sobre el para cargar los datos como de muestra en la imagen inferior
  • 4. b) ubicaremos el archivo de Empleados4.csv que contiene los datos con los cuales se trabajara a lo largo de esta práctica el cual seleccionaremos y presionaremos el botón abrir. c) posteriormente de abrir el archivo cvs se cargaran los datos como se muestra a continuación, se aplicaran los cambios y los datos se cargaran al var.file.
  • 5. 2) Ahora añadiremos un nodo tabla el cual encontraremos en la parte inferior de la interface de clementina y lo conectaremos, para esto posicionaremos el más sobre el var.file pulsaremos clic derecho y seleccionaremos la opción conect con el clic izquierdo sobre la tabla realizaremos la conexión con el nodo var.File, como se ve en la siguiente figura: a) Se procederá a dar doble click sobre la tabla para verificar aparecerá una pantalla en la cual presionaremos el botón ejecute.
  • 6. b) aparecerá una tabla en la cual estarán los datos de lo contrario regrese a los pasos anteriores y verifique que no salteo ningún paso asi se vera la tabla. c) A continuación añadimos un nodo “Type” y lo enganchamos. Todos los atributos deberían estar IN exceptuando el número de ejemplo, que es irrelevante y pondremos NONE, como se muestra en lasiguiente figura:
  • 7. d) Ahora vamos a utilizar un algoritmo de clustering para obtener grupos sobre esta población. En primer lugar vamos a probar con tres grupos. Para ello añadimos un nodo Kmeans, lo enganchamos al nodo Type y modificamos el campo “Number of clusters” a 3, como se ve en la siguiente figura: c) Ahora podemos ejecutar el stream, obteniendo un nodo diamante Kmeans. Lo podemos añadir y conectaremos al nodo Type, como se muestra en la siguiente figura:
  • 8. d) ahora añadimos una tabla a la salida del nodo diamante Kmeans podemos observar qué ejemplos exactamente han caído en qué clúster como se muestra en la siguente imagen 3) procederemos a la agrupación de empleados con datos errones o fatlantes La empresa de software para internet “Memolum Web” ha aumentado vertiginosamente su plantilla en los últimos años, debido principalmente a una absorción de la compañía “Intelligent Stones” y quiere ver si las tipologías de empleados existentes siguen valiendo. Las variables que se recogen de las fichas de los 40 empleados actuales de la empresa son: · Sueldo: sueldo anual en euros. · Casado: si está casado o no. · Coche: si viene en coche a trabajar (o al menos si lo aparca en el parking de la empresa). · Hijos: si tiene hijos. · Alq/Prop: si vive en una casa alquilada o propia. · Sindic.: si pertenece al sindicato revolucionario de Internet · Bajas/Año: media del nº de bajas por año · Antigüedad: antigüedad en la empresa · Sexo: H: hombre, M: mujer.
  • 9. a) si corremos nuestra tabla conectada al var.file podremos observar los datos faltantes así como los erróneos que en los siguientes pasos se realizara el correcto análisis en la imagen inferior se muestra la tabla con los campos los cuales están sin contenido. b) Ahora vamos a realizar ciertas gráficas para detectar datos anómalos. Nos interesa ver los datos numéricos, ya que en estos casos es más fácil detectar outliers. Para ello podemos añadir ciertos nodos “Plot” para comparar diferentes valores. Por ejemplo, podemos querer visualizar la antigüedad respecto al sueldo y además mostrando los estudios. Añadimos un nodo “Plot” y lo enganchamos con la fuente de datos. Si lo editamos podemos especificar que el campo X será “Sueldo”, el campo Y será “Antigüedad” y el campo de overlay será “Estudios”:
  • 10. Si lo ejecutamos tendremos la siguiente gráfica: Parece destacar un dato cerca de los 400000€ de sueldo que parece ser un dato anómalo, dadas las características de la empresa. c) De modo similar podemos añadir y conectar otro nodo Plot para intentar relacionar el número de Hijos con las Bajas mostrando el Sexo como overlay. El resultado es el siguiente.
  • 11. de momento, no nos aporta demasiada información, aparte que la antiguedad parece estar relacionada con estar casado. Elige una interpretación para esta relación: a) Los jóvenes van saltando de una empresa a otra, con lo que no obtienen antigüedad. b) La edad y el estado civil están relacionados en el total de la población por lo que esto no es más que una muestra de ello, ya que para estar más de 10 años en la empresa hay que tener por lo menos 30 años. c) Casarse envejece. d) Todas las anteriores. El stream que llevamos hasta el momento es el que se muestra en la siguiente figura:
  • 12. 4) Siguiendo con nuestro problema, hemos identificado dos campos con valores faltantes y dos registros anómalos. Ya que tenemos 40 empleados, lo más conveniente en este caso es eliminar los dos registros anómalos, pues los resultados con 38 empleados van a ser similares que con 40 (además más fiables al haber eliminado registros dudosos). a)Para eliminarlos, iremos al archivo cvs y los elimaneros guardaremos cambios y se cargara de nuevo la base de datos en var.file ejecutamos el nodo “Table” y pinchamos sobre los datos anómalos: en este caso El sueldo del registro 16 y los hijos del registro 18, como se muestra en la siguiente figura.
  • 13. Posteior mente correremos la tabla, como podemos observar los datos anomalos ya no se encuentran que era el renglon 16 y 18 Pulsando en el menú “Generate”, pulsamos la opción “Select Node (“or”)”: el cual nos creara un generated en la superficie de trabajo como se muetra a continuación. Nos ha generado un nodo select con el nombre “Generated”. Enganchamos el nodo fuente con él y lo editamos, para comprobar que las condiciones se han
  • 14. generado bien y para modificar el modo a y para modificar el modo a “Discard” (porque son los que queremos eliminar), como se muestra en la siguiente figura: Para combrobar que los datos anómalos se han eliminado aregaremos una tabla nueva y la conectaremos con el nodo créate y procederos a ejecutarla para sersiorarnos que los datos anómalos se han eliminado como podemos observar en la imagen inferior.
  • 15. Podemos añadir un nodo “Table” y engancharlo con el nodo “generated” para comprobar que realmente elimina esos dos registros, resultando en 38 registros de datos.Una vez resuelto el tema de los datos anómalos vamos a ocuparnos de los datos faltantes. En primer lugar vamos a abordar el campo “Estudios”. Según se tiene conocimiento de la manera de adquirir este dato (en el momento de contratación en la empresa) es muy posible que la ausencia de valor en este campo pueda significar que el contratado no tenía estudios aparte de los elementales, Dejando en blanco este campo. Por tanto, vamos a suponer que aquellos registros sin estudios van a ser realmente “Estudios obligatorios”. Para arreglarlo, y siguiendo este criterio, vamos a añadir un nodo “Filler”. Previamente debemos añadir un nodo “Type” y conectarlo al nodo“generated”, como se muestra a continuación Ahora pinchamos en el checkbox “defibe blancks”, para que nos reconozca los valores en blanco, como se muestra en la siguiente figura:
  • 16. Ahora ya sólo nos queda abordar los blancos en “Alq/Prop”. Al haber tres casos con nulo en este atributo, no parece aconsejable eliminar tres registros, ya que su información puede ser valiosa. La idea es intentar rellenarlos con algún valor relativamente razonable. Una idea sería ver qué valor es más frecuente y rellenar con ese valor, pero en este caso prácticamente los dos valores tienen una frecuencia similar. Otra opción sería predecir ese valor faltante. Eso es lo que vamos a hacer. Para ello vamos a crear un clasificador para obtener este valor. En primer lugar, vamos a eliminar (momentáneamente) los tres valores blancos. Para ello, ejecutamos el último nodo “table” yseleccionamos uno de los campos que estén en blanco. Pulsamos en el menú “Generate” como se muestra a constinuacion en el diagrama:
  • 17. Nos ha generado un nodo “Generated” que enganchamos al nodo “filler”. Editamos el nodo “Generated” para que excluya estos registros nulos: Ahora añadimos un nodo “Type” a este nodo “generated” y vamos a señalar el campo “Alq/Prop” como campo de salida (OUT):
  • 18. Ahora añadimos un nodo de clasificación, por ejemplo, un “C&r tree” y lo enganchamos al nodo Type como se muestra en la siguiente figura: Ahora ejecutamos el stream y obtenemos un modelo en el área de trabajo derecha del Clementine. El cual conectaremos a nuestro nodo type como se muestra en la siguiente imgen:
  • 19. Añadimos un nodo “analysis", se conectara nuestro crt alq/prop como se muestra en la siguiente figura: Podemos evaluar la calidad del modelo ejecutando el nodo “analysis": el cual nos dará un 100% de correct lo cual es un muy porcentaje. Este modelo es lo suficientemente aceptable para substituirnos los valores blancos que teníamos en ese campo. Para ello, volvemos a copiar el modelo en la zona de trabajo de la izquierda y lo enganchamos a través de un nuevo nodo Type con el filler y añadimos un nodo “Table”:
  • 20. Si ejecutamos la tabla, vemos que el modelo genera valores para Alq/Prop en un nuevo campo “RAlq/Prop”:
  • 21. Por último, el campo “Estudios” sería interesante que fuera numérico en vez de simbólico. Es decir, que fuera una escala. Para ello añadimos un nodo “Derive”. Lo conectamos al nodo diamante “Alq/Prop” de arriba y lo editamos, poniendo como nombre “Vestudios” y de tipo “Set”, Ponemos el primer valor current 1 con la condición (Estudios == ‘Obl’) y le damos al botón “Add”. Así lo vamos haciendo con todos los valores siguientes, como se muestra en la siguiente tabla:como se muestra en la figura:
  • 22. Podemos observar el resultado añadiendo un nodo “Table”: Por último, ya sólo nos falta quedarnos con las columnas válidas. En este caso, se trata de quedarnos con la columna Vestudios y no la vieja Estudios y en el caso de Alq/Prop con la derivada y no con la original, que tiene blancos. Para eso simplemente añadimos un nodo Filter que enganchamos con el nodo “VEstudios" y lo editamos de la siguiente manera:
  • 23. Ahora ya podemos examinar mejor los datos y realizar múltiples gráficas y tablas para analizar losdatos, p.ej. los plots que ya vimos, nuevos histogramas, tablas “Matriz”, etc:Para esto agragaremos tres plots y los conectaremos al ultimo filter tal como se muestra en la figura Ahora vamos a añadir un nodo “Type” que lo enganchamos a continuación de “filter” y ponemos la dirección de todos los campos a IN menos el campo “#Ej” que ponemos NONE. Además, para pode utilizar bien los datos, vamos a cambiar el tipo de VEstudios, que lo habíamos generado como Set y vamos a cambiarlo a Integer Value utilizando un nodo Type adicional, como se muestra en la siguiente figura:
  • 24. Agregaremos un nodo kemens para obtener los datos deseados después de aplicar los filtros en el nodo filter A continuación procederemos a ejecutar nuestro nodo kemens para extraer los datos el cual obtendremos un diamante k-mens el cual aparecerá en la parte superior derecha del programa lo conectaremos a nustro nodo type.
  • 25. Procederemos a agregar una table la cual conectaremos al diamante k-mens para observar los datos filtrados que nos aparesera como cluster se muestra en la siguente figura A continuación procederemos a agregar un nodo región el cual nos alludara a establecer la regiones de los clustering de el k-mens previamente configurado
  • 26. A continuación agregaremos un nuevo nodo k-mens el cual conectaremos a el nodo región para clustericar los datos deseados. Procederemos a ejecutar el nodo kmens el cual clusterisara nuestros datos posteriormente etraeremos el diamante k-mens el cual contendrá los datos de clostering.
  • 27. Agregaremos una tabla nueva para ver los datos clasificados por regiones el cual la tabla la conectaremos de nuestro nodo región. Procedemos a ejecutar nustra tabla para ver los datos clustering cargados por región.
  • 28. Por ultmio crearemos un nodo k-mens para cargar un nuevo grupos de datos obteniendo otra dimencion y filtro el cual se conectara a nustro nodo región. Procederemos a ejecutar nuestro nodo k-means para obtener el diamante k-mens el cual lo conectaremos a nuestro nodo región.
  • 29. Para comporbar la closterisacion correcta de nuestro k-mens agregaremos una tabla la cual conectaremos a nuestro k-mens Procederemos a ejecutar nuestra tabla la cual nos dara como resultado nuestra tabla de empledos clasificados por clusterin deseados