SlideShare una empresa de Scribd logo
ANÁLISIS DISCRIMINANTE
Análisis discriminante:
¿Qué tan fiable es tu clasificación?
Amaya Ramos Isaac Bernabé
I. Introducción
El Análisis Discriminante es una técnica
estadı́stica multivariante cuya finalidad es el
reconocimiento de patrones y aprendizaje de
máquinas para encontrar una combinación lineal
de rasgos que caracterizan o separan dos o más
clases de objetos o eventos.
En este reporte se utiliza este método para una
clasificación supervisada de variables cuantitati-
vas, en el que dos grupos son conocidos a priori y
nuevas observaciones se clasifican en uno de estos
en función de sus caracterı́sticas.
Figura 1: Análisis Discriminante
Para realizar esta clasificación se utiliza una ba-
se de datos en donde se tiene como variables de-
pendientes dos categorı́as, es decir, dos grupos de
clasificación. Estos grupos corresponden a dos tipo
de cráneos encontrados en el Tibet. Las variables
independientes son cinco medidas antropométri-
cas de longitudes, anchuras de cráneo y de cara
que pertenecen a 32 cráneos que conforman el nu-
mero total campos de la base de datos.
II. Desarrollo
Para realizar este análisis discriminante se co-
mienza importante a MATLAB la base de datos
(datos.csv) que contiene las muestras previamen-
te clasificados por los expertos. Un criterio que se
utiliza en Machine Learning para realizar clasifica-
ciones es utilizar el 80 % de la base de datos como
entrenamiento del algoritmo y el 20 % restante pa-
ra realizar las pruebas. Teniendo en cuenta esto se
tomaron 26 datos al azar para forma los datos de
entrenamiento y 6 datos para las pruebas.
Tabla 1: Datos de Entrenamiento
Datos en Entrenamiento
Lon An Al Al.C An.C Tipo
1 190.5 152.5 145 73.5 136.5 1
2 172.5 132 125.5 63 121 1
3 167 130 125.5 69.5 119.5 1
24 195.5 144 138.5 78.5 144 2
25 197 131.5 135 80.5 139 2
26 182.5 131 135 68.5 136 2
Tabla 2: Datos de Prueba
Datos de Prueba
Long An Al Al.C An.C Tipo
1 179.5 138 133.5 73.5 132.5 1
2 173.5 135.5 130.5 70 133.5 1
3 184.5 141.5 134.5 76.5 141.5 2
4 181 142 132.5 79 136.5 2
5 173.5 136.5 126 71.5 136.5 2
6 188.5 130 143 79.5 136 2
Una vez formados estos grupos de entrena-
miento y prueba se utiliza la función classify
para clasificar cada fila de datos de prueba. Esta
clasificación se hace de acuerdo al aprendizaje
Ing. Mecatrónica 1
ANÁLISIS DISCRIMINANTE
que se obtuvo del grupo de entrenamiento pro-
porcionado. En este caso se va a ocupar una
clasificación lineal, es decir la clasificación se
ajusta a una densidad normal multivariante para
cada grupo, con una estimación combinada de la
covarianza. Esta función también nos devuelve el
error de clasificación, tomando en cuenta la tasa
de observaciones de prueba mal clasificados.
En la figura 2 se muestra los resultados del clasi-
ficador, visualizando las variables Longitud y An-
chura.
Figura 2: Predicción del clasificador y Clasifica-
ción Real
A continuación se muestra la clasificación de los
grupos tomando en cuenta las 5 caracterı́sticas de
la base de datos.
Figura 3: Clasificación del predictor mostrando las
5 caracterı́sticas de la base de datos
Dentro del análisis de resultados se creo la si-
guiente matriz de confusión.
Figura 4: Matriz de confusión
Finalmente se calcularon las siguientes métricas
de clasificación.
Métrica Valor Métrica Valor
Acurracy 83,33 % Precisión
grupo 2
100 %
Sensibilidad
grupo 1
100 % Error ti-
po 1
0,25
Sensibilidad
grupo 2
75 % Error ti-
po 2
0
Precisión
grupo 1
66,667 %
Tabla 3: Métricas de clasificación
Ing. Mecatrónica 2
ANÁLISIS DISCRIMINANTE
III. Conclusión
Al observar la clasificación realizada podemos
ver que de 6 datos de prueba, el clasificador
tuvo un error del 19.09 %. Esto es cierto ya
que se puede ver como el clasificador etiquetó
un datos como grupo 1, mientras que viendo
los datos reales ese dato pertenece al grupo 2
(figura 4). Este error es comprensible ya que
tenemos un eje discriminante lineal , el cual
determina el limite para considerar que un dato
pertenezca a un grupo o a otro. Siguiendo esto,
el dato mal etiquetado se encuentra del lado
del grupo 1 , por lo que computacionalmen-
te es menos costoso etiquetarlo en ese grupo,
aunque realmente pertenezca al grupo 2 (figura 2).
Analizando la matriz de confusión podemos
determinar que la exactitud (Accuracy) de la
predicción es del 83.33 %. La exactitud nos indica
el numero de elementos clasificados correctamente
en comparación del numero total de datos. En
este caso de 6 datos, se observa que 5 datos están
bien clasificados.
También se puede ver la sensibilidad de la
predicción, es decir, los datos identificados co-
rrectamente como positivos del total de positivos
verdaderos. Esta sensibilidad es del 100 % para el
grupo 1, ya que de 2 datos pertenecientes al grupo
1, el clasificador los ha etiquetado correctamente.
Para el grupo 2 se tiene una sensibilidad del 75 %,
ya que de 4 datos pertenecientes a este grupo, el
clasificador ha etiquetado como positivos 3.
La precisión es la cantidad de datos identifica-
dos correctamente como positivos de un total de
elementos identificados como positivos. Para esta
métrica se tiene un 66.667 % de precisión para
el grupo 1 y un 100 % de precisión para el grupo 2.
Finalmente podemos decir que el clasificador
realizado tiene un buen rendimiento, aunque se
notó que modificando los porcentajes de datos
de entrenamiento y de prueba los porcentajes de
exactitud si disminuyen considerablemente.
Referencias
[1] SitioBigData, “Machine Learning: Seleccion
Metricas de clasificacion,” Jan. 2019.
[2] J. Martinez, “Precision, Recall, F1, Accuracy
en clasificación,” 2020. Section: machine lear-
ning.
[3] S. de La Fuente, “Análisis Discriminante,”
tech. rep., Fac. Ciencias Económicas y Empre-
sariales, 2011.
[4] J. A. Rodrigo, “Análisis discriminante li-
neal (LDA) y análisis discriminante cuadrático
(QDA),” 2016.
Ing. Mecatrónica 3

Más contenido relacionado

La actualidad más candente

Distribución Hipergeometrica
Distribución HipergeometricaDistribución Hipergeometrica
Distribución HipergeometricaRonny Sanchez
 
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICA
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICAAPROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICA
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICAyaritza_ing
 
Clasificador naive bayes
Clasificador naive bayesClasificador naive bayes
Clasificador naive bayesNetworkTIC
 
(3). lagrange 2019-1
(3). lagrange 2019-1(3). lagrange 2019-1
(3). lagrange 2019-1kevin cordova
 
AEP19. Presentaciones: Cap. 5. Valor esperado
AEP19. Presentaciones: Cap. 5. Valor esperadoAEP19. Presentaciones: Cap. 5. Valor esperado
AEP19. Presentaciones: Cap. 5. Valor esperadoFrancisco Sandoval
 
Teorema de bayes, probabilidad total & probabilidad condicional
Teorema de bayes, probabilidad total & probabilidad condicional Teorema de bayes, probabilidad total & probabilidad condicional
Teorema de bayes, probabilidad total & probabilidad condicional Cynthiia Ot
 
Principio de minimos cuadrados
Principio de minimos cuadradosPrincipio de minimos cuadrados
Principio de minimos cuadradosEstef_ML4
 
Algoritmos Genéticos
Algoritmos GenéticosAlgoritmos Genéticos
Algoritmos GenéticosESCOM
 
P4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multipleP4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multipleEvelyn Arrey
 
2017 Distribuciones de Probabilidad- Guía de estudio-
2017 Distribuciones de Probabilidad- Guía de estudio- 2017 Distribuciones de Probabilidad- Guía de estudio-
2017 Distribuciones de Probabilidad- Guía de estudio- Zoraida Pérez S.
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealjorge chami
 

La actualidad más candente (20)

Cálculo de la muestra
Cálculo de la muestraCálculo de la muestra
Cálculo de la muestra
 
DISTRIBUCION MUESTRAL
DISTRIBUCION MUESTRALDISTRIBUCION MUESTRAL
DISTRIBUCION MUESTRAL
 
Distribución Hipergeometrica
Distribución HipergeometricaDistribución Hipergeometrica
Distribución Hipergeometrica
 
EJERCICIOS DE DISTRIBUCIÓN MULTINOMIAL
EJERCICIOS DE DISTRIBUCIÓN MULTINOMIALEJERCICIOS DE DISTRIBUCIÓN MULTINOMIAL
EJERCICIOS DE DISTRIBUCIÓN MULTINOMIAL
 
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICA
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICAAPROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICA
APROXIMACIÓN BINOMIAL DE HIPERGEOMÉTRICA
 
Clasificador naive bayes
Clasificador naive bayesClasificador naive bayes
Clasificador naive bayes
 
(3). lagrange 2019-1
(3). lagrange 2019-1(3). lagrange 2019-1
(3). lagrange 2019-1
 
Semana 2 1_
Semana 2 1_Semana 2 1_
Semana 2 1_
 
Relacion de problemas
Relacion de problemasRelacion de problemas
Relacion de problemas
 
AEP19. Presentaciones: Cap. 5. Valor esperado
AEP19. Presentaciones: Cap. 5. Valor esperadoAEP19. Presentaciones: Cap. 5. Valor esperado
AEP19. Presentaciones: Cap. 5. Valor esperado
 
Teorema de bayes, probabilidad total & probabilidad condicional
Teorema de bayes, probabilidad total & probabilidad condicional Teorema de bayes, probabilidad total & probabilidad condicional
Teorema de bayes, probabilidad total & probabilidad condicional
 
Principio de minimos cuadrados
Principio de minimos cuadradosPrincipio de minimos cuadrados
Principio de minimos cuadrados
 
Clase12 heterocedasticidad
Clase12 heterocedasticidadClase12 heterocedasticidad
Clase12 heterocedasticidad
 
Algoritmos Genéticos
Algoritmos GenéticosAlgoritmos Genéticos
Algoritmos Genéticos
 
Distribuciones de probalidad
Distribuciones de probalidadDistribuciones de probalidad
Distribuciones de probalidad
 
6 sigmas cap. 2 resolucion
6 sigmas cap. 2 resolucion6 sigmas cap. 2 resolucion
6 sigmas cap. 2 resolucion
 
P4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multipleP4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multiple
 
2017 Distribuciones de Probabilidad- Guía de estudio-
2017 Distribuciones de Probabilidad- Guía de estudio- 2017 Distribuciones de Probabilidad- Guía de estudio-
2017 Distribuciones de Probabilidad- Guía de estudio-
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Teorema de chebyshev
Teorema de chebyshevTeorema de chebyshev
Teorema de chebyshev
 

Similar a Analisis discriminante

Pca. 9. validación de una escala logaritmica diagramática
Pca. 9. validación de una escala logaritmica diagramáticaPca. 9. validación de una escala logaritmica diagramática
Pca. 9. validación de una escala logaritmica diagramáticaSINAVEF_LAB
 
3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdf
3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdf3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdf
3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdfAdelioFalon
 
Reporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKAReporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKANathaly Rohe
 
Estadistica no parametrica aplus
Estadistica no parametrica aplusEstadistica no parametrica aplus
Estadistica no parametrica aplusMaestros Online
 
Estadistica no parametrica aplus
Estadistica no parametrica aplusEstadistica no parametrica aplus
Estadistica no parametrica aplusEducaciontodos
 
Normalidad uni y multivariante en r
Normalidad uni y multivariante en rNormalidad uni y multivariante en r
Normalidad uni y multivariante en redgar carpio
 
Rey diapositiva diapositivas_c10
Rey diapositiva diapositivas_c10Rey diapositiva diapositivas_c10
Rey diapositiva diapositivas_c10Jose Turcios
 
analisis de conglomerados prctica en spss
analisis de conglomerados prctica en spssanalisis de conglomerados prctica en spss
analisis de conglomerados prctica en spssjosephcruz74484
 
TEMA 08 - Análisis estadístico con IBM SPSS.pdf
TEMA 08 - Análisis estadístico con IBM SPSS.pdfTEMA 08 - Análisis estadístico con IBM SPSS.pdf
TEMA 08 - Análisis estadístico con IBM SPSS.pdfeminfo
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Estudio R & R Mejia
Estudio R & R  MejiaEstudio R & R  Mejia
Estudio R & R Mejiaguruclef01
 
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio ClínicoSistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio ClínicoIPN
 
Informe sobre análisis de datos experimentales en el laboratorio.
Informe sobre análisis de datos experimentales en el laboratorio.Informe sobre análisis de datos experimentales en el laboratorio.
Informe sobre análisis de datos experimentales en el laboratorio.Jean Vega
 
Capítulo 10 análisis de los datos cuantitativos
Capítulo 10 análisis de los datos cuantitativosCapítulo 10 análisis de los datos cuantitativos
Capítulo 10 análisis de los datos cuantitativosYarenisHerrera09
 

Similar a Analisis discriminante (20)

Analisis multivariante 2012
Analisis multivariante 2012Analisis multivariante 2012
Analisis multivariante 2012
 
A18v39n06p18jj
A18v39n06p18jjA18v39n06p18jj
A18v39n06p18jj
 
Descriptiva
DescriptivaDescriptiva
Descriptiva
 
Pca. 9. validación de una escala logaritmica diagramática
Pca. 9. validación de una escala logaritmica diagramáticaPca. 9. validación de una escala logaritmica diagramática
Pca. 9. validación de una escala logaritmica diagramática
 
3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdf
3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdf3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdf
3_TratamientoEstadisticoDeDatosAnaliticos_(G - 01-2020).pdf
 
Reporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKAReporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKA
 
Estadistica no parametrica aplus
Estadistica no parametrica aplusEstadistica no parametrica aplus
Estadistica no parametrica aplus
 
Estadistica no parametrica aplus
Estadistica no parametrica aplusEstadistica no parametrica aplus
Estadistica no parametrica aplus
 
Normalidad uni y multivariante en r
Normalidad uni y multivariante en rNormalidad uni y multivariante en r
Normalidad uni y multivariante en r
 
Rey diapositiva diapositivas_c10
Rey diapositiva diapositivas_c10Rey diapositiva diapositivas_c10
Rey diapositiva diapositivas_c10
 
analisis de conglomerados prctica en spss
analisis de conglomerados prctica en spssanalisis de conglomerados prctica en spss
analisis de conglomerados prctica en spss
 
SPSS versión 22 para ingenieros
SPSS versión 22 para ingenierosSPSS versión 22 para ingenieros
SPSS versión 22 para ingenieros
 
TEMA 08 - Análisis estadístico con IBM SPSS.pdf
TEMA 08 - Análisis estadístico con IBM SPSS.pdfTEMA 08 - Análisis estadístico con IBM SPSS.pdf
TEMA 08 - Análisis estadístico con IBM SPSS.pdf
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Exposicion Tema Analisis De Datos
Exposicion Tema Analisis De DatosExposicion Tema Analisis De Datos
Exposicion Tema Analisis De Datos
 
Estudio R & R Mejia
Estudio R & R  MejiaEstudio R & R  Mejia
Estudio R & R Mejia
 
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio ClínicoSistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
 
Informe sobre análisis de datos experimentales en el laboratorio.
Informe sobre análisis de datos experimentales en el laboratorio.Informe sobre análisis de datos experimentales en el laboratorio.
Informe sobre análisis de datos experimentales en el laboratorio.
 
Capítulo 10 análisis de los datos cuantitativos
Capítulo 10 análisis de los datos cuantitativosCapítulo 10 análisis de los datos cuantitativos
Capítulo 10 análisis de los datos cuantitativos
 
Trabajo de factorial
Trabajo de factorialTrabajo de factorial
Trabajo de factorial
 

Último

matematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccionmatematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccionalberto891871
 
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOLNORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOLPol Peña Quispe
 
IMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdf
IMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdfIMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdf
IMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdfJonathanFernandoRodr
 
Sistema de 4 barras articuladas bb_2.pdf
Sistema de 4 barras articuladas bb_2.pdfSistema de 4 barras articuladas bb_2.pdf
Sistema de 4 barras articuladas bb_2.pdfLuisMarioMartnez1
 
Diagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdfDiagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdfjoseabachesoto
 
Deilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - ConstrucciónDeilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - ConstrucciónDeilybethAinellAlaaY
 
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDFACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDFDavidMorales257484
 
monografia sobre puentes 1234456785432o5
monografia sobre puentes 1234456785432o5monografia sobre puentes 1234456785432o5
monografia sobre puentes 1234456785432o5garciacordovadiuler
 
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloPlan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloAlbertoRiveraPrado
 
Criterios de la primera y segunda derivada
Criterios de la primera y segunda derivadaCriterios de la primera y segunda derivada
Criterios de la primera y segunda derivadaYoverOlivares
 
Trabajo Mecanismos de cuatro barras.pdf
Trabajo  Mecanismos de cuatro barras.pdfTrabajo  Mecanismos de cuatro barras.pdf
Trabajo Mecanismos de cuatro barras.pdfIvanIsraelPiaColina
 
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptxTEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptxmaitecuba2006
 
Los vidrios eléctricos en un automóvil.pptx
Los vidrios eléctricos en un automóvil.pptxLos vidrios eléctricos en un automóvil.pptx
Los vidrios eléctricos en un automóvil.pptxIsraelRebolledo1
 
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOSAnálisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOSppame8010
 
SISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdfSISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdfIvanIsraelPiaColina
 
El abecedario constituye el conjunto de grafías que son utilizadas para repre...
El abecedario constituye el conjunto de grafías que son utilizadas para repre...El abecedario constituye el conjunto de grafías que son utilizadas para repre...
El abecedario constituye el conjunto de grafías que son utilizadas para repre...MarjorieDeLeon12
 
&PLC Ladder.pdf automatización industrial
&PLC Ladder.pdf automatización industrial&PLC Ladder.pdf automatización industrial
&PLC Ladder.pdf automatización industrialjulianmayta1
 
Joseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidadJoseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidadKevinCabrera96
 
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdfDavidHunucoAlbornoz
 

Último (20)

matematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccionmatematicas en la ingenieria de la construccion
matematicas en la ingenieria de la construccion
 
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOLNORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
 
IMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdf
IMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdfIMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdf
IMPORTANCIA DE LOS LIPIDOS EN FARMACIA.pdf
 
Sistema de 4 barras articuladas bb_2.pdf
Sistema de 4 barras articuladas bb_2.pdfSistema de 4 barras articuladas bb_2.pdf
Sistema de 4 barras articuladas bb_2.pdf
 
Diagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdfDiagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdf
 
Deilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - ConstrucciónDeilybeth Alaña - Operaciones Básicas - Construcción
Deilybeth Alaña - Operaciones Básicas - Construcción
 
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDFACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
ACT MECANISMO DE 4 BARRAS ARTICULADAS.PDF
 
monografia sobre puentes 1234456785432o5
monografia sobre puentes 1234456785432o5monografia sobre puentes 1234456785432o5
monografia sobre puentes 1234456785432o5
 
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloPlan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
 
Criterios de la primera y segunda derivada
Criterios de la primera y segunda derivadaCriterios de la primera y segunda derivada
Criterios de la primera y segunda derivada
 
Trabajo Mecanismos de cuatro barras.pdf
Trabajo  Mecanismos de cuatro barras.pdfTrabajo  Mecanismos de cuatro barras.pdf
Trabajo Mecanismos de cuatro barras.pdf
 
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptxTEMA 11.  FLUIDOS-HIDROSTATICA.TEORIApptx
TEMA 11. FLUIDOS-HIDROSTATICA.TEORIApptx
 
Los vidrios eléctricos en un automóvil.pptx
Los vidrios eléctricos en un automóvil.pptxLos vidrios eléctricos en un automóvil.pptx
Los vidrios eléctricos en un automóvil.pptx
 
DESVIACION
DESVIACION DESVIACION
DESVIACION
 
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOSAnálisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
 
SISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdfSISTEMA ARTICULADO DE CUATRO BARRAS .pdf
SISTEMA ARTICULADO DE CUATRO BARRAS .pdf
 
El abecedario constituye el conjunto de grafías que son utilizadas para repre...
El abecedario constituye el conjunto de grafías que son utilizadas para repre...El abecedario constituye el conjunto de grafías que son utilizadas para repre...
El abecedario constituye el conjunto de grafías que son utilizadas para repre...
 
&PLC Ladder.pdf automatización industrial
&PLC Ladder.pdf automatización industrial&PLC Ladder.pdf automatización industrial
&PLC Ladder.pdf automatización industrial
 
Joseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidadJoseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidad
 
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
14. DISEÑO LOSA ALIGERADA MOD G VOLADO.pdf
 

Analisis discriminante

  • 1. ANÁLISIS DISCRIMINANTE Análisis discriminante: ¿Qué tan fiable es tu clasificación? Amaya Ramos Isaac Bernabé I. Introducción El Análisis Discriminante es una técnica estadı́stica multivariante cuya finalidad es el reconocimiento de patrones y aprendizaje de máquinas para encontrar una combinación lineal de rasgos que caracterizan o separan dos o más clases de objetos o eventos. En este reporte se utiliza este método para una clasificación supervisada de variables cuantitati- vas, en el que dos grupos son conocidos a priori y nuevas observaciones se clasifican en uno de estos en función de sus caracterı́sticas. Figura 1: Análisis Discriminante Para realizar esta clasificación se utiliza una ba- se de datos en donde se tiene como variables de- pendientes dos categorı́as, es decir, dos grupos de clasificación. Estos grupos corresponden a dos tipo de cráneos encontrados en el Tibet. Las variables independientes son cinco medidas antropométri- cas de longitudes, anchuras de cráneo y de cara que pertenecen a 32 cráneos que conforman el nu- mero total campos de la base de datos. II. Desarrollo Para realizar este análisis discriminante se co- mienza importante a MATLAB la base de datos (datos.csv) que contiene las muestras previamen- te clasificados por los expertos. Un criterio que se utiliza en Machine Learning para realizar clasifica- ciones es utilizar el 80 % de la base de datos como entrenamiento del algoritmo y el 20 % restante pa- ra realizar las pruebas. Teniendo en cuenta esto se tomaron 26 datos al azar para forma los datos de entrenamiento y 6 datos para las pruebas. Tabla 1: Datos de Entrenamiento Datos en Entrenamiento Lon An Al Al.C An.C Tipo 1 190.5 152.5 145 73.5 136.5 1 2 172.5 132 125.5 63 121 1 3 167 130 125.5 69.5 119.5 1 24 195.5 144 138.5 78.5 144 2 25 197 131.5 135 80.5 139 2 26 182.5 131 135 68.5 136 2 Tabla 2: Datos de Prueba Datos de Prueba Long An Al Al.C An.C Tipo 1 179.5 138 133.5 73.5 132.5 1 2 173.5 135.5 130.5 70 133.5 1 3 184.5 141.5 134.5 76.5 141.5 2 4 181 142 132.5 79 136.5 2 5 173.5 136.5 126 71.5 136.5 2 6 188.5 130 143 79.5 136 2 Una vez formados estos grupos de entrena- miento y prueba se utiliza la función classify para clasificar cada fila de datos de prueba. Esta clasificación se hace de acuerdo al aprendizaje Ing. Mecatrónica 1
  • 2. ANÁLISIS DISCRIMINANTE que se obtuvo del grupo de entrenamiento pro- porcionado. En este caso se va a ocupar una clasificación lineal, es decir la clasificación se ajusta a una densidad normal multivariante para cada grupo, con una estimación combinada de la covarianza. Esta función también nos devuelve el error de clasificación, tomando en cuenta la tasa de observaciones de prueba mal clasificados. En la figura 2 se muestra los resultados del clasi- ficador, visualizando las variables Longitud y An- chura. Figura 2: Predicción del clasificador y Clasifica- ción Real A continuación se muestra la clasificación de los grupos tomando en cuenta las 5 caracterı́sticas de la base de datos. Figura 3: Clasificación del predictor mostrando las 5 caracterı́sticas de la base de datos Dentro del análisis de resultados se creo la si- guiente matriz de confusión. Figura 4: Matriz de confusión Finalmente se calcularon las siguientes métricas de clasificación. Métrica Valor Métrica Valor Acurracy 83,33 % Precisión grupo 2 100 % Sensibilidad grupo 1 100 % Error ti- po 1 0,25 Sensibilidad grupo 2 75 % Error ti- po 2 0 Precisión grupo 1 66,667 % Tabla 3: Métricas de clasificación Ing. Mecatrónica 2
  • 3. ANÁLISIS DISCRIMINANTE III. Conclusión Al observar la clasificación realizada podemos ver que de 6 datos de prueba, el clasificador tuvo un error del 19.09 %. Esto es cierto ya que se puede ver como el clasificador etiquetó un datos como grupo 1, mientras que viendo los datos reales ese dato pertenece al grupo 2 (figura 4). Este error es comprensible ya que tenemos un eje discriminante lineal , el cual determina el limite para considerar que un dato pertenezca a un grupo o a otro. Siguiendo esto, el dato mal etiquetado se encuentra del lado del grupo 1 , por lo que computacionalmen- te es menos costoso etiquetarlo en ese grupo, aunque realmente pertenezca al grupo 2 (figura 2). Analizando la matriz de confusión podemos determinar que la exactitud (Accuracy) de la predicción es del 83.33 %. La exactitud nos indica el numero de elementos clasificados correctamente en comparación del numero total de datos. En este caso de 6 datos, se observa que 5 datos están bien clasificados. También se puede ver la sensibilidad de la predicción, es decir, los datos identificados co- rrectamente como positivos del total de positivos verdaderos. Esta sensibilidad es del 100 % para el grupo 1, ya que de 2 datos pertenecientes al grupo 1, el clasificador los ha etiquetado correctamente. Para el grupo 2 se tiene una sensibilidad del 75 %, ya que de 4 datos pertenecientes a este grupo, el clasificador ha etiquetado como positivos 3. La precisión es la cantidad de datos identifica- dos correctamente como positivos de un total de elementos identificados como positivos. Para esta métrica se tiene un 66.667 % de precisión para el grupo 1 y un 100 % de precisión para el grupo 2. Finalmente podemos decir que el clasificador realizado tiene un buen rendimiento, aunque se notó que modificando los porcentajes de datos de entrenamiento y de prueba los porcentajes de exactitud si disminuyen considerablemente. Referencias [1] SitioBigData, “Machine Learning: Seleccion Metricas de clasificacion,” Jan. 2019. [2] J. Martinez, “Precision, Recall, F1, Accuracy en clasificación,” 2020. Section: machine lear- ning. [3] S. de La Fuente, “Análisis Discriminante,” tech. rep., Fac. Ciencias Económicas y Empre- sariales, 2011. [4] J. A. Rodrigo, “Análisis discriminante li- neal (LDA) y análisis discriminante cuadrático (QDA),” 2016. Ing. Mecatrónica 3