TIPOS DE APLICACIONES
      DEL A. MULTIVARIADO
1.    Reducir la dimensionalidad de un problema
      (análisis de componentes principales, análisis
      factorial, escalamiento multidimensional
2.    Estudio de la dependencia múltiple de un conjunto
      de variables (correlación canónica)
3.    Clasificar sujetos o grupos preestablecidos
      (análisis discriminante, regresión logística)
4.    Comparar grupos en múltiples variables
      dependientes (análisis multivariado de la varianza:
      MANOVA)
¿Cuáles son los factores que influyen en el desarrollo de un infarto de miocardio?
¿Es posible predecir de antemano que un paciente corre un riesgo cierto de
infarto?

¿Cuáles son las razones que llevan a un consumidor a preferir una determinada
marca sobre otras existentes en el mercado?

¿Existe discriminación por razones de sexo o de raza en una empresa o en un
colegio?

¿Se puede predecir el rendimiento académico de un alumno en función del barrio
en el que reside, el nivel educativo de sus padres, los ingresos familiares?

¿Se puede predecir problemas de autoestima en un estudiante? ¿Se puede
predecir a los estudiantes de bajo rendimiento académico y conflictivos?

¿Se puede predecir la baja autoestima a partir de las puntuaciones de los sujetos
en el cuestionario moldes de la mente?
El AD permite examinar las diferencias entre dos o más grupos empleando un
conjunto de variables discriminantes (Camacho)

El objetivo es hallar la combinación de v. discriminantes que maximiza la
diferencia entre los grupos (fase descriptiva), y predecir la pertenencia a un
grupo en base a las v. discriminantes (fase predictiva).

Esas combinaciones lineales de las v. discriminantes se llaman funciones
discriminantes.

El AD y el MANOVA de una sola vía matemáticamente son iguales. La
diferencia radica en que en el AD las variables dependientes en el MANOVA
son las variables discriminantes en el AD y la variable grupal en el AD es la
variable independiente en el MANOVA


e.j.: Establecimiento de un diagnóstico diferencial entre niños con incapacidad
de aprendizaje y niños con desordenes emocionales en base a una serie de
pruebas de rendimiento y de aptitud psicológicas.
En resumen:

El AD busca analizar si existen diferencias significativas entre grupos de objetos
respecto a un conjunto de variables medidas sobre los mismos para, en el caso de
que existan, explicar en qué sentido se dan y proporcionar procedimientos de
clasificación sistemática de nuevas observaciones de origen desconocido en uno
de los grupos analizados.


Los pasos en el AD son:

1.Selección de las variables

2.Significación de las funciones discriminantes

3.Interpretación de las funciones discriminantes

4.Interpretación de los grupos en el espacio discriminante
1.Selección de las variables

Dependerá del problema a investigar (revisión de la bibliografía). El número de
sujetos a muestrear depende del número de variables elegidas. Así una ratio 10 a
1 (sujetos/variables) aunque Camacho recomienda (50/1).

2.Significación de las funciones discriminantes

El criterio de medida de diferencia entre los grupos es la lambda de Wilks (λ).
Varía entre 0 y 1. Más próxima a cero mayor separación entre los grupos, mayor
nivel de significación.

La dimensionalidad del problema, número de funciones discriminantes, es
fundamental en el AD. Cuando tenemos dos grupos tenemos sólo una dimensión
o una sola función discriminante . En general el número de funciones
discriminantes es el menor número de: grupos-1, y variables discriminantes.
La significación en el AD es un proceso de discriminación residual, se mira la
capacidad que tienen las funciones para discriminar sin tener en cuenta la
información extraída por las funciones precedentes.

El proceso es el siguiente:
a) Se mira la significación global (todas las funciones)
b) Significación global sin la primera función discriminante
c) Significación global sin las dos primeras funciones discriminantes
d) Se continúa hasta agotar el número de funciones..

La distribución que sigue el estadístico es una ji-cuadrado. Si la probabilidad del
estadístico es menor que 0,05 concluimos que hay diferencia significativa entre
los grupos teniendo en cuenta todas las funciones discriminantes así seguimos
según los pasos anteriores. Si la función global no es significativa concluimos el
proceso.
3.Pruebas de significación univariadas

La interpretación de las funciones discriminantes se lleva a cabo con las
pruebas F univariadas. Se responde a la pregunta de si hay diferencia entre los
grupos a partir de cada función discriminante. En este caso la variable grupo es
la variable independiente y la variable dependiente la función discriminante.


4. Otros criterios para separar grupos

Puede ser que la significación sustantiva de una función discriminante no sea
suficiente criterio como para quedarnos con esa función para separar los
grupos. Tenemos otros criterios como por ejemplo los valores propios de las
funciones discriminantes. No son directamente interpretables por no tener un
valor máximo, pero puede ser útil si tenemos varias funciones ver el peso
relativo de cada una atendiendo a los valores propios. Por ejemplo si tenemos
dos funciones discriminantes con valores propios 0,98 y 0,30 el porcentaje
relativo (dividir el valor propio por, la suma de todos los valores propios y
multiplicando el resultado de esta división por 100) en este caso encontramos
que la primera función explica un 76,6% y la segunda un 23,4%
Otra manera es atendiendo al coeficiente de correlación canónica, es decir la
relación entre la función discriminante y los grupos. A mayor relación mayor
poder discriminante..


5. Interpretación de las funciones discriminantes

Se basa en dos coeficientes, los típicos y los estructura. Los primeros indican la
contribución relativa de cada variable a la función discriminante. El coeficiente
estructura, mide la correlación entre la variable discriminante y la función
discriminante (igual que en el AF). EL coeficiente estructura es más estable y
más interpretable además varía entre -1 y 1.

En general ambos coeficientes nos hablan del papel de las variables
discriminantes en la función discriminante, su relevancia, su papel supresor o
redundante, etc. En el caso de una variable supresora sería aquella que tiene
una baja correlación con la función discriminante, pero tiene un gran coeficiente
típico debido a que está correlacionada con otras variables discriminantes.
6. Interpretación de los grupos en el espacio discriminante

El último paso del AD es la interpretación de los grupos en el espacio
discriminante. Los coeficientes no típicos se emplean para conocer la posición
relativa de los sujetos y de los centroides (medias de los grupos en el espacio)

Las dimensiones significativas interpretadas suponen un espacio en el que se
pueden situar los sujetos y los grupos.
Ejemplo de uso del discriminante a partir del MANOVA

          Estamos interesados en el efecto de una terapia conductual-cognitiva
en el trastorno obsesivo compulsivo. TOC se caracteriza por la aparición de
pensamientos o imágenes abominables. Estos pensamientos normalmente
hacen que el paciente despliegue una serie de conductas para neutralizar lo
desagradable de esos pensamientos. Estas conductas pueden ser mentales
(p.e. contar, o recitar….) o físicas (p.e. lavarme las manos 20 veces antes de
comer, o pasar la llave en la puerta 40 veces antes de salir de casa). Vamos a
comparar a un grupo que sufre TOC y ha sido tratado con terapia conductual
(TC) y otro con terapia conductual-cognitiva (TCC) con un grupo de pacientes
con TOC que está a la espera de terapia.

La efectividad de la terapia no se mide sólo por las conductas compulsivas
reducidas, también es importante establecer si las cogniciones entorno a esa
compulsión han disminuido. Hemos medido dos variables dependientes
(acciones y pensamientos) en un día “normal” de los pacientes con TOC
Análisis Discriminante. MANOVA desde otro punto de vista
Ejemplo de las
Autovalores

                                                           Correlación
                                                                                              0.335   0 
                                                                              Valor. propio  
                                                                                                     0.073
Función   Autovalor % de varianza      % acumulado          canónic a
1              .335a         82.2             82.2                 .501


                                                                                                0        
2              .073a         17.8            100.0                 .260
  a. Se han empleado las 2 primeras f unciones discriminantes
     canónic as en el anális is.



                          Lam bda de Wilks

Contras te de     Lambda
las f unciones    de Wilks      Chi-cuadrado          gl            Sig.
1 a la 2              .699             9.508                 4         .050             La correlación canónica es la
2                     .932             1.856                 1         .173             correlación entre la función y los
                                                                                        grupos son variables dummy
                                                                                        (ser o no ser de un grupo
                                                                                        concreto). Si la elevamos al
                                                                                        cuadrado sería el % de varianza
                                                                                        común entre la función y los
 los autovalores                                                                        grupos.
son el resultado
de la ratio HE-1
Coeficientes de Correlación Canónica de las
         Contribución de cada                                    funciones discriminantes a mayor correlación
         variable a la función                                   mayor contribución de la variable
         discriminante                                           dependiente a la separación entre grupos

Coeficiente s e standarizados de las funcione s                                 Matri z de estructura
          discrim inantes canónicas
                                                                                                      Función
                                        Función
                                                                                                  1             2
                                   1              2
                                                                   acc ion conductas
 acc ion conductas                                                                                 .711*         .703
                                   .829               .584         compuls iv as
 compulsiv as
 pensamiento                                                       pensamiento
                                   -.713              .721                                        -. 576         .817*
 conductas obses ivas                                              conduct as obsesiv as
                                                                   Correlac iones intra-grupo c ombinadas ent re las
                                                                   v ariables disc riminantes y las f unciones
                                                                   disc riminantes canónicas tipif icadas
                                                                   Variables ordenadas por el tamaño de la
                                                                   correlac ión con la f unción.
                                                                      *. May or correlación absoluta ent re cada
                                                                         v ariable y cualquier f unción discriminante.
  Versión no típica o estandarizada de la
  anterior. Es la que nos permite generar las
  ecuaciones de las funciones discriminantes

 Coefi cientes de l as funci ones canónicas discri minantes

                                        Función
                                                                                0.603 0.425
                                   1              2
                                                              Vector. propio  
                                                                                 0.335 0.339 
   acc ion conductas
                                       .603        .425

                                                                                             
   compuls iv as
   pensamiento
                                   -. 335          .339
   conduct as obsesiv as
   (Constante)                     2. 139         -6.857
   Coef icientes no tipif icados
Funciones e n los centroide s de los grupos

                           Función
    grupo group         1          2
    TCC                  .601      -.229
    TC                  -.726      -.128
    Control              .125       .357
    Funciones dis criminantes canónicas no tipific adas
    evaluadas en las medias de los grupos




El grupo TCC tiene un centroide
de .601, el grupo TC de -.726 y el
grupo Control .125 podemos ver
cómo la función 1 discrimina el
grupo TC de los otros dos. Para
ver esto nos valemos de la
gráfica combinada observando la
separación entre los centróides.
Recodar que la función 2 no fue
significativa por lo tanto no la
interpretamos.
Computo de las funciones
         discriminantes a partir de los
    coeficientes de las funciones canónicas




D1  2.139  0.6 A  0.335P
D2  6.857  0.42 A  0.339P
Asignación probabilística de los sujetos a los grupos en el SPSS.
                                                     La regla de Bayes


    La probabilidad de que un sujeto j a partir de su puntuación obtenida en la
    función discriminante pertenezca al grupo i se puede estimar mediante la
    regla de Bayes a través de la siguiente expresión

                         Probabilidad condicional: Obtener la puntuación Di
                                                                                      Probabilidad a priori
                         estándo en el grupo i




                                                            P  D Gi  P  Gi 
              P  Gi D                                  g


Probabilidad a posteriori: Cuál es la
                                                       P  D G  P G 
                                                        i 1
                                                                              i   i
probabilidad de que un sujeto pertenezca
al grupo i habiendo obtenido la puntuación
discriminante Di
a
                          Re sultados de la clasificación

                                       Grupo de pertenenc ia pronos ticado
                       grupo group       TCC          TC         Control        Total
Original   Recuento    TCC                    6             2             2        10
                       TC                     1             6             3        10
                       Control                5             3             2        10
           %           TCC                 60.0         20.0           20.0      100.0
                       TC                  10.0         60.0           30.0      100.0
                       Control             50.0         30.0           20.0      100.0
  a. Clasificados c orrectamente el 46.7% de los casos agrupados originales .




No es un porcentaje muy alto en la asignación de los sujetos
a los grupos pronosticados…
Gracias!!!!

Discriminante mb

  • 2.
    TIPOS DE APLICACIONES DEL A. MULTIVARIADO 1. Reducir la dimensionalidad de un problema (análisis de componentes principales, análisis factorial, escalamiento multidimensional 2. Estudio de la dependencia múltiple de un conjunto de variables (correlación canónica) 3. Clasificar sujetos o grupos preestablecidos (análisis discriminante, regresión logística) 4. Comparar grupos en múltiples variables dependientes (análisis multivariado de la varianza: MANOVA)
  • 3.
    ¿Cuáles son losfactores que influyen en el desarrollo de un infarto de miocardio? ¿Es posible predecir de antemano que un paciente corre un riesgo cierto de infarto? ¿Cuáles son las razones que llevan a un consumidor a preferir una determinada marca sobre otras existentes en el mercado? ¿Existe discriminación por razones de sexo o de raza en una empresa o en un colegio? ¿Se puede predecir el rendimiento académico de un alumno en función del barrio en el que reside, el nivel educativo de sus padres, los ingresos familiares? ¿Se puede predecir problemas de autoestima en un estudiante? ¿Se puede predecir a los estudiantes de bajo rendimiento académico y conflictivos? ¿Se puede predecir la baja autoestima a partir de las puntuaciones de los sujetos en el cuestionario moldes de la mente?
  • 4.
    El AD permiteexaminar las diferencias entre dos o más grupos empleando un conjunto de variables discriminantes (Camacho) El objetivo es hallar la combinación de v. discriminantes que maximiza la diferencia entre los grupos (fase descriptiva), y predecir la pertenencia a un grupo en base a las v. discriminantes (fase predictiva). Esas combinaciones lineales de las v. discriminantes se llaman funciones discriminantes. El AD y el MANOVA de una sola vía matemáticamente son iguales. La diferencia radica en que en el AD las variables dependientes en el MANOVA son las variables discriminantes en el AD y la variable grupal en el AD es la variable independiente en el MANOVA e.j.: Establecimiento de un diagnóstico diferencial entre niños con incapacidad de aprendizaje y niños con desordenes emocionales en base a una serie de pruebas de rendimiento y de aptitud psicológicas.
  • 5.
    En resumen: El ADbusca analizar si existen diferencias significativas entre grupos de objetos respecto a un conjunto de variables medidas sobre los mismos para, en el caso de que existan, explicar en qué sentido se dan y proporcionar procedimientos de clasificación sistemática de nuevas observaciones de origen desconocido en uno de los grupos analizados. Los pasos en el AD son: 1.Selección de las variables 2.Significación de las funciones discriminantes 3.Interpretación de las funciones discriminantes 4.Interpretación de los grupos en el espacio discriminante
  • 6.
    1.Selección de lasvariables Dependerá del problema a investigar (revisión de la bibliografía). El número de sujetos a muestrear depende del número de variables elegidas. Así una ratio 10 a 1 (sujetos/variables) aunque Camacho recomienda (50/1). 2.Significación de las funciones discriminantes El criterio de medida de diferencia entre los grupos es la lambda de Wilks (λ). Varía entre 0 y 1. Más próxima a cero mayor separación entre los grupos, mayor nivel de significación. La dimensionalidad del problema, número de funciones discriminantes, es fundamental en el AD. Cuando tenemos dos grupos tenemos sólo una dimensión o una sola función discriminante . En general el número de funciones discriminantes es el menor número de: grupos-1, y variables discriminantes.
  • 7.
    La significación enel AD es un proceso de discriminación residual, se mira la capacidad que tienen las funciones para discriminar sin tener en cuenta la información extraída por las funciones precedentes. El proceso es el siguiente: a) Se mira la significación global (todas las funciones) b) Significación global sin la primera función discriminante c) Significación global sin las dos primeras funciones discriminantes d) Se continúa hasta agotar el número de funciones.. La distribución que sigue el estadístico es una ji-cuadrado. Si la probabilidad del estadístico es menor que 0,05 concluimos que hay diferencia significativa entre los grupos teniendo en cuenta todas las funciones discriminantes así seguimos según los pasos anteriores. Si la función global no es significativa concluimos el proceso.
  • 8.
    3.Pruebas de significaciónunivariadas La interpretación de las funciones discriminantes se lleva a cabo con las pruebas F univariadas. Se responde a la pregunta de si hay diferencia entre los grupos a partir de cada función discriminante. En este caso la variable grupo es la variable independiente y la variable dependiente la función discriminante. 4. Otros criterios para separar grupos Puede ser que la significación sustantiva de una función discriminante no sea suficiente criterio como para quedarnos con esa función para separar los grupos. Tenemos otros criterios como por ejemplo los valores propios de las funciones discriminantes. No son directamente interpretables por no tener un valor máximo, pero puede ser útil si tenemos varias funciones ver el peso relativo de cada una atendiendo a los valores propios. Por ejemplo si tenemos dos funciones discriminantes con valores propios 0,98 y 0,30 el porcentaje relativo (dividir el valor propio por, la suma de todos los valores propios y multiplicando el resultado de esta división por 100) en este caso encontramos que la primera función explica un 76,6% y la segunda un 23,4%
  • 9.
    Otra manera esatendiendo al coeficiente de correlación canónica, es decir la relación entre la función discriminante y los grupos. A mayor relación mayor poder discriminante.. 5. Interpretación de las funciones discriminantes Se basa en dos coeficientes, los típicos y los estructura. Los primeros indican la contribución relativa de cada variable a la función discriminante. El coeficiente estructura, mide la correlación entre la variable discriminante y la función discriminante (igual que en el AF). EL coeficiente estructura es más estable y más interpretable además varía entre -1 y 1. En general ambos coeficientes nos hablan del papel de las variables discriminantes en la función discriminante, su relevancia, su papel supresor o redundante, etc. En el caso de una variable supresora sería aquella que tiene una baja correlación con la función discriminante, pero tiene un gran coeficiente típico debido a que está correlacionada con otras variables discriminantes.
  • 10.
    6. Interpretación delos grupos en el espacio discriminante El último paso del AD es la interpretación de los grupos en el espacio discriminante. Los coeficientes no típicos se emplean para conocer la posición relativa de los sujetos y de los centroides (medias de los grupos en el espacio) Las dimensiones significativas interpretadas suponen un espacio en el que se pueden situar los sujetos y los grupos.
  • 11.
    Ejemplo de usodel discriminante a partir del MANOVA Estamos interesados en el efecto de una terapia conductual-cognitiva en el trastorno obsesivo compulsivo. TOC se caracteriza por la aparición de pensamientos o imágenes abominables. Estos pensamientos normalmente hacen que el paciente despliegue una serie de conductas para neutralizar lo desagradable de esos pensamientos. Estas conductas pueden ser mentales (p.e. contar, o recitar….) o físicas (p.e. lavarme las manos 20 veces antes de comer, o pasar la llave en la puerta 40 veces antes de salir de casa). Vamos a comparar a un grupo que sufre TOC y ha sido tratado con terapia conductual (TC) y otro con terapia conductual-cognitiva (TCC) con un grupo de pacientes con TOC que está a la espera de terapia. La efectividad de la terapia no se mide sólo por las conductas compulsivas reducidas, también es importante establecer si las cogniciones entorno a esa compulsión han disminuido. Hemos medido dos variables dependientes (acciones y pensamientos) en un día “normal” de los pacientes con TOC
  • 12.
    Análisis Discriminante. MANOVAdesde otro punto de vista Ejemplo de las
  • 14.
    Autovalores Correlación 0.335 0  Valor. propio   0.073 Función Autovalor % de varianza % acumulado canónic a 1 .335a 82.2 82.2 .501  0  2 .073a 17.8 100.0 .260 a. Se han empleado las 2 primeras f unciones discriminantes canónic as en el anális is. Lam bda de Wilks Contras te de Lambda las f unciones de Wilks Chi-cuadrado gl Sig. 1 a la 2 .699 9.508 4 .050 La correlación canónica es la 2 .932 1.856 1 .173 correlación entre la función y los grupos son variables dummy (ser o no ser de un grupo concreto). Si la elevamos al cuadrado sería el % de varianza común entre la función y los los autovalores grupos. son el resultado de la ratio HE-1
  • 15.
    Coeficientes de CorrelaciónCanónica de las Contribución de cada funciones discriminantes a mayor correlación variable a la función mayor contribución de la variable discriminante dependiente a la separación entre grupos Coeficiente s e standarizados de las funcione s Matri z de estructura discrim inantes canónicas Función Función 1 2 1 2 acc ion conductas acc ion conductas .711* .703 .829 .584 compuls iv as compulsiv as pensamiento pensamiento -.713 .721 -. 576 .817* conductas obses ivas conduct as obsesiv as Correlac iones intra-grupo c ombinadas ent re las v ariables disc riminantes y las f unciones disc riminantes canónicas tipif icadas Variables ordenadas por el tamaño de la correlac ión con la f unción. *. May or correlación absoluta ent re cada v ariable y cualquier f unción discriminante. Versión no típica o estandarizada de la anterior. Es la que nos permite generar las ecuaciones de las funciones discriminantes Coefi cientes de l as funci ones canónicas discri minantes Función  0.603 0.425 1 2 Vector. propio   0.335 0.339  acc ion conductas .603 .425   compuls iv as pensamiento -. 335 .339 conduct as obsesiv as (Constante) 2. 139 -6.857 Coef icientes no tipif icados
  • 16.
    Funciones e nlos centroide s de los grupos Función grupo group 1 2 TCC .601 -.229 TC -.726 -.128 Control .125 .357 Funciones dis criminantes canónicas no tipific adas evaluadas en las medias de los grupos El grupo TCC tiene un centroide de .601, el grupo TC de -.726 y el grupo Control .125 podemos ver cómo la función 1 discrimina el grupo TC de los otros dos. Para ver esto nos valemos de la gráfica combinada observando la separación entre los centróides. Recodar que la función 2 no fue significativa por lo tanto no la interpretamos.
  • 17.
    Computo de lasfunciones discriminantes a partir de los coeficientes de las funciones canónicas D1  2.139  0.6 A  0.335P D2  6.857  0.42 A  0.339P
  • 18.
    Asignación probabilística delos sujetos a los grupos en el SPSS. La regla de Bayes La probabilidad de que un sujeto j a partir de su puntuación obtenida en la función discriminante pertenezca al grupo i se puede estimar mediante la regla de Bayes a través de la siguiente expresión Probabilidad condicional: Obtener la puntuación Di Probabilidad a priori estándo en el grupo i P  D Gi  P  Gi  P  Gi D   g Probabilidad a posteriori: Cuál es la  P  D G  P G  i 1 i i probabilidad de que un sujeto pertenezca al grupo i habiendo obtenido la puntuación discriminante Di
  • 19.
    a Re sultados de la clasificación Grupo de pertenenc ia pronos ticado grupo group TCC TC Control Total Original Recuento TCC 6 2 2 10 TC 1 6 3 10 Control 5 3 2 10 % TCC 60.0 20.0 20.0 100.0 TC 10.0 60.0 30.0 100.0 Control 50.0 30.0 20.0 100.0 a. Clasificados c orrectamente el 46.7% de los casos agrupados originales . No es un porcentaje muy alto en la asignación de los sujetos a los grupos pronosticados…
  • 20.