SlideShare una empresa de Scribd logo
1 de 24
Manual de análisis factorial Jose F. Nieves Mendez Prof. Balbino Garcia ECONOMETRIA
Indice Capitulo 3: Extracción de factores por el método centroide Ecuaciones para el método centroide Un ejemplo de dos factores y cuatro variables Un ejemplo de cuatro factores y doce variables Interacción de las comunalidades Capitulo 4: Los métodos de extracción factorial de factor principal y residuo mínimo. El método del factor principal El método del residuo mínimo
Capitulo 3: Extracción de factores por el método centroide
El método centroide para extracción de factores es probablemente el mas conocido de todos los métodos de extracción factorial. El método centroide resulta mas adecuado para fines didácticos, ya que es factible hacer un problema de suficiente tamaño.
Ecuaciones para el método centroide En la fig. 2.1, el punto centroide fue localizado hallando la media do todas las coordenadas X del punto centroide y todas las coordenadas Y de los vectores de datos para obtener la coordenada Y del punto centroide. Si hubiera estado implicadas mas de dos dimensiones, se habría utilizado la media de la tercera, la cuarta y las otras coordenadas.
La Ec. (3.10) da la forma para un peso centroide para la variable j en el factor 1 (o I, si usamos numerales romanos. Para obtener el peso del factor centriode para la variable de datos 1, se requiere los siguientes pasos:  1. sumar las entradas de la primera columna de la matriz de correlaciones, incluyendo el elemento de la diagonal. Dividir este numero por la raíz cuadrada (o multiplicarlo por la reciproca de la raíz cuadrada) de la suma de todas las entradas de la matriz de correlaciones entera, incluyendo los elementos diagonales.
Un ejemplo de dos factores y cuatro variables La contribución del factor 1 debe eliminarse de la matriz de correlaciones mediante la operación R-A1A1’.  Las columnas en cada caso suman cero, dentro de los limites del error de redondeo. Como comprobación, las filas deben sumarse también para asegurar que el total de las filas es igual al total de las columnas, como se requiere en una matriz simétrica.
En la Ec. (3.1) se estableció que la suma de los pesos del segundo y los siguientes factores cancroides es cero, lo cual proporciona la base para una comprobación del calculo de los residuos del primer factor usados anteriormente. Sin embargo, puesto que las sumas de las columnas son cero, es claramente imposible aplicar los pasos utilizados para calcular el primer factor centroide a la matriz de residuos dada en la Tabla 3.2. Es necesario, primero llevar a cabo un proceso de reflexión de los residuos para eliminar tantos signos negativos como sea posible en la matriz de residuos del primer factor
Un ejemplo de cuatro factores y doce variables Esta tabla de correlaciones de 44x44, proporciona una fuente de problemas de muestra para ejercicios de clase. Seleccionando cuatro de los ocho factores y tres variables con pesos factoriales altos que definan cada factor, puede servir como ejercicio para los estudiantes. Si se desea, cada estudiante puede tomar una muestra diferente de factores y/o variables de forma que no haya estudiantes que trabajen en el mismo ejercicio. Es importante tener al menos cuatro factores y, preferiblemente, tres variables que definan cada factor. De esta forma, el ejercicio proporcionara una apropiada experiencia de aprendizaje al estudiante, dándole oportunidad de desarrollar la destreza requerida tanto para extraer factores como para rotarlos.
Pasos en el calculo del primer factor centroide Sumar algebraicamente cada columna de la matriz de correlaciones omitiendo del total el elemento diagonal, el valor h^2. Sumar las filas calculando cada total de fila de R, omitiendo de nuevo los elementos diagonales. Comparar los totales de fila con los totales de columnas para asegurarse de que son idénticos. Si alguno de estos totales de fila-columna es negativo, debe aplicarse el proceso de reflexión, como se explica en los pasos para el calculo del segundo factor centroide. Colocar los valores de comunalidad estimados en las entradas de la diagonal. Lo mas común es usar como estimaciones los valores absolutos de las correlaciones mas altas en las columnas Sumar las comunalidades estimadas a los totales de columna y colocar estas sumas en la fila t. Como comprobación, restar las nominalidades de los totales de la fila t, para ver si se recuperan los totales de columna sin nominalidades.
Pasos en el calculo del primer factor centroide 7. Sumar los totales de columna con comunalidades, es decir los elementos de la fila t, para obtener T, la suma de todas las entradas de la tabla. 8. Calcular la raíz cuadrada de T hasta al menos cinco cifras decimales. 9. Calcular el reciproco de la raíz cuadrada de T hasta el menos cinco cifras decimales. 10. Multiplicar los totales de columna con comunalidades, es decir las entradas de la fila t, por 1/ √T e introducir los productos en la fila a. Estos son los pesos centroides previos al anadido de cualquier signo. 11. Si alguna variable ha sido reflejada previamente a estos cálculos, los pesos centroides deben tener los signos apropiados antes de ser introducidos como la primera columna en la matriz A, la tabla de pesos factoriales. 12. Sumar los pesos factoriales de la fila ai y comprobar que la suma es igual a √T dentro de los limites del error de redondeo, como se requiere en la Ec. (3.7)
Calculo del segundo factor centroide Se repiten los pasos 1 y 2 del procedimiento de extracción del primer factor centroide, es decir, se suman las filas y columnas de la matriz de residuos, omitiendo los elementos diagonales, y las sumas de filas se cotejan con las sumas de columna.
Reflexión de variables Algunas veces en el primer factor, y siempre en el segundo y los subsiguientes, las sumas de algunas de las columnas, sin contar las diagonales, son negativas. Esto requiere la reflexión de las variables con sumas de columnas negativas (sin sumar las comunalidades) de modo que todas las sumas de columna sean positivas. Los pasos a seguir en este proceso de reflexión son los siguientes: Localizar la variable que tiene el mayor total negativo sin haberle sumado la comunalidad, como primera variable a reflejar. Etiquetar la fila inmediatamente inferior a la fila  ∑0 con el numero de la variable que va a ser reflejada. Bajar la suma de columna de la fila  ∑0  , para esta variable, cambiando su signo de negativo a positivo, y colocarla en la fila siguiente, subrayando el numero.  Los totales de columna para las otras variables deben ser ajustados para tomar en consideración el hecho de que la variable 3 esta siendo reflejada. Antes de la reflexión, estos valores fueron sumados al total con un signo contrario. Por eso, para ajustar el total correctamente, la entrada debe ser doblada, su signo cambiado y el resultado sumado al total de columna previo. Como comprobación, los nuevos totales de columna son sumados. Este valor deberá ser igual a la anterior suma de totales de columna mas cuatro veces la suma de columna positiva para la variable que se esta reflejando.  Si alguno de los totales de columna es todavía negativo después de la primera reflexión, y generalmente así ocurre, se selecciona la variable con el mayor total negativo. Su total se baja con un signo positivo y se subraya como el nuevo total para esa columna. Se continua como antes, doblando los valores de fila, cambiando sus signos y sumándolos a los totales de columna previos.  Este proceso de reflexión de variables se continua hasta que no quede ningún total de columna negativo. En ocasiones, puede ser necesario volver a reflejar una variable que había sido reflejada anteriormente
Calculo de pesos del segundo factor Este procedimiento se usa cuando se dispone de buenas estimaciones de las comunalidades al principio del analisis o cuando se desea una solución con estas estimaciones de las comunalidades particulares. En este problema de muestra, y en la practica común, se introducen nuevas estimaciones de las nominalidades para cada factor extraido. Para estimar las comunalidades, se localiza el mayor residuo de cada columna, se le pone signo positivo y se coloca sobre el valor de la comunalidad residual.  Los pesos del segundo factor son calculados del mismo modo que para el primer factor, y los resultados pasan a la fila ai .
Calculo de los residuos del segundo factor Cuando los residuos del segundo factor con calculados mediante la fórmula R2=R1-A2A2’, R1 es una matriz de residuos reflejados del primer factor y A2 es una sola columna con todos los signos positivos. Al llevar a cabo las reflexiones para una variable dada, tanto los signos de la fila como los de columna para esta variable deben ser cambiados a menos que el residuo afecte a otra variable que también esta reflejada, en cuyo caso el signo no se cambia.
Cálculos de los pesos del tercer factor Los pesos del tercer factor se obtienen esencialmente mediante los mismos pasos usados para el calculo de los pesos del segundo factor, excepto que debe reflejarse un conjunto diferente de variables. Cada nuevo proceso de reflexión para calcular otro factor comienza sin asteriscos en la tabla. Sin embargo, cuando los pesos del tercer factor son incluidos en la matriz A, es mas complicado adjuntar los signos apropiados que en el caso del segundo factor. El signo de cada variable que ha sido reflejada durante el calculo del tercer factor debe ser invertido, pero no es solo cuestión de poner signos negativos en los pesos para esas variables en el factor III. Mas bien, es una cuestión de cambio de signo de lo que era en el factor II inmediatamente precedente. Si una variable no ha sido reflejada al calcular cualquier factor previo, los signos de todos los pesos factoriales previos serán positivos, así, una reflexión en el factor actual simplemente hará que su signo se vuelva negativo.
Calculo de los pesos del cuarto factor Una vez extraido el tercer factor, es necesario llevar a cabo las reflexiones de los residuos antes de eliminar la contribución del tercer factor mediante la formula R3=R2-A3A3. La matriz reflejada R2 no se muestra, pero se obtiene mediante el mismo método que se uso para obtener la matriz reflejase R1. Los residuos del tercer factor (matriz R3), derivados de los residuos del segundo factor reflejados, se muestran en la Tabla 3.10, junto con el calculo de los pesos del cuarto factor. Al introducir los pesos del cuarto factor en la matriz A, los signos para estas variables recién reflejadas deben hacerse opuestas a lo que eran para el factor III. Los restantes pesos del cuarto factor tendrán los mismos signos que estaban presentes para estas variables en el tercer factor, puesto que no fueron reflejados al obtener los pesos del cuarto factor. Los residuos del cuarto factor, calculados mediante la formula R4=R3-A4A. De nuevo, R3 es una matriz de residuos reflejados y todos los signos de A4 son positivos; R4, es una matriz de residuos no reflejados. Si se calculan un quinto factor y se aplicara la ecuación matricial R5=R4-A5A5’ para obtener los residuos del quinto factor, seria importante darse cuenta de que, aunque R4 aparece en ambas ecuaciones, en el primer caso no esta reflejada y en el segundo si lo esta.
Reducción de la matriz de correlaciones Si los cálculos han sido llevados a cabo correctamente, debe valer la siguiente ecuación:            R=AA’ + R4      Es decir, si la matriz factorial, consistente en cuatro factores,  es multiplicada por su traspuesta y sumada a la matriz de los residuos del cuarto factor, debe reproducirse la matriz de correlaciones original dentro de los limites del error de redondeo. Antes de que R4 pueda ser sumada a AA’, los residuos individuales deben volver a su estado original no reflejado.  De otro modo, algunos elementos residuales deberían ser sumados al producto interno de los pesos factoriales de AA’ para reproducir la correlación original, y otros deberían ser sustraídos.
Interaccion de las comunalidades En una matriz grande, los errores al estimar las comunalidades generalmente no afectan mucho a la solución, puesto que estas discrepancias son pequeñas comparadas con las sumas de columna después de la reflexión. Con matrices mas pequeñas, estos errores pueden ser de mayor significación. Es necesario a veces calcular las comunalidades derivadas de la primera solución sumando los cuadrados de los pesos factoriales extraídos y usar estos valores como estimaciones de las nominalidades para una segunda solución. La comunalidad residual del primer factor es usada como la estimación de la comunalidad para el segundo factor. El residuo del segundo factor se usa como estimación para el tercer factor, y asi sucesivamente. EL mismo numero de factores es extraido en cada solución.  En la practica real, la mayoría de los problemas empíricos con datos reales no requieren un alto grado de precisión en los valores estimados de las nominalidades para obtener resultados útiles.
Capitulo 4: Los métodos de extracción factorial de factor principal y residuo mínimo.
El método del factor principal Una serie de pasos que podría producir una solución de factor principal son los siguientes: Constrúyase la matriz de correlaciones R de n x n, con los valores apropiados seleccionados para las casillas diagonales como estimaciones de las nominalidades. Descúbrase una matriz ortogonal B de n x n, tal que cuando R es pre multiplicada por B y pos multiplicada por B’, el resultado es una matriz diagonal D, de n x n, con elementos diagonales ℓ1, ℓ2, ℓ3,….., ℓn Multiplíquese cada elemento de la columna 1 de B’ por √ℓ1, cada electo de la columna 2 de B’ por √ℓ2 y así sucesivamente para las restantes columnas hasta que cada elemento de la ultima columna B’ sea multiplicado por √ℓn. Las operaciones de este paso 3 equivalen a multiplicar la matriz B’ por la derecha por una matriz diagonal con elementos diagonales √ℓ1, √ℓ2, √ℓ3,….., √ℓn La matriz que se obtiene en el paso 3, es una matriz factorial A, tal que R = AA’. La suma de los cuadrados de la columna n de A, que es igual a ℓ1.

Más contenido relacionado

La actualidad más candente

Coeficiente de correlacion
Coeficiente de correlacionCoeficiente de correlacion
Coeficiente de correlacionCleofé Zavaleta
 
Procesos estocasticos resumen del curso
Procesos estocasticos resumen del cursoProcesos estocasticos resumen del curso
Procesos estocasticos resumen del cursoArmando Mateus Rojas
 
Análisis de la regresión en SPSS
Análisis de la regresión en SPSSAnálisis de la regresión en SPSS
Análisis de la regresión en SPSSJosé Felipe
 
Regresion simple
Regresion simpleRegresion simple
Regresion simpleluismelgar
 
Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .JosLuis355
 
Programa matemática 2° año 2017
Programa matemática 2° año 2017Programa matemática 2° año 2017
Programa matemática 2° año 2017Martín Buedo
 
regresión lineal simple
regresión lineal simpleregresión lineal simple
regresión lineal simplemarielssg17
 
Compilacion econometria con Eviews
Compilacion econometria con EviewsCompilacion econometria con Eviews
Compilacion econometria con EviewsRodrigo Paniagua
 
Regresion aplicada a la ingenieria
Regresion aplicada a la ingenieriaRegresion aplicada a la ingenieria
Regresion aplicada a la ingenieriaBryanRoyCordovaGomez
 

La actualidad más candente (20)

Análisis de regresión múltiple
Análisis de regresión múltipleAnálisis de regresión múltiple
Análisis de regresión múltiple
 
Matrices y determinantes
Matrices y determinantes Matrices y determinantes
Matrices y determinantes
 
Coeficiente de correlacion
Coeficiente de correlacionCoeficiente de correlacion
Coeficiente de correlacion
 
Procesos estocasticos resumen del curso
Procesos estocasticos resumen del cursoProcesos estocasticos resumen del curso
Procesos estocasticos resumen del curso
 
Tutorial análisis de regresión
Tutorial análisis de regresiónTutorial análisis de regresión
Tutorial análisis de regresión
 
Análisis de la regresión en SPSS
Análisis de la regresión en SPSSAnálisis de la regresión en SPSS
Análisis de la regresión en SPSS
 
Regresion simple
Regresion simpleRegresion simple
Regresion simple
 
minimos-cuadrados-y-regresion
minimos-cuadrados-y-regresionminimos-cuadrados-y-regresion
minimos-cuadrados-y-regresion
 
Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .
 
Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
 
Gráficos y funciones
Gráficos y funcionesGráficos y funciones
Gráficos y funciones
 
Programa matemática 2° año 2017
Programa matemática 2° año 2017Programa matemática 2° año 2017
Programa matemática 2° año 2017
 
Notas de clase Algebra Lineal
Notas de clase  Algebra LinealNotas de clase  Algebra Lineal
Notas de clase Algebra Lineal
 
01 regresion
01 regresion01 regresion
01 regresion
 
regresión lineal simple
regresión lineal simpleregresión lineal simple
regresión lineal simple
 
Compilacion econometria con Eviews
Compilacion econometria con EviewsCompilacion econometria con Eviews
Compilacion econometria con Eviews
 
Matrices+y+determinantes 1
Matrices+y+determinantes 1Matrices+y+determinantes 1
Matrices+y+determinantes 1
 
Regresion aplicada a la ingenieria
Regresion aplicada a la ingenieriaRegresion aplicada a la ingenieria
Regresion aplicada a la ingenieria
 
Tutorial eviews (normalidad)
Tutorial eviews (normalidad)Tutorial eviews (normalidad)
Tutorial eviews (normalidad)
 
Coef Contingencia
Coef ContingenciaCoef Contingencia
Coef Contingencia
 

Destacado

Analisis Factorial
Analisis FactorialAnalisis Factorial
Analisis Factorialnorlan9886
 
Relación entre el rendimiento escolar y un desayuno saludable
Relación entre el rendimiento escolar y un desayuno saludableRelación entre el rendimiento escolar y un desayuno saludable
Relación entre el rendimiento escolar y un desayuno saludablerevueltaqui
 
Proyecto de Regresión Lineal Simple
Proyecto de Regresión Lineal SimpleProyecto de Regresión Lineal Simple
Proyecto de Regresión Lineal SimpleJerry Jimenez
 
Econometria Vanessa Santiago
Econometria Vanessa SantiagoEconometria Vanessa Santiago
Econometria Vanessa SantiagoVanessa Santiago
 
Análisis factorial SPSS
Análisis factorial SPSSAnálisis factorial SPSS
Análisis factorial SPSSAl Cougar
 
Regresion Lineal: Estadistica
Regresion Lineal: EstadisticaRegresion Lineal: Estadistica
Regresion Lineal: EstadisticaJesús G. Ponce
 
Regresion lineal
Regresion lineal Regresion lineal
Regresion lineal aranda.ines
 
Análisis factorial de la inteligencia
Análisis factorial de la inteligenciaAnálisis factorial de la inteligencia
Análisis factorial de la inteligenciaAndrea Buenaver Medina
 
analisis y graficas estadisticas
analisis y graficas estadisticasanalisis y graficas estadisticas
analisis y graficas estadisticasguest44ef69f
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlaciónAlejandro Ruiz
 

Destacado (20)

Analisis factorial
Analisis factorialAnalisis factorial
Analisis factorial
 
Analisis Factorial
Analisis FactorialAnalisis Factorial
Analisis Factorial
 
Analisis factorial y de perfiles
Analisis factorial y de perfilesAnalisis factorial y de perfiles
Analisis factorial y de perfiles
 
Analisis de factores ppt
Analisis de factores ppt Analisis de factores ppt
Analisis de factores ppt
 
Estadística: Análisis Factorial con SPSS
Estadística: Análisis Factorial con SPSSEstadística: Análisis Factorial con SPSS
Estadística: Análisis Factorial con SPSS
 
Relación entre el rendimiento escolar y un desayuno saludable
Relación entre el rendimiento escolar y un desayuno saludableRelación entre el rendimiento escolar y un desayuno saludable
Relación entre el rendimiento escolar y un desayuno saludable
 
Proyecto de Regresión Lineal Simple
Proyecto de Regresión Lineal SimpleProyecto de Regresión Lineal Simple
Proyecto de Regresión Lineal Simple
 
analis fact_UNID_4
analis fact_UNID_4analis fact_UNID_4
analis fact_UNID_4
 
trabajo de correlacion
trabajo de correlacion trabajo de correlacion
trabajo de correlacion
 
Econometria Vanessa Santiago
Econometria Vanessa SantiagoEconometria Vanessa Santiago
Econometria Vanessa Santiago
 
Análisis factorial SPSS
Análisis factorial SPSSAnálisis factorial SPSS
Análisis factorial SPSS
 
Proyecto de correlacion
Proyecto de correlacionProyecto de correlacion
Proyecto de correlacion
 
Regresion Lineal: Estadistica
Regresion Lineal: EstadisticaRegresion Lineal: Estadistica
Regresion Lineal: Estadistica
 
Regresion lineal
Regresion lineal Regresion lineal
Regresion lineal
 
17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
 
Análisis factorial de la inteligencia
Análisis factorial de la inteligenciaAnálisis factorial de la inteligencia
Análisis factorial de la inteligencia
 
Analisis De Regresion Y Correlacion
Analisis De Regresion Y CorrelacionAnalisis De Regresion Y Correlacion
Analisis De Regresion Y Correlacion
 
analisis y graficas estadisticas
analisis y graficas estadisticasanalisis y graficas estadisticas
analisis y graficas estadisticas
 
Conclusion cuentos
Conclusion cuentosConclusion cuentos
Conclusion cuentos
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlación
 

Similar a Análisis factorial método centroide

Similar a Análisis factorial método centroide (20)

Determinantes
DeterminantesDeterminantes
Determinantes
 
Determinantes
DeterminantesDeterminantes
Determinantes
 
Determinantes
DeterminantesDeterminantes
Determinantes
 
2 determinantes
2 determinantes2 determinantes
2 determinantes
 
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOSOPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
 
Determinantes
DeterminantesDeterminantes
Determinantes
 
3eso quincena1
3eso quincena13eso quincena1
3eso quincena1
 
Los numeros racionales
Los numeros racionalesLos numeros racionales
Los numeros racionales
 
Aplicaciones informaticas libroalumno_unidad8muestra
Aplicaciones informaticas libroalumno_unidad8muestraAplicaciones informaticas libroalumno_unidad8muestra
Aplicaciones informaticas libroalumno_unidad8muestra
 
El sistema de los números reales
El sistema de los números realesEl sistema de los números reales
El sistema de los números reales
 
Mat ii
Mat iiMat ii
Mat ii
 
Portafolio de algebra
Portafolio de algebraPortafolio de algebra
Portafolio de algebra
 
Método simplex
Método simplexMétodo simplex
Método simplex
 
Algebra portafolio
Algebra portafolioAlgebra portafolio
Algebra portafolio
 
Matrices
MatricesMatrices
Matrices
 
Excel
ExcelExcel
Excel
 
Matrices
MatricesMatrices
Matrices
 
Determinantes
DeterminantesDeterminantes
Determinantes
 
Determinantes
DeterminantesDeterminantes
Determinantes
 
OPERACIONES CON MATRICES EN DIFERENTES METODOS.pptx
OPERACIONES CON MATRICES EN DIFERENTES METODOS.pptxOPERACIONES CON MATRICES EN DIFERENTES METODOS.pptx
OPERACIONES CON MATRICES EN DIFERENTES METODOS.pptx
 

Más de paquitootd

Proyecto creativo cadenas de markov josé_f_nieves
Proyecto creativo cadenas de markov josé_f_nieves Proyecto creativo cadenas de markov josé_f_nieves
Proyecto creativo cadenas de markov josé_f_nieves paquitootd
 
Cadena de Markov Portada, tabla contenido, agradecimientos
Cadena de Markov Portada, tabla contenido, agradecimientosCadena de Markov Portada, tabla contenido, agradecimientos
Cadena de Markov Portada, tabla contenido, agradecimientospaquitootd
 
Estadistica, Probabilidad E Investigacin De Operacines
Estadistica, Probabilidad E Investigacin De OperacinesEstadistica, Probabilidad E Investigacin De Operacines
Estadistica, Probabilidad E Investigacin De Operacinespaquitootd
 
Programacion Cuadratica
Programacion CuadraticaProgramacion Cuadratica
Programacion Cuadraticapaquitootd
 
Programacion Cuadratica
Programacion CuadraticaProgramacion Cuadratica
Programacion Cuadraticapaquitootd
 
BiografíA De Euclides De AlejandríA
BiografíA De Euclides De AlejandríABiografíA De Euclides De AlejandríA
BiografíA De Euclides De AlejandríApaquitootd
 
Econometria Jose Nieves
Econometria Jose NievesEconometria Jose Nieves
Econometria Jose Nievespaquitootd
 
Intervención de la estadística para resolver problemas relacionados al censo ...
Intervención de la estadística para resolver problemas relacionados al censo ...Intervención de la estadística para resolver problemas relacionados al censo ...
Intervención de la estadística para resolver problemas relacionados al censo ...paquitootd
 

Más de paquitootd (9)

Proyecto creativo cadenas de markov josé_f_nieves
Proyecto creativo cadenas de markov josé_f_nieves Proyecto creativo cadenas de markov josé_f_nieves
Proyecto creativo cadenas de markov josé_f_nieves
 
Cadena de Markov Portada, tabla contenido, agradecimientos
Cadena de Markov Portada, tabla contenido, agradecimientosCadena de Markov Portada, tabla contenido, agradecimientos
Cadena de Markov Portada, tabla contenido, agradecimientos
 
Estadistica, Probabilidad E Investigacin De Operacines
Estadistica, Probabilidad E Investigacin De OperacinesEstadistica, Probabilidad E Investigacin De Operacines
Estadistica, Probabilidad E Investigacin De Operacines
 
Programacion Cuadratica
Programacion CuadraticaProgramacion Cuadratica
Programacion Cuadratica
 
Programacion Cuadratica
Programacion CuadraticaProgramacion Cuadratica
Programacion Cuadratica
 
BiografíA De Euclides De AlejandríA
BiografíA De Euclides De AlejandríABiografíA De Euclides De AlejandríA
BiografíA De Euclides De AlejandríA
 
Econometria Jose Nieves
Econometria Jose NievesEconometria Jose Nieves
Econometria Jose Nieves
 
Intervención de la estadística para resolver problemas relacionados al censo ...
Intervención de la estadística para resolver problemas relacionados al censo ...Intervención de la estadística para resolver problemas relacionados al censo ...
Intervención de la estadística para resolver problemas relacionados al censo ...
 
Salud Publica
Salud PublicaSalud Publica
Salud Publica
 

Análisis factorial método centroide

  • 1. Manual de análisis factorial Jose F. Nieves Mendez Prof. Balbino Garcia ECONOMETRIA
  • 2. Indice Capitulo 3: Extracción de factores por el método centroide Ecuaciones para el método centroide Un ejemplo de dos factores y cuatro variables Un ejemplo de cuatro factores y doce variables Interacción de las comunalidades Capitulo 4: Los métodos de extracción factorial de factor principal y residuo mínimo. El método del factor principal El método del residuo mínimo
  • 3. Capitulo 3: Extracción de factores por el método centroide
  • 4. El método centroide para extracción de factores es probablemente el mas conocido de todos los métodos de extracción factorial. El método centroide resulta mas adecuado para fines didácticos, ya que es factible hacer un problema de suficiente tamaño.
  • 5. Ecuaciones para el método centroide En la fig. 2.1, el punto centroide fue localizado hallando la media do todas las coordenadas X del punto centroide y todas las coordenadas Y de los vectores de datos para obtener la coordenada Y del punto centroide. Si hubiera estado implicadas mas de dos dimensiones, se habría utilizado la media de la tercera, la cuarta y las otras coordenadas.
  • 6.
  • 7. La Ec. (3.10) da la forma para un peso centroide para la variable j en el factor 1 (o I, si usamos numerales romanos. Para obtener el peso del factor centriode para la variable de datos 1, se requiere los siguientes pasos: 1. sumar las entradas de la primera columna de la matriz de correlaciones, incluyendo el elemento de la diagonal. Dividir este numero por la raíz cuadrada (o multiplicarlo por la reciproca de la raíz cuadrada) de la suma de todas las entradas de la matriz de correlaciones entera, incluyendo los elementos diagonales.
  • 8.
  • 9. Un ejemplo de dos factores y cuatro variables La contribución del factor 1 debe eliminarse de la matriz de correlaciones mediante la operación R-A1A1’. Las columnas en cada caso suman cero, dentro de los limites del error de redondeo. Como comprobación, las filas deben sumarse también para asegurar que el total de las filas es igual al total de las columnas, como se requiere en una matriz simétrica.
  • 10.
  • 11. En la Ec. (3.1) se estableció que la suma de los pesos del segundo y los siguientes factores cancroides es cero, lo cual proporciona la base para una comprobación del calculo de los residuos del primer factor usados anteriormente. Sin embargo, puesto que las sumas de las columnas son cero, es claramente imposible aplicar los pasos utilizados para calcular el primer factor centroide a la matriz de residuos dada en la Tabla 3.2. Es necesario, primero llevar a cabo un proceso de reflexión de los residuos para eliminar tantos signos negativos como sea posible en la matriz de residuos del primer factor
  • 12. Un ejemplo de cuatro factores y doce variables Esta tabla de correlaciones de 44x44, proporciona una fuente de problemas de muestra para ejercicios de clase. Seleccionando cuatro de los ocho factores y tres variables con pesos factoriales altos que definan cada factor, puede servir como ejercicio para los estudiantes. Si se desea, cada estudiante puede tomar una muestra diferente de factores y/o variables de forma que no haya estudiantes que trabajen en el mismo ejercicio. Es importante tener al menos cuatro factores y, preferiblemente, tres variables que definan cada factor. De esta forma, el ejercicio proporcionara una apropiada experiencia de aprendizaje al estudiante, dándole oportunidad de desarrollar la destreza requerida tanto para extraer factores como para rotarlos.
  • 13. Pasos en el calculo del primer factor centroide Sumar algebraicamente cada columna de la matriz de correlaciones omitiendo del total el elemento diagonal, el valor h^2. Sumar las filas calculando cada total de fila de R, omitiendo de nuevo los elementos diagonales. Comparar los totales de fila con los totales de columnas para asegurarse de que son idénticos. Si alguno de estos totales de fila-columna es negativo, debe aplicarse el proceso de reflexión, como se explica en los pasos para el calculo del segundo factor centroide. Colocar los valores de comunalidad estimados en las entradas de la diagonal. Lo mas común es usar como estimaciones los valores absolutos de las correlaciones mas altas en las columnas Sumar las comunalidades estimadas a los totales de columna y colocar estas sumas en la fila t. Como comprobación, restar las nominalidades de los totales de la fila t, para ver si se recuperan los totales de columna sin nominalidades.
  • 14. Pasos en el calculo del primer factor centroide 7. Sumar los totales de columna con comunalidades, es decir los elementos de la fila t, para obtener T, la suma de todas las entradas de la tabla. 8. Calcular la raíz cuadrada de T hasta al menos cinco cifras decimales. 9. Calcular el reciproco de la raíz cuadrada de T hasta el menos cinco cifras decimales. 10. Multiplicar los totales de columna con comunalidades, es decir las entradas de la fila t, por 1/ √T e introducir los productos en la fila a. Estos son los pesos centroides previos al anadido de cualquier signo. 11. Si alguna variable ha sido reflejada previamente a estos cálculos, los pesos centroides deben tener los signos apropiados antes de ser introducidos como la primera columna en la matriz A, la tabla de pesos factoriales. 12. Sumar los pesos factoriales de la fila ai y comprobar que la suma es igual a √T dentro de los limites del error de redondeo, como se requiere en la Ec. (3.7)
  • 15. Calculo del segundo factor centroide Se repiten los pasos 1 y 2 del procedimiento de extracción del primer factor centroide, es decir, se suman las filas y columnas de la matriz de residuos, omitiendo los elementos diagonales, y las sumas de filas se cotejan con las sumas de columna.
  • 16. Reflexión de variables Algunas veces en el primer factor, y siempre en el segundo y los subsiguientes, las sumas de algunas de las columnas, sin contar las diagonales, son negativas. Esto requiere la reflexión de las variables con sumas de columnas negativas (sin sumar las comunalidades) de modo que todas las sumas de columna sean positivas. Los pasos a seguir en este proceso de reflexión son los siguientes: Localizar la variable que tiene el mayor total negativo sin haberle sumado la comunalidad, como primera variable a reflejar. Etiquetar la fila inmediatamente inferior a la fila ∑0 con el numero de la variable que va a ser reflejada. Bajar la suma de columna de la fila ∑0 , para esta variable, cambiando su signo de negativo a positivo, y colocarla en la fila siguiente, subrayando el numero. Los totales de columna para las otras variables deben ser ajustados para tomar en consideración el hecho de que la variable 3 esta siendo reflejada. Antes de la reflexión, estos valores fueron sumados al total con un signo contrario. Por eso, para ajustar el total correctamente, la entrada debe ser doblada, su signo cambiado y el resultado sumado al total de columna previo. Como comprobación, los nuevos totales de columna son sumados. Este valor deberá ser igual a la anterior suma de totales de columna mas cuatro veces la suma de columna positiva para la variable que se esta reflejando. Si alguno de los totales de columna es todavía negativo después de la primera reflexión, y generalmente así ocurre, se selecciona la variable con el mayor total negativo. Su total se baja con un signo positivo y se subraya como el nuevo total para esa columna. Se continua como antes, doblando los valores de fila, cambiando sus signos y sumándolos a los totales de columna previos. Este proceso de reflexión de variables se continua hasta que no quede ningún total de columna negativo. En ocasiones, puede ser necesario volver a reflejar una variable que había sido reflejada anteriormente
  • 17. Calculo de pesos del segundo factor Este procedimiento se usa cuando se dispone de buenas estimaciones de las comunalidades al principio del analisis o cuando se desea una solución con estas estimaciones de las comunalidades particulares. En este problema de muestra, y en la practica común, se introducen nuevas estimaciones de las nominalidades para cada factor extraido. Para estimar las comunalidades, se localiza el mayor residuo de cada columna, se le pone signo positivo y se coloca sobre el valor de la comunalidad residual. Los pesos del segundo factor son calculados del mismo modo que para el primer factor, y los resultados pasan a la fila ai .
  • 18. Calculo de los residuos del segundo factor Cuando los residuos del segundo factor con calculados mediante la fórmula R2=R1-A2A2’, R1 es una matriz de residuos reflejados del primer factor y A2 es una sola columna con todos los signos positivos. Al llevar a cabo las reflexiones para una variable dada, tanto los signos de la fila como los de columna para esta variable deben ser cambiados a menos que el residuo afecte a otra variable que también esta reflejada, en cuyo caso el signo no se cambia.
  • 19. Cálculos de los pesos del tercer factor Los pesos del tercer factor se obtienen esencialmente mediante los mismos pasos usados para el calculo de los pesos del segundo factor, excepto que debe reflejarse un conjunto diferente de variables. Cada nuevo proceso de reflexión para calcular otro factor comienza sin asteriscos en la tabla. Sin embargo, cuando los pesos del tercer factor son incluidos en la matriz A, es mas complicado adjuntar los signos apropiados que en el caso del segundo factor. El signo de cada variable que ha sido reflejada durante el calculo del tercer factor debe ser invertido, pero no es solo cuestión de poner signos negativos en los pesos para esas variables en el factor III. Mas bien, es una cuestión de cambio de signo de lo que era en el factor II inmediatamente precedente. Si una variable no ha sido reflejada al calcular cualquier factor previo, los signos de todos los pesos factoriales previos serán positivos, así, una reflexión en el factor actual simplemente hará que su signo se vuelva negativo.
  • 20. Calculo de los pesos del cuarto factor Una vez extraido el tercer factor, es necesario llevar a cabo las reflexiones de los residuos antes de eliminar la contribución del tercer factor mediante la formula R3=R2-A3A3. La matriz reflejada R2 no se muestra, pero se obtiene mediante el mismo método que se uso para obtener la matriz reflejase R1. Los residuos del tercer factor (matriz R3), derivados de los residuos del segundo factor reflejados, se muestran en la Tabla 3.10, junto con el calculo de los pesos del cuarto factor. Al introducir los pesos del cuarto factor en la matriz A, los signos para estas variables recién reflejadas deben hacerse opuestas a lo que eran para el factor III. Los restantes pesos del cuarto factor tendrán los mismos signos que estaban presentes para estas variables en el tercer factor, puesto que no fueron reflejados al obtener los pesos del cuarto factor. Los residuos del cuarto factor, calculados mediante la formula R4=R3-A4A. De nuevo, R3 es una matriz de residuos reflejados y todos los signos de A4 son positivos; R4, es una matriz de residuos no reflejados. Si se calculan un quinto factor y se aplicara la ecuación matricial R5=R4-A5A5’ para obtener los residuos del quinto factor, seria importante darse cuenta de que, aunque R4 aparece en ambas ecuaciones, en el primer caso no esta reflejada y en el segundo si lo esta.
  • 21. Reducción de la matriz de correlaciones Si los cálculos han sido llevados a cabo correctamente, debe valer la siguiente ecuación: R=AA’ + R4 Es decir, si la matriz factorial, consistente en cuatro factores, es multiplicada por su traspuesta y sumada a la matriz de los residuos del cuarto factor, debe reproducirse la matriz de correlaciones original dentro de los limites del error de redondeo. Antes de que R4 pueda ser sumada a AA’, los residuos individuales deben volver a su estado original no reflejado. De otro modo, algunos elementos residuales deberían ser sumados al producto interno de los pesos factoriales de AA’ para reproducir la correlación original, y otros deberían ser sustraídos.
  • 22. Interaccion de las comunalidades En una matriz grande, los errores al estimar las comunalidades generalmente no afectan mucho a la solución, puesto que estas discrepancias son pequeñas comparadas con las sumas de columna después de la reflexión. Con matrices mas pequeñas, estos errores pueden ser de mayor significación. Es necesario a veces calcular las comunalidades derivadas de la primera solución sumando los cuadrados de los pesos factoriales extraídos y usar estos valores como estimaciones de las nominalidades para una segunda solución. La comunalidad residual del primer factor es usada como la estimación de la comunalidad para el segundo factor. El residuo del segundo factor se usa como estimación para el tercer factor, y asi sucesivamente. EL mismo numero de factores es extraido en cada solución. En la practica real, la mayoría de los problemas empíricos con datos reales no requieren un alto grado de precisión en los valores estimados de las nominalidades para obtener resultados útiles.
  • 23. Capitulo 4: Los métodos de extracción factorial de factor principal y residuo mínimo.
  • 24. El método del factor principal Una serie de pasos que podría producir una solución de factor principal son los siguientes: Constrúyase la matriz de correlaciones R de n x n, con los valores apropiados seleccionados para las casillas diagonales como estimaciones de las nominalidades. Descúbrase una matriz ortogonal B de n x n, tal que cuando R es pre multiplicada por B y pos multiplicada por B’, el resultado es una matriz diagonal D, de n x n, con elementos diagonales ℓ1, ℓ2, ℓ3,….., ℓn Multiplíquese cada elemento de la columna 1 de B’ por √ℓ1, cada electo de la columna 2 de B’ por √ℓ2 y así sucesivamente para las restantes columnas hasta que cada elemento de la ultima columna B’ sea multiplicado por √ℓn. Las operaciones de este paso 3 equivalen a multiplicar la matriz B’ por la derecha por una matriz diagonal con elementos diagonales √ℓ1, √ℓ2, √ℓ3,….., √ℓn La matriz que se obtiene en el paso 3, es una matriz factorial A, tal que R = AA’. La suma de los cuadrados de la columna n de A, que es igual a ℓ1.