Análisis  de los datos
ANALISIS DE DATOS CUANTITATIVOS Programas Computacionales SPSS Minitab SAS Stats Distribución de frecuencias Medidas de tendencia central Medidas de variabilidad ANALISIS DE DATOS CUANTITATIVOS Media. Mediana . Moda Rango. Desviación estándar. Varianza Gráficas Puntuaciones Z La matriz de datos Descriptiva Estadística Inferencial Se efectúa mediante Y la
ANALISIS DE DATOS CUANTITATIVOS Análisis paramétricos Análisis no paramétricos Coeficientes de correlación. Prueba t Prueba de diferencias de proporciones. Análisis de varianza Chi cuadrada. Spearman y Kendall Coeficientes para tabulaciones cruzadas Estadística Inferencial Estimar parámetros Probar  hipótesis Distribución muestral ANALISIS DE DATOS CUANTITATIVOS
ANALISIS DE DATOS CUANTITATIVOS REPORTAR RESULTADOS Análisis estadístico de variables e hipótesis Explorar datos Evaluar la confiabilidad y validez Ejecutarlo PASOS Seleccionar el Programa ANALISIS DE DATOS CUANTITATIVOS
Estadísticos total-elemento         Media de la escala si se elimina el elemento Varianza de la escala si se elimina el elemento Correlación elemento-total corregida Alfa de Cronbach si se eleimina el elemento p1 34.1076923 82.34490161 0.51572306 0.919112855 p2 33.7230769 79.48861061 0.52288378 0.920134007 p3 33.6846154 78.83774597 0.66698428 0.914934288 p4 34.2230769 81.7405486 0.5724501 0.917646698 p5 33.7153846 76.59278473 0.72957994 0.912909884 p6 33.4923077 77.49218843 0.73055437 0.912938363 p7 33.9923077 79.99218843 0.59421838 0.917112935 p8 33.5692308 78.21610018 0.718686 0.913392359 p9 34.1384615 79.67060227 0.6206626 0.916319238 p10 33.9461538 80.33041145 0.69171183 0.914638589 p11 34.3615385 83.31788909 0.51620397 0.919064274 p13 33.9230769 80.47465713 0.62045497 0.91633199 p14 33.8076923 80.69916518 0.58154149 0.917416627 p15 33.9461538 80.15986881 0.666663 0.915133921 p16 34.2384615 84.64812165 0.44031547 0.920740118 p17 33.4384615 75.82951699 0.76835231 0.911583916
Análisis de los datos en el proceso de Investigación Se busca decidir que pruebas estadísticas son apropiadas para analizar los datos dependiendo de  las hipótesis formuladas y los niveles de medición de las variables
¿Qué análisis pueden efectuarse en los datos? Los análisis de datos dependen de 3 factores: El nivel de medición de las variables La manera que se hayan formulado las hipótesis. Cada método tiene su razón de ser y un propósito especifico. No se deben hacer mas análisis de los necesarios
Variables
Los principales análisis que pueden efectuarse son: Estadística descriptiva para cada variable Puntuaciones “Z” Cálculos y Razones de estadísticos inferencial Análisis paramétricos  Análisis  no paramétricos Análisis multivariables
1.  Estadísticas  descriptivas para cada variable “ La primera tarea es describir los datos, valores o puntaciones obtenidas para cada variable... ¿cómo pueden describirse estos datos ? Describiendo  la  distribución de las puntuaciones o frecuencias ”  (Fernadez- Collao, Baptista y Elkes)
Distribución de frecuencia: Es un conjunto de puntuaciones ordenadas en sus respectivas categorías. Variable : conductor preferido Categorías  Códigos  Frecuencias AMT  1  50 LEM  2  88 FGI  3  12 MML  4  03 TOTAL  153
Distribución de frecuencia resumida: Variable: calificación en la prueba de motivación   CATEGORIAS  FRECUENCIAS 55 o menos  03 56-60  16 61-65  09 66-70  03  71-75  07  76-80  09 81-85  04 86-90  11 91-96  01 TOTAL  63
HISTOGRAMA CATEGORÍAS P O R C E N T A J E S
GRADO DE CONOCIMIENTO   GRAFICO N° 05
Modelo de Gráfico  Gráfico 7.   Cantidades de   sanciones  por bimestre recibidas por cada aula de la Escuela Militar de Chorrillos.
RECURSOS GRAFICO N° 02
Modelo de Tabla Tabla 5 Tasas de error para grupos de menor y mayor edad.   Tasa media   Desviacion    Tamaño de  de error   Estándar   la muestra Grado de  Menor  Mayor     Menor  Mayor  Menor  Mayor  Dificultad edad edad   edad   edad  edad   edad Bajo  .05 .14   .08   .15   12   18 Moderado  .05 .17   .07   .15   15   12 Alto  .11 .26   .10   .21   16   14
Frecuencias relativas y acumuladas Frecuencia relativas : son los resultados (%) de casos de cada categoría. Frecuencias acumuladas :  son los que se va acumulando en cada categoría. Frecuencias absolutas : son los puntajes directos, sin tener trasformación alguna. Las distribución de frecuencias, generalmente las frecuencias relativa, pueden presentarse en forma de histograma o gráficas de otro tipo.
Variable: cooperación del personal en el desarrollo de  la empresa XX Categorías  códigos  frecuencia  Frecuencia  frecuencia (cooperación)  absoluta  relativas ( %)  acumulada - Si se ha  Obtenido  1  91  74.6%  91 - No se ha  Obtenido  2  05  4.1%  96 - No  Respondieron  3  26   21. 3%  122  TOTAL  122  100%
2. Puntuaciones “z” “…  Son las trasformaciones que se pueden hacer a los valores o puntuaciones obtenidas, con el propósito de analizar sus distancia respecto a la media, en unidades de desviaciones estándar ….”(Sampieri,Collado,Lucio). Siendo la formula :  X = valor a trasformar X = media de distribución S= desviación estándar  Z= trasformación en  unidades  de    Desviación estándar  Z =  X - X   S
3. Razones y tasas Razón : es la relación entre dos categorías.  Ejm: categorías  frecuencias    absolutas   Masculino   60   Femenino     30 La razón de H y M es  60  =2 30 ^ Por cada dos H hay una M.
Tasa:  es la relación entre el número de casos, frecuencias y el número total de observaciones, multiplicada por un múltiplo de 10. (100 ó 1000).  Ejemplo: Tasa = Nº de nacidos vivos en ciudad  X 1000   Nª de habitantes en la ciudad  T. De nacidos vivos  =  10 000   X 1000 = 33.33 300 000 Hay 33.33 nacidos vivos por cada 1000 habitantes  Tasa= Nª. de eventos durante un período   X  100 ó 1000 Nª. total  de eventos posibles
4. Cálculos y Razones de estadísticos inferencial La estadística inferencial puede ser utilizada para dos procedimientos.(Wiersma,1986). a) Probar hipotesis: b) Estimar paramétros (determinar las  estadísticas de la población).
5. Análisis Paramétricos Para realizar  análisis paramétricos debe partirse de los siguientes supuestos: La distribución poblacional de la variable dependiente es normal. El nivel de medición de la variable dependiente es por intervalos o razón. Cuando dos o más poblaciones son estudiadas, tienen una varianza.
Pruebas paramétricas mas usadas son : Coeficiente de correlación de Pearson Prueba “T” Prueba de contraste de la diferencia de proporciones. Análisis de varianza unidireccional  (ANOVA Oneway) Análisis de varianza factorial ( ANOVA) Análisis de covarianza ( ANCOVA)
6. Análisis no Paramétricos Las distribuciones pueden ser no normales. Las variables deben ser categóricas. Pruebas estadísticas mas utilizadas: La ji cuadrada o X2. Los coeficiente de correlación e independencia para tabulaciones cruzadas. Los coeficientes de correlación por rangos ordenados de Spearman y kendall.
7. ANÁLISIS MULTIVARIADO Son aquellos en que se analiza la relación entre varias variables independiente y al menos una dependiente.  X 1  X 2   VD X 3 X 4
PROCESAMIENTO, ANÁLISIS E INTERPRETACIÓN DE LA INFORMACIÓN Al presentar la información a través de cuadros, éstos deberán contener preferentemente una o dos variables (Tabla de doble entrada), ya que la descripción e interpretación de cuadros de más de dos variables pueden resultar inadecuadas.
PROCESAMIENTO, ANÁLISIS E INTERPRETACIÓN DE LA INFORMACIÓN Los métodos para el análisis estadístico de los datos deberán elegirse según los objetivos planteados y de acuerdo con las hipótesis que se deseen contrastar.
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
Coeficiente de Correlación de Pearson Interpretación: El coeficiente r de Pearson puede variar de – 1.00 a + 1.00, donde: - 1.00 Correlación negativa perfecta (“A mayor X, menos Y”, de manera proporcional. Es decir, cada vez que X aumenta una unidad, Y disminuye siempre una cantidad constante). Esto también se aplica “a menor X, mayor Y” - 0.90 Correlación negativa muy fuerte. - 0.75 Correlación negativa considerable. - 0.50 Correlación negativa media. - 0.25 Correlación negativa débil. - 0.10 Correlación negativa muy débil. 0.00 No existe correlación alguna entre las variables + 0.10 Correlación positiva muy débil + 0.25 Correlación positiva débil. + 0.50 Correlación positiva media. + 0.75 Correlación positiva considerable. + 0.90 Correlación positiva muy fuerte. + 1.00 Correlación positiva perfecta

Clase10 analisisdedatos

  • 1.
    Análisis delos datos
  • 2.
    ANALISIS DE DATOSCUANTITATIVOS Programas Computacionales SPSS Minitab SAS Stats Distribución de frecuencias Medidas de tendencia central Medidas de variabilidad ANALISIS DE DATOS CUANTITATIVOS Media. Mediana . Moda Rango. Desviación estándar. Varianza Gráficas Puntuaciones Z La matriz de datos Descriptiva Estadística Inferencial Se efectúa mediante Y la
  • 3.
    ANALISIS DE DATOSCUANTITATIVOS Análisis paramétricos Análisis no paramétricos Coeficientes de correlación. Prueba t Prueba de diferencias de proporciones. Análisis de varianza Chi cuadrada. Spearman y Kendall Coeficientes para tabulaciones cruzadas Estadística Inferencial Estimar parámetros Probar hipótesis Distribución muestral ANALISIS DE DATOS CUANTITATIVOS
  • 4.
    ANALISIS DE DATOSCUANTITATIVOS REPORTAR RESULTADOS Análisis estadístico de variables e hipótesis Explorar datos Evaluar la confiabilidad y validez Ejecutarlo PASOS Seleccionar el Programa ANALISIS DE DATOS CUANTITATIVOS
  • 8.
    Estadísticos total-elemento        Media de la escala si se elimina el elemento Varianza de la escala si se elimina el elemento Correlación elemento-total corregida Alfa de Cronbach si se eleimina el elemento p1 34.1076923 82.34490161 0.51572306 0.919112855 p2 33.7230769 79.48861061 0.52288378 0.920134007 p3 33.6846154 78.83774597 0.66698428 0.914934288 p4 34.2230769 81.7405486 0.5724501 0.917646698 p5 33.7153846 76.59278473 0.72957994 0.912909884 p6 33.4923077 77.49218843 0.73055437 0.912938363 p7 33.9923077 79.99218843 0.59421838 0.917112935 p8 33.5692308 78.21610018 0.718686 0.913392359 p9 34.1384615 79.67060227 0.6206626 0.916319238 p10 33.9461538 80.33041145 0.69171183 0.914638589 p11 34.3615385 83.31788909 0.51620397 0.919064274 p13 33.9230769 80.47465713 0.62045497 0.91633199 p14 33.8076923 80.69916518 0.58154149 0.917416627 p15 33.9461538 80.15986881 0.666663 0.915133921 p16 34.2384615 84.64812165 0.44031547 0.920740118 p17 33.4384615 75.82951699 0.76835231 0.911583916
  • 9.
    Análisis de losdatos en el proceso de Investigación Se busca decidir que pruebas estadísticas son apropiadas para analizar los datos dependiendo de las hipótesis formuladas y los niveles de medición de las variables
  • 10.
    ¿Qué análisis puedenefectuarse en los datos? Los análisis de datos dependen de 3 factores: El nivel de medición de las variables La manera que se hayan formulado las hipótesis. Cada método tiene su razón de ser y un propósito especifico. No se deben hacer mas análisis de los necesarios
  • 12.
  • 13.
    Los principales análisisque pueden efectuarse son: Estadística descriptiva para cada variable Puntuaciones “Z” Cálculos y Razones de estadísticos inferencial Análisis paramétricos Análisis no paramétricos Análisis multivariables
  • 14.
    1. Estadísticas descriptivas para cada variable “ La primera tarea es describir los datos, valores o puntaciones obtenidas para cada variable... ¿cómo pueden describirse estos datos ? Describiendo la distribución de las puntuaciones o frecuencias ” (Fernadez- Collao, Baptista y Elkes)
  • 15.
    Distribución de frecuencia:Es un conjunto de puntuaciones ordenadas en sus respectivas categorías. Variable : conductor preferido Categorías Códigos Frecuencias AMT 1 50 LEM 2 88 FGI 3 12 MML 4 03 TOTAL 153
  • 16.
    Distribución de frecuenciaresumida: Variable: calificación en la prueba de motivación CATEGORIAS FRECUENCIAS 55 o menos 03 56-60 16 61-65 09 66-70 03 71-75 07 76-80 09 81-85 04 86-90 11 91-96 01 TOTAL 63
  • 17.
    HISTOGRAMA CATEGORÍAS PO R C E N T A J E S
  • 18.
    GRADO DE CONOCIMIENTO GRAFICO N° 05
  • 19.
    Modelo de Gráfico Gráfico 7. Cantidades de sanciones por bimestre recibidas por cada aula de la Escuela Militar de Chorrillos.
  • 20.
  • 22.
    Modelo de TablaTabla 5 Tasas de error para grupos de menor y mayor edad. Tasa media Desviacion Tamaño de de error Estándar la muestra Grado de Menor Mayor Menor Mayor Menor Mayor Dificultad edad edad edad edad edad edad Bajo .05 .14 .08 .15 12 18 Moderado .05 .17 .07 .15 15 12 Alto .11 .26 .10 .21 16 14
  • 23.
    Frecuencias relativas yacumuladas Frecuencia relativas : son los resultados (%) de casos de cada categoría. Frecuencias acumuladas : son los que se va acumulando en cada categoría. Frecuencias absolutas : son los puntajes directos, sin tener trasformación alguna. Las distribución de frecuencias, generalmente las frecuencias relativa, pueden presentarse en forma de histograma o gráficas de otro tipo.
  • 24.
    Variable: cooperación delpersonal en el desarrollo de la empresa XX Categorías códigos frecuencia Frecuencia frecuencia (cooperación) absoluta relativas ( %) acumulada - Si se ha Obtenido 1 91 74.6% 91 - No se ha Obtenido 2 05 4.1% 96 - No Respondieron 3 26 21. 3% 122 TOTAL 122 100%
  • 25.
    2. Puntuaciones “z”“… Son las trasformaciones que se pueden hacer a los valores o puntuaciones obtenidas, con el propósito de analizar sus distancia respecto a la media, en unidades de desviaciones estándar ….”(Sampieri,Collado,Lucio). Siendo la formula : X = valor a trasformar X = media de distribución S= desviación estándar Z= trasformación en unidades de Desviación estándar Z = X - X S
  • 26.
    3. Razones ytasas Razón : es la relación entre dos categorías. Ejm: categorías frecuencias absolutas Masculino 60 Femenino 30 La razón de H y M es 60 =2 30 ^ Por cada dos H hay una M.
  • 27.
    Tasa: esla relación entre el número de casos, frecuencias y el número total de observaciones, multiplicada por un múltiplo de 10. (100 ó 1000). Ejemplo: Tasa = Nº de nacidos vivos en ciudad X 1000 Nª de habitantes en la ciudad T. De nacidos vivos = 10 000 X 1000 = 33.33 300 000 Hay 33.33 nacidos vivos por cada 1000 habitantes Tasa= Nª. de eventos durante un período X 100 ó 1000 Nª. total de eventos posibles
  • 28.
    4. Cálculos yRazones de estadísticos inferencial La estadística inferencial puede ser utilizada para dos procedimientos.(Wiersma,1986). a) Probar hipotesis: b) Estimar paramétros (determinar las estadísticas de la población).
  • 29.
    5. Análisis ParamétricosPara realizar análisis paramétricos debe partirse de los siguientes supuestos: La distribución poblacional de la variable dependiente es normal. El nivel de medición de la variable dependiente es por intervalos o razón. Cuando dos o más poblaciones son estudiadas, tienen una varianza.
  • 30.
    Pruebas paramétricas masusadas son : Coeficiente de correlación de Pearson Prueba “T” Prueba de contraste de la diferencia de proporciones. Análisis de varianza unidireccional (ANOVA Oneway) Análisis de varianza factorial ( ANOVA) Análisis de covarianza ( ANCOVA)
  • 31.
    6. Análisis noParamétricos Las distribuciones pueden ser no normales. Las variables deben ser categóricas. Pruebas estadísticas mas utilizadas: La ji cuadrada o X2. Los coeficiente de correlación e independencia para tabulaciones cruzadas. Los coeficientes de correlación por rangos ordenados de Spearman y kendall.
  • 32.
    7. ANÁLISIS MULTIVARIADOSon aquellos en que se analiza la relación entre varias variables independiente y al menos una dependiente. X 1 X 2 VD X 3 X 4
  • 33.
    PROCESAMIENTO, ANÁLISIS EINTERPRETACIÓN DE LA INFORMACIÓN Al presentar la información a través de cuadros, éstos deberán contener preferentemente una o dos variables (Tabla de doble entrada), ya que la descripción e interpretación de cuadros de más de dos variables pueden resultar inadecuadas.
  • 34.
    PROCESAMIENTO, ANÁLISIS EINTERPRETACIÓN DE LA INFORMACIÓN Los métodos para el análisis estadístico de los datos deberán elegirse según los objetivos planteados y de acuerdo con las hipótesis que se deseen contrastar.
  • 35.
    PRINCIPALES METODOS DEANÁLISIS ESTADÍSTICO
  • 36.
    PRINCIPALES METODOS DEANÁLISIS ESTADÍSTICO
  • 37.
    PRINCIPALES METODOS DEANÁLISIS ESTADÍSTICO
  • 38.
    PRINCIPALES METODOS DEANÁLISIS ESTADÍSTICO
  • 39.
    PRINCIPALES METODOS DEANÁLISIS ESTADÍSTICO
  • 40.
    Coeficiente de Correlaciónde Pearson Interpretación: El coeficiente r de Pearson puede variar de – 1.00 a + 1.00, donde: - 1.00 Correlación negativa perfecta (“A mayor X, menos Y”, de manera proporcional. Es decir, cada vez que X aumenta una unidad, Y disminuye siempre una cantidad constante). Esto también se aplica “a menor X, mayor Y” - 0.90 Correlación negativa muy fuerte. - 0.75 Correlación negativa considerable. - 0.50 Correlación negativa media. - 0.25 Correlación negativa débil. - 0.10 Correlación negativa muy débil. 0.00 No existe correlación alguna entre las variables + 0.10 Correlación positiva muy débil + 0.25 Correlación positiva débil. + 0.50 Correlación positiva media. + 0.75 Correlación positiva considerable. + 0.90 Correlación positiva muy fuerte. + 1.00 Correlación positiva perfecta