SUPLEMENTO 1 Parte 1
(con gráficas)

Estadísticas Paramétricas
para el análisis de datos
        Dr. Walter López Moreno
                  2012

         DERECHOS RESERVADOS 2012
Pruebas y cómputos estadísticos paramétricos
    Promedio
    Desviación estándar
    Coeficiente de variación de Pearson
    Curtosis
    Sesgo
    Regresión lineal
    Coeficiente de correlación de Pearson (r)
    Coeficiente de determinación (r2)
    Prueba t
    Prueba Z
    Prueba P
    Análisis de varianza
   Las paramétricas presumen que la distribución de la
    frecuencia por clase o intervalos es normal.

   Para comprobar la normalidad de los datos, se deben
    organizar y luego presentar su distribución en un histograma.

   También se pueden relacionar las medidas de tendencia
    central.

   Las no paramétricas ocurren cuando los datos son menores
    de 30 unidades y no hay evidencia de normalidad en su
    distribución.
Útil para medir la tendencia central de los datos.
 En datos no agrupados, se suman todos los números y se
 divide entre la cantidad total de datos.
 Las medidas de tendencia central se pueden relacionar
 para determinar la simetría o sesgo de la distribución.




             Figura S1.1 - Relación de tendencia central y forma.
                         Fuente: Tomado de González (2008).



Lea en la pagina 168 cómo determinar el promedio de datos agrupados.
Es útil para medir la dispersión entre los datos de una variable. Representa la dispersión de los
datos con respecto al promedio. Las fórmulas para determinar la desviación de datos agrupados
y no agrupados de población y muestra respectivamente son:
                 Datos no agrupados                             Para datos agrupados
          Población                 Muestra             Población                    Muestra




                            Lea el ejemplo de la página 170
   Se utiliza para comparar la dispersión entre grupos con diferente
    promedio y desviación estándar.

   Se determina dividiendo la desviación estándar entre el promedio y
    luego multiplicando el resultado por 100.

Ejemplo, si la desviación estándar de la población es de 1.41, la
desviación estándar de la muestra es de 1.55 y el promedio es 3 los
coeficientes de variación de Pearson serían los siguientes:

   CV población = σ/µ x 100 = 1.41/3 = 47 por ciento

   CV muestra     = s/ x 100 = 1.55/3 = 51.7 por ciento
Es el cuadrado de la desviación estándar. Las fórmulas para calcular la varianza de datos
agrupados y no agrupados de población y muestra respectivamente son:
              Datos no agrupados                            Para datos agrupados
       Población               Muestra              Población                  Muestra




                         Lea el ejemplo de la página 171
    Se usa para determinar si la distribución tiene un pico
     bajo o alto.

    Si el resultado es negativo, la distribución es plana y se
     conoce como platicúrtica. Esto significa que hay poca
     concentración de datos en el centro de la distribución.

    Si es positivo el resultado, su pico es alto y la
     distribución se llama leptocúrtica.


    Para hallar el valor de la curtosis sigue los pasos de la página 173.f
   Es útil para determinar la dirección en la asimetría de la
    distribución.

   Si el resultado es positivo el sesgo es a la derecha.

   Si es negativo el sesgo es a la izquierda.

   Si es cero la distribución es simétrica.
Se utiliza para determinar la ecuación de la línea, que representa la relación entre dos
variables.




                               Figura S1.3 - Diagrama de dispersión
                             Fuente: Modelo diseñado por el autor.
Si se traza una línea que represente la relación de los puntos, se obtiene la línea de
regresión.




                                   Figura S1.4 - Línea de regresión
                             Fuente: Modelo diseñado por el autor.

       El método del mínimo cuadrado utiliza la ecuación de una línea para representar la
relación entre las dos variables.



       En la ecuación a es el intercepto en el eje de y mientras b es la pendiente de la línea. Las
variables están representadas por la x (por lo general, la variable independiente) y por la y, (la
variable dependiente).
                            Lea el ejemplo de la página 175
Se usa para determinar qué tan fuerte es la relación de los datos de las dos variables en la línea de
regresión. Si el valor r es 1, está perfectamente correlacionado con una pendiente positiva. Si es
-1, está perfectamente correlacionado con una pendiente negativa.
        Cuando los puntos están bien dispersos no se pueden relacionar las dos variables por
medio de una ecuación. Por lo tanto, el valor de la correlación es de cero.




    Perfectamente positiva           Perfectamente negativa               No hay correlación
            r=1                              r = -1                            (r =0)
En valores intermedios mientras más cerca de 1 ó -1 sea el valor r, la correlación es mayor.




             Correlación positiva
                                                               Correlación negativa
                  0<r<1
                                                                    0 > r > -1

              Para determinar la correlación, se utiliza la siguiente ecuación.
   Es el cuadrado del coeficiente de correlación de Pearson.

   Es un valor igual o mayor que cero y menor o igual a uno.

   Representa por cuánto el comportamiento de una variable
    explica el comportamiento de una segunda variable.

   Si el coeficiente de determinación es mayor de 0.70, se
    considera un buen resultado.
   Útil para determinar si dos grupos de datos o dos
       muestras son diferentes de manera significativa con
       relación a sus promedios.

      Por ejemplo, si en la hipótesis se establece que las
       mujeres y los hombres no difieren por el promedio de
       gastos mensuales en la compra de ropa, se puede
       utilizar la Prueba t para comprobarlo.




Los pasos a seguir para hacer la prueba t se encuentran en la página 180
   Se usa para comparar el promedio de dos muestras con
    una constante como el promedio de una población.

   El propósito es determinar si los promedios en dos
    muestras son diferentes de manera significativa.




                     Siga el ejemplo de la página 183.
   Se usa para comparar el promedio de dos muestras con
    una constante como el promedio de una población. El
    propósito es determinar si los promedios en dos
    muestras son diferentes de manera significativa.




                    Siga el ejemplo de la página 184.
   Es útil para comparar tres o más promedios.

   Cuando se comparan los promedios de una variable se
    hace la prueba “Oneway” ANOVA.

   Esta prueba compara las varianzas de cada grupo.

   Si los promedios son de dos variables independientes,
    se hace la prueba “twoway” ANOVA.


      Siga los pasos y los ejemplos de las páginas 186 a la 191
Asignación para repaso de conceptos: Leer el
Suplemento 1 y contesta los ejercicios 1 al 10, 13 al 15


TRABAJO individual: Ejercicios 11, 12, 18,21,22, 24.


TRABAJO en Grupo: Ejercicios 16, 17,19 ,20, 23, 25
Puedes obtener información y ayudas
 adicionales en la página WEB del libro


   http:/www.ochopasos.tk

Para adquirir el libro escribe al autor a su
           correo electrónico:

drwalterlopezmoreno@gmail.com

Suplemento 1 parte 1 de los Ocho pasos pasos para el desarrollo de una investigación

  • 1.
    SUPLEMENTO 1 Parte1 (con gráficas) Estadísticas Paramétricas para el análisis de datos Dr. Walter López Moreno 2012 DERECHOS RESERVADOS 2012
  • 2.
    Pruebas y cómputosestadísticos paramétricos Promedio Desviación estándar Coeficiente de variación de Pearson Curtosis Sesgo Regresión lineal Coeficiente de correlación de Pearson (r) Coeficiente de determinación (r2) Prueba t Prueba Z Prueba P Análisis de varianza
  • 3.
    Las paramétricas presumen que la distribución de la frecuencia por clase o intervalos es normal.  Para comprobar la normalidad de los datos, se deben organizar y luego presentar su distribución en un histograma.  También se pueden relacionar las medidas de tendencia central.  Las no paramétricas ocurren cuando los datos son menores de 30 unidades y no hay evidencia de normalidad en su distribución.
  • 4.
    Útil para medirla tendencia central de los datos. En datos no agrupados, se suman todos los números y se divide entre la cantidad total de datos. Las medidas de tendencia central se pueden relacionar para determinar la simetría o sesgo de la distribución. Figura S1.1 - Relación de tendencia central y forma. Fuente: Tomado de González (2008). Lea en la pagina 168 cómo determinar el promedio de datos agrupados.
  • 5.
    Es útil paramedir la dispersión entre los datos de una variable. Representa la dispersión de los datos con respecto al promedio. Las fórmulas para determinar la desviación de datos agrupados y no agrupados de población y muestra respectivamente son: Datos no agrupados Para datos agrupados Población Muestra Población Muestra Lea el ejemplo de la página 170
  • 6.
    Se utiliza para comparar la dispersión entre grupos con diferente promedio y desviación estándar.  Se determina dividiendo la desviación estándar entre el promedio y luego multiplicando el resultado por 100. Ejemplo, si la desviación estándar de la población es de 1.41, la desviación estándar de la muestra es de 1.55 y el promedio es 3 los coeficientes de variación de Pearson serían los siguientes:  CV población = σ/µ x 100 = 1.41/3 = 47 por ciento  CV muestra = s/ x 100 = 1.55/3 = 51.7 por ciento
  • 7.
    Es el cuadradode la desviación estándar. Las fórmulas para calcular la varianza de datos agrupados y no agrupados de población y muestra respectivamente son: Datos no agrupados Para datos agrupados Población Muestra Población Muestra Lea el ejemplo de la página 171
  • 8.
    Se usa para determinar si la distribución tiene un pico bajo o alto.  Si el resultado es negativo, la distribución es plana y se conoce como platicúrtica. Esto significa que hay poca concentración de datos en el centro de la distribución.  Si es positivo el resultado, su pico es alto y la distribución se llama leptocúrtica. Para hallar el valor de la curtosis sigue los pasos de la página 173.f
  • 9.
    Es útil para determinar la dirección en la asimetría de la distribución.  Si el resultado es positivo el sesgo es a la derecha.  Si es negativo el sesgo es a la izquierda.  Si es cero la distribución es simétrica.
  • 10.
    Se utiliza paradeterminar la ecuación de la línea, que representa la relación entre dos variables. Figura S1.3 - Diagrama de dispersión Fuente: Modelo diseñado por el autor.
  • 11.
    Si se trazauna línea que represente la relación de los puntos, se obtiene la línea de regresión. Figura S1.4 - Línea de regresión Fuente: Modelo diseñado por el autor. El método del mínimo cuadrado utiliza la ecuación de una línea para representar la relación entre las dos variables. En la ecuación a es el intercepto en el eje de y mientras b es la pendiente de la línea. Las variables están representadas por la x (por lo general, la variable independiente) y por la y, (la variable dependiente). Lea el ejemplo de la página 175
  • 12.
    Se usa paradeterminar qué tan fuerte es la relación de los datos de las dos variables en la línea de regresión. Si el valor r es 1, está perfectamente correlacionado con una pendiente positiva. Si es -1, está perfectamente correlacionado con una pendiente negativa. Cuando los puntos están bien dispersos no se pueden relacionar las dos variables por medio de una ecuación. Por lo tanto, el valor de la correlación es de cero. Perfectamente positiva Perfectamente negativa No hay correlación r=1 r = -1 (r =0)
  • 13.
    En valores intermediosmientras más cerca de 1 ó -1 sea el valor r, la correlación es mayor. Correlación positiva Correlación negativa 0<r<1 0 > r > -1 Para determinar la correlación, se utiliza la siguiente ecuación.
  • 14.
    Es el cuadrado del coeficiente de correlación de Pearson.  Es un valor igual o mayor que cero y menor o igual a uno.  Representa por cuánto el comportamiento de una variable explica el comportamiento de una segunda variable.  Si el coeficiente de determinación es mayor de 0.70, se considera un buen resultado.
  • 15.
    Útil para determinar si dos grupos de datos o dos muestras son diferentes de manera significativa con relación a sus promedios.  Por ejemplo, si en la hipótesis se establece que las mujeres y los hombres no difieren por el promedio de gastos mensuales en la compra de ropa, se puede utilizar la Prueba t para comprobarlo. Los pasos a seguir para hacer la prueba t se encuentran en la página 180
  • 16.
    Se usa para comparar el promedio de dos muestras con una constante como el promedio de una población.  El propósito es determinar si los promedios en dos muestras son diferentes de manera significativa. Siga el ejemplo de la página 183.
  • 17.
    Se usa para comparar el promedio de dos muestras con una constante como el promedio de una población. El propósito es determinar si los promedios en dos muestras son diferentes de manera significativa. Siga el ejemplo de la página 184.
  • 18.
    Es útil para comparar tres o más promedios.  Cuando se comparan los promedios de una variable se hace la prueba “Oneway” ANOVA.  Esta prueba compara las varianzas de cada grupo.  Si los promedios son de dos variables independientes, se hace la prueba “twoway” ANOVA. Siga los pasos y los ejemplos de las páginas 186 a la 191
  • 19.
    Asignación para repasode conceptos: Leer el Suplemento 1 y contesta los ejercicios 1 al 10, 13 al 15 TRABAJO individual: Ejercicios 11, 12, 18,21,22, 24. TRABAJO en Grupo: Ejercicios 16, 17,19 ,20, 23, 25
  • 23.
    Puedes obtener informacióny ayudas adicionales en la página WEB del libro http:/www.ochopasos.tk Para adquirir el libro escribe al autor a su correo electrónico: drwalterlopezmoreno@gmail.com