Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Prueba estadística paramétrica
1. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
1
Prueba Estadística paramétrica
A diario cada uno de nosotros hacemos cosas increíblemente complejas, y
somos únicos, pues nadie posee nuestras características tanto físicas, intelectuales, de
personalidad, etc . en cada momento de nuestra vida damos testimonio de captar,
procesar e integrar una gran cantidad de datos captados por nuestros sentidos y que
actuamos de manera instantánea, basándose en la información obtenida y que
origina una gama de probabilidades relativas a los posible comportamientos. Veamos
un ejemplo, si Ud va a cruzar una avenida, el tiempo que demora en cambiar la luz
de semáforo, Ud a tomado en cuenta ( en base a una información descriptiva) en
colocarse en un lugar “ seguro” llámese paradero. Pues bien, justo en el momento de
cruzar la avenida , de manera intempestiva ve un auto que no respeta el reglamento
de tránsito e intenta cruzar. En ese instante se verá obligado a actuar de acuerdo a la
información estadística que posee: rezar, detenerse, retroceder o adelantarse, su
mecanismo probalistico le prevé de varias alternativas de manera inmediata.
Si se detiene, cual es la probabilidad de que el conductor del auto también frene a
tiempo? Si Ud en base a sus datos sensoriales tiene a bien, antes de cruzar una
avenida observa que los coches están detenidos. Entonces es correcta la decisión que
tomó, el de detenerse, porque es muy probable que al coche que siguió sin percatarse
el cambio de luz del semáforo. Ud lo notara.
Como a podido advertir son muchas las circunstancias que se presentar en nuestra
vida diaria y que de manera instantánea tenemos que tomar decisiones correctas en
base a una generación de decisiones estadísticas. Por lo tanto, es Ud un estadístico.
Cuando se habla de estadística, se le considera como un método para manejar los
datos, es decir, es una herramienta para la recopilación, organización, y análisis de
hechos numéricos o de observaciones.
El método estadístico muestra dos funciones: la estadística descriptiva, que tiene
como propósito presentar la información de manera cómoda, utilizable y
comprensible y la estadística inferencial, es una técnica mediante la cual se obtienen
generalizaciones o se toman decisiones en base a una información parcial o completa
obtenida mediante técnicas descriptivas. Por lo tanto, se ocupa del proceso metódico
para obtener conclusiones válidas de una muestra, con respecto a la población, de
manera tal que se le pueda considerar representativa de ella.
“se basan en que se supone una forma determinada de la distribución de valores,
generalmente la distribución normal, en la población de la que se obtiene la muestra
experimental.” SEO
2. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
2
Al realizar una investigación paramétrica, el investigador en base a una
muestra, estima una o varias características de la población de donde proviene. Se
obtiene de dos maneras: mediante la estimación y la prueba de hipótesis. Es decir,
estimar el valor de un parámetro a partir de la muestra y contrastar si su hipótesis es
confirmada en la muestra. Considerando a la hipótesis Ho como hipótesis nula , de no
confirmarse se explica por la hipótesis alterna H1 que acepta que esas diferencias
existen dentro de cierto margen de probabilidad: cuando son significativas (a nivel de
una p < 0.05 o < 0.001) se rechaza la hipótesis nula y se acepta la hipótesis alterna (
MGG Y CDB “ sinopsis de las pruebas no paramétricas” p7. podemos afirmar que el contraste
de hipótesis es el procedimiento que nos permite verificar y confirmar si esa relación
potencial es verdadera o no y con qué margen de error.
Es conveniente señalar lo siguiente: En el desarrollo del proceso de contraste
de hipótesis es igualmente relevante el nivel de significación, error tipo I o α (rechazar
una Ho cuanto ésta es verdadera) que se asume en el mismo, así como el nivel de
confianza (1-α). Los valores habituales asumidos para los errores son el 10%, menos
usado y, sobre todo, 5% y 1%, siendo por ende, los niveles de confianza del 90%, 95% y
99%.( se conoce como p< 0.05 o < 0,1 o 0.001). También destacamos el error tipo II o β
(no rechazar una Ho cuando ésta es falsa) y la potencia de contraste (1-β). Todos
estos aspectos quedan esquemáticamente reflejados en la siguiente tabla:
Decisiones respecto a Ho H0 cierta H0 falsa
H0 rechazada Error tipo I (α) Decisión correcta
Potencia de contraste (1-β)
H0 no rechazada Decisión correcta
Nivel de confianza
(1-α)
Error tipo II (β)
Como podemos apreciar en la tabla anterior el proceso final del contraste de
hipótesis es un resultado que sirve para aceptar o rechazar la hipótesis nula con un
cierto grado de error.
Que es un parámetro? Es cualquier característica medible de una población.
Es un número que resume la enorme cantidad de datos que pueden derivarse del
estudio de una variable estadística.
El cálculo de este número está bien definido, usualmente mediante una
fórmula aritmética obtenida a partir de datos de la población. En estadística se
definen como variables a los atributos, rasgos o propiedades de un grupo de
elementos que toman diferentes valores, magnitudes o intensidades. En el proceso de
medición de ellas se les asignan números o códigos de observación. Las variables
pueden ser cuantitativas (que se pueden contar)y cualitativas ( por su atributo)
veamos: el color de ojos ( azules, verdes, negros) la religión a la que pertenece(
católica, protestante), partido político. sexo ( masculino, femenino) Corresponde a
variables cualitativas nominales. Si se considera los niveles jerárquicos (soldado,
alférez, teniente, capitán) la intensidad del dolor ( leve, agudo, crónico) grado
académico( doctor , maestro, licenciado), clase social( baja, media, alta) se designan
3. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
3
como variable cualitativa ordinal . Etc y en el otro caso: el número de nacimientos, el
número de estudiantes etc. son valores enteros se conoce como variable cuantitativa
discreta; también se presenta valores fraccionarios como: el peso de las personas( 60.3
kg 25,4 kg), la estatura ( 1.57m, 1,78m ), el salario de un empleado ( $ 2450.6 ) se les
denominan variable cuantitativa continuas.
Las pruebas paramétricas asumen los parámetros de la distribución de la
variable (media y Varianza) y un tipo de distribución normal. Veamos un ejemplo: Si
se conoce la estatura de las personas sigue una distribución normal, luego se puede
obtener la media ( promedio) de la estatura de las personas que han sido medidas
posteriormente queremos conocer cuan distante esta del promedio la estatura de
cada uno de los participantes de la medición, como habrá podido notar dado que es
un promedio existirá datos mayores al promedio como también menores esa
diferencia se conoce como dispersión entonces se ha conseguido 2 cosas: calcular el
promedio y las medidas de variabilidad, mediante el promedio y la varianza.
No debe olvidar que, la solución de problemas de investigación sin estas dos
medidas es casi imposible. Asimismo, cuando se menciona Normal nos referimos a la
campana de Gauss o distribución Gaussiana ( se recomienda revisar cualquier libro
de estadística básica).
Las pruebas paramétricas, para usarlas deben cumplirse supuestos:
1. Independencia de las observaciones a excepción de datos pareados.
2. Las observaciones para la variable dependiente se han obtenido de manera
aleatoria de una población con distribución normal.
3. La variable dependiente es medida al menos en una escala de intervalo.
4. Se recomienda un tamaño de muestra mínimo de 30 sujetos por grupo( mediciones
cuantitativas, actualmente es opcional)
5. Los datos son obtenidos de poblaciones que tienen varianzas iguales (una varianza
no debe ser el doble o mayor que la otra). ¿?
6. Habitualmente las hipótesis se hacen sobre valores numéricos, especialmente el
promedio de una población (μ), como ejemplo:
Ho: μ1 = μ2
H1: μ1 ≠ μ2
7. Otros posibles requisitos: variable independiente nominal o de intervalo,
homocedasticidad (para cada nivel de la variable independiente hay una variación
similar de la variable dependiente) y casillas de igual tamaño.
A veces se usa sin cumplir los supuestos pero debe usarse con cautela en
muestras más pequeñas o con varianzas desiguales, en estos casos prefiera usar
pruebas no paramétricas. Cuando se menciona medidas de intervalo es conveniente
4. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
4
indicar lo siguiente, si a Ud le preguntaran cual es la estatura de su amigo, dirá 1.80
m ¿ qué confianza tiene Ud, en que la estatura de su amigo sea exactamente 1.80m?
Si nos preguntaran, probablemente responderíamos “dudo que su estatura sea
exactamente de 1.80m. Así es porque pueden ocurrir 3 casos, la primera es que
acierte, créame que tuvo una suerte extraordinaria en adivinarlo, pero también es
probable que sea mayor o menor a lo señalado por Ud. Sin embargo, se puede estar
razonablemente seguro que su estatura este comprendido entre 1.79 y 1.81m. al hacer
esto, hemos establecido el intervalo dentro del cual confiamos esté la verdadera
estatura. Después de un momento de reflexión y vacilar ligeramente,” bien, quizás su
estatura este entre 1.75 y 1.85 m , estoy completamente seguro” Nótese que cuanto
mayor sea el tamaño del intervalo mayor confianza tendremos de que el verdadero
valor esté comprendido entre estos límites. Es necesario advertir que al establecer
estos límites de confianza estamos haciendo dos cosas. a) establecer los límites entre
los cuales creemos que se encuentra el verdadero valor y b) rechazamos la posibilidad
de que su verdadera estatura esté fuera de los límites.
Además, debe tener presente que mientras más grande sea la muestra más
exacta será la estimación. También es importante acotar que como dijimos
anteriormente acerca de la normal (llamada también campana de Gauss) en la cual
los datos suelen seguir una distribución normal. Acepte que no siempre es asi, a veces
los datos con los que se cuentan no cumplen dicho supuesto, simplemente por no
contar con la suficiente cantidad de datos.
Asimismo, cuando se menciona sobre las varianzas iguales (homogéneas),
tenga cuidado en su interpretación, son ignoradas dicha requisito cuando las
muestras son muestras relacionadas al parecer no existe riesgo alguno de distorsionar
los resultados.
Las pruebas paramétricas son :
Prueba del valor Z de la distribución normal
Prueba T de student para datos relacionados y no relacionados –
muestras independientes.
Prueba T de student – Welch para dos muestras independientes con
varianzas homogéneas.
Prueba del Ji cuadrada de barlett para demostrar la homogeneidad
de varianzas.
Prueba F( análisis de varianza)
Las pruebas estadísticas paramétricas, como la de la “t” de Student o el
análisis de la varianza (ANOVA), se basan en que se supone una forma determinada
de la distribución de valores, generalmente la distribución normal, en la población de
la que se obtiene la muestra experimental.
DESCRIPCIÓN DE ALGUNAS PRUEBAS PARÁMETRICAS:
5. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
5
a) La prueba Z. Comparación de una media muestra X respecto a una
media poblacional .
La hipótesis teórica puede plantear que el valor de una muestra es
diferente, mayor o menor que el obtenido en una población respecto a
una determinada característica.
Simbolicamente, las hipótesis nula y alterna se plantean de la siguiente
manera:
Ho: μ1 = μ2
H1: μ1 ≠ μ2 ( prueba bilateral)
Ho: μ1 = μ2
H1: μ1 < μ2 ( prueba unilateral)
Ho: μ1 = μ2
H1: μ1 > μ2 ( prueba unilateral)
La formulación es la siguiente:
Ejemplo: La medición del cociente de las habilidades sociales en una
institución educativa es de 110 puntos como promedio , y una desviación
estándar de 4. Ante este resultado un investigador seleccionó una muestra
aleatoria de 600 alumnos y encontró que el promedio alcanzaban los 116
6. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
6
puntos ¿indican estos resultados la existencia de concordancia con lo
obtenido en la primera evaluación?
La hipótesis nula Ho, es la afirmación que se hace generalmente con la
finalidad de rechazarla. Con toda seguridad el investigador querrá
rechazar, la que se obtuvo en la primera medición. Por lo tanto la hipótesis
nula será:
Ho : El promedio del cociente de habilidades sociales es de 110 puntos
Ho : = 110
H1 : el promedio del cociente de habilidades sociales es mayor a 110 puntos
H1 : > 110
Como habrá podido notar que no se menciona la cantidad obtenida
por el investigador en ninguna de las hipótesis ( nula o alterna), puesto
que lo que nos interesa son los 110 puntos del promedio poblacional.
El nivel de significación es de α = 0,05, indica que la probabilidad de
rechazar el promedio de 110 puntos, por efectos del azar y no porque en
dicha institución educativa los alumnos tengan en promedio un valor
mayor de 110, es de 5%. Asimismo, si de rechaza la hipótesis nula, se tendrá
la confianza del 95% que realmente el promedio de los estudiantes es
mayor a 110.
La muestra es grande, y las mediciones son cuantitativas, se conoce la
varianza de la población como su muestra aleatoria. Asumiendo que las
habilidades sociales en la institución educativa, es normal.
Como se puede observar la prueba es unilateral, el nivel de significación
elegido es 5% el valor teórico de Z = 1.64
= media poblacional = 110
X = media de la muestra = 116
n = 600
= 4
Donde el error estándar de la media:
× = 41 / √ 600 = 1.67
Reemplazando en la fórmula:
Zo = 116 – 110 / 1.67 = 3.59
7. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
7
El valor de Zo = 3.59 es mayor que el valor crítico de Zo = 1,64.
Por lo tanto se encuentra en la región de rechazo, por lo tanto se
rechaza la hipótesis nula y se acepta la hipótesis alterna. Se
concluye que el promedio de los estudiantes de la Institución
educativa es mayor que 110 puntos.
b) La prueba t de Student de dos grupos independientes.
Se utiliza para comparar dos pequeñas muestras cuando se conocen su
varianza poblacionales.
La gráfica de la T de Student, depende del número de grados de libertad
el cual es igual al número de elementos menos 1, por cada muestra. Si se
tiene un número muy grande de grados de libertad, la gráfica de grados
de libertad, la gráfica de la T de Student se confunde con la curva normal.
En la prueba de hipótesis, generalmente se usa para comparar las medias
poblacionales a través de muestras pequeñas.
8. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
8
Si las muestras son independientes, la prueba de hipótesis correspondiente
utilizando la t de Student, tiene el mismo procedimiento que se sigue para
el caso de diferencias de medias con la prueba Z .
Como elegir la distribución apropiada, la distribución normal estándar Z o la distribución
de t Student.
9. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
9
Existen las siguientes versiones:
Prueba t para grupos independientes con tamaños de muestras diferentes.
Prueba t para grupos independientes con tamaños de muestras iguales.
Ejemplo:
Determinar la existencia estadísticamente significativa entre los puntajes
de responsabilidad de dos grupos de alumnos, uno del turno diurno y otro
del turno nocturno, se seleccionaron muestras aleatorias de 12 alumnos del
turno diurno y 14 alumnos del turno nocturno. Para obtener los puntajes se
aplicó la prueba ARQ. Asumiéndose puntajes más altos mayor
responsabilidad. Los puntajes fueron los siguientes.
TURNO
Alumnos Diurno Nocturno
1 22 20
2 20 18
3 18 22
4 19 21
5 21 20
6 19 18
7 19 21
8 21 20
9 23 22
10 19 21
11 22 22
12 17 19
13 20
14 22
La hipótesis nula se plantea de la siguiente manera:
Ho = No existen diferencias estadísticamente significativas entre los puntajes
promedios de responsabilidad de los alumnos del turno diurno y los alumnos
del turno nocturno.
Ho = µ1 = µ2
µ1 = Representa el puntaje promedio de responsabilidad de la población de
alumnos que estudian el el turno diurno.
10. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
10
µ2 = Representa el puntaje promedio de responsabilidad de la población de
alumnos que estudian el el turno nocturno.
Se sugiere determinar si existen diferencias significativas entre los dos grupos
de estudiantes.
donde :
H1 = µ1 ≠ µ2
El nivel de significación es de 5%. Indica que existe la probabilidad de o,o5
de rechazar la hipótesis nula por efectos de azar.
No se conocen las varianzas de las poblaciones. Se asume que la
distribución de los puntajes en las poblaciones tiene una distribución normal.
Las mediciones se han realizado en el nivel por intervalos. Se elige la t de
Student para comparar dos grupos independientes.
gl : 12 + 14 -2 = 24
El valor teórico de la t de student para 24 grados de libertad al nivel de
significación del 5% para una prueba de tipo bilateral es tt= 2.064
- 2.064 +2.064
El valor de de to (reemplazando en la formula correspondiente a dos grupos
independientes) es mayor que 2.064, se rechazará la hipótesis nula.
11. desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …
11
Si to > = ( mayor o igual) 2.064 se rechaza Ho
Para decidir si se acepta ose rechaza H0 se halla el valor de t0
X1 = 20 ∑X1 = 240 ∑X12
= 4836 SC1 = 36
X2 = 20,4 ∑X2 = 286 ∑X2
2
= 5868 SC2 = 25.4
Aplicando la ecuación correspondiente para dos grupos independientes con
tamaños de muestra diferentes.
T0 = 0,634
Como 2,064 es mayor que 0,634 t0 < tt se acepta la hipótesis nula y se
concluye que no existe diferencias estadísticamente significativas entre los
promedios de responsabilidad de los alumnos del turno diurno y del turno
nocturno
Nota : con respecto a la T de Student, es conveniente señalar que puede
presentarse situaciones donde los grupos son independientes y las muestras
iguales , o que las muestras estén relacionadas ( dependientes).