Instituto tecnológico superior de la sierra negra de ajalp an
Unidad 5
1. HER
2012
UNIDAD 5
“ E STADÍSTICA NO
PARAMÉ TRICA” .
LUCIA FLORES GARCÍA
ING. EN ADMISTRACIÓN.
MATERIA: ESTADÍSTICA II
DOMINGO, 6 DE MAYO DE 2012
2. 5.1 ESCALA DE MEDICIÓN
Niveles o Escalas de mediciones
Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la
asignación, puramente arbitraria de números o símbolos a cada una de las diferentes
categorías en las cuales podemos dividir el carácter que observamos, sin que puedan
3. establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda
pertenecer a una y solo una de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean
equivalentes respecto del atributo o propiedad en estudio, después de lo cual se asignan
nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan
números, puede ser una de las razones por las cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San
Carlos de acuerdos a la carrera que cursan.
Carrera Número asignada a la categoría
4. Educación 1
Administración 2
Se ha de tener presente que los números asignados a cada categoría sirven única y
exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la
medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden"
5. de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto
A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B.
La asignación de números a las distintas categorías no puede ser completamente arbitraria,
debe hacerse atendiendo al orden existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder
ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como por
ejemplo la mediana.
Escalas de intervalos iguales:
6. La escala de intervalos iguales, está caracterizada por una unidad de medida común y
constante que asigna un número igual al número de unidades equivalentes a la de la magnitud
que posea el elemento observado. Es importante destacar que el punto cero en las escalas de
intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que
estamos midiendo. Esta escala, además de poseer las características de la escala ordinal,
encontramos que la asignación de los números a los elemento es tan precisa que podemos
determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin
lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente
cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las
medidas estadísticas a excepción del coeficiente de variación.
7. Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de
intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el
valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa
una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales
diferencias entre los números asignados corresponden iguales diferencias en el grado de
atributo presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un
valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la
propiedad presente en B.
8. Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no
tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3
hijos.
Las variables y su medición:
Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de
valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que
puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en
caso contrario diremos que la variable es discreta".
9. Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son
susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente
la magnitud de dichas variaciones. Por intuición y por experiencia sabemos que pueden
distinguirse dos tipos de variables; las continuas y las discretas
Las variables continuas se caracterizan por el hecho de que para todo para de valores
siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para
realizar un trabajo, etc.)
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos
valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
10. Para ver el gráfico seleccione la opción "Descargar" del menú superior.
Las variables discretas serán aquellas que pueden tomar solo un número limitado de
valores separados y no continuos; son aquellas que solo toman un determinado números de
valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo el
número de estudiantes de una clase es una variable discreta ya que solo tomará los valores 1, 2,
3, 4... Nótese que no encontramos valor como 1,5 estudiantes
5.2 MÉTODOS ESTADISTICOS CONTRA NO
PARAMETRICOS
11. 5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD
Una corrida es una serie de observaciones similares. La prueba de corridas se usa para probar
la aleatoriedad de una serie de observaciones cuando cada observación puede ser asignada a
una de dos categorías.
12. Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos que cuando
se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F, F, F, M, M. Estos datos
contienen tres corridas, o series de elementos semejantes.
Respecto de datos numéricos, un medio para obtener el esquema requerido de dos categorías
es clasificar cada observación según si es superior o inferior a la mediana del grupo. En general,
mucho menos corridas o mucho más corridas que las que sería de esperar al azar resultarían
en el rechazo de la hipótesis nula de que la secuencia de observaciones es una secuencia
aleatoria.
13. El número de corridas de elementos semejantes se determina de acuerdo con los datos
muéstrales, con el uso del símbolo R para designar el número de corridas observadas. Si n1
equivale al número de elementos muestreados de un tipo y n2 al número de elementos
muestreados del segundo tipo, la media y el error estándar asociados con la distribución de
muestreo de la estadística de prueba R cuando la secuencia es aleatoria son
Sin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución normal. Por lo
tanto, en estas circunstancias la estadística R puede convertirse a la estadística de prueba z de
la siguiente manera:
Cuando n1 ≤ 20 y n2 ≤ 20, en libros de texto especializados en estadística no paramétrica se
dispone de tablas de valores críticos de la estadística de prueba R.
14. 5.4 UNA MUESTRA: PRUEBA DE SIGNOS
Esta prueba corresponde a la prueba de media de una sola muestra y se recurre a ella cuando
la muestra es de menos de 30 elementos y no se puede sostener el supuesto de normalidad de
la población.
15. Se le llama prueba del signo porque la información contenida en la muestra seleccionada se
puede transformar en un conjunto de signos más y menos; y cuando se hace la prueba no se
hace uso de la magnitud de los valores de la muestra, sino solamente se consideran los signos.
Ésta se aplica cuando se muestrea una población simétrica continua de tal manera que la
probabilidad de que una valor sea mayor que la media o menor que la media es de un medio.
Para esta prueba se utiliza la distribución binomial.
En esta prueba se tiene la hipótesis nula H0 : m = m0 contra la alternativa pertinente,
pudiendo ser ésta de uno o dos extremos. Los supuestos que se deben tomar en cuenta para
16. aplicarla, son los siguientes: se tiene una muestra aleatoria que proviene de una población con
mediana desconocida, la variable de interés se mide en escala ordinal o más fuerte y esta
misma variable es de naturaleza continua .Cuando la variable se mide en escala ordinal, las
hipótesis se referirán a la mediana y no a la media.
La prueba de signos es uno de los métodos no paramétricos más simples. La prueba t
supone que los datos se distribuyen normalmente. La prueba del signo prescinde de tal
hipótesis y es mucho más fácil de realizar. Se puede utilizar de diferentes formas, la más
simple se describe a continuación:
17. Para probar la hipótesis nula m = mo contra una alternativa apropiada, basándose en una
muestra aleatoria de tamaño n, se reemplaza cada valor muestral mayor que mo por un
signo más y cada valor muestral menor que mo por un signo menos (MILLER y FREUND,
1986, cap. 10).
Se ignoran por completo aquellos valores que son iguales a mo. Para contrastar si la
preponderancia de signos menos, es significativa se utiliza la ley de la binomial acumulada.
Esta ley establece que la probabilidad de que aparezcan r signos menos entre n signos
está dada por (MILLER y MILLER, 1993, cap. 6):
18. nCr : Indica el número de combinaciones de r elementos de un total de n
elementos.
p: es la probabilidad de que aparezca un signo menos en uno de los resultados.
q: es la probabilidad de que no aparezca un signo menos en uno de los resultados,
es decir, q = 1 – p.
19.
20. 5.5 UNA MUESTRA PRUEBA DE WILCOXON
Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre la mediana de
dicha variable en la población, por ejemplo, M=M0. Extraigamos una muestra de tamaño m y
21. averigüemos las diferencias Di = X - M0. Consideremos únicamente las n diferencias no nulas
(n " m). Atribuyamos un rango u orden (0i) a cada diferencia según su magnitud sin tener en
cuenta el signo.
Sumemos por un lado los 0+i , rangos correspondientes a diferencias positivas y por otro lado
los 0-i , rangos correspondientes a diferencias negativas.
La suma de los órdenes de diferencias positivas sería igual a la suma de los órdenes de
diferencias negativas, caso que la mediana fuera el valor propuesto M0. En las muestras, siendo
M0 el valor de la verdadera mediana, aparecerán por azar ciertas discrepancias, pero si la suma
de los rangos de un ciclo es considerablemente mayor que la suma de los rangos de otro signo,
nos hará concebir serias dudas sobre la veracidad de M0.
22. La prueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra aleatoria
procede de una población con mediana M0. Además, bajo el supuesto de simetría este
contraste se puede referir a la media, E(X). Esta prueba es mucho mas sensible y poderosa que
la prueba de los signos; como se puede apreciar utiliza mas información, pues no solo tiene en
cuenta si las diferencias son positivas o negativas, sino también su magnitud.
El contraste de Wilcoxon puede ser utilizado para comparar datos por parejas. Supongamos
que la distribución de las diferencias es simétrica, y nuestro propósito es contrastar la
hipótesis nula de que dicha distribución está centrada en 0. Eliminando aquellos pares para los
cuales la diferencia es 0 se calculan los rangos en orden creciente de magnitud de los valores
absolutos de las restantes diferencias. Se calculan las sumas de los rangos positivos y
23. negativos, y la menor de estas sumas es el estadístico de Wilcoxon. La hipótesis nula será
rechazada si T es menor o igual que el valor correspondiente.
5.6 DOSMUESTRAS: PRUEBA DE MANN-WHITNEY