Unidad 5

HER

2012

UNIDAD 5
“ E STADÍSTICA NO
PARAMÉ TRICA” .
LUCIA FLORES GARCÍA
ING. EN ADMISTRACIÓN.
MATERIA: ESTADÍSTICA II

DOMINGO, 6 DE MAYO DE 2012

5.1 ESCALA DE MEDICIÓN

Niveles o Escalas de mediciones

 Escala Nominal:

La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la

asignación, puramente arbitraria de números o símbolos a cada una de las diferentes

categorías en las cuales podemos dividir el carácter que observamos, sin que puedan

establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda

pertenecer a una y solo una de estas categorías.

Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean

equivalentes respecto del atributo o propiedad en estudio, después de lo cual se asignan

nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan

números, puede ser una de las razones por las cuales se le conoce como "medidas nominales".

Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San

Carlos de acuerdos a la carrera que cursan.

Carrera Número asignada a la categoría

Educación 1

Administración 2

Se ha de tener presente que los números asignados a cada categoría sirven única y

exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.

 Escala Ordinal:

En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la

medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden"

de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto

A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B.

La asignación de números a las distintas categorías no puede ser completamente arbitraria,

debe hacerse atendiendo al orden existente entre éstas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder

ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como por

ejemplo la mediana.

 Escalas de intervalos iguales:

La escala de intervalos iguales, está caracterizada por una unidad de medida común y

constante que asigna un número igual al número de unidades equivalentes a la de la magnitud

que posea el elemento observado. Es importante destacar que el punto cero en las escalas de

intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que

estamos midiendo. Esta escala, además de poseer las características de la escala ordinal,

encontramos que la asignación de los números a los elemento es tan precisa que podemos

determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin

lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente

cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las

medidas estadísticas a excepción del coeficiente de variación.

 Escala de coeficientes o Razones:

El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de

intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el

valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa

una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales

diferencias entre los números asignados corresponden iguales diferencias en el grado de

atributo presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un

valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la

propiedad presente en B.

Ejemplo:

En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no

tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3

hijos.

Las variables y su medición:

Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de

valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que

puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en

caso contrario diremos que la variable es discreta".

Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son

susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente

la magnitud de dichas variaciones. Por intuición y por experiencia sabemos que pueden

distinguirse dos tipos de variables; las continuas y las discretas

Las variables continuas se caracterizan por el hecho de que para todo para de valores

siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para

realizar un trabajo, etc.)

Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos

valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.

Para ver el gráfico seleccione la opción "Descargar" del menú superior.

Las variables discretas serán aquellas que pueden tomar solo un número limitado de

valores separados y no continuos; son aquellas que solo toman un determinado números de

valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo el

número de estudiantes de una clase es una variable discreta ya que solo tomará los valores 1, 2,

3, 4... Nótese que no encontramos valor como 1,5 estudiantes

5.2 MÉTODOS ESTADISTICOS CONTRA NO
PARAMETRICOS

5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD

Una corrida es una serie de observaciones similares. La prueba de corridas se usa para probar

la aleatoriedad de una serie de observaciones cuando cada observación puede ser asignada a

una de dos categorías.

Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos que cuando

se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F, F, F, M, M. Estos datos

contienen tres corridas, o series de elementos semejantes.

Respecto de datos numéricos, un medio para obtener el esquema requerido de dos categorías

es clasificar cada observación según si es superior o inferior a la mediana del grupo. En general,

mucho menos corridas o mucho más corridas que las que sería de esperar al azar resultarían

en el rechazo de la hipótesis nula de que la secuencia de observaciones es una secuencia

aleatoria.

El número de corridas de elementos semejantes se determina de acuerdo con los datos

muéstrales, con el uso del símbolo R para designar el número de corridas observadas. Si n1

equivale al número de elementos muestreados de un tipo y n2 al número de elementos

muestreados del segundo tipo, la media y el error estándar asociados con la distribución de

muestreo de la estadística de prueba R cuando la secuencia es aleatoria son

Sin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución normal. Por lo

tanto, en estas circunstancias la estadística R puede convertirse a la estadística de prueba z de

la siguiente manera:

Cuando n1 ≤ 20 y n2 ≤ 20, en libros de texto especializados en estadística no paramétrica se

dispone de tablas de valores críticos de la estadística de prueba R.

5.4 UNA MUESTRA: PRUEBA DE SIGNOS

Esta prueba corresponde a la prueba de media de una sola muestra y se recurre a ella cuando

la muestra es de menos de 30 elementos y no se puede sostener el supuesto de normalidad de

la población.

Se le llama prueba del signo porque la información contenida en la muestra seleccionada se

puede transformar en un conjunto de signos más y menos; y cuando se hace la prueba no se

hace uso de la magnitud de los valores de la muestra, sino solamente se consideran los signos.

Ésta se aplica cuando se muestrea una población simétrica continua de tal manera que la

probabilidad de que una valor sea mayor que la media o menor que la media es de un medio.

Para esta prueba se utiliza la distribución binomial.

En esta prueba se tiene la hipótesis nula H0 : m = m0 contra la alternativa pertinente,

pudiendo ser ésta de uno o dos extremos. Los supuestos que se deben tomar en cuenta para

aplicarla, son los siguientes: se tiene una muestra aleatoria que proviene de una población con

mediana desconocida, la variable de interés se mide en escala ordinal o más fuerte y esta

misma variable es de naturaleza continua .Cuando la variable se mide en escala ordinal, las

hipótesis se referirán a la mediana y no a la media.

La prueba de signos es uno de los métodos no paramétricos más simples. La prueba t

supone que los datos se distribuyen normalmente. La prueba del signo prescinde de tal

hipótesis y es mucho más fácil de realizar. Se puede utilizar de diferentes formas, la más

simple se describe a continuación:

Para probar la hipótesis nula m = mo contra una alternativa apropiada, basándose en una

muestra aleatoria de tamaño n, se reemplaza cada valor muestral mayor que mo por un

signo más y cada valor muestral menor que mo por un signo menos (MILLER y FREUND,

1986, cap. 10).

Se ignoran por completo aquellos valores que son iguales a mo. Para contrastar si la

preponderancia de signos menos, es significativa se utiliza la ley de la binomial acumulada.

Esta ley establece que la probabilidad de que aparezcan r signos menos entre n signos

está dada por (MILLER y MILLER, 1993, cap. 6):

nCr : Indica el número de combinaciones de r elementos de un total de n

elementos.

p: es la probabilidad de que aparezca un signo menos en uno de los resultados.

q: es la probabilidad de que no aparezca un signo menos en uno de los resultados,

es decir, q = 1 – p.

5.5 UNA MUESTRA PRUEBA DE WILCOXON

Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre la mediana de

dicha variable en la población, por ejemplo, M=M0. Extraigamos una muestra de tamaño m y

averigüemos las diferencias Di = X - M0. Consideremos únicamente las n diferencias no nulas

(n " m). Atribuyamos un rango u orden (0i) a cada diferencia según su magnitud sin tener en

cuenta el signo.

Sumemos por un lado los 0+i , rangos correspondientes a diferencias positivas y por otro lado

los 0-i , rangos correspondientes a diferencias negativas.

La suma de los órdenes de diferencias positivas sería igual a la suma de los órdenes de

diferencias negativas, caso que la mediana fuera el valor propuesto M0. En las muestras, siendo

M0 el valor de la verdadera mediana, aparecerán por azar ciertas discrepancias, pero si la suma

de los rangos de un ciclo es considerablemente mayor que la suma de los rangos de otro signo,

nos hará concebir serias dudas sobre la veracidad de M0.

La prueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra aleatoria

procede de una población con mediana M0. Además, bajo el supuesto de simetría este

contraste se puede referir a la media, E(X). Esta prueba es mucho mas sensible y poderosa que

la prueba de los signos; como se puede apreciar utiliza mas información, pues no solo tiene en

cuenta si las diferencias son positivas o negativas, sino también su magnitud.

El contraste de Wilcoxon puede ser utilizado para comparar datos por parejas. Supongamos

que la distribución de las diferencias es simétrica, y nuestro propósito es contrastar la

hipótesis nula de que dicha distribución está centrada en 0. Eliminando aquellos pares para los

cuales la diferencia es 0 se calculan los rangos en orden creciente de magnitud de los valores

absolutos de las restantes diferencias. Se calculan las sumas de los rangos positivos y

negativos, y la menor de estas sumas es el estadístico de Wilcoxon. La hipótesis nula será

rechazada si T es menor o igual que el valor correspondiente.

5.6 DOSMUESTRAS: PRUEBA DE MANN-WHITNEY

5.8 OBSERVACIONES PAREADAS PRUEBA DE
WILCOXON

5.9 VARIAS MUESTRAS INDEPENDIENTES:
PRUEBA DE KRAUSKAL-WALLIS

Unidad 5

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (17)

Destacado

Destacado (20)

Similar a Unidad 5

Similar a Unidad 5 (20)

Más de Lucia Flores Garcia

Más de Lucia Flores Garcia (17)

Unidad 5