1. Mg. Daniel Ramirez A.
ELECCIÓN DE LA PRUEBA ESTADÍSTICA
EN LA INVESTIGACIÓN
2. DEFINICIONES PREVIAS
NIVEL
El concepto de nivel se refiere a la altura, a ubicar algo en el mismo nivel o en el caso de la altura en
la que está ubicada una ciudad con respecto al nivel del mar. También se usa la palabra nivel para
expresar el rango que va de lo inferior a lo superior, como los semestres de estudios en la universidad;
de igual manera para expresar los cambios de lo simple a lo complejo . Este último es el sentido de
“niveles de investigación”. Los estudios varían según van de lo simple a lo complejo, de lo impreciso a
lo preciso.
5 pasos o niveles
LA ESTADÍSTICA EN LOS
NIVELES DE VESTIGACIÓN
4. ESTADÍSTICA
Definición
Es la ciencia que trata de la recolección y descripción de las
mediciones de muestras así como de las estimaciones y
comparaciones poblacionales a partir de los resultados
muestrales.
Funciones Estadística Descriptiva
Niveles de Medición
Resúmenes
Estadística Inferencial
Prueba de Hipótesis
5. Niveles de Medición
20/04/2024
20:32
DATOS CATEGÓRICOS
Variable Nominal
Esta es una variable cualitativa y sólo permite
distinguir entre la pertenencia o no a una clase.
Ejemplo: Nacionalidad, Estado Civil, color de pelo, marca de las
calculadoras, etc.
Variable Ordinal:
Esta es también una variable cualitativa, pero además existe
una relación de orden en el recorrido de la variable. No
maneja el concepto de distancia, se establece relaciones
mayor o menor
Ejemplo: Nivel Socioeconómico, Grado en la Fuerzas
Armadas y de Orden, etc.
6. Niveles de Medición
20/04/2024
20:32
DATOS CONTINUOS (ESCALA)
Variable Intervalo
La distancia entre dos puntos adyacentes es el mismo por la
escala, incluyen noción de orden y admiten operaciones de
suma y resta. Se establece relación de desigualdad pues tiene
una unidad de medida constante. El valor CERO es arbitrario y
no tiene significado de ausencia del atributo.
Ejemplo: Presión arterial, Temperatura, puntuación en un test
7. Niveles de Medición
20/04/2024
20:32
Variable Razón
Admiten cualquier tipo de operaciones matemáticas, tiene todas
las propiedades de las variables de Intervalo y además cuenta
con un cero ABSOLUTO, que representa ausencia total de la
propiedad
Ejemplo: Numero de hijos, salario mensual, prestamos
crediticios, etc.
8. Niveles de Medición
EJEMPLOS PROPIEDADES
NOMINAL: Marca de gaseosa Pertenencia
ORDINAL: Nivel socioeconómico Pertenencia, orden
INTERVALO: Puntuación en un test
IQ
Pertenencia, orden, distancia
RAZÓN: Monto de préstamo Pertenencia, orden, distancia, razón,
cero absoluto
20/04/2024
20:32
10. Resumen de variables categóricas
Exponen la información recogida en la muestra, de forma que no se pierda nada de
información (o poca).
Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad
Frecuencias relativas (porcentajes): Idem, pero dividido por el total
Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas
Muy útiles para calcular cuantiles
¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%.
Soluc 2ª: 97,3% - 83,8% = 13,5%
20/04/2024
20:32
Nivel de felicidad
467 30,8 31,1 31,1
872 57,5 58,0 89,0
165 10,9 11,0 100,0
1504 99,1 100,0
13 ,9
1517 100,0
Muy feliz
Bastante feliz
No demasiado feliz
Total
Válidos
No contesta
Perdidos
Total
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Sexo del encuestado
636 41,9 41,9
881 58,1 58,1
1517 100,0 100,0
Hombre
Mujer
Total
Válidos
Frecuencia Porcentaje
Porcentaje
válido
Número de hijos
419 27,6 27,8 27,8
255 16,8 16,9 44,7
375 24,7 24,9 69,5
215 14,2 14,2 83,8
127 8,4 8,4 92,2
54 3,6 3,6 95,8
24 1,6 1,6 97,3
23 1,5 1,5 98,9
17 1,1 1,1 100,0
1509 99,5 100,0
8 ,5
1517 100,0
0
1
2
3
4
5
6
7
Ocho o más
Total
Válidos
No contesta
Perdidos
Total
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
11. Resumen de variables escalares
▪ Barras e Histogramas, medias y desviaciones
estándar no son suficientes
▪ John Tukey - EDA
20/04/2024
20:32
Histograma Gráfico de tallo y hojas
Diagrama de caja
y bigotes
12. Hipótesis
Una creencia sobre la
población, principalmente sus
parámetros:
Media
Varianza
Proporción/Tasa
OJO: Si queremos contrastarla,
debe establecerse antes del
análisis.
20/04/2024
20:32
Creo que el porcentaje
de enfermos será el
5%
13. Identificación de Hipótesis
Hipótesis nula Ho
La que contrastamos
Los datos pueden refutarla
No debería ser rechazada sin una
buena razón.
Hip. Alternativa H1
Niega a H0
Los datos pueden mostrar
evidencia a favor
No debería ser aceptada sin una
gran evidencia a favor.
20/04/2024
20:32
:
H
:
H
1
0
%
50
=
p
%
50
p
,
,
= ,
,
14. Significación: p valor
El contraste es estadísticamente significativo cuando p<a
Es decir, si el resultado experimental discrepa más de
“lo tolerado” a priori.
20/04/2024
20:32
15. Definiciones básicas
⚫ Error de Medida
⚫ Validez: Grado en que la medida representa con
precisión lo que se supone que representa.
⚫ Fiabilidad: Grado en que la variable observada mide el
valor “verdadero” y está “libre de error”.
⚫ Significación Estadística frente a Potencia Estadística
20/04/2024
20:32
Realidad
Ho: Cierta Ha: Falsa
Ho: Aceptar 1-a
Error Tipo II
Decisión
Estadística
Ha: No aceptar
a
Error Tipo I
1-
Potencia
16. Lógica de Prueba para la diferencia de medianas
20/04/2024 20:32
19. NIVEL EXPLORATORIO
Son llevados a cabo cuando no se tiene información de
estudios previos sobre una problemática en un área
determinada. El propósito de estos estudios es precisar
mejor un problema de investigación. No hay preguntas
precisas, sino exploración de un área problemática.
Generalmente son investigaciones cualitativas que, por
tanto, no requieren de análisis estadístico.
20. NIVEL DESCRIPTIVO
Describen fenómenos en su circunstancia real en
un tiempo y en un área geográfica determinados.
Desde el punto de vista cognoscitivo su finalidad
es la de describir variables.
21. ESTADÍSTICA EN EL NIVEL DESCRIPTIVO
Desde el punto de vista estadístico su finalidad
es estimar parámetros.
La estadística que se aplica es univariada, se
estiman medias (promedios), frecuencias,
prevalencia, incidencia, etc.
22. Ejemplos:
✓ Determinar el CI promedio de los alumnos de un colegio, una UGEL, una zona, una
ciudad, etc.
✓ Determinar las preferencias de un programa de TV o de un producto en general.
✓ Describir los rendimientos académicos de los alumnos de la Facultad de Psicología, en un
semestre, en un año o en varios semestres o años.
✓ Describir los montos que pagan por pensión de enseñanza, los alumnos de una
universidad.
23. En cada caso, se podría trabajar con toda la población si es posible llegar a todos y cada
uno de sus elementos o con una muestra y luego a partir de los resultados obtenidos en
ella, inferir para toda la población.
Luego que se han realizado las mediciones, con el apoyo en un software estadístico se
hallan:
a) Frecuencias (para datos individuales o agrupados).
b) Estadísticos de posición y de dispersión
c) Asimetría y kurtosis
Si no es posible trabajar con toda la población, se selecciona una muestra con una
determinada confianza y por lo tanto, con un margen de error y se realiza la estimación
puntual o por intervalos que corresponda.
En los ejemplos dados, se podría estimar puntualmente o por intervalos el CI de la
población, la puntual consiste en seleccionar la muestra, realizar las mediciones de
cada uno de los sujetos y calcular la media y si se considera pertinente, también la
varianza y la desviación estándar. Estos resultados obtenidos son las estimaciones de la
media, la varianza y la desviación estándar.
Es importante precisar que en el cálculo de la varianza y la desviación estándar, el
denominador es “n-1”.
24. En el segundo ejemplo podría determinarse el porcentaje de personas que prefieren
un determinado producto, calculando las frecuencias porcentuales o relativas
porcentuales, si se ha trabajado con toda la población o mediante una estimación
puntual se ha seleccionado una muestra.
Para los otros ejemplos podríamos describir las poblaciones directamente o
indirectamente a través de las muestras, tal como se explicó para el ejemplo de los
CI.
En este nivel de investigación, como se ha mencionado, el estudio es univariado, es
decir se describe considerando el comportamiento de una variable. Esta pudo haber
sido medida cuantitativamente o cualitativamente
25. NIVEL RELACIONAL
Estudios en los que se busca entender la relación o asociación entre variables, sin
establecer causalidad. No pretende establecer relación causa-efecto sino relación entre
eventos que se dan con cierta secuencia.
26. ESTADÍSTICA EN EL NIVEL RELACIONAL
Son estudios de asociación sin dependencia. La estadística que se aplica es bivariada. Ej.
Coeficientes de correlación, chi cuadrada, etc
27. Ejemplos
a) Relación entre el género y las carreras universitarias de ciencias y humanidades.
b) Ansiedad antes y después de una operación de apéndice, hernia y vesícula.
c) Frustración de profesores de Instituciones Educativas Públicas y Privadas.
d) Motivación con relación a su carrera en estudiantes de ingeniería, arquitectura,
psicología y medicina humana.
28. En este nivel se plantean hipótesis. Se determinan muestras de
poblaciones con una confianza determinada. Se aplican pruebas
que pueden ser paramétricas o no paramétricas.
No basta tener datos cuantitativos para optar por una prueba paramétrica. Debe aplicarse
una prueba para determinar la normalidad, estas pruebas pueden ser Kolmogorov, Shapiro
Wilks o la de Anderson Darling.
Las pruebas pueden ser uni o bilaterales.
Debe tenerse presente que en este nivel no se determina causalidad.
29. NIVEL EXPLICATIVO
Tienen la finalidad de explicar el comportamiento de una variable en función de otra u
otras. Pretenden señalar que la ocurrencia de un fenómeno depende de otro; es decir
establecer relación causa-efecto. Se apoyan en criterios de causalidad y requieren de
control metodológico y estadístico.
30. ESTADÍSTICA EN EL NIVEL EXPLICATIVO
El control estadístico puede ser bivariado, aunque generalmente es multivariado a fin de
descartar asociaciones aleatorias, casuales o espurias entre la variable independiente y
dependiente.
La relación de las variables es independiente del lugar y del tiempo.
31. Ejemplo
Un estudio sobre la implementación de una nueva técnica o terapia con pacientes con
discapacidad motriz.
32. Pruebas estadísticas
✓ t de student
✓ Análisis de varianza
✓ Análisis Factorial
✓ Análisis de covarianza (ANOVA)
etc.
33. Análisis Factorial
20/04/2024
20:32
Es una modalidad del Análisis Multivariado que nos permite reducir una
serie de variables a un conjunto menor (factores) que contienen la
mayor parte de la información y son suficientes para explicar el
modelo.
34. NIVEL PREDICTIVO
Pretenden anticipar la ocurrencia de determinados fenómenos. A partir de datos de las
circunstancias actuales, pretenden realizar estimaciones de comportamientos futuros de
un fenómeno
35. ESTADÍSTICA EN EL NIVEL PREDICTIVO
Las variables predictoras son llamadas variables exógenas y las variables a predecir,
endógenas.
Se aplican técnicas de análisis predictivos. Ejm. La regresión logística, regresión de
COX, las series de tiempo, el análisis de supervivencia de Kaplan Meier, los riesgos
de Hazard, etc.
36. Ejemplo
Considerando las variables exógenas: Puntaje promedio de secundaria, Puntaje en el
examen de admisión, promedio del primer semestre, notas promedio de los cursos de
matemática y de física, predecir si un alumno de ingeniería culmina sus estudios en el
tiempo mínimo establecido.
37. Plantea resolver problemas o intervenir en la historia
natural de la enfermedad. Enmarca a la innovación
técnica, artesanal e industrial como la científica
NIVEL APLICATIVO
38. Las técnicas estadísticas del control de calidad apuntan a
evaluar el éxito de la intervención sobre la población en
cuanto a: proceso, resultados e impacto
ESTADÍSTICA EN EL NIVEL APLICATIVO
39. Herramientas de la evaluación de la
calidad
✓ Diagrama de causa y efecto de la calidad
✓ Principio de Pareto.
✓ Gráficas de corridas y prueba de aleatoriedad
✓ Gráfica Multivariable y Análisis de Variabilidad.
✓ Gráficas de Control para el monitoreo.
40. Técnicas Empleadas
20/04/2024
20:32
Técnicas
Multivariante
s
¿Que tipo de
relaciones están
siendo
examinadas?
Dependencia
Interdependencia
¿Cuantas variables
están explicando?
Múltiples relaciones
de variables dependientes
e independientes
Modelo de
ecuaciones
estructurales
Varias variables
dependientes en
una relación única
¿Cuál es la escala
de medida
de las variables
dependientes?
Análisis
multivariado de
variables
No Métrica
Una variable
dependiente en
una relación única
¿Cuál es la escala
de medida
de la variable
dependiente?
No Métrica
Métrica
Regresión
múltiple
Análisis de
conjunto
Métrica
¿Cuál es la escala
de medida
de las variables
predictoras?
No Métrica
Análisis
de correlación
canónica con
variables
ficticias
Análisis
de correlación
canónica
Métrica
Es la estructura
de relación entre:
Variables
Análisis
factorial
Casos o
Encuestados
Análisis
cluster
Análisis
Discriminante
Regresión
Logística
Análisis
CHAID
Objetos
¿Como son
los atributos?
Métrico
No Métrico
Análisis de
correspondencias
Análisis
multidimensional
No Métrico
42. PRUEBAS ESTADÍSTICAS
Las pruebas estadísticas forman parte de la teoría de la
decisión. Esencialmente emplean métodos inductivos para, a
partir de la información de las muestras, establecer o
estimar características generales de las poblaciones de
origen.
43. Construcción de Hipótesis
estadísticas
Todo comienza con la formulación de las hipótesis. Las hipótesis
conceptuales del estudio deben traducirse en hipótesis estadísticas.
Las hipótesis estadísticas se establecen mediante características de las
poblaciones de origen. Las poblaciones de origen están definidas por
parámetros, que son valores fijos de la distribución pero desconocidos.
Mediante los datos muestrales podremos aceptar o rechazar, con cierto
grado de confianza determinado, una hipótesis hecha sobre una
población determinada. Tal proceso se conoce como contraste de
hipótesis estadísticas o aplicación de una prueba estadística.
44. HIPÓTESIS ESTADÍSTICAS
En la práctica es necesario la formulación de dos hipótesis
estadísticas complementarias: la Hipótesis Nula (Ho) y la
Hipótesis Alterna (H1).
La hipótesis nula corresponde al estado actual de
conocimiento, por el cual, si no se hiciese el estudio sería la
que prevalecería. La hipótesis alterna, por el contrario, está
relacionada con el objetivo del estudio.
45. Contraste de Hipótesis
Las afirmaciones que se realizan a través de las hipótesis
nula y alterna, se contrastan teniendo en cuenta los datos
muestrales.
Las conclusiones estadísticas pueden ser cualquiera de las
dos siguientes: Rechazar o no Rechazar la hipótesis nula
46. Posibles situaciones del investigador con
respecto a las conclusiones
Rechazar la hipótesis nula siendo falsa.
Rechazar la hipótesis nula siendo verdadera
No Rechazar la hipótesis nula siendo verdadera.
No Rechazar la hipótesis nula siendo falsa
47. Ejemplo de Hipótesis
Ho: No existen diferencias estadísticamente
significativas entre la ansiedad y la depresión antes
y después de una operación de apéndice.
Ho: Sí existen diferencias estadísticamente
significativas entre la ansiedad y la depresión antes
y después de una operación de apéndice.
49. Pruebas Paramétricas
Se llaman así porque su cálculo implica una
estimación de los parámetros de la población con
base en muestras estadísticas. Presuponen para los
datos de la población, una distribución de
probabilidad.
50. Pruebas no Paramétricas
Pruebas no paramétricas son aquellas que no
presuponen una distribución de probabilidad para los
datos, por ello se conocen también como de
distribución libre. En la mayor parte de ellas los
resultados estadísticos se derivan únicamente a partir
de procedimientos de ordenación y recuento.
En estos casos se emplea como parámetro de
centralización la mediana
51. ¿Cómo elegir la prueba estadística
adecuada?
La elección de la prueba estadística es uno de los
primeros pasos que hay que realizar cuando se
quiere hacer un análisis estadístico, mucho antes
incluso que la recogida experimental de los datos.
Se presenta a continuación ciertas
consideraciones que nos pueden servir de ayuda
para llevar a cabo dicha elección.
52. ¿En qué casos las pruebas paramétricas
Variable numérica
Que las variable dependiente esté medida en una escala que sea
por lo menos de intervalo.
Normalidad
Que los valores de la variable dependiente sigan la distribución
de la curva normal; por lo menos, en la población a la que
pertenece la muestra.
Homocedasticidad
Que las varianzas de los grupos que se comparan en una variable
dependiente sean aproximadamente iguales (homogeneidad de
las varianzas).
53. Ventajas de las pruebas paramétricas
Más poder de eficiencia.
Más sensibles a los rasgos de los datos
recolectados.
Menos posibilidad de errores.
Robustas (dan estimaciones
probabilísticas bastante exactas).
54. ¿Y las no paramétricas?
La Estadística no paramétrica es una rama de la
Estadística que estudia las pruebas y modelos
estadísticos cuya distribución no se ajusta a los
llamados criterios paramétricos. La utilización de
estos métodos se hace recomendable cuando no se
puede asumir que los datos se ajusten a una
distribución normal o cuando el nivel de medida
empleado no sea, como mínimo, de intervalo.
55. Pruebas Paramétricas Importantes
“r” de Pearson
Correlación de dos variables
“z”
Diferencia de medias
“t” de student
Diferencia de medias (muestras independientes y
dependientes)
Análisis de Varianza
Comparación de la media de 2 o más grupos
56. Pruebas No Paramétricas
Kolmogorov-Smirnov
Para determinar si existe o no normalidad y para encontrar diferencias entre
dos muestras
Chi-cuadrada
Como prueba de independencia o para comparar dos o más muestras medidas
al nivel nominal.
U de Mann Whitney
Para comparar dos muestras independientes de igual o diferente tamaño
Friedman
Cuando una muestras es medida más de una vez
Kruskal-Wallis
Para muestras independientes cuando no se cumplen los requisitos para
aplicar una prueba paramétrica
57. Wilcoxon
Para el contraste no paramétrico de dos muestras
relacionadas se utiliza la prueba de Wilcoxon.
Coeficiente de correlación de Spearman
Coeficiente de correlación para los casos en los que, no
se ha logrado el nivel de medición o no se han cumplido
los requisitos para aplicar la “r” de Pearson.