Este documento resume los conceptos básicos de la estadística descriptiva e inferencial. Explica que la estadística descriptiva ayuda a organizar y presentar datos a través de tablas y gráficas, y genera estadísticas como promedios y desviaciones estándar. La estadística inferencial utiliza la probabilidad para estimar parámetros poblacionales a través de intervalos de confianza y probar hipótesis. También cubre temas como muestreo, normalidad, correlaciones y pruebas estadísticas
2. LO BÁSICO
• Si Ud, ha decidido emplear técnicas de análisis estadístico de datos,
es porque ha determinado que esta ciencia “La Estadística”, le
permitirá generar conclusiones científicas y válidas para las tomas
de decisiones.
• Reconoce la IMPORTANCIA DE LA ESTADÍSTICA en el análisis de
datos.
Elisa Mendoza G.
Universidad de Panamá
3. LO BÁSICO
• La Estadística: recolecta, procesa u organiza,
presenta y analiza.
• La Estadística, se divide en dos grandes ramas:
• Estadística descriptiva
• Estadística inferencial
• La Estadística descriptiva, entre otros aspectos:
• Ayuda a definir variables de estudio en cuanto al tipo y la
escala de medición.
• Provee formas o métodos de organización y presentación de
datos, como lo son los cuadros, tablas y gráficas.
• Genera resultados numéricos importantes, como los
promedios, porcentajes, varianzas y desviaciones estándar.
Elisa Mendoza G.
Universidad de Panamá
4. LO BÁSICO
• La comprensión de los métodos básicos estadísticos, como la obtención
del promedio y la varianza, así como su interpretación es un paso
importante para realizar análisis más complejos.
• La probabilidad es el inicio en la aplicación de la Estadística Inferencial.
Por ejemplo, ayuda a verificar la probabilidad de que la media de una
muestra (estimación) es igual o aproximadamente igual, a la supuesta
media de la población (parámetro).
• Las probabilidades, cuantifican las posibilidades de la ocurrencia de un
evento, “hecho”, o “resultado”.
• La importancia de una correcta decisión de muestrear o censar: Por
ejemplo, Analiza esto: Si realizas un estudio por muestras, y la media
resultante en la edad es 5 años; pero luego, tienes la oportunidad de
completar el estudio y estudiar a toda la población, y encuentras que la
media es 5. ¿a qué conclusión llegarías? ¿era necesario censar?.
Elisa Mendoza G.
Universidad de Panamá
5. LO BÁSICO
• Las Estimaciones por Intervalos, Proporcionan un rango de
valores, a partir de una muestra, entre los cuales
probablemente está el verdadero poblacional.
• Recuerda que en la selección de una sola muestra, se pueden
seleccionar muchas muestras más del mismo tamaño.
• Ejemplo: Sea una población compuesta por Ana, Blas, Carlos, Diana y
Ema, cuyos nombres representamos con A, B, C, D y E.
• Se toma una muestra de tres de ellos: ¿A quiénes elegirías? Y ¿por qué?
• ¿Qué otras muestras de tres de ellos se pudieron conformar?.
• Al realizar el estudio por muestras, ¿qué ocurre con el resto de las
muestra? ¿las tomas en cuenta o sólo te basas en la primera que elegiste?.
• Bien, supongamos que se estudian los pesos de estas 5 personas,
respectivamente son: 120, 135, 158, 133, 109. Ahora, para la muestra que
tomaste, cuánto fue el promedio y la desviación estándar?. Para las cinco
personas o población, cuánto fue el promedio y la desviación estándar?.
• A qué conclusión llegas?
• Las estimaciones, son estadísticas de las muestras, que
esperamos sean aproximaciones de los parámetros
poblacionales.
Elisa Mendoza G.
Universidad de Panamá
6. ESTIMACIONES
• Para hablar de estimaciones por intervalos, se debe tener en cuenta dos
términos:
• Nivel de confianza: Probabilidad de que en 100 muestras, 95 de ellas den
como resultado la estadística parámetro. ¿cuántas escogemos nosotros?. La
probabilidad (muestreo probabilístico) nos asegura que podemos elegir una
buena muestra.
• Error típico: Cantidad en que se desvía la estimación en promedio con
relación al parámetro. S/
• Los intervalos de confianza, son expresiones numéricas en rangos de
dos números (valor inferior y valor superior), obtenido a partir de las
estadísticas de la muestra.
• Intervalo de confianza: Límite inferior, Límite superior
• La amplitud de este intervalo, o sus límites dependen de varios
aspectos, entre ellos la estadística a estimar: media, proporción o
varianza; del error típico correspondiente y el nivel de confianza que se
utiliza (generalmente 95%).
• Intervalo de confianza (IC): ( Lim. Inf., Lim. Sup. )
• Límite inferior: Estadística – coef. De confianza * error típico
• Límite superior: Estadística + coef. De confianza * error típico
: error
1- : nivel de confianza
n
Elisa Mendoza G.
Universidad de Panamá
7. ESTIMACIONES
• Los coeficientes de confianza, son los valores de la
abscisa (X) correspondientes a determinadas
probabilidades.
• Por ejemplo, en la distribución normal estándar, Z representa
el coeficiente de confianza. Para una probabilidad de 90%, Z =
1.645 (una cola) y Z=1.96 (dos colas).
• ¿Qué significado tiene las dos colas o una cola?
• Pues las distribuciones de probabilidad, éstas pueden ser
acumulativas “menor que”.
• Ejemplo:
• Por ejemplo, la probabilidad acumulada hasta 200 libras es
0.95; pero la probabilidad de 101 a 200 libras es de 0.85. ¿Cómo
obtuvimos 0.85?
Peso Probabilidad
Acumulada
Menor de 100 0.10
De 101 a 200 0.95
De 201 a más 1.00
Elisa Mendoza G.
Universidad de Panamá
8. ESTIMACIONES
• Los intervalos de confianza, expresan dos valores o límites, así que
gráficamente en una distribución simétrica como la distribución
normal, se representa con dos colas, así:
-c c
Cola 1. Cola 2.
Probabilidad “entre -c y c”
Si las estimaciones, se obtienen para la media, es necesario obtener su
respectiva desviación estándar.
Si las estimaciones, se obtienen para las proporciones, es necesario calcular su
respectiva desviación estándar.
Los intervalos de confianza, requieren la estadística (media o proporción) y su
desviación estándar correspondiente.
Además, se requiere la probabilidad de confianza y por lo tanto el coeficiente
de confianza. Elisa Mendoza G.
Universidad de Panamá
9. REGLA EMPÍRICA
-3 -2 - 2 3 z
1-
Entre - y , hay 68 % [(1- )%]
probabilidad de acertar y
= 32% de error.
Entre -2 y 2 hay 95% de acertar
y 5% de error
Entre -3 y 3 hay 99.7% de
acertar y 0.3% de error.
/ 2 / 2
En las colas de ambos extremos se reparte el complemento de 1-
68%
95%
99%
-3 -2 - 2 3 z
1-
Entre - y , hay 68 % [(1- )%]
probabilidad de acertar y
= 32% de error.
Entre -2 y 2 hay 95% de acertar
y 5% de error
Entre -3 y 3 hay 99.7% de
acertar y 0.3% de error.
Entre - y , hay 68 % [(1- )%]
probabilidad de acertar y
= 32% de error.
Entre -2 y 2 hay 95% de acertar
y 5% de error
Entre -3 y 3 hay 99.7% de
acertar y 0.3% de error.
/ 2 / 2
En las colas de ambos extremos se reparte el complemento de 1-
68%
95%
99%
10. PRUEBAS DE HIPÓTESIS
Igualmente, se emplean los conceptos de nivel de confianza y error.
Las pruebas de hipótesis, comprueban la veracidad de un supuesto.
Generalmente, su aproximación al valor que se considera como
el parámetro poblacional.
Las pruebas de hipótesis se pueden realizar sobre los datos
muestrales de una población, de dos poblaciones o más
poblaciones.
Cuando se refieren a dos poblaciones, se realiza la comparación de
las estadísticas. Pueden se mediciones antes – después, o
pueden ser mediciones de dos poblaciones distintas.
Cuando se refieren a más de dos poblaciones las técnicas de
análisis a emplear son más complejas.
Elisa Mendoza G.
Universidad de Panamá
11. PRUEBAS DE HIPÓTESIS EN
DISTRIBUCIONES DE
PROBABILIDAD SIMÉTRICAS.
-c c
Cola 1. Cola 2.
-c
Cola 1.
c
Cola 2.
Probabilidad “menor que -c”
Probabilidad “mayor que c”
Probabilidad “entre -c y c”
Caso donde las
Hipótesis son:
Ho: =
o.
Ha: < o.
Caso donde las Hipótesis son:
Ho: = o.
Ha: o.
Caso donde las Hipótesis son:
Ho: = o.
Ha: > o.
Elisa Mendoza G.
Universidad de Panamá
12. POBLACIONES ESTADÍSTICAS Y
PRUEBAS DE HIPÓTESIS
Fuente
Muestra 1 Muestra 2
Fuente A Fuente B
Muestra 1 Muestra 2
Muestra Dependiente Muestras Independientes
En las pruebas de hipótesis de dos poblaciones o más, es importante reconocer
si las poblaciones son independientes o no lo son, esta característica influye
en las pruebas estadísticas a realizar. Elisa Mendoza G.
Universidad de Panamá
13. FÓRMULAS GENERALES
Estimaciones puntuales: media, proporciones, varianzas, etc.
Estimaciones por intervalos: Intervalo de confianza (IC)
Para la media de una población
media coeficiente de confianza * error
El coeficiente de confianza, para 95% de confianza es 1.96
El error se calcula, como: (en poblaciones infinitas)ns /
Nivel de confianzaNivel de confianza ZZ(1(1--))
99%99% 2.582.58
98%98% 2.332.33
95%95% 1.961.96
90%90% 1.651.65
Elisa Mendoza G.
Universidad de Panamá
14. CORRELACIONES DE VARIABLES
• En las correlaciones de variables, es importante
conocer qué tipos de variables se están
analizando. ¿Son cualitativas o son
cuantitativas?.
• Las correlaciones, miden el grado de asociación
de las variables de estudio. Hablar de
asociación, es decir, que una variable (o varias)
afecta en alguna medida el cambio o la
variabilidad de la otra variable.
• Si son cuantitativas, entonces, se aplica la
técnica de Análisis de Regresión.
• Si son cualitativas, entonces, se aplica la
Prueba de Independencia o Tablas de
contingencias. Elisa Mendoza G.
Universidad de Panamá
15. LA NORMALIDAD:
DISTRIBUCIÓN NORMAL
• La mayoría de las técnicas inferenciales, se basan en el supuesto de
la normalidad. Cuando los datos no tienen o no suponen
normalidad. Se emplean técnicas no paramétricas.
• La normalidad se debe verificar o puede verificar a través de
estadísticas de sesgo, curtosis, de tendencia central y gráficas como
el histograma y el polígono de frecuencias entre otras.
Formas sencillas de verificar la normalidad de los
datos.
Formas sencillas de verificar la normalidad de los
datos.
Elisa Mendoza G.
Universidad de Panamá
16. LO IMPORTANTE, ES ...
• Comprender que la media y la varianza son
insumos básicos en la estadística inferencial.
Saber calcular la media y la varianza ayudará a
realizar mejores análisis.
• La probabilidad es un concepto fundamental para
comprender la posibilidad de la ocurrencia de algo
de un resultado.
• Las probabilidades se conocen también como
percentiles.
• En la estadística inferencia, la probabilidad
ayuda a determinar intervalos de confianza y a
comprobar hipótesis.
Elisa Mendoza G.
Universidad de Panamá