Este documento resume los conceptos básicos de la estadística descriptiva e inferencial. Explica que la estadística descriptiva ayuda a organizar y presentar datos a través de tablas y gráficas, y genera estadísticas como promedios y desviaciones estándar. La estadística inferencial utiliza la probabilidad para estimar parámetros poblacionales a través de intervalos de confianza y probar hipótesis. También cubre temas como muestreo, normalidad, correlaciones y pruebas estadísticas
Esta presentación ha sido elaborada para introducir a los estudiantes en el tema de estadística descriptiva. Se presentan conceptos básicos relacionadas con la Estadística, la metodología estadística, y las principales medidas de tendencia central, de dispersión y las medidas de forma (sesgo y curtosis).
Esta presentación ha sido elaborada para introducir a los estudiantes en el tema de estadística descriptiva. Se presentan conceptos básicos relacionadas con la Estadística, la metodología estadística, y las principales medidas de tendencia central, de dispersión y las medidas de forma (sesgo y curtosis).
La estadística es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva. Se considera como su fundador a Godofredo Achenwall, profesor alemán (1719-1772), él y sus seguidores estructuraron métodos estadísticos para estudiar las riquezas de las naciones. La estadística es una de las ramas de la matemática con más aplicaciones, ya que casi en cualquier rama del conocimiento humano tiene aplicación. Los métodos estadísticos son utilizados por mercadólogos, contadores, analistas de control de calidad, clientes, profesionales del deporte, administradores de hospitales, educadores, políticos, físicos, etc.
La estadística es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva. Se considera como su fundador a Godofredo Achenwall, profesor alemán (1719-1772), él y sus seguidores estructuraron métodos estadísticos para estudiar las riquezas de las naciones. La estadística es una de las ramas de la matemática con más aplicaciones, ya que casi en cualquier rama del conocimiento humano tiene aplicación. Los métodos estadísticos son utilizados por mercadólogos, contadores, analistas de control de calidad, clientes, profesionales del deporte, administradores de hospitales, educadores, políticos, físicos, etc.
Chwila odprężenia, oderwania od codziennych spraw, wolność – to określenia, które śmiało mogłyby kojarzyć się z trwającymi wakacjami. Jak się jednak okazuje Polakom podobne uczucia towarzyszą gdy… chodzą na bosaka po domu. To wnioski, które płyną z badania, przeprowadzonego przez Newspoint dla marki TECE.
Epiinfo es un programa muy útil y versátil para el diseño de cuestionarios y aún más si los propósitos es el análisis epidemiológico o en el campo de la salud.
AWS: Architecting for resilience & cost at scaleJos Boumans
As anyone using AWS will be able to tell you, there are good parts, and there are the bad ones. If you come from a datacenter background, you are most definitely not in Kansas anymore, and we had our share of learning experiences as a result.
This is the story of all the pitfalls we encountered, and how, through architecture, convention and common sense, we managed to build an infrastructure that is "Always Up" from the end user perspective and incredibly economical to build, scale and operate.
The talk will focus on leveraging the strong/economical points of AWS, while avoiding the weak/expensive ones. I'll give a break down of the pain points, how we managed them and how we avoided painting ourselves in a corner accidentally.
For many companies starting today, success is defined by large traffic or user numbers; if you are one of those companies, these lessons will very likely save you significant operational headaches.
Chaos patterns - architecting for failure in distributed systemsJos Boumans
As we architect our systems for greater demands, scale, uptime, and performance, the hardest thing to control becomes the environment in which we deploy and the subtle but crucial interactions between complicated systems. Chaos Patterns help us establish and implement a virtuous cycle that let’s us both prove & improve our system along each of these dimensions before the inevitable happens.
While it may seem reckless or counter-intuitive, our experience has proven that it’s a matter of how and when (not if) we will learn about the limitations and failure modes of the system.
This is the story of the pitfalls we encountered, and how, through architecture, convention and common sense, we managed to build an infrastructure that is "Always Up" from the end user perspective and incredibly economical to build, scale & operate; using chaos testing, we learn more about how our system fails from a 10 second controlled failure than a multi-hour uncontrolled outage.
In this session we will cover various implementation techniques, available to any developer & operator, which will vastly increase the resilience of your systems and provide a superior end user experience; from optimizing your use of DNS for failure, to configuring your CDN to have your back, to synthetic responses and expected database outages.
But why stop there? Netflix has pioneered a culture and suite of tools that actively injects ‘once in a blue moon’ failures into its production systems, which lets you battle test your resilience design and let developers & operators sleep comfortably at night knowing their systems are able to handle even the worst of worst case scenarios.
Presentación de la conferencia sobre la basílica de San Pedro en el Vaticano realizada en el Ateneo Cultural y Mercantil de Onda el jueves 2 de mayo de 2024.
2. LO BÁSICO
• Si Ud, ha decidido emplear técnicas de análisis estadístico de datos,
es porque ha determinado que esta ciencia “La Estadística”, le
permitirá generar conclusiones científicas y válidas para las tomas
de decisiones.
• Reconoce la IMPORTANCIA DE LA ESTADÍSTICA en el análisis de
datos.
Elisa Mendoza G.
Universidad de Panamá
3. LO BÁSICO
• La Estadística: recolecta, procesa u organiza,
presenta y analiza.
• La Estadística, se divide en dos grandes ramas:
• Estadística descriptiva
• Estadística inferencial
• La Estadística descriptiva, entre otros aspectos:
• Ayuda a definir variables de estudio en cuanto al tipo y la
escala de medición.
• Provee formas o métodos de organización y presentación de
datos, como lo son los cuadros, tablas y gráficas.
• Genera resultados numéricos importantes, como los
promedios, porcentajes, varianzas y desviaciones estándar.
Elisa Mendoza G.
Universidad de Panamá
4. LO BÁSICO
• La comprensión de los métodos básicos estadísticos, como la obtención
del promedio y la varianza, así como su interpretación es un paso
importante para realizar análisis más complejos.
• La probabilidad es el inicio en la aplicación de la Estadística Inferencial.
Por ejemplo, ayuda a verificar la probabilidad de que la media de una
muestra (estimación) es igual o aproximadamente igual, a la supuesta
media de la población (parámetro).
• Las probabilidades, cuantifican las posibilidades de la ocurrencia de un
evento, “hecho”, o “resultado”.
• La importancia de una correcta decisión de muestrear o censar: Por
ejemplo, Analiza esto: Si realizas un estudio por muestras, y la media
resultante en la edad es 5 años; pero luego, tienes la oportunidad de
completar el estudio y estudiar a toda la población, y encuentras que la
media es 5. ¿a qué conclusión llegarías? ¿era necesario censar?.
Elisa Mendoza G.
Universidad de Panamá
5. LO BÁSICO
• Las Estimaciones por Intervalos, Proporcionan un rango de
valores, a partir de una muestra, entre los cuales
probablemente está el verdadero poblacional.
• Recuerda que en la selección de una sola muestra, se pueden
seleccionar muchas muestras más del mismo tamaño.
• Ejemplo: Sea una población compuesta por Ana, Blas, Carlos, Diana y
Ema, cuyos nombres representamos con A, B, C, D y E.
• Se toma una muestra de tres de ellos: ¿A quiénes elegirías? Y ¿por qué?
• ¿Qué otras muestras de tres de ellos se pudieron conformar?.
• Al realizar el estudio por muestras, ¿qué ocurre con el resto de las
muestra? ¿las tomas en cuenta o sólo te basas en la primera que elegiste?.
• Bien, supongamos que se estudian los pesos de estas 5 personas,
respectivamente son: 120, 135, 158, 133, 109. Ahora, para la muestra que
tomaste, cuánto fue el promedio y la desviación estándar?. Para las cinco
personas o población, cuánto fue el promedio y la desviación estándar?.
• A qué conclusión llegas?
• Las estimaciones, son estadísticas de las muestras, que
esperamos sean aproximaciones de los parámetros
poblacionales.
Elisa Mendoza G.
Universidad de Panamá
6. ESTIMACIONES
• Para hablar de estimaciones por intervalos, se debe tener en cuenta dos
términos:
• Nivel de confianza: Probabilidad de que en 100 muestras, 95 de ellas den
como resultado la estadística parámetro. ¿cuántas escogemos nosotros?. La
probabilidad (muestreo probabilístico) nos asegura que podemos elegir una
buena muestra.
• Error típico: Cantidad en que se desvía la estimación en promedio con
relación al parámetro. S/
• Los intervalos de confianza, son expresiones numéricas en rangos de
dos números (valor inferior y valor superior), obtenido a partir de las
estadísticas de la muestra.
• Intervalo de confianza: Límite inferior, Límite superior
• La amplitud de este intervalo, o sus límites dependen de varios
aspectos, entre ellos la estadística a estimar: media, proporción o
varianza; del error típico correspondiente y el nivel de confianza que se
utiliza (generalmente 95%).
• Intervalo de confianza (IC): ( Lim. Inf., Lim. Sup. )
• Límite inferior: Estadística – coef. De confianza * error típico
• Límite superior: Estadística + coef. De confianza * error típico
: error
1- : nivel de confianza
n
Elisa Mendoza G.
Universidad de Panamá
7. ESTIMACIONES
• Los coeficientes de confianza, son los valores de la
abscisa (X) correspondientes a determinadas
probabilidades.
• Por ejemplo, en la distribución normal estándar, Z representa
el coeficiente de confianza. Para una probabilidad de 90%, Z =
1.645 (una cola) y Z=1.96 (dos colas).
• ¿Qué significado tiene las dos colas o una cola?
• Pues las distribuciones de probabilidad, éstas pueden ser
acumulativas “menor que”.
• Ejemplo:
• Por ejemplo, la probabilidad acumulada hasta 200 libras es
0.95; pero la probabilidad de 101 a 200 libras es de 0.85. ¿Cómo
obtuvimos 0.85?
Peso Probabilidad
Acumulada
Menor de 100 0.10
De 101 a 200 0.95
De 201 a más 1.00
Elisa Mendoza G.
Universidad de Panamá
8. ESTIMACIONES
• Los intervalos de confianza, expresan dos valores o límites, así que
gráficamente en una distribución simétrica como la distribución
normal, se representa con dos colas, así:
-c c
Cola 1. Cola 2.
Probabilidad “entre -c y c”
Si las estimaciones, se obtienen para la media, es necesario obtener su
respectiva desviación estándar.
Si las estimaciones, se obtienen para las proporciones, es necesario calcular su
respectiva desviación estándar.
Los intervalos de confianza, requieren la estadística (media o proporción) y su
desviación estándar correspondiente.
Además, se requiere la probabilidad de confianza y por lo tanto el coeficiente
de confianza. Elisa Mendoza G.
Universidad de Panamá
9. REGLA EMPÍRICA
-3 -2 - 2 3 z
1-
Entre - y , hay 68 % [(1- )%]
probabilidad de acertar y
= 32% de error.
Entre -2 y 2 hay 95% de acertar
y 5% de error
Entre -3 y 3 hay 99.7% de
acertar y 0.3% de error.
/ 2 / 2
En las colas de ambos extremos se reparte el complemento de 1-
68%
95%
99%
-3 -2 - 2 3 z
1-
Entre - y , hay 68 % [(1- )%]
probabilidad de acertar y
= 32% de error.
Entre -2 y 2 hay 95% de acertar
y 5% de error
Entre -3 y 3 hay 99.7% de
acertar y 0.3% de error.
Entre - y , hay 68 % [(1- )%]
probabilidad de acertar y
= 32% de error.
Entre -2 y 2 hay 95% de acertar
y 5% de error
Entre -3 y 3 hay 99.7% de
acertar y 0.3% de error.
/ 2 / 2
En las colas de ambos extremos se reparte el complemento de 1-
68%
95%
99%
10. PRUEBAS DE HIPÓTESIS
Igualmente, se emplean los conceptos de nivel de confianza y error.
Las pruebas de hipótesis, comprueban la veracidad de un supuesto.
Generalmente, su aproximación al valor que se considera como
el parámetro poblacional.
Las pruebas de hipótesis se pueden realizar sobre los datos
muestrales de una población, de dos poblaciones o más
poblaciones.
Cuando se refieren a dos poblaciones, se realiza la comparación de
las estadísticas. Pueden se mediciones antes – después, o
pueden ser mediciones de dos poblaciones distintas.
Cuando se refieren a más de dos poblaciones las técnicas de
análisis a emplear son más complejas.
Elisa Mendoza G.
Universidad de Panamá
11. PRUEBAS DE HIPÓTESIS EN
DISTRIBUCIONES DE
PROBABILIDAD SIMÉTRICAS.
-c c
Cola 1. Cola 2.
-c
Cola 1.
c
Cola 2.
Probabilidad “menor que -c”
Probabilidad “mayor que c”
Probabilidad “entre -c y c”
Caso donde las
Hipótesis son:
Ho: =
o.
Ha: < o.
Caso donde las Hipótesis son:
Ho: = o.
Ha: o.
Caso donde las Hipótesis son:
Ho: = o.
Ha: > o.
Elisa Mendoza G.
Universidad de Panamá
12. POBLACIONES ESTADÍSTICAS Y
PRUEBAS DE HIPÓTESIS
Fuente
Muestra 1 Muestra 2
Fuente A Fuente B
Muestra 1 Muestra 2
Muestra Dependiente Muestras Independientes
En las pruebas de hipótesis de dos poblaciones o más, es importante reconocer
si las poblaciones son independientes o no lo son, esta característica influye
en las pruebas estadísticas a realizar. Elisa Mendoza G.
Universidad de Panamá
13. FÓRMULAS GENERALES
Estimaciones puntuales: media, proporciones, varianzas, etc.
Estimaciones por intervalos: Intervalo de confianza (IC)
Para la media de una población
media coeficiente de confianza * error
El coeficiente de confianza, para 95% de confianza es 1.96
El error se calcula, como: (en poblaciones infinitas)ns /
Nivel de confianzaNivel de confianza ZZ(1(1--))
99%99% 2.582.58
98%98% 2.332.33
95%95% 1.961.96
90%90% 1.651.65
Elisa Mendoza G.
Universidad de Panamá
14. CORRELACIONES DE VARIABLES
• En las correlaciones de variables, es importante
conocer qué tipos de variables se están
analizando. ¿Son cualitativas o son
cuantitativas?.
• Las correlaciones, miden el grado de asociación
de las variables de estudio. Hablar de
asociación, es decir, que una variable (o varias)
afecta en alguna medida el cambio o la
variabilidad de la otra variable.
• Si son cuantitativas, entonces, se aplica la
técnica de Análisis de Regresión.
• Si son cualitativas, entonces, se aplica la
Prueba de Independencia o Tablas de
contingencias. Elisa Mendoza G.
Universidad de Panamá
15. LA NORMALIDAD:
DISTRIBUCIÓN NORMAL
• La mayoría de las técnicas inferenciales, se basan en el supuesto de
la normalidad. Cuando los datos no tienen o no suponen
normalidad. Se emplean técnicas no paramétricas.
• La normalidad se debe verificar o puede verificar a través de
estadísticas de sesgo, curtosis, de tendencia central y gráficas como
el histograma y el polígono de frecuencias entre otras.
Formas sencillas de verificar la normalidad de los
datos.
Formas sencillas de verificar la normalidad de los
datos.
Elisa Mendoza G.
Universidad de Panamá
16. LO IMPORTANTE, ES ...
• Comprender que la media y la varianza son
insumos básicos en la estadística inferencial.
Saber calcular la media y la varianza ayudará a
realizar mejores análisis.
• La probabilidad es un concepto fundamental para
comprender la posibilidad de la ocurrencia de algo
de un resultado.
• Las probabilidades se conocen también como
percentiles.
• En la estadística inferencia, la probabilidad
ayuda a determinar intervalos de confianza y a
comprobar hipótesis.
Elisa Mendoza G.
Universidad de Panamá