Este documento presenta una introducción a las estadísticas no paramétricas, incluyendo pruebas como Chi-cuadrado, Mann-Whitney, Kruskal-Wallis y correlación de Spearman. Explica cuándo usar cada prueba dependiendo del tipo de variables (intervalo, ordinal, nominal) y número de grupos. También incluye tablas resumiendo los tipos de pruebas para diferentes diseños experimentales como grupos independientes, medidas repetidas, asociación entre variables.
Este documento proporciona información sobre pruebas estadísticas no paramétricas como el chi-cuadrado, Mann-Whitney y Kruskal-Wallis. Explica qué tipo de prueba se debe utilizar según el tipo y número de variables y grupos, y proporciona ejemplos de cómo calcular valores esperados y estadísticos chi-cuadrado. También resume los pasos para realizar pruebas de proporciones como comparar una proporción muestral con una población conocida o comparar dos proporciones.
Este documento presenta los conceptos fundamentales tratados en la primera clase de un curso. Se introducen temas como magnitudes y unidades, notación científica, variables, funciones, tablas y gráficos, probabilidad y errores de medición. Se explican conceptos como medición, valor, unidad, variable, relación funcional, ecuación, parámetro y constante. También se describen los pasos para graficar datos experimentales y calcular promedios y rangos.
Estadística, medidas de tendencia central 10º pii 2013Jose Castellar
Este documento describe diferentes medidas de tendencia central como la media armónica, geométrica, aritmética y cuadrática. Explica cómo calcular cada una de estas medidas a partir de datos agrupados en una tabla de frecuencias. También describe cómo calcular la mediana y la moda en este tipo de tabla. Por último, presenta dos ejemplos numéricos para ilustrar el cálculo de estas medidas.
Este documento presenta un análisis de regresión para explicar el riesgo de infección en hospitales en términos de cinco variables predictoras. Se estima un modelo de regresión múltiple significativo que explica el 53.8% de la variabilidad. Tres de las variables no son significativas individualmente y pueden ser descartadas. El análisis de diagnóstico identifica algunos puntos influyentes pero no atípicos, y el supuesto de normalidad de los errores no se cumple completamente.
Este documento describe conceptos relacionados con distribuciones de probabilidad binomial y Poisson. Explica las fórmulas para calcular la probabilidad de éxitos en una distribución binomial y la varianza en distribuciones binomiales y de Poisson. Además, presenta ejemplos numéricos de cálculos de probabilidades para estas distribuciones.
La distribución binomial describe experimentos con los siguientes parámetros: (1) dos resultados posibles llamados éxito y fracaso, (2) una probabilidad fija de éxito p en cada prueba, (3) pruebas independientes, (4) un número fijo de pruebas n. Calcula la probabilidad de obtener k éxitos tras n pruebas. Para n=1 se reduce a una distribución de Bernoulli.
Estadística y probabilidad de la universidad nacional de la amazonia peruanaJosueDavidTuanamaLin
El documento presenta información sobre la organización y presentación de datos unidimensionales. Explica conceptos como frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa y frecuencia relativa acumulada. También describe cómo construir una distribución de frecuencias para variables cuantitativas discretas y continuas, incluyendo el cálculo de intervalos de clase y la elaboración de tablas y histogramas de frecuencia.
Este documento proporciona información sobre pruebas estadísticas no paramétricas como el chi-cuadrado, Mann-Whitney y Kruskal-Wallis. Explica qué tipo de prueba se debe utilizar según el tipo y número de variables y grupos, y proporciona ejemplos de cómo calcular valores esperados y estadísticos chi-cuadrado. También resume los pasos para realizar pruebas de proporciones como comparar una proporción muestral con una población conocida o comparar dos proporciones.
Este documento presenta los conceptos fundamentales tratados en la primera clase de un curso. Se introducen temas como magnitudes y unidades, notación científica, variables, funciones, tablas y gráficos, probabilidad y errores de medición. Se explican conceptos como medición, valor, unidad, variable, relación funcional, ecuación, parámetro y constante. También se describen los pasos para graficar datos experimentales y calcular promedios y rangos.
Estadística, medidas de tendencia central 10º pii 2013Jose Castellar
Este documento describe diferentes medidas de tendencia central como la media armónica, geométrica, aritmética y cuadrática. Explica cómo calcular cada una de estas medidas a partir de datos agrupados en una tabla de frecuencias. También describe cómo calcular la mediana y la moda en este tipo de tabla. Por último, presenta dos ejemplos numéricos para ilustrar el cálculo de estas medidas.
Este documento presenta un análisis de regresión para explicar el riesgo de infección en hospitales en términos de cinco variables predictoras. Se estima un modelo de regresión múltiple significativo que explica el 53.8% de la variabilidad. Tres de las variables no son significativas individualmente y pueden ser descartadas. El análisis de diagnóstico identifica algunos puntos influyentes pero no atípicos, y el supuesto de normalidad de los errores no se cumple completamente.
Este documento describe conceptos relacionados con distribuciones de probabilidad binomial y Poisson. Explica las fórmulas para calcular la probabilidad de éxitos en una distribución binomial y la varianza en distribuciones binomiales y de Poisson. Además, presenta ejemplos numéricos de cálculos de probabilidades para estas distribuciones.
La distribución binomial describe experimentos con los siguientes parámetros: (1) dos resultados posibles llamados éxito y fracaso, (2) una probabilidad fija de éxito p en cada prueba, (3) pruebas independientes, (4) un número fijo de pruebas n. Calcula la probabilidad de obtener k éxitos tras n pruebas. Para n=1 se reduce a una distribución de Bernoulli.
Estadística y probabilidad de la universidad nacional de la amazonia peruanaJosueDavidTuanamaLin
El documento presenta información sobre la organización y presentación de datos unidimensionales. Explica conceptos como frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa y frecuencia relativa acumulada. También describe cómo construir una distribución de frecuencias para variables cuantitativas discretas y continuas, incluyendo el cálculo de intervalos de clase y la elaboración de tablas y histogramas de frecuencia.
Este documento describe dos pruebas estadísticas para determinar si los datos históricos siguen una distribución teórica en particular: la prueba de chi-cuadrado y la prueba de Kolmogorov-Smirnov. La prueba de chi-cuadrado compara las frecuencias observadas con las esperadas de acuerdo a la distribución teórica, mientras que la prueba de Kolmogorov-Smirnov compara las funciones de distribución empírica y teórica. Ambas pruebas producen valores estadísticos que se compar
Este documento describe la distribución chi cuadrada y cómo se usa para probar hipótesis sobre frecuencias. Explica que la distribución chi cuadrada tiene un parámetro de grados de libertad y describe cómo calcular valores chi cuadrado y decidir si se acepta o rechaza una hipótesis basada en una tabla de distribución chi cuadrada. También incluye ejemplos para ilustrar cómo aplicar la prueba chi cuadrada para determinar si dos variables categóricas están asociadas.
El documento presenta un resumen de los conceptos básicos de un diseño factorial 3K, incluyendo factores, niveles, tratamientos y réplicas. Explica que este diseño permite investigar los efectos de los factores individuales (A, B, C), sus interacciones (AB, AC, BC) y la interacción de todos los factores (ABC). Finalmente, muestra un ejemplo numérico de cómo aplicar un análisis de varianza para probar las hipótesis nulas de los diferentes efectos.
Este documento explica el estadístico de chi cuadrado de Pearson, que se utiliza para estudiar la relación entre variables cualitativas. Incluye las condiciones para aplicarlo, el procedimiento a seguir y tres ejemplos resueltos. En los ejemplos se formula la hipótesis nula, se realizan tablas con frecuencias observadas y esperadas, se calcula el estadístico y se compara con tablas para aceptar o rechazar la hipótesis nula.
Este resumen describe un trabajo práctico final sobre bioestadística realizado por 5 estudiantes para analizar datos sobre el peso de cabras en un criadero. El objetivo era mejorar el control de pesaje y registro de nacimientos. Se incluyen tablas simples y de intervalos, así como gráficos de barras, polígono y torta para analizar los datos sobre el peso de las cabras.
Este documento presenta los resultados de un experimento sobre el efecto de dos virus (Spfmv y Spcsv) en el cultivo de camote. Se establecieron cuatro tratamientos (dos virus individuales, ambos virus y un testigo sin virus). Se midió el peso total de la cosecha. El análisis de varianza mostró diferencias significativas entre los tratamientos. La prueba de Tukey reveló diferencias significativas entre todos los tratamientos excepto entre los tratamientos con un solo virus y el testigo.
Diseño de bloques completamente aleatorio (dbca) 7Carmelo Perez
Este documento presenta los aspectos teóricos y metodológicos del diseño de bloque completamente aleatorizado (DBCA) para experimentos agrícolas. Explica que el DBCA divide la muestra en bloques homogéneos para controlar variación ajena y asigna tratamientos aleatoriamente dentro de cada bloque. Incluye fórmulas para el análisis de varianza (ANOVA) y un ejemplo numérico para ilustrar el proceso de DBCA.
El documento presenta un problema académico con tres tareas. La primera tarea involucra cálculos estadísticos como media, varianza y desviación estándar de notas de estudiantes. La segunda tarea calcula el cuartil y percentil 75 de puntajes de empleados. La tercera tarea compara el uso de la conjunción "y entonces" entre niños y adultos al contar películas a través de tablas de frecuencias y gráficos.
Este documento presenta conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva se encarga de recolectar, organizar y resumir datos para describir las características de una población. Luego describe cómo organizar y presentar los datos mediante tablas de frecuencia, intervalos de clase y gráficos como el polígono de frecuencias. Finalmente, ilustra estos conceptos con ejemplos numéricos.
Este documento presenta conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva se encarga de recolectar, organizar y resumir datos para describir las características de una población. Luego, detalla métodos para ordenar, agrupar y presentar datos como tablas de frecuencia, intervalos de clase e histograma, los cuales permiten analizar y visualizar de forma concisa la información sobre una población.
Este documento presenta conceptos básicos de estadística descriptiva, incluyendo términos como población, muestra, variable, datos cuantitativos y cualitativos. Explica métodos para recopilar, organizar y resumir datos como tablas de frecuencia, intervalos de clase e histograma. El objetivo de la estadística descriptiva es analizar y presentar datos de una población.
Este documento presenta varios ejercicios resueltos de estadística que incluyen tablas de datos, cálculos de medidas de tendencia central y dispersión, y representaciones gráficas como histogramas y diagramas de cajas. Los ejercicios cubren temas como distribuciones de frecuencias, medidas de posición y variabilidad, y análisis de datos cuantitativos y cualitativos.
Este documento presenta 6 ejercicios de estadística probabilística resueltos. Los ejercicios involucran conceptos como distribución normal, probabilidad, media poblacional, desviación estándar y tamaño de muestra. Se calculan probabilidades de que la media muestral se encuentre dentro de ciertos rangos, y se estiman parámetros poblacionales como la desviación estándar a partir de datos muestrales.
Presentación de Organización DE Datos, elaborado por el Bachiller Josè Carrasquero, titular de la C.I: 29.733.396, cursando actualmente el IV semestre de Ing Civil. En el Instituto Universitario Politécnico Santiago Mariño, Sede Barcelona, ubicado en el estado Anzoategui en Venezuela, espero que esta presentaciòn sea de su agrado y saludos cordiales
Gerencia en mantenimiento 3r Corte
Estadística aplicada
Grupo 5
Integrantes:
Ing. Alexander Quijada C.I.: 19.142.119
Ing. Estefanía Zabala C.I: 18.205.313
Ing. Irayleth Brito C.I.: 15.127.426
Ing. María Guevara C.I.: 17.590.715
Ing. Mauricio Flores C.I: 19.510.541
El documento introduce conceptos básicos de teoría de conjuntos y probabilidad como espacio muestral, eventos, cardinalidad, probabilidad simple y condicional. Explica la diferencia entre conjuntos, subconjuntos y su intersección, y presenta ejemplos para ilustrar los cálculos de probabilidad usando diagramas de árbol y el teorema de Bayes.
Este documento presenta información estadística sobre las faltas de asistencia de estudiantes y los resultados de una prueba de salto de longitud. Incluye tablas de datos, cálculos de medidas de tendencia central, dispersión y posición como la media, moda, varianza, desviación típica, cuartiles y diagramas. Resume los pasos para analizar los datos y representarlos gráficamente.
Este documento presenta los conceptos y procedimientos de reducción al primer cuadrante para determinar las razones trigonométricas de ángulos que no son agudos en función de ángulos agudos. Explica casos como ángulos positivos menores de una vuelta, mayores de una vuelta, negativos, fraccionarios y relacionados. También incluye ejemplos y problemas para practicar la aplicación de estas técnicas.
Este documento presenta varios ejercicios y problemas relacionados con conceptos estadísticos como intervalos, tablas de frecuencias, medidas de tendencia central, medidas de dispersión y diagramas. Se piden calcular parámetros como media, mediana, cuartiles, desviación típica y coeficiente de variación para diferentes conjuntos de datos. También se solicita construir histogramas, polígonos de frecuencias y diagramas de caja para representar gráficamente las distribuciones.
Este documento presenta varios ejercicios y problemas relacionados con conceptos estadísticos como intervalos, tablas de frecuencias, medidas de tendencia central, medidas de dispersión y diagramas. Se piden calcular parámetros como la media, mediana, cuartiles, desviación típica y coeficiente de variación para diferentes conjuntos de datos. También se solicita construir histogramas, diagramas de caja y barras para representar gráficamente la información. El último ejercicio presenta los pesos de 50 recién nacidos.
Este documento describe dos pruebas estadísticas para determinar si los datos históricos siguen una distribución teórica en particular: la prueba de chi-cuadrado y la prueba de Kolmogorov-Smirnov. La prueba de chi-cuadrado compara las frecuencias observadas con las esperadas de acuerdo a la distribución teórica, mientras que la prueba de Kolmogorov-Smirnov compara las funciones de distribución empírica y teórica. Ambas pruebas producen valores estadísticos que se compar
Este documento describe la distribución chi cuadrada y cómo se usa para probar hipótesis sobre frecuencias. Explica que la distribución chi cuadrada tiene un parámetro de grados de libertad y describe cómo calcular valores chi cuadrado y decidir si se acepta o rechaza una hipótesis basada en una tabla de distribución chi cuadrada. También incluye ejemplos para ilustrar cómo aplicar la prueba chi cuadrada para determinar si dos variables categóricas están asociadas.
El documento presenta un resumen de los conceptos básicos de un diseño factorial 3K, incluyendo factores, niveles, tratamientos y réplicas. Explica que este diseño permite investigar los efectos de los factores individuales (A, B, C), sus interacciones (AB, AC, BC) y la interacción de todos los factores (ABC). Finalmente, muestra un ejemplo numérico de cómo aplicar un análisis de varianza para probar las hipótesis nulas de los diferentes efectos.
Este documento explica el estadístico de chi cuadrado de Pearson, que se utiliza para estudiar la relación entre variables cualitativas. Incluye las condiciones para aplicarlo, el procedimiento a seguir y tres ejemplos resueltos. En los ejemplos se formula la hipótesis nula, se realizan tablas con frecuencias observadas y esperadas, se calcula el estadístico y se compara con tablas para aceptar o rechazar la hipótesis nula.
Este resumen describe un trabajo práctico final sobre bioestadística realizado por 5 estudiantes para analizar datos sobre el peso de cabras en un criadero. El objetivo era mejorar el control de pesaje y registro de nacimientos. Se incluyen tablas simples y de intervalos, así como gráficos de barras, polígono y torta para analizar los datos sobre el peso de las cabras.
Este documento presenta los resultados de un experimento sobre el efecto de dos virus (Spfmv y Spcsv) en el cultivo de camote. Se establecieron cuatro tratamientos (dos virus individuales, ambos virus y un testigo sin virus). Se midió el peso total de la cosecha. El análisis de varianza mostró diferencias significativas entre los tratamientos. La prueba de Tukey reveló diferencias significativas entre todos los tratamientos excepto entre los tratamientos con un solo virus y el testigo.
Diseño de bloques completamente aleatorio (dbca) 7Carmelo Perez
Este documento presenta los aspectos teóricos y metodológicos del diseño de bloque completamente aleatorizado (DBCA) para experimentos agrícolas. Explica que el DBCA divide la muestra en bloques homogéneos para controlar variación ajena y asigna tratamientos aleatoriamente dentro de cada bloque. Incluye fórmulas para el análisis de varianza (ANOVA) y un ejemplo numérico para ilustrar el proceso de DBCA.
El documento presenta un problema académico con tres tareas. La primera tarea involucra cálculos estadísticos como media, varianza y desviación estándar de notas de estudiantes. La segunda tarea calcula el cuartil y percentil 75 de puntajes de empleados. La tercera tarea compara el uso de la conjunción "y entonces" entre niños y adultos al contar películas a través de tablas de frecuencias y gráficos.
Este documento presenta conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva se encarga de recolectar, organizar y resumir datos para describir las características de una población. Luego describe cómo organizar y presentar los datos mediante tablas de frecuencia, intervalos de clase y gráficos como el polígono de frecuencias. Finalmente, ilustra estos conceptos con ejemplos numéricos.
Este documento presenta conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva se encarga de recolectar, organizar y resumir datos para describir las características de una población. Luego, detalla métodos para ordenar, agrupar y presentar datos como tablas de frecuencia, intervalos de clase e histograma, los cuales permiten analizar y visualizar de forma concisa la información sobre una población.
Este documento presenta conceptos básicos de estadística descriptiva, incluyendo términos como población, muestra, variable, datos cuantitativos y cualitativos. Explica métodos para recopilar, organizar y resumir datos como tablas de frecuencia, intervalos de clase e histograma. El objetivo de la estadística descriptiva es analizar y presentar datos de una población.
Este documento presenta varios ejercicios resueltos de estadística que incluyen tablas de datos, cálculos de medidas de tendencia central y dispersión, y representaciones gráficas como histogramas y diagramas de cajas. Los ejercicios cubren temas como distribuciones de frecuencias, medidas de posición y variabilidad, y análisis de datos cuantitativos y cualitativos.
Este documento presenta 6 ejercicios de estadística probabilística resueltos. Los ejercicios involucran conceptos como distribución normal, probabilidad, media poblacional, desviación estándar y tamaño de muestra. Se calculan probabilidades de que la media muestral se encuentre dentro de ciertos rangos, y se estiman parámetros poblacionales como la desviación estándar a partir de datos muestrales.
Presentación de Organización DE Datos, elaborado por el Bachiller Josè Carrasquero, titular de la C.I: 29.733.396, cursando actualmente el IV semestre de Ing Civil. En el Instituto Universitario Politécnico Santiago Mariño, Sede Barcelona, ubicado en el estado Anzoategui en Venezuela, espero que esta presentaciòn sea de su agrado y saludos cordiales
Gerencia en mantenimiento 3r Corte
Estadística aplicada
Grupo 5
Integrantes:
Ing. Alexander Quijada C.I.: 19.142.119
Ing. Estefanía Zabala C.I: 18.205.313
Ing. Irayleth Brito C.I.: 15.127.426
Ing. María Guevara C.I.: 17.590.715
Ing. Mauricio Flores C.I: 19.510.541
El documento introduce conceptos básicos de teoría de conjuntos y probabilidad como espacio muestral, eventos, cardinalidad, probabilidad simple y condicional. Explica la diferencia entre conjuntos, subconjuntos y su intersección, y presenta ejemplos para ilustrar los cálculos de probabilidad usando diagramas de árbol y el teorema de Bayes.
Este documento presenta información estadística sobre las faltas de asistencia de estudiantes y los resultados de una prueba de salto de longitud. Incluye tablas de datos, cálculos de medidas de tendencia central, dispersión y posición como la media, moda, varianza, desviación típica, cuartiles y diagramas. Resume los pasos para analizar los datos y representarlos gráficamente.
Este documento presenta los conceptos y procedimientos de reducción al primer cuadrante para determinar las razones trigonométricas de ángulos que no son agudos en función de ángulos agudos. Explica casos como ángulos positivos menores de una vuelta, mayores de una vuelta, negativos, fraccionarios y relacionados. También incluye ejemplos y problemas para practicar la aplicación de estas técnicas.
Este documento presenta varios ejercicios y problemas relacionados con conceptos estadísticos como intervalos, tablas de frecuencias, medidas de tendencia central, medidas de dispersión y diagramas. Se piden calcular parámetros como media, mediana, cuartiles, desviación típica y coeficiente de variación para diferentes conjuntos de datos. También se solicita construir histogramas, polígonos de frecuencias y diagramas de caja para representar gráficamente las distribuciones.
Este documento presenta varios ejercicios y problemas relacionados con conceptos estadísticos como intervalos, tablas de frecuencias, medidas de tendencia central, medidas de dispersión y diagramas. Se piden calcular parámetros como la media, mediana, cuartiles, desviación típica y coeficiente de variación para diferentes conjuntos de datos. También se solicita construir histogramas, diagramas de caja y barras para representar gráficamente la información. El último ejercicio presenta los pesos de 50 recién nacidos.
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdfMedTechBiz
Este libro ofrece una introducción completa y accesible a los campos de la minería de datos y la inteligencia artificial. Cubre todo, desde conceptos básicos hasta estudios de casos avanzados, con énfasis en la aplicación práctica utilizando herramientas como Python y R.
También aborda cuestiones críticas de ética y responsabilidad en el uso de estas tecnologías, discutiendo temas como la privacidad, el sesgo algorítmico y transparencia.
El objetivo es permitir al lector aplicar técnicas de minería de datos e inteligencia artificial a problemas reales, contribuyendo a la innovación y el progreso en su área de especialización.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
2. Tipo de Variables y test a utilizar
Variable Grupos Test
Intervalar 2 - ind dif. Student no pareado
Intervalar 2 - mismos ind. Student pareado
Intervalar 3 ó más grupos ANOVA/Scheffé/...
Dep/Ind Análisis de Reg. / r
Nominal 2 grupos Chi cuadrado
Ordinal 2 grupos Chi cuadrado
Ordinal 2 grupos Mann-Whitney
Ordinal 3 grupos Kruskal-Wallis
Ordinal 2 g /mismos ind Wilcoxon
Ordinal dep/ind Spearman
3. Tipo de experimento
Escala de
medición
Dos grupos de
tratamiento
consistentes de
individuos
diferentes
Tres o más
grupos
consistentes
de individuos
diferentes
Antes y
después de un
tratamiento en
los mismos
individuos
Múltiples
tratamientos
en los
mismos
individuos
Asociación
entre dos
variables
Intervalar (y
obtenida de
población con
distribución
normal)*
Test t no pareado Análisis de
Varianza
Test t pareado Análisis de
varianza de
medidas
repetidas
Regresión
linear y
correlación de
Pearson;
análisis de
Bland-Altman
Nominal Chi-cuadrado de
tabla de
contingencia
Chi-cuadrado
de tabla de
contingencia
Test de
McNemar
Q de
Cochrane
Coeficiente de
contingencia
Ordinal Test de suma de
rangos de Mann-
Whitney
Estadístico de
Kruskal-Wallis
Test del signo
de rangos de
Wilcoxon
Estadístico de
Friedman
Correlación de
rangos de
Spearman
Tiempo de
sobrevida
Test de Gehan ó
Test de rango del
Log
* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales
4. Proporción
• Resumen de variables binarias:
– Síntoma: Presente / Ausente
– Tratamiento: Efectivo / Fracaso
• Si r, número de sujetos observados con
la característica, en la muestra n la
proporción será:
– Con la característica p = r / n
– Sin la característica q = 1- p
5. Intervalo de confianza de una
proporción
)
(
96
,
1
/
)
1
(
)
(
%
95 p
se
p
IC
n
p
p
p
se
6. En una clínica dental le
preguntan a 263 pctes si
confían que sus CD tengan
los datos en un PC, 81
dicen que la privacidad se
pierde, el IC 95% es:
0,364
a
252
,
0
0285
,
0
96
,
1
308
,
0
0285
,
0
263
/
)
308
,
0
1
(
308
,
0
)
(
308
,
0
263
/
81
%
95
IC
p
se
p
30.8%
No confía
69.2%
Si confía
7. Tests de proporciones
• Si existe diferencia con una proporción
conocida
• Comparar si existen diferencias
significativas entre dos proporciones no
pareadas
• Comparar si existen diferencias
significativas entre dos proporciones
pareadas
8. Si existe diferencia con una
proporción conocida
• Similar a lo visto en test t (comparar con
promedio conocido), o sea:
observado
valor
de
estándar
error
esperado
valor
-
observado
Valor
9. En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel
nacional se sabe que el asma se presenta en 15%.
¿Existen diferencias significativas, entre 15% y 18%?
187
2
,
0
1,23
:
(buscar)
z
valores
de
Tabla
23
,
1
0244
,
0
15
,
0
18
,
0
0244
,
0
215
85
,
0
15
,
0
)
(
)
1
(
)
(
)
(
z
p
se
n
p
p
p
se
p
se
p
p
z
esp
10. A 25 pctes con osteoartrosis cervical se les dividió, al
azar, en dos grupos (Lewith y Machin, 1981):
• 12 fueron tratados con estimulación infra roja (IR).
• 13 recibieron placebo.
9/12 con IR mejoró o desapareció el dolor = 0,75
4/13 en el grupo placebo mejoró =0,31
¿Existen diferencias significativas?
13. c2= 31,793, gl = 1, p<0,0001
SI NO
75
25
34
63
MEJORA SINTOMAS DEL RESFRIO
VITAMINA C
PLACEBO
793
,
31
33
,
43
)
33
,
43
63
(
67
,
44
)
67
,
44
25
(
67
,
53
)
67
,
53
34
(
33
,
55
)
33
,
55
75
(
)
(
2
2
2
2
2
2
2
c
c
E
E
O
14. Cálculo del test – chi-cuadrado
Mejoran de los síntomas del
resfrío
SI NO Total
Vitamina C fo =75
fe =55,33
fo =34
fe =53,67
109
Placebo fo =25
fe =44,67
fo =63
fe =43,33
88
Total
f columna
100 25 197
= 100*109/197
= 100*88/197
15. Cálculo de valores esperados
A
C
B
D
)
/(
)
)(
(
)
/(
)
)(
(
)
/(
)
)(
(
)
/(
)
)(
(
D
C
B
A
D
C
D
B
E
D
C
B
A
D
C
C
A
E
D
C
B
A
D
B
B
A
E
D
C
B
A
C
A
B
A
E
d
c
b
a
16. Cálculo de valores esperados
Si No Total Esperados
75 34 109 55,33 53,67
25 63 88 44,67 43,33
100 97 197
793
,
31
33
,
43
)
33
,
43
63
(
67
,
44
)
67
,
44
25
(
67
,
53
)
67
,
53
34
(
33
,
55
)
33
,
55
75
(
)
(
2
2
2
2
2
2
2
c
c
E
E
O
20. Chi - cuadrado (c2)
c2 = (O - E)2/E (Chi cuadrado de Pearson)
c = (|O - E|2 - 1/2) / E Corrección de Yates
Corrección de Yates: para tablas 2x2, con
muestras pequeñas (en una celda existen
menos de 5 observaciones).
Tamaño de muestra: n de celdas x 10.
Ej: 2 x 2 = 4 x 10 = 40
Ej. Ant: 3x3 = 9 x 10 = 90
22. Distribución de Chi-Cuadrado
• Supongamos que repetimos
experimento 1000 veces (el de
la Vit C / Placebo). Para cada
experimento calculamos el
valor de Chi-Cuadrado y
ploteamos dichos valores.
• Eje X es el valor calculado de
Chi-cuadrado de acuerdo a la
fórmula.
• Eje Y es el número de veces
que se obtiene el valor de chi-
cuadrado.
23. ODDS RATIO
• Proporciona:
– Estimado de la relación entre dos variables
binarias (si / no)
– Permite examinar los efectos de otras
variables en dicha relación
– Forma especial y conveniente de
interpretación en estudios caso-control
24. • “The odds that a single throw of a die
will produce a six are 1 to 5, or 1/5”.
• “ODDS: es la relación de la probabilidad
que el evento de interés ocurra contra
la probabilidad de que esto no ocurra”.
Bland y Altman. The odds ratio, BMJ 320;1468, 2000
25. Razón de desigualdad
(Odd ratio)
OR = 5,559
IC 95% : 3,00 a 10,29
75 (a) 34 (b)
25 (c) 63 (d)
Si No
Si
No
)
(log
96
,
1
1
1
1
1
)
(log
%
95 OR
SE
OR
IC
d
c
b
a
OR
SE
bc
ad
d
b
c
a
OR
e
e
28. Cases are weighted by the value of variable N.
Frequencies
HACE_EJERC$ (rows) by MEJOR_SINT$ (columns)
si no Total
Si 75.000 34.000 109.000
No 25.000 63.000 88.000
Total 100.000 97.000 197.000
Test statistic Value df Prob
Pearson Chi-square 31.793 1.000 0.000
Yates corrected Chi-square 30.197 1.000 0.000
Coefficient Value Asymptotic Std Error
Odds Ratio 5.559
Ln(Odds) 1.715 0.314
OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314
29. Riesgo Relativo
• Relación de frecuencias de dos categorías.
O desigualdad de ser clasificado en la
columna 1 en lugar de la columna 2.
• OR = (A/C) / (B/D)
• >1: personas con factor de riesgo tienen
más probabilidad que presenten el evento.
• <1: personas con factor de riesgo son
menos probable que experimenten el
evento.
30. Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200
Existe asociación entre niños de bajo peso al nacer
y edad de la madre?
31. Odds ratio
(es solamente para estudios caso-control, variables
nominales, tablas 2x2)
(similar a riesgo relativo)
• Si OR >1: existe una asociación positiva entre el
factor de riesgo y el evento.
• Si OR <1: hay una asociación negativa, (presencia
del factor disminuye la probabilidad de encontrar el
evento.
32. Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200
n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2
c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2 50x150x25x175
33. Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. n11 n12 n1.
> 20 a. n21 n22 n2.
Total n.1 n.2 n..
n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2
c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2 50x150x25x175
34. Proporciones
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 0,050 0,200 0,25
> 20 a. 0,075 0,675 0,75
Total 0,125 0,875 1,00
35. Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 20 80 100
> 20 a. 30 270 300
Total 50 350 400
Existe asociación entre niños de bajo peso al nacer
y edad de la madre?
36. • Sensibilidad: proporción de positivos
que son correctamente identificados por
el test.
• Especificidad: proporción de negativos
que son correctamente identificados por
el test
37. Comparación de sensibilidad y especificidad vs.
Valores predictivos positivo y negativo para evaluar la
seguridad de tests para diagnóstico
SI NO
SI
NO
(a)
Verdad +
45
(c)
Falso –
5
(b)
Falso +
10
(d)
Verdad -
40
TEST
ENFERMEDAD
Sensibilidad = a / a + c = 45 / 50 = 0,90
Especificidad = d / b + d = 40 / 50 = 0,80
VPP = a / a + b = 45 / 55 = 0,82
VPN = d / c + d = 40 / 45 = 0,89
N = 100
38. Comparación de sensibilidad y especificidad vs. Valores
predictivos positivo y negativo para evaluar la seguridad de tests
para diagnóstico
Tomado de Kramer, 1988
SI NO
SI
NO
(a)
Verdad +
9
(c)
Falso –
1
(b)
Falso +
18
(d)
Verdad -
72
TEST
ENFERMEDAD
Sensibilidad = a / a + c = 9 / 10 = 0,90
Especificidad = d / b + d = 72 / 90 = 0,80
VPP = a / a + b = 9 / 27 = 0,33
VPN = d / c + d = 72 / 73 = 0,99
N = 100
39. • Valor predictivo positivo (VPP): proporción de
pacientes con resultado de test positivo que
son correctamente diagnosticados.
• Valor predictivo negativo (VPN): proporción
de pacientes con resultado de test negativo
que son correctamente diagnosticados.
40. Tests no paramétricos para dos o
más muestras
Equivalente a test t pareado: Wilcoxon
Equivalente a test t no pareado: Mann-Whitney
Equivalente a ANOVA: Kruskal Wallis
Utilizar con variables ordinales o cuando
variables intervalares no presenten
distribución normal
41. Test U de Mann-Whitney
• Colocar rangos a las observaciones en
orden de menor a mayor
42. Test de Mann-Whitney
Producción de orina diaria mL/día.
Placebo Rango Droga Rango
------------------------------------------------------------------------
1000 1 1400 6
1380 5 1600 7
1200 3 1180 2
1220 4
T= 9 19
--------------------------------------------------------------------------
Mann-Whitney U= 3, p = 0.289
43. Test de Tukey-Duckworth
• Cálculos se pueden hacer en la cabeza
• Existe solamente un requisito que
cumplir:
4 ≤ n1 ≤ n2 ≤ 30
• Ho: Las muestras son idénticas
• Ha: Las muestras son diferentes
• El test estadístico a calcular es C
45. Test de Tukey-Duckworth
Procedimiento
1. Determine medición más grande y más
pequeña en cada muestra ranqueada.
2. En la muestra que contiene el valor
más grande de todos los valores
combinados, cuente todos los valores
que son mayores que la medición más
grande en el otro grupo.
46. 3. En la otra muestra, cuente todas las
mediciones que son más pequeñas que
la medición más pequeña del grupo de
la primera medición.
4. Sume ambas cantidades (= C).
47. Grupo1 Grupo2
80 84
81 89
82 92
83 92
84 92
85 94
86 95
87 96
89 96
92 96
93 98
94 98
96 99
97 101
98 103 Mayor valor
Valores de
exclusión
Ccalc = 4 + 3 = 7 C0,05 = 7
Ccalc ≥ C0,05 por lo tanto se rechaza Ho.
Conclusión: las muestras son diferentes
48. Kruskal-Wallis
• Equivalente a Anova
• Extensión del test de Mann-Whitney a más
de dos grupos
• Al conjunto de observaciones (N) se les da
rango (1 a N), indiferente de qué grupo estén,
y para cada grupo se calcula la suma de
rangos, y posteriormente se calcula H,
definido por
49. Donde R es el promedio de todos los rangos, y
es siempre igual a (N+1)/2. Ri = es la suma de
los rangos de ni observaciones.
Para calcular es más fácil:
)
1
(
)
(
12 2
N
N
R
R
n
H i
i
)
1
(
3
)
1
(
12 2
N
n
R
N
N
H
i
i
50. % de reducción de cefalea en
tres grupos (Fentress et al, 1986)
(Rangos en paréntesis)
Relajación y biofeedback Relajación No tratados
62 (11) 69 (10) 50 (12)
74 ( 8,5) 43 (13) -120 (17)
86 ( 7) 100 ( 2) 100 ( 2)
74 ( 8,5) 94 ( 5) -288 (18)
91 ( 6) 100 ( 2) 4 (15)
37 (14) 98 ( 4) -76 (16)
rango 55 36 80
Rango medio 9,17 6,00 13,33
52. Correlación de Spearman
• Medida No
Paramétrica para
establecer relación
de dos variables
ordinales (ó
intervalares sin DN)
Ventajas:
- No se necesita
distribución normal
- No se ve tan
afectada por
“outliers”
Sicólogo, 1863 - 1945
53. Correlación de Spearman
• Correlación para variables ordinales
• Para determinar la significancia de la
asociación de dos variables continuas
en que no existe normalidad de las
variables.
• Contrapartida no paramétrica de la
correlación de Pearson.
54. (n: número de pares de obs.)
(d= dif de rangos)
n
n
d
r
n
n
y
x
r
s
i
i
s
3
2
2
2
6
1
)
1
(
)
(
6
1
56. Diferentes escalas, diferentes
medidas de su asociación
Escala de ambas
variables
Medida de
asociación
Nominal Chi-Square de
Pearson: χ2
Ordinal rho de Spearman
Intervalar r de Pearson
57. Resumen
• Método de investigación
– Protocolo
– Artículo científico
• Bioestadística
– Estadística descriptiva: n, %, x ± ds
– Inferencia estadística: test t, ANOVA, ARS,
RL, c2