1. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
1
1. Cuando se registra el desarrollo de cáncer de mama como Estadio I, II, III o IV se
está trabajando con un dato:
a. numérico
b. discreto
c. nominal
d. ordinal
Ya que cada uno de los estadios es una categoría a la que se llega en
función de cierta condición predefinida de la evolución y cada uno de ellos
representa un avance progresivo para esa variable, es decir un orden
determinado para la ubicación en cada categoría.
2. La tensión arterial máxima registrada a partir de la medida de una columna de
mercurio en pacientes sometidos a una dieta hiposódica es un dato en escala:
a. continua
b. discreta
c. nominal
d. ordinal
Una medida se obtiene a partir de relacionar la situación observada con
una situación patrón y como relacionar es dividir el resultado puede tener
cualquier valor numérico. Esto significa que el dato se ubica en una escala
continua. En la situación mencionada lo habitual es que se utilice como
patrón el metro pero, por razones de practicidad, se registre el dato
redondeado al milímetro o centímetro; esto no significa que la escala en la
que se ubica el dato no sea continua.
3. La cantidad de recaídas registrada en cada uno de 36 pacientes geriátricos es un
conjunto de datos en escala:
a. continua
b. discreta
c. ordinales
d. nominales
Cada uno de los datos registrados en el conjunto es numérico ya que
expresa una cantidad: cuatro recaídas es el doble de dos. La escala es
discreta ya que cada dato registrado en cada paciente solo puede asumir
un número entero, es decir sin decimales. Un paciente puede experimentar
cinco o seis recaídas pero no 5, 43 recaídas.
2. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
2
2
4. En el cálculo de la proporción correspondiente a la frecuencia relativa de individuos
en una categoría para una variable registrada con datos nominales el denominador
es:
a. la cantidad de variables con que se trabaja
b. la categoría con mayor frecuencia
c. los datos no incluidos en la categoría del numerador
d. el total de datos del conjunto
Solo en caso de calcular una razón se realiza el cálculo colocando en el
denominador la cantidad de datos que no pertenecen a la categoría del
numerado. En la proporción, generalmente luego expresada como
porcentaje, el denominador está dado por la cantidad total de datos
comprendidos en el conjunto.
5. De los siguientes datos estadísticos, es una medida de dispersión:
a. la media
b. la mediana
c. el rango
d. la moda
El rango o recorrido es la diferencia entre el valor máximo y el mínimo
por lo que es una medida de dispersión a diferencia de las otras
mencionadas que son indicadores de tendencia central.
6. La media de los cuadrados de las desviaciones de valores para cada dato numérico
con respecto a la correspondiente media es una medida de la:
a. simetría de una distribución
b. tendencia central del conjunto
c. variancia de la población
d. desviación estándar
El enunciado corresponde a la descripción del procedimiento que se
sigue para calcular la varianza (o varianza) de una población. Si se hubiera
tratado de una muestra la definición podría haberse modificado ya que no
es la media propiamente dicha ya que, en este caso, el denominador no es
la cantidad total de datos sino la cantidad de datos menos uno que se
conoce como grados de libertad. En ambos casos, el cálculo posterior de la
raíz cuadrada del valor obtenido es la desviación estándar de la población o
muestra según corresponda.
3. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
3
7. En un conjunto de datos con distribución asimétrica con respecto a la media
aritmética el valor que separa al conjunto en mitades es:
a. el rango intercuartil
b. la mediana
c. la moda
d. todas las anteriores son correctas
Por definición la mediana corresponde al percentil 50 de una
distribución por lo que separa al conjunto de datos al que pertenece en
mitades independientemente de la forma y simetría o asimetría de la
distribución. La moda no necesariamente coincide con la mediana y el
rango intercuartil no es un valor sin un rango de valores dentro del que se
ubican la mitad de los datos centrales del conjunto.
8. En una distribución de datos numéricos el percentil de un dato indica su ubicación
en el conjunto en términos de:
a. porcentaje de datos con valores menores que él
b. desviaciones estándar
c. porcentaje del valor máximo
d. ninguna es correcta
Por convención se determina el percentil de un dato ordenándolos de
menor a mayor en su valor numérico y luego estableciendo la cantidad de
datos que quedan por debajo de uno en particular. Esa cantidad dividida
por la cantidad total de datos del conjunto y multiplicada por cien es el
percentil o sea el porcentaje de datos con valores inferiores a él.
9. Para conocer la ubicación de un dato con respecto a la media aritmética en
términos de desviaciones estándar se calcula:
a. la ecuación de Gauss
b. el valor de "z" para ese dato
c. cualquiera de las anteriores
d. ninguna de las anteriores
El valor de “z” se calcula dividiendo la diferencia entre el valor de un
dato y el valor de la media aritmética del conjunto al que pertenece por la
desviación estándar del conjunto por lo que permite ubicar el dato de la
forma que lo propone el enunciado. Este cálculo no depende de que se esté
trabajando con datos con distribución gaussiana pero adquiere relevancia
en este caso ya que en la ecuación correspondiente el resultado está
determinado por esa posición del dato.
4. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
4
4
10. En una población con distribución normal – gaussiana – la mayor frecuencia se
encuentra para el valor de la:
a. media aritmética
b. mediana
c. moda
d. todas las anteriores son correctas
Una de las características de la distribución gaussiana – además de la
forma de corte de campana que genera en la descripción gráfica es la
simetría con respecto a la media aritmética. Esto hace que los valores de
media aritmética y mediana sean coincidentes. Además la mayor
frecuencia – la moda - se encuentra, en esta forma de distribución,
coincidente con los valores mencionados.
11. En un conjunto de datos con distribución gaussiana un dato con valor de “z” igual
a 0,1 está:
a. por encima de la mediana
b. dentro del rango intercuartil
c. a menos de una desviación estándar de la media
d. todas las anteriores son correctas
El valor de z mencionado representa – como se debió responder en una
propuesta anterior – la posición del dato con respecto a la media en
términos de desviación estándar. Por ello un dato con z= 0,1 (valor positivo)
está por encima de la media aritmética y, como en una distribución
gaussiana la media aritmética coincide con la mediana, también está por
encima de ésta. A su vez en una distribución gaussiana a ese valor 0,1 le
corresponde un percentil que ubica al dato dentro del 50% central (dentro
del rango intercuartil). Por último como 0,1 es menor que 1 el dato está a
menos de una desviación estándar de la media.
5. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
5
12. Para una variable valorada con datos numéricos con distribución gaussiana se
registró para uno de los integrantes de la población un valor 130. Si la media
aritmética para esos datos es 110 y la desviación estándar 10 puede considerarse
que el dato para ese individuo:
a. está fuera del rango intercuartil
b. corresponde al percentil 50
c. está por debajo de la media aritmética
d. ninguna de las anteriores es correcta
El valor 130 es mayor que la media aritmética o sea que no está por
debajo de ella ni tampoco coincidente con ella. Esta última condición es la
que debería darse para que al dato le corresponda el percentil 50 ya que en
una distribución gaussiana ese percentil corresponde a la mediana que
coincide con el valor de la media aritmética. Además el valor 130 está dos
desviaciones estándar por encima de la media aritmética (z = 2 = (130-110)
/ 10) y esto lo ubica claramente por fuera del rango que corresponde al
50% central.
13. Si en una población de datos numéricos la media aritmética es 240 y la desviación
estándar 50, al tomar muestras de tamaño 25 el error estándar será:
a. 2
b. 5
c. 10
d. 25
El error estándar es numéricamente igual al valor de la desviación
estándar divido por la raíz cuadrada del tamaño de muestra. En este caso
sería 50 dividido poa la raíz cuadrada de 50, o sea 5, lo arroga 10 como
resultado.
14. El error estándar mide:
a. la probabilidad de cometer un error estadístico
b. la dispersión de los valores de los estadísticos de muestras
c. el posible error en los datos obtenidos en una muestra
d. ninguna de las anteriores es correcta
El error estándar es la medida de dispersión de los datos estadísticos de
muestras. En un valor necesario para, en procedimientos estadísticos
inferenciales, calcular la probabilidad de algún error pero no es la medida
de este error. Por otro lado el error en los datos está dado por la forma en
fueron recolectados y no se mide con el error estándar.
6. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
6
6
15. El error estándar aumenta cuando aumenta:
a. el tamaño de la muestra
b. la probabilidad de cometer un error de Tipo I
c. la dispersión de los datos en la población
d. la confiabilidad de los datos registrados
En función de lo que se analizó en las respuestas a las proposiciones
previas, el numerador en el cálculo del error estándar es la desviación
estándar del conjunto de datos que es una medida de su dispersión. En
consecuencia el valor del error estándar aumenta al aumentar esa medida
de dispersión. Por el contrario disminuye al aumentar el tamaño de
muestra. El error estándar no aumenta cuando aumenta la probabilidad de
error de tipo I ya que esta probabilidad de error se establece previamente a
un procedimiento inferencial cuando se fija la confianza que se pone en una
muestra. Nuevamente la confiabilidad de los datos puede estar dado por la
forma de recolección y, en última instancia, su aumento podría ser causa de
menor dispersión con lo que, nuevamente, disminuiría el valor del error
estándar.
16. Un intervalo de confianza permite:
a. controlar la dispersión de los datos
b. estimar un parámetro dentro de dos límites
c. las dos anteriores son correctas
d. ninguna de las anteriores es correcta
La dispersión de los datos de un conjunto está dada por la dispersión de
la manifestación de la variable en cuestión en los individuos (unidades) en
los que son registrados o por el mayor o menor error que se cometa en el
registro: no es controlado con un intervalo de confianza. Este último
permite estimar, a partir de datos de una muestra, el valor de un
parámetro en la población que la muestra representa.
7. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
7
17. Cuando se hace una prueba de hipótesis estadística se calcula el valor de alfa para
estimar:
a. la probabilidad de cometer un error de Tipo I
b. la probabilidad de cometer un error de Tipo II
c. el poder del experimento
d. todas las anteriores son correctas
Se conoce con el nombre de alfa a la probabilidad de cometer el error
que consiste en rechazar una hipótesis que es verdadera, o sea el que se
conoce como error de tipo I. La probabilidad de error de tipo II – el que se
comete cuando se acepta una hipótesis que es falsa – se conoce como beta
y la de no cometerlo como poder de un experimento.
18. Si, al realizar una prueba de una hipótesis relacionada con la diferencia entre las
medias aritméticas registradas con dos tratamientos, se obtiene un valor de "t"
mayor que el "crítico" preestablecido se dice que:
a. la distribución no es gaussiana
b. la diferencia entre ambas no es significativa
c. el valor de alfa es demasiado elevado
d. ninguna de las anteriores es correcta
Un valor de “t” mayor que el crítico en este caso no hace referencia a la
forma de una distribución. Indica en cambio que la diferencia observada
entre lo observado en la investigación con muestras está más lejos de lo
que se esperaría según lo que se deduce de la hipótesis nula (hipótesis de
igualdad entre las medias aritméticas de las poblaciones de las que fueron
tomadas). Por lo tanto un valor mayor que el crítico indica que la
probabilidad de encontrar el resultado observado es menor que la
aceptable (habitualmente menor que 0,05 o 5%). Se rechazaría ante esa
situación la hipótesis nula y se diría que la diferencia es significativa ya que
el valor de alfa – probabilidad de estar cometiendo un error de tipo I, o sea
de estar rechazando una hipótesis verdadera – sería bajo. Por eso ninguna
de las tres primeras opciones es correcta.
8. PREGUNTAS Y RESPUESTAS – EXAMEN FINAL
BASES ESTADÍSTICAS PARA LA INVESTIGACIÓN EN CIENCIAS DE LA SALUD
8
8
19. El poder en porciento de una prueba estadística está determinado por la
diferencia entre 100 y la probabilidad de:
a. cometer un error de Tipo I
b. cometer un error de Tipo II
c. no cometer un error de Tipo I
d. no cometer un error de Tipo II
Como se indicó en el análisis de respuestas anteriores el poder de una
prueba estadística aplicada está dado por la probabilidad de no cometer el
error de aceptar una hipótesis falsa, o sea un error de tipo II o el valor de
beta. Si se lo expresa en porcentaje el valor es 100 menos el valor de beta
expresado en porciento.
20. En un estudio se utilizaron dos grupos de 25 pacientes cada uno para tratar de
establecer si en las poblaciones respectivas existe una diferencia de más de 5
puntos porcentuales en la prevalencia de una enfermedad. Si no se detectan
diferencias estadísticamente significativas es recomendable:
a. considerar iguales a ambas poblaciones
b. calcular el poder de la experiencia para detectar la
diferencia buscada
c. determinar el tamaño de muestra
d. todas las anteriores
Frente a una situación como la descrita no se debe concluir
considerando automáticamente iguales a ambas poblaciones. Debe
estimarse la posibilidad de estar cometiendo un error de tipo II o sea la
probabilidad de que, al llegar a esta conclusión, se esté aceptando una
hipótesis que es falsa. Por ello, antes de tomar esa decisión debe calcularse
el poder de la experiencia para detectar como significativa la diferencia que
se considera de importancia (en la proposición, 5 puntos porcentuales). Solo
si el poder se encuentra suficiente (habitualmente 80% o más) se puede
estimar que pueden considerarse iguales ambas poblaciones. De ser
encontrado el poder insuficiente, y si se considera oportuno rehacer la
investigación, puede determinarse el tamaño de muestra conveniente para
obtener el poder suficiente.