1. Universidad Da Vinci de Guatemala
Sede Escuintla
Técnico y Licenciatura en Enfermería
III Semestre
Bioestadística
CLASE 4
Lic. Hugo Francisco Felipe Caceros
Escuintla, 3 de marzo de 2024
2. Conceptos generales/básicos
Variable "x": En estadística, "x" suele representar una variable, es decir, una
cantidad que puede variar y que se está midiendo, observando o manipulando
en un estudio. Por ejemplo, si estás midiendo la altura de los estudiantes de
una clase, "x" podría representar la altura de un estudiante en particular.
Frecuencia "f": En estadística, "f" se utiliza comúnmente para representar la
frecuencia de un evento o valor en un conjunto de datos. Por ejemplo, si estás
registrando cuántas veces ocurre un evento determinado en un experimento,
"f" podría representar la frecuencia de ese evento.
Tamaño de la muestra "n": En estadística, "n" representa el tamaño de la
muestra, es decir, el número total de observaciones o elementos en un
conjunto de datos. Por ejemplo, si estás realizando una encuesta y recopilando
respuestas de 100 personas, "n" sería igual a 100.
Serie de datos: Una serie de datos es simplemente un conjunto de valores
observados o medidas tomadas en relación con un fenómeno específico. Estos
valores pueden ser numéricos, categóricos o cualquier otro tipo de datos. Por
ejemplo, si estás registrando las edades de las personas en una encuesta, la
serie de datos serían las edades individuales que has registrado.
3. Medidas de Tendencia Central
Son medidas estadísticas que
pretenden resumir en un solo
valor a un conjunto de valores.
Representan un centro en torno
al cual se encuentra ubicado el
conjunto de los datos.
Existen diversos tipos de medidas
de tendencia central estadística.
Las más utilizadas son: media
aritmética, mediana y moda.
4. Media Aritmética o Promedio Aritmético
Esta medida es la más utilizada para
centralizar los datos. Se utiliza
ampliamente, debido a que está
definida algebraicamente y es fácil,
entonces, introducirla en procesos de
análisis más complejos,
aprovechando sus propiedades
algebraicas. Tiene como desventaja,
el hecho de moverse hacia los valores
extremos cuando en la muestra hay
valores atípicos o dispersos con
respecto a la generalidad. Lo anterior,
favorece que en un momento dado
se subestime o se sobrestime el valor
medio real. Este defecto se controla si
en un análisis, la media aritmética va
acompañada de una medida
adecuada de variabilidad.
La media aritmética de una muestra
se representa mediante el símbolo X y
se define así:
Donde xi, representa cada valor
diferente, adquirido por la variable y
n es el total de datos en la muestra.
Así que, la definición nos dice,
básicamente, que hay que sumar
todos los datos, desde el primero al n-
ésimo y dividir por n.
Esta fórmula es adecuada cuando no
hay repetición de datos y la cantidad
de ellos es pequeña.
5. Ejemplo de Promedio
Un vendedor de licuados de fruta
consigue fresas, de la misma clase, a
diferente precio al comprar con 5
diferentes distribuidores:
En este caso, se suman todos los
precios y se divide esta suma entre el
total de elementos (precios) que
contribuyen al promedio:
Distribuidor 1 2 3 4 5
Precio(Q/Kg) 28 26 27.3 25.75 27.5
¿Cuál es el precio promedio, pagado
por kilogramo de fresas? Este resultado nos dice que el cliente
pagó 26.91, en promedio, por kilo de
fresas
Promedio 26.91
6. Mediana – Serie de datos impares
Esta es una medida de tendencia
central que se calcula ubicando su
posición en el grupo de datos. Para
calcular esta medida, es obligatorio
ordenar los datos, de menor a
mayor y localizar el dato o datos, que
dividen a la mitad, a la distribución
ordenada. Esto es, el 50% de los
datos queda a la izquierda de ese
valor y el otro 50% queda a la
derecha de este.
Esta medida no se ve afectada por
valores extremos, como la media
aritmética, porque su definición es
posicional y, por lo tanto, es más
justa para valorar el promedio de una
distribución. Su desventaja es que no
puede definirse algebraicamente por
lo que no se utiliza mucho para
análisis más complejos.
Tomando los datos del Ejemplo del
Promedio:
Distribuidor 1 2 3 4 5
Precio(Q/Kg) 28 26 27.3 25.75 27.5
Observamos que nuestra muestra
tiene 5 datos, esto es el tamaño de la
muestra n, entonces calculamos
primero la posición de la mediana
como sigue:
El resultado nos indica que la
mediana es la posición tres de los
datos, ordenados de menor a mayor.
Distribuidor 1 2 3 4 5
Precio(Q/Kg) 25.75 26 27.3 27.5 28
x(n + 1) x(5 + 1)
2 2
P Md = = = 3
Mediana 27.3
7. x(n/2) + x((n/2)+1) x(6/2) + x((6/2)+1)
2 2
PMd = = =
Mediana – Serie de datos pares
Esta es una medida de tendencia
central que se calcula promediando
los valores de las dos posiciones
centrales del grupo de datos. Para
calcular esta medida, es obligatorio
ordenar los datos, de menor a
mayor y localizar los 2 valores de las
posiciones centrales.
Agregando un valor más a la serie de
datos del Ejemplo del Promedio,
encontraremos:
Observamos que nuestra muestra
ahora tiene 6 datos, esto es el tamaño
de la muestra n, entonces calculamos
primero la posición de la mediana
como sigue:
El resultado nos indica que la
mediana es el resultado del promedio
existente entre el valor de la tercera y
cuarta posiciones de la serie de datos.
Distribuidor 1 2 3 4 5 6
Precio (Q/Kg) 25.75 26 26.85 27.3 27.5 28
Distribuidor 1 2 3 4 5 6
Precio (Q/Kg) 28 26 27.3 25.75 27.5 26.85
x(n/2) + x((n/2)+1) 26.85 + 27.3
2 2
P Md = = = 27.075
Mediana 27.075
x(3) + x(4)
2
8. Moda
Se define como el dato que aparece
con mayor frecuencia, esto es, el dato
que más se repite.
Aunque la moda está considerada
como una medida de tendencia
central, no siempre está colocada en
el centro de la distribución. Es más,
podría no haber moda (porque todos
los datos son únicos) o inclusive
haber más de una moda.
Debido a estas características, no es
factible utilizar la moda para hacer
análisis más complejos.
Tomando los datos del Ejemplo del
Promedio, vemos que son datos
únicos, no hay repeticiones, por lo
tanto, la moda no está definida.
Distribuidor 1 2 3 4 5
Precio(Q/Kg) 28 26 27.3 25.75 27.5
En el siguiente ejemplo, donde se le
preguntó la edad a un grupo de 10
niños.
Vemos que 4 de los niños
respondieron tener 8 años, por lo
que es el dato que más se repite,
entonces, podemos tomar como
resultado que 8 es la moda en esta
serie de datos, ya que es el valor que
aparece con mayor frecuencia.
Alúmnos Juan Manuel Samuel María Ana Ingrid Práxedes Alek Sigrid Daniel
Edades 8 9 10 8 8 9 11 12 8 10
9. Moda múltiple o multimodal
Tamañobotón 5 7 9 10 13 14 15 17 20
Cantidadventa 45 28 30 29 30 18 16 16 45
En este caso hay dos modas
porque los botones de tamaño 5
y 20 presentan la misma
frecuencia de venta (45) y los
botones de tamaño 9 y 13
también, con una frecuencia de
venta de (30).
Catalina es empleada en una
mercería y el dueño de esta la
envía a obtener el inventario de
venta de botones blancos. Estos
botones se venden en 9 tamaños
identificados por un número. Ella
registra la siguiente información:
Por esta razón, se concluye que la
serie de datos cuenta con una
moda bimodal o multimodal.
10. TAREA
Fecha de entrega 10-03-2024
• Hoja de trabajo número 3
• Debe imprimir y responder los ejercicios que se presentan.
• Debe entregar el día de la siguiente clase.
• Debe agregar la hoja de retroalimentación al final del trabajo.
11. Valoraciones por Tarea
• Redacción
• Contenido
• Normativa APA vigente que exige la Universidad
• Los trabajos escritos todos debe de contener al final, como última
hoja, la ficha de retroalimentación para el docente.
• Orden, Limpieza, Presentación, Oportunidad de entrega