SlideShare una empresa de Scribd logo
1 de 10
Guía
Matemática
Para tener éxito en el desarrollo de este nuevo tema, debemos tener en cuenta los conceptos: de
Estadística Descriptiva y Probabilidades, como: Medidas de tendencia central, gráficos de frecuencias,
manejo de la información, probabilidad compuesta, probabilidad total y fórmula de Laplace en el cálculo
de las probabilidades.
En esta Unidad:
Estadística Descriptiva
 Aplicarás conceptos estadísticos: muestra, población y tipos de variables.
 Ordenarás y organizarás la información.
 Analizarás y construirás tablas y gráficos.
 Determinarás medidas de tendencia central: media aritmética, moda y mediana.
 Calcularás medidas de dispersión: rango, desviación estándar y varianza.
 Conocerás e interpretarás las medidas de posición: cuartiles, quintiles, deciles y percentiles.
Estadística Inferencial
 Determinarás la homogeneidad y heterogeneidad de una muestra.
 Compararás distribuciones de distintas muestras de poblaciones dependiendo del tipo de muestreo
aplicado.
 Determinarás y calcularás funciones de probabilidad y distribución de una variable aleatoria discreta.
 Estudiarás la correlación y regresión lineal de distribuciones bidimensionales.
 Reconocerás distribuciones normales y binominales. Y calcularás probabilidades con ellas.
Introducción
Existen diferentes razones por las cuales los profesionales deben conocer los fundamentos de la estadística
como instrumento del trabajo cotidiano. En esta guía se pretende dar a conocer algunas nociones estadísticas que
nos ayudarán a explorar y describir, en un primer momento, nuestros datos.
Poblaciones y Muestras
Francisco Arratia Camus
Página 1
Estadística y Probabilidad
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar resultados de una
muestra a una población. Se estudia en particular a un reducido número de individuos a los que tenemos acceso
con la idea de poder generalizar los hallazgos a la población de la cual esa muestra procede. Este proceso de
inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad.
La población representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser
inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas características determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la población accesible y limitado sobre el que
realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la población). El
individuo es cada uno de los componentes de la población y la muestra. La muestra debe ser representativa de la
población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma
probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar:
a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
b. Como consecuencia del punto anterior ahorraremos costes.
c. Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones
puede ser una tarea inaccesible o imposible de realizar.
d. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones
realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos
que realizar a una población.
e. La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar
los criterios de inclusión y/o exclusión.
Tipos de datos
Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensión arterial
sistólica, etcétera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir,
es decir, asignar valores a las variables incluidas en el estudio. Deberemos además concretar la escala de medida
que aplicaremos a cada variable.
La naturaleza de las observaciones será de gran importancia a la hora de elegir el método estadístico más
apropiado para abordar su análisis. Con este fin, clasificaremos las variables, a grandes rasgos, en dos tipos 3-5
:
variables cuantitativas o variables cualitativas.
a. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse
numéricamente. Las variables cuantitativas pueden ser de dos tipos:
o Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numérico
determinado (edad, peso, talla).
o Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen
tomar solamente valores enteros (número de hijos, número de partos, número de hermanos, etc).
b. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a cada
caso en una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada caso en
uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o
binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificación no es suficiente y se requiere
de un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión, etcétera).
En el proceso de medición de estas variables, se pueden utilizar dos escalas:
Francisco Arratia Camus
Página 2
Estadística y Probabilidad
o Escalas nominales: ésta es una forma de observar o medir en la que los datos se ajustan por
categorías que no mantienen una relación de orden entre sí (color de los ojos, sexo, profesión,
presencia o ausencia de un factor de riesgo o enfermedad, etcétera).
o Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las
categorías (grados de disnea, estadiaje de un tumor, etcétera).
Estadística descriptiva
Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos), procederemos al
análisis descriptivo de los mismos. Para variables categóricas, como el sexo o la estatura, se quiere conocer el
número de casos en cada una de las categorías, reflejando habitualmente el porcentaje que representan del total,
y expresándolo en una tabla de frecuencias.
Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se ha de optar
por un método de análisis distinto, respondiendo a las siguientes preguntas:
a. ¿Alrededor de qué valor se agrupan los datos?
b. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy dispersos?
a. Medidas de tendencia central
Las medidas de centralización vienen a responder a la primera pregunta. La medida más evidente que podemos
calcular para describir un conjunto de observaciones numéricas es su valor medio. La media no es más que la suma
de todos los valores de una variable dividida entre el número total de datos de los que se dispone.
Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de
edad de estos sujetos será de:
Más formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en cuestión, el
valor medio vendrá dado por:
Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es la observación equidistante de
los extremos.
La mediana del ejemplo anterior sería el valor que deja a la mitad de los datos por encima de dicho valor y a la
otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez
60, que es el valor de la mediana.
Si la media y la mediana son iguales, la distribución de la variable es simétrica. La media es muy sensible a la
variación de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios.
Cálculo de la mediana para datos agrupados
Francisco Arratia Camus
Página 3
Estadística y Probabilidad
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la
suma de las frecuencias absolutas .
Es decir tenemos que buscar el intervalo en el que se encuentre .
Li es el límite inferior de la clase donde se encuentra la mediana.
es la semisuma de las frecuencias absolutas.
Fi - 1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Por último, otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo éste el valor de
la variable que presenta una mayor frecuencia.
En el ejemplo anterior el valor que más se repite es 60, que es la moda
Cálculo de la moda para datos agrupados
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi - 1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi + 1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
b. Medidas de dispersión
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión de
los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas, la varianza (S2
) de los datos
es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
aritmética de la distribución.
Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como
unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.
En el ejemplo anterior la varianza sería:
Sx
2
=
La desviación típica (S) es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa
en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en
estadística.
Francisco Arratia Camus
Página 4
Estadística y Probabilidad
Aunque esta fórmula de la desviación típica muestral es correcta, en la práctica, la estadística nos interesa para
realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1.
Por tanto, la medida que se utiliza es la cuasidesviación típica, dada por:
Aunque en muchos contextos se utiliza el término de desviación típica para referirse a ambas expresiones.
En los cálculos del ejercicio previo, la desviación típica muestral, que tiene como denominador n, el valor sería
20.678. A efectos de cálculo lo haremos como n-1 y el resultado seria 21,79.
El haber cambiado el denominador de n por n-1 está en relación al hecho de que esta segunda fórmula es una
estimación más precisa de la desviación estándar verdadera de la población y posee las propiedades que
necesitamos para realizar inferencias a la población.
Cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar la amplitud como
medida de dispersión. La amplitud es la diferencia entre el valor mayor y el menor de la distribución.
Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65.
Como medidas de variabilidad más importantes, conviene destacar algunas características de la varianza y
desviación típica:
• Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están muy alejados de
la media, el numerador de sus fórmulas será grande y la varianza y la desviación típica lo serán.
• Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. Para reducir a la mitad
la desviación típica, la muestra se tiene que multiplicar por 4.
• Cuando todos los datos de la distribución son iguales, la varianza y la desviación típica son iguales a 0.
• Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de valor será
detectado.
Otra medida que se suele utilizar es el coeficiente de variación (CV). Es una medida de dispersión relativa de los
datos y se calcula dividiendo la desviación típica muestral por la media y multiplicando el cuociente por 100. Su
utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o más grupos. Así, por ejemplo, si
tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69,6 kg. y su desviación típica (s) =
10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviación típica
de 21,3. La pregunta sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si comparamos las
desviaciones típicas observamos que la desviación típica de la tensión arterial es mucho mayor; sin embargo, no
podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes
de variación:
CV de la variable peso =
CV de la variable TAS =
A la vista de los resultados, observamos que la variable peso tiene mayor dispersión.
Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre cuando los valores de su
media y mediana están próximos), se usan para describir esa variable su media y desviación típica. En el caso de
distribuciones asimétricas, la mediana y la amplitud son medidas más adecuadas. En este caso, se suelen utilizar
además los cuartiles y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición. El percentil es el valor
de la variable que indica el porcentaje de una distribución que es igual o menor a esa cifra.
Francisco Arratia Camus
Página 5
Estadística y Probabilidad
Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80% del total de
las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del
total de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3).
Cálculo de los cuartiles
1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa cada cuartil mediante la expresión .
Número impar de datos
2, 5, 3, 6, 7, 4, 9
Número par de datos
2, 5, 3, 4, 6, 7, 1, 9
Cálculo de los cuartiles para datos agrupados
En primer lugar buscamos la clase donde se encuentra , en la tabla de las
frecuencias acumuladas.
Li es el límite inferior de la clase donde se encuentra el cuartil.
N es la suma de las frecuencias absolutas.
Fi - 1 es la frecuencia acumulada anterior a la clase del cuartil.
ai es la amplitud de la clase.
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Cálculo de los deciles
En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias
acumuladas.
Li es el límite inferior de la clase donde se encuentra el decil.
N es la suma de las frecuencias absolutas.
Fi - 1 es la frecuencia acumulada anterior a la clase el decil.
ai es la amplitud de la clase.
Francisco Arratia Camus
Página 6
Estadística y Probabilidad
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P5 0 coincide con la mediana.
Cálculo de los percentiles
En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias
acumuladas.
Li es el límite inferior de la clase donde se encuentra el percentil.
N es la suma de las frecuencias absolutas.
Fi - 1 es la frecuencia acumulada anterior a la clase del percentil.
ai es la amplitud de la clase.
Ejercicios
Leer atentamente el siguiente resumen, del artículo de investigación titulado:
Competencias docentes en los profesores de medicina de la Universidad
Michoacana de San Nicolás de Hidalgo
Resumen
Para la identificación de un grupo de competencias docentes básicas en los profesores que se desempeñan en la
licenciatura en medicina en la Facultad de Medicina “Dr. Ignacio Chávez”, objetivo fundamental del presente
trabajo, se utilizaron métodos teóricos y empíricos. Se aplicó una encuesta a una muestra seleccionada de
docentes y alumnos. Se emplearon procedimientos estadísticos para el análisis de los resultados y se elaboraron
tablas. A partir de la identificación de las necesidades de aprendizaje de los profesores estudiados, en relación
con la dirección del proceso enseñanza-aprendizaje y los referentes teóricos sobre el tema, se realizó un análisis
integrador para valorar los datos obtenidos, lo que permitió la caracterización de los docentes objeto de
investigación, en relación con las competencias docentes básicas propias de una gestión formativa pertinente. Se
tomaron en consideración los principios metodológicos más actuales acerca de la formación de recursos humanos
en la educación superior en sentido general y en particular en la educación médica superior.
A partir de este resumen:
a. Define la población.
b. Define la muestra.
c. Define la(s) variable(s) aleatoria(s).
1. Indica que variables son cualitativas y cuales cuantitativas:
1 Comida Favorita.
2 Profesión que te gusta.
3 Número de goles marcados por tu equipo favorito en la última temporada.
4 Número de alumnos de tu Instituto.
5 El color de los ojos de tus compañeros de clase.
6 Coeficiente intelectual de tus compañeros de clase.
2. De las siguientes variables indica cuáles son discretas y cuales continuas.
1 Número de acciones vendidas cada día en la Bolsa.
2Temperaturas registradas cada hora en un observatorio.
3 Período de duración de un automóvil.
Francisco Arratia Camus
Página 7
Estadística y Probabilidad
4 El diámetro de las ruedas de varios coches.
5 Número de hijos de 50 familias.
6 Censo de la población chilena.
3. Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas.
1 La nacionalidad de una persona.
2 Número de litros de agua contenidos en un depósito.
3 Número de libros en un estante de librería.
4 Suma de puntos tenidos en el lanzamiento de un par de dados.
5 La profesión de una persona.
6 El área de las distintas baldosas de un edificio.
4. Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias y dibuja el gráfico más adecuado.
5. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias y dibuja el gráfico más adecuado.
6. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4,
6, 3, 5, 5, 6, 7.
Construir la tabla de distribución de frecuencias y dibuja el gráfico más adecuado.
7. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
fi 8 10 16 14 10 5 2
8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Física.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37,
34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1 Construir la tabla de frecuencias.
2 Dibujar el histograma y el polígono de frecuencias.
9. Sea una distribución estadística que viene dada por la siguiente tabla:
xi 61 64 67 70 73
fi 5 18 42 27 8
Calcular:
1 La moda, mediana y media.
2 El rango, varianza y desviación típica .
Francisco Arratia Camus
Página 8
Estadística y Probabilidad
10. Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide:
1. Calcular su media y su varianza.
2. Si los todos los datos anteriores los multiplicamos por 3, cuál será la nueva media y desviación típica.
11. El resultado de lanzar dos dados 120 veces viene dado por la tabla:
Sumas 2 3 4 5 6 7 8 9 10 11 12
Veces 3 8 9 11 20 19 16 13 11 6 4
1. Calcular la media y la desviación típica .
2. Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ).
12. De esta distribución de frecuencias absolutas acumuladas, calcular:
Edad Fi
[0, 2) 4
[2, 4) 11
[4, 6) 24
[6, 8) 34
[8, 10) 40
1. Media aritmética y desviación típica.
2. ¿Entre qué valores se encuentran las 10 edades centrales?
3. Representar el polígono de frecuencias absolutas acumuladas .
Información recopilada en:
Francisco Arratia Camus
Página 9
Estadística y Probabilidad
• “Estadística Descriptiva” Vitutor 2010 España, 14 de marzo de 2010.
http://www.vitutor.com/estadistica.html
“Estadística descriptiva de los datos“ Pita Fernández S, Pértega Díaz, S. Unidad de Epidemiología Clínica y
Bioestadística. Complexo Hospitalario Universitario de A Coruña (España).
http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp
Francisco Arratia Camus
Página 10
Estadística y Probabilidad

Más contenido relacionado

La actualidad más candente

Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generalesCarlos Franco
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivajennypao39
 
analisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1xanalisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1xHerbert Cosio Dueñas
 
Ccw Bioestadistica Y EpidemiologíA
Ccw   Bioestadistica Y EpidemiologíACcw   Bioestadistica Y EpidemiologíA
Ccw Bioestadistica Y EpidemiologíAguest1c2eca
 
Guía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticasGuía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticasEnrique Navarro
 
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...Mayra Madrid Castillo
 
Medidas de Centralidad y Dispersión
Medidas de Centralidad y Dispersión Medidas de Centralidad y Dispersión
Medidas de Centralidad y Dispersión Paula Diaz
 
Estadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia CentralEstadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia CentralAngel Villalpando
 
Terminos basicos estadistica
Terminos basicos estadisticaTerminos basicos estadistica
Terminos basicos estadisticaagustin rojas
 
TamañO De La Muestra
TamañO De La MuestraTamañO De La Muestra
TamañO De La MuestraAna kristell
 
Estadistica basica I .doc
Estadistica basica I .docEstadistica basica I .doc
Estadistica basica I .docguestbf8866d8
 
Estadistica Repaso
Estadistica RepasoEstadistica Repaso
Estadistica Repasomtamoni
 
Proceso de investigación y análisis de datos
Proceso de investigación y análisis de datosProceso de investigación y análisis de datos
Proceso de investigación y análisis de datosFernando Reyes Baños
 
Estadística: Conceptos básicos
Estadística: Conceptos básicosEstadística: Conceptos básicos
Estadística: Conceptos básicosYris Bettiana
 

La actualidad más candente (20)

Metodología y estadística básicas
Metodología y estadística básicasMetodología y estadística básicas
Metodología y estadística básicas
 
3. estadistica descriptiva
3. estadistica descriptiva3. estadistica descriptiva
3. estadistica descriptiva
 
Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generales
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
analisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1xanalisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1x
 
Ccw Bioestadistica Y EpidemiologíA
Ccw   Bioestadistica Y EpidemiologíACcw   Bioestadistica Y EpidemiologíA
Ccw Bioestadistica Y EpidemiologíA
 
Guía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticasGuía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticas
 
Distribución de frecuencias
Distribución de frecuenciasDistribución de frecuencias
Distribución de frecuencias
 
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
 
Clase 02. analisis descriptivo
Clase 02. analisis descriptivoClase 02. analisis descriptivo
Clase 02. analisis descriptivo
 
Medidas de Centralidad y Dispersión
Medidas de Centralidad y Dispersión Medidas de Centralidad y Dispersión
Medidas de Centralidad y Dispersión
 
3eso quincena11
3eso quincena113eso quincena11
3eso quincena11
 
Estadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia CentralEstadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia Central
 
Terminos basicos estadistica
Terminos basicos estadisticaTerminos basicos estadistica
Terminos basicos estadistica
 
ESTADISTICA
ESTADISTICA ESTADISTICA
ESTADISTICA
 
TamañO De La Muestra
TamañO De La MuestraTamañO De La Muestra
TamañO De La Muestra
 
Estadistica basica I .doc
Estadistica basica I .docEstadistica basica I .doc
Estadistica basica I .doc
 
Estadistica Repaso
Estadistica RepasoEstadistica Repaso
Estadistica Repaso
 
Proceso de investigación y análisis de datos
Proceso de investigación y análisis de datosProceso de investigación y análisis de datos
Proceso de investigación y análisis de datos
 
Estadística: Conceptos básicos
Estadística: Conceptos básicosEstadística: Conceptos básicos
Estadística: Conceptos básicos
 

Similar a Guia 1-estadistica

Bioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíABioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíAPaola Torres
 
Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Elfego Lopez
 
Variables y tipos de Variables
Variables y tipos de Variables Variables y tipos de Variables
Variables y tipos de Variables stefany_90
 
Medidas de Tendencia Central, Posición y Dispersión
Medidas de Tendencia Central, Posición y DispersiónMedidas de Tendencia Central, Posición y Dispersión
Medidas de Tendencia Central, Posición y Dispersiónreynier valor
 
Fundamentos de la Estadística
Fundamentos de la EstadísticaFundamentos de la Estadística
Fundamentos de la EstadísticaJCMENESESV
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadísticaJenny HB
 
Presentación estadistica l
Presentación estadistica lPresentación estadistica l
Presentación estadistica ljouberth24
 
Trabajo de matematicas
Trabajo de matematicasTrabajo de matematicas
Trabajo de matematicasy_m_k
 
Analisis de datos cuantitativos
Analisis de datos cuantitativosAnalisis de datos cuantitativos
Analisis de datos cuantitativosDila0887
 
Términos Básicos en Estadística
Términos Básicos en EstadísticaTérminos Básicos en Estadística
Términos Básicos en Estadísticastefany_90
 
presentacion estadistica
presentacion estadisticapresentacion estadistica
presentacion estadisticaluijo0215
 
Distribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la saludDistribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la saludTiago Alves
 

Similar a Guia 1-estadistica (20)

Descriptiva
DescriptivaDescriptiva
Descriptiva
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Bioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíABioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíA
 
Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15
 
Variables y tipos de Variables
Variables y tipos de Variables Variables y tipos de Variables
Variables y tipos de Variables
 
Estadistica y Probabilidad.
Estadistica y Probabilidad.Estadistica y Probabilidad.
Estadistica y Probabilidad.
 
Medidas de Tendencia Central, Posición y Dispersión
Medidas de Tendencia Central, Posición y DispersiónMedidas de Tendencia Central, Posición y Dispersión
Medidas de Tendencia Central, Posición y Dispersión
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Fundamentos de la Estadística
Fundamentos de la EstadísticaFundamentos de la Estadística
Fundamentos de la Estadística
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadística
 
Presentación estadistica l
Presentación estadistica lPresentación estadistica l
Presentación estadistica l
 
Terminos basicos en estadistica
Terminos basicos en estadisticaTerminos basicos en estadistica
Terminos basicos en estadistica
 
Trabajo de matematicas
Trabajo de matematicasTrabajo de matematicas
Trabajo de matematicas
 
Analisis de datos cuantitativos
Analisis de datos cuantitativosAnalisis de datos cuantitativos
Analisis de datos cuantitativos
 
EstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicosEstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicos
 
Bioestadistica 2.2
Bioestadistica 2.2Bioestadistica 2.2
Bioestadistica 2.2
 
Términos Básicos en Estadística
Términos Básicos en EstadísticaTérminos Básicos en Estadística
Términos Básicos en Estadística
 
presentacion estadistica
presentacion estadisticapresentacion estadistica
presentacion estadistica
 
Distribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la saludDistribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la salud
 

Último

FICHA CUENTO BUSCANDO UNA MAMÁ 2024 MAESTRA JANET.pdf
FICHA CUENTO BUSCANDO UNA MAMÁ  2024 MAESTRA JANET.pdfFICHA CUENTO BUSCANDO UNA MAMÁ  2024 MAESTRA JANET.pdf
FICHA CUENTO BUSCANDO UNA MAMÁ 2024 MAESTRA JANET.pdfPaulaAnglicaBustaman
 
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONamelia poma
 
12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHU
12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHU12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHU
12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHUSantiago Perez-Hoyos
 
AEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxAEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxhenarfdez
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfapunteshistoriamarmo
 
POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...
POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...
POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...Agrela Elvixeo
 
1ERGRA~2.PDF EVALUACION DIAGNOSTICA 2024
1ERGRA~2.PDF EVALUACION DIAGNOSTICA 20241ERGRA~2.PDF EVALUACION DIAGNOSTICA 2024
1ERGRA~2.PDF EVALUACION DIAGNOSTICA 2024hlitocs
 
GRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdf
GRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdfGRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdf
GRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdfjorge531093
 
La Evaluacion Formativa SM6 Ccesa007.pdf
La Evaluacion Formativa SM6  Ccesa007.pdfLa Evaluacion Formativa SM6  Ccesa007.pdf
La Evaluacion Formativa SM6 Ccesa007.pdfDemetrio Ccesa Rayme
 
Presentación de la propuesta de clase.pdf
Presentación de la propuesta de clase.pdfPresentación de la propuesta de clase.pdf
Presentación de la propuesta de clase.pdfFranciscoJavierEstra11
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024IES Vicent Andres Estelles
 
Actividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxActividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxpaogar2178
 
COMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIA
COMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIACOMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIA
COMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIAWilian24
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primariaWilian24
 
informe-de-laboratorio-metodos-de-separacion-de-mezclas.pdf
informe-de-laboratorio-metodos-de-separacion-de-mezclas.pdfinforme-de-laboratorio-metodos-de-separacion-de-mezclas.pdf
informe-de-laboratorio-metodos-de-separacion-de-mezclas.pdfAndreaTurell
 
MINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docx
MINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docxMINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docx
MINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docxLorenaHualpachoque
 
Las Preguntas Educativas entran a las Aulas CIAESA Ccesa007.pdf
Las Preguntas Educativas entran a las Aulas CIAESA  Ccesa007.pdfLas Preguntas Educativas entran a las Aulas CIAESA  Ccesa007.pdf
Las Preguntas Educativas entran a las Aulas CIAESA Ccesa007.pdfDemetrio Ccesa Rayme
 
animalesdelaproincia de beunos aires.pdf
animalesdelaproincia de beunos aires.pdfanimalesdelaproincia de beunos aires.pdf
animalesdelaproincia de beunos aires.pdfSofiaArias58
 

Último (20)

FICHA CUENTO BUSCANDO UNA MAMÁ 2024 MAESTRA JANET.pdf
FICHA CUENTO BUSCANDO UNA MAMÁ  2024 MAESTRA JANET.pdfFICHA CUENTO BUSCANDO UNA MAMÁ  2024 MAESTRA JANET.pdf
FICHA CUENTO BUSCANDO UNA MAMÁ 2024 MAESTRA JANET.pdf
 
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
 
12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHU
12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHU12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHU
12 - Planetas Extrasolares - Seminario de las Aulas de la Experiencia UPV/EHU
 
AEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxAEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptx
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...
POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...
POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...
 
1ERGRA~2.PDF EVALUACION DIAGNOSTICA 2024
1ERGRA~2.PDF EVALUACION DIAGNOSTICA 20241ERGRA~2.PDF EVALUACION DIAGNOSTICA 2024
1ERGRA~2.PDF EVALUACION DIAGNOSTICA 2024
 
GRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdf
GRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdfGRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdf
GRUPO 2 - LA GRAN TRIBULACIÓN 25-03-2024 vf.pdf
 
La Evaluacion Formativa SM6 Ccesa007.pdf
La Evaluacion Formativa SM6  Ccesa007.pdfLa Evaluacion Formativa SM6  Ccesa007.pdf
La Evaluacion Formativa SM6 Ccesa007.pdf
 
TÉCNICAS OBSERVACIONALES Y TEXTUALES.pdf
TÉCNICAS OBSERVACIONALES Y TEXTUALES.pdfTÉCNICAS OBSERVACIONALES Y TEXTUALES.pdf
TÉCNICAS OBSERVACIONALES Y TEXTUALES.pdf
 
Presentación de la propuesta de clase.pdf
Presentación de la propuesta de clase.pdfPresentación de la propuesta de clase.pdf
Presentación de la propuesta de clase.pdf
 
Lecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigosLecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigos
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Actividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxActividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docx
 
COMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIA
COMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIACOMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIA
COMPENDIO ECE 5 GRADO MATEMÁTICAS DE PRIMARIA
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
informe-de-laboratorio-metodos-de-separacion-de-mezclas.pdf
informe-de-laboratorio-metodos-de-separacion-de-mezclas.pdfinforme-de-laboratorio-metodos-de-separacion-de-mezclas.pdf
informe-de-laboratorio-metodos-de-separacion-de-mezclas.pdf
 
MINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docx
MINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docxMINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docx
MINEDU BASES JUEGOS ESCOLARES DEPORTIVOS PARADEPORTIVOS 2024.docx
 
Las Preguntas Educativas entran a las Aulas CIAESA Ccesa007.pdf
Las Preguntas Educativas entran a las Aulas CIAESA  Ccesa007.pdfLas Preguntas Educativas entran a las Aulas CIAESA  Ccesa007.pdf
Las Preguntas Educativas entran a las Aulas CIAESA Ccesa007.pdf
 
animalesdelaproincia de beunos aires.pdf
animalesdelaproincia de beunos aires.pdfanimalesdelaproincia de beunos aires.pdf
animalesdelaproincia de beunos aires.pdf
 

Guia 1-estadistica

  • 1. Guía Matemática Para tener éxito en el desarrollo de este nuevo tema, debemos tener en cuenta los conceptos: de Estadística Descriptiva y Probabilidades, como: Medidas de tendencia central, gráficos de frecuencias, manejo de la información, probabilidad compuesta, probabilidad total y fórmula de Laplace en el cálculo de las probabilidades. En esta Unidad: Estadística Descriptiva  Aplicarás conceptos estadísticos: muestra, población y tipos de variables.  Ordenarás y organizarás la información.  Analizarás y construirás tablas y gráficos.  Determinarás medidas de tendencia central: media aritmética, moda y mediana.  Calcularás medidas de dispersión: rango, desviación estándar y varianza.  Conocerás e interpretarás las medidas de posición: cuartiles, quintiles, deciles y percentiles. Estadística Inferencial  Determinarás la homogeneidad y heterogeneidad de una muestra.  Compararás distribuciones de distintas muestras de poblaciones dependiendo del tipo de muestreo aplicado.  Determinarás y calcularás funciones de probabilidad y distribución de una variable aleatoria discreta.  Estudiarás la correlación y regresión lineal de distribuciones bidimensionales.  Reconocerás distribuciones normales y binominales. Y calcularás probabilidades con ellas. Introducción Existen diferentes razones por las cuales los profesionales deben conocer los fundamentos de la estadística como instrumento del trabajo cotidiano. En esta guía se pretende dar a conocer algunas nociones estadísticas que nos ayudarán a explorar y describir, en un primer momento, nuestros datos. Poblaciones y Muestras Francisco Arratia Camus Página 1 Estadística y Probabilidad
  • 2. Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar resultados de una muestra a una población. Se estudia en particular a un reducido número de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la población de la cual esa muestra procede. Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad. La población representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas características determinadas. La muestra es el conjunto menor de individuos (subconjunto de la población accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la población). El individuo es cada uno de los componentes de la población y la muestra. La muestra debe ser representativa de la población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma probabilidad de ser elegido. Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar: a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo. b. Como consecuencia del punto anterior ahorraremos costes. c. Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. d. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos que realizar a una población. e. La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar los criterios de inclusión y/o exclusión. Tipos de datos Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensión arterial sistólica, etcétera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos además concretar la escala de medida que aplicaremos a cada variable. La naturaleza de las observaciones será de gran importancia a la hora de elegir el método estadístico más apropiado para abordar su análisis. Con este fin, clasificaremos las variables, a grandes rasgos, en dos tipos 3-5 : variables cuantitativas o variables cualitativas. a. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse numéricamente. Las variables cuantitativas pueden ser de dos tipos: o Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numérico determinado (edad, peso, talla). o Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (número de hijos, número de partos, número de hermanos, etc). b. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificación no es suficiente y se requiere de un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión, etcétera). En el proceso de medición de estas variables, se pueden utilizar dos escalas: Francisco Arratia Camus Página 2 Estadística y Probabilidad
  • 3. o Escalas nominales: ésta es una forma de observar o medir en la que los datos se ajustan por categorías que no mantienen una relación de orden entre sí (color de los ojos, sexo, profesión, presencia o ausencia de un factor de riesgo o enfermedad, etcétera). o Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las categorías (grados de disnea, estadiaje de un tumor, etcétera). Estadística descriptiva Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos), procederemos al análisis descriptivo de los mismos. Para variables categóricas, como el sexo o la estatura, se quiere conocer el número de casos en cada una de las categorías, reflejando habitualmente el porcentaje que representan del total, y expresándolo en una tabla de frecuencias. Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se ha de optar por un método de análisis distinto, respondiendo a las siguientes preguntas: a. ¿Alrededor de qué valor se agrupan los datos? b. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy dispersos? a. Medidas de tendencia central Las medidas de centralización vienen a responder a la primera pregunta. La medida más evidente que podemos calcular para describir un conjunto de observaciones numéricas es su valor medio. La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone. Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de edad de estos sujetos será de: Más formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en cuestión, el valor medio vendrá dado por: Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es la observación equidistante de los extremos. La mediana del ejemplo anterior sería el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana. Si la media y la mediana son iguales, la distribución de la variable es simétrica. La media es muy sensible a la variación de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios. Cálculo de la mediana para datos agrupados Francisco Arratia Camus Página 3 Estadística y Probabilidad
  • 4. La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas . Es decir tenemos que buscar el intervalo en el que se encuentre . Li es el límite inferior de la clase donde se encuentra la mediana. es la semisuma de las frecuencias absolutas. Fi - 1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase. La mediana es independiente de las amplitudes de los intervalos. Por último, otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo éste el valor de la variable que presenta una mayor frecuencia. En el ejemplo anterior el valor que más se repite es 60, que es la moda Cálculo de la moda para datos agrupados Li es el límite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi - 1 es la frecuencia absoluta inmediatamente inferior a la clase modal. fi + 1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase. b. Medidas de dispersión Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión de los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas, la varianza (S2 ) de los datos es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada. En el ejemplo anterior la varianza sería: Sx 2 = La desviación típica (S) es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en estadística. Francisco Arratia Camus Página 4 Estadística y Probabilidad
  • 5. Aunque esta fórmula de la desviación típica muestral es correcta, en la práctica, la estadística nos interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1. Por tanto, la medida que se utiliza es la cuasidesviación típica, dada por: Aunque en muchos contextos se utiliza el término de desviación típica para referirse a ambas expresiones. En los cálculos del ejercicio previo, la desviación típica muestral, que tiene como denominador n, el valor sería 20.678. A efectos de cálculo lo haremos como n-1 y el resultado seria 21,79. El haber cambiado el denominador de n por n-1 está en relación al hecho de que esta segunda fórmula es una estimación más precisa de la desviación estándar verdadera de la población y posee las propiedades que necesitamos para realizar inferencias a la población. Cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar la amplitud como medida de dispersión. La amplitud es la diferencia entre el valor mayor y el menor de la distribución. Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65. Como medidas de variabilidad más importantes, conviene destacar algunas características de la varianza y desviación típica: • Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están muy alejados de la media, el numerador de sus fórmulas será grande y la varianza y la desviación típica lo serán. • Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. Para reducir a la mitad la desviación típica, la muestra se tiene que multiplicar por 4. • Cuando todos los datos de la distribución son iguales, la varianza y la desviación típica son iguales a 0. • Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de valor será detectado. Otra medida que se suele utilizar es el coeficiente de variación (CV). Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación típica muestral por la media y multiplicando el cuociente por 100. Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o más grupos. Así, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69,6 kg. y su desviación típica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviación típica de 21,3. La pregunta sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si comparamos las desviaciones típicas observamos que la desviación típica de la tensión arterial es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variación: CV de la variable peso = CV de la variable TAS = A la vista de los resultados, observamos que la variable peso tiene mayor dispersión. Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre cuando los valores de su media y mediana están próximos), se usan para describir esa variable su media y desviación típica. En el caso de distribuciones asimétricas, la mediana y la amplitud son medidas más adecuadas. En este caso, se suelen utilizar además los cuartiles y percentiles. Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición. El percentil es el valor de la variable que indica el porcentaje de una distribución que es igual o menor a esa cifra. Francisco Arratia Camus Página 5 Estadística y Probabilidad
  • 6. Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del total de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3). Cálculo de los cuartiles 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresión . Número impar de datos 2, 5, 3, 6, 7, 4, 9 Número par de datos 2, 5, 3, 4, 6, 7, 1, 9 Cálculo de los cuartiles para datos agrupados En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas. Li es el límite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. Fi - 1 es la frecuencia acumulada anterior a la clase del cuartil. ai es la amplitud de la clase. Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana. Cálculo de los deciles En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas. Li es el límite inferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. Fi - 1 es la frecuencia acumulada anterior a la clase el decil. ai es la amplitud de la clase. Francisco Arratia Camus Página 6 Estadística y Probabilidad
  • 7. Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P5 0 coincide con la mediana. Cálculo de los percentiles En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas. Li es el límite inferior de la clase donde se encuentra el percentil. N es la suma de las frecuencias absolutas. Fi - 1 es la frecuencia acumulada anterior a la clase del percentil. ai es la amplitud de la clase. Ejercicios Leer atentamente el siguiente resumen, del artículo de investigación titulado: Competencias docentes en los profesores de medicina de la Universidad Michoacana de San Nicolás de Hidalgo Resumen Para la identificación de un grupo de competencias docentes básicas en los profesores que se desempeñan en la licenciatura en medicina en la Facultad de Medicina “Dr. Ignacio Chávez”, objetivo fundamental del presente trabajo, se utilizaron métodos teóricos y empíricos. Se aplicó una encuesta a una muestra seleccionada de docentes y alumnos. Se emplearon procedimientos estadísticos para el análisis de los resultados y se elaboraron tablas. A partir de la identificación de las necesidades de aprendizaje de los profesores estudiados, en relación con la dirección del proceso enseñanza-aprendizaje y los referentes teóricos sobre el tema, se realizó un análisis integrador para valorar los datos obtenidos, lo que permitió la caracterización de los docentes objeto de investigación, en relación con las competencias docentes básicas propias de una gestión formativa pertinente. Se tomaron en consideración los principios metodológicos más actuales acerca de la formación de recursos humanos en la educación superior en sentido general y en particular en la educación médica superior. A partir de este resumen: a. Define la población. b. Define la muestra. c. Define la(s) variable(s) aleatoria(s). 1. Indica que variables son cualitativas y cuales cuantitativas: 1 Comida Favorita. 2 Profesión que te gusta. 3 Número de goles marcados por tu equipo favorito en la última temporada. 4 Número de alumnos de tu Instituto. 5 El color de los ojos de tus compañeros de clase. 6 Coeficiente intelectual de tus compañeros de clase. 2. De las siguientes variables indica cuáles son discretas y cuales continuas. 1 Número de acciones vendidas cada día en la Bolsa. 2Temperaturas registradas cada hora en un observatorio. 3 Período de duración de un automóvil. Francisco Arratia Camus Página 7 Estadística y Probabilidad
  • 8. 4 El diámetro de las ruedas de varios coches. 5 Número de hijos de 50 familias. 6 Censo de la población chilena. 3. Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas. 1 La nacionalidad de una persona. 2 Número de litros de agua contenidos en un depósito. 3 Número de libros en un estante de librería. 4 Suma de puntos tenidos en el lanzamiento de un par de dados. 5 La profesión de una persona. 6 El área de las distintas baldosas de un edificio. 4. Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de distribución de frecuencias y dibuja el gráfico más adecuado. 5. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla de distribución de frecuencias y dibuja el gráfico más adecuado. 6. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Construir la tabla de distribución de frecuencias y dibuja el gráfico más adecuado. 7. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla: Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120) fi 8 10 16 14 10 5 2 8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Física. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Construir la tabla de frecuencias. 2 Dibujar el histograma y el polígono de frecuencias. 9. Sea una distribución estadística que viene dada por la siguiente tabla: xi 61 64 67 70 73 fi 5 18 42 27 8 Calcular: 1 La moda, mediana y media. 2 El rango, varianza y desviación típica . Francisco Arratia Camus Página 8 Estadística y Probabilidad
  • 9. 10. Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: 1. Calcular su media y su varianza. 2. Si los todos los datos anteriores los multiplicamos por 3, cuál será la nueva media y desviación típica. 11. El resultado de lanzar dos dados 120 veces viene dado por la tabla: Sumas 2 3 4 5 6 7 8 9 10 11 12 Veces 3 8 9 11 20 19 16 13 11 6 4 1. Calcular la media y la desviación típica . 2. Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ). 12. De esta distribución de frecuencias absolutas acumuladas, calcular: Edad Fi [0, 2) 4 [2, 4) 11 [4, 6) 24 [6, 8) 34 [8, 10) 40 1. Media aritmética y desviación típica. 2. ¿Entre qué valores se encuentran las 10 edades centrales? 3. Representar el polígono de frecuencias absolutas acumuladas . Información recopilada en: Francisco Arratia Camus Página 9 Estadística y Probabilidad
  • 10. • “Estadística Descriptiva” Vitutor 2010 España, 14 de marzo de 2010. http://www.vitutor.com/estadistica.html “Estadística descriptiva de los datos“ Pita Fernández S, Pértega Díaz, S. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Universitario de A Coruña (España). http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp Francisco Arratia Camus Página 10 Estadística y Probabilidad