Sesión de aprendizaje Planifica Textos argumentativo.docx
Estadística y probabilidad I: introducción a la estadística descriptiva
1. ESTADÍSTICA Y PROBABILIDAD I
Versión 1.0 – Julio 29, 2015.
Yovanny Gonzalez
yovannygon@hotmail.com
Departamento de Física y Matemática
Universidad Nacional Experimental Francisco de Miranda
2.
3. ÍNDICE GENERAL
ÍNDICE GENERAL
1 ESTADISTICA DESCRIPTIVA PÁGINA 3
1.1 Introduccion a la Estadistica 3
1.1.1 Definición de la estadística. 3
1.1.2 Importancia de la estadística para la ing. Biomédica 3
1.1.3 Clasificación de la estadística 3
1.1.4 Poblacion y Muestra 4
1.1.5 Dato y Escalas de Medicion Estadistica 4
1.2 Estudio Estadistico 5
1.2.1 Recogida de Datos 5
1.2.2 Organización y representación de datos 6
1.2.3 Análisis de datos 6
1.3 Distribucion de Frecuencia 6
1.3.1 Tipos de Frecuencia 8
1.3.2 Tabla de Distribucion de Frecuencia 8
1.4 Medidas de tendencia central 9
1.4.1 Media 9
1.4.2 Moda 9
1.4.3 Mediana 10
1.5 Metodos Graficos 11
1.5.1 Graficos de barra simple 11
1.5.2 Graficos Lineales 12
1.5.3 Circular o Pastel 12
1.6 Analisis de la Informacion 13
4.
5. 1 Estadistica Descriptiva
1.1 Introduccion a la Estadistica
A continuacion se presenta el contenido de esta primera secion descrito de la siguiente manera. “definicion”,“Importancia de
la Estadistica ”, “Importancia de la Estadistica para la Ing. Biomedica”, “Clasificacion de la Estadistica”, “Poblacion”, “Muestra”,
“Datos” y “Escalas de Medidas”. Informacion de importancia para actividades posteriores.
1.1.1. Definición de la estadística.
Definición 1.1
La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra
representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurren-
cia en forma aleatoria o condicional.
1.1.2. Importancia de la estadística para la ing. Biomédica
Los avances científicos, la inversión en salud y el control de los equipos medicos, no tienen otro objetivo que prolongar y
mejorar la calidad de vida, y atenuar el impacto que tienen las enfermedades sobre los ciudadanos. De tal manera que, LA
ESTADÍSTICA juega un papel de importancia para llevar un control y seguimiento de los equipos medicos en cada centro
asistencial a fin de ordenar la informacion, procesarla de forma confiable y presisa de acuerdo a su funcionalidad, manteni-
miento necesario y asi dar respuesta tomando desiciones en pro de la gestion tegnologica que a bien sea necesario en cada
centro asistencial
1.1.3. Clasificación de la estadística
Estadística Deductiva. Se emplea simplemente para resumir de forma numérica o gráfica un conjunto de datos. Se restringe
a describir los datos que se analizan. Si aplicamos las herramientas ofrecidas por la estadística descriptiva a una muestra,
solo nos limitaremos a describir los datos encontrados en dicha muestra, no se podrá generalizar la información hacia la po-
blación. Estadística Inductiva. La estadística inferencial permite realizar conclusiones o inferencias, basándose en los datos
simplificados y analizados de una muestra hacia la población o universo. Por ejemplo, a partir de una muestra representativa
6. 4 Estadistica Descriptiva
tomada a los habitantes de una ciudad, se podrá inferir la votación de todos los ciudadanos que cumplan los requisitos con
un error de aproximación.
1.1.4. Poblacion y Muestra
Definición 1.2
Poblacion: También llamada universo, es el conjunto de elementos de referencia sobre el que se realizan las observa-
ciones. También es el conjunto sobre el que estamos interesados en obtener conclusiones (inferir). Normalmente es
demasiado grande para poder abarcarla, motivo por el cual se puede hacer necesaria la extracción de una muestra de
ésta.
Definición 1.3
Muestra: Es un subconjunto de una población. Una muestra es representativa cuando los elementos son selecciona-
dos de tal forma que pongan de manifiesto las características de una población. Su característica más importante es
la representatividad.
La selección de los elementos que conforman una muestra pueden ser realizados de forma probabilística o aleatoria
(al azar), o no probabilística
1.1.5. Dato y Escalas de Medicion Estadistica
Definición 1.4
Dato: Un dato estadístico es cada uno de los valores que se ha obtenido al realizar un estudio estadístico.
Definición 1.5
Escala de medicion Estadistica: Se entenderá por medición al proceso de asignar el valor a una variable de un elemen-
to en observación. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón
Clasificacion de las Escalas de medicion:
La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte en la menos informativa de
las escalas de medición.
Los siguientes son ejemplos de variables con este tipo de escala:
• Nacionalidad.
• Uso de anteojos.
• Número de camiseta en un equipo de fútbol.
• Número de Cédula Nacional de Identidad.
7. Estadistica Descriptiva 5
A pesar de que algunos valores son formalmente numéricos, sólo están siendo usados para identificar a los individuos
medidos
La escala ordinal, además de las propiedades de la escala nominal, permite establecer un orden entre los elementos
medidos.
Ejemplos de variables con escala ordinal:
-Preferencia a productos de consumo.
-Etapa de desarrollo de un ser vivo.
-Clasificación de películas por una comisión especializada.
-Madurez de una fruta al momento de comprarla.
La escala de intervalo, además de todas las propiedades de la escala ordinal, hace que tenga sentido calcular diferencias
entre las mediciones.
Los siguientes son ejemplos de variables con esta escala:
-Temperatura de una persona.
-Ubicación en una carretera respecto de un punto de referencia (Kilómetro 85 Ruta 5).
-Sobrepeso respecto de un patrón de comparación.
-Nivel de aceite en el motor de un automóvil medido con una vara graduada.
La escala de razón permite, además de lo de las otras escalas, comparar mediciones mediante un cociente.
Algunos ejemplos de variables con la escala de razón son los siguientes:
-Altura de personas.
-Cantidad de litros de agua consumido por una persona en un día.
-Velocidad de un auto en la carretera.
-Número de goles marcados por un jugador de básquetbol en un partido
1.2 Estudio Estadistico
Constituyen la utilizacion de un conjunto de herramientas y tecnicas estadisticas a fin de recolectar, organizar, resumir y
analizar datos para despues obtener conclusiones a partir de ellos tomar desiciones y solucionar un problema en especifico.
1.2.1. Recogida de Datos
Definición 1.6
El primer paso de toda investigacion estadistica consiste en fijar el conjunto de elementos que queremos estudiar,
que llamaremos poblacion o universo. Cada elemento de la poblacion se denomina individuo o unidad estadistica,
la poblacion puede ser el conjunto de personas de una localidad, las llamadas telefonicas de una localidad, llamare-
mos muestra a un subconjunto limitado extraido de la poblacion, con el objeto de reducir el numero de experiencia.
Cuando una investigacion se realiza a toda la poblacion decimos que estamos realizando un censo (Estadistica Des-
criptiva), pero si recogemos datos de observacion relativa solo a una muestra diremos que estamos realizando una
encuesta o sondeo (Inferencia Estadistica).
8. 6 Estadistica Descriptiva
1.2.2. Organización y representación de datos
Definición 1.7
Presentacion de los Datos. Una vez evaluados los datos, se presentan en cuadros y en graficos estadisticos. La presen-
tacion implica tener la informacion estadistica organizada para proceder al analisis e interpretacion de los resultados
y de los aspectos considerados de la poblacion en estudio.
Definición 1.8
Organizacion de los Datos. Siendo el dato el material que se debe procesar, es decir, la materia prima de la estadística,
el primer paso es entonces la recolección de datos, para lo cual se emplean diferentes técnicas, como la entrevista
personal, el cuestionario, la observación, etc. El segundo paso es la organización y ordenamiento de los datos, lo
que se hace a través de tablas, las cuales pueden ser por medio de una distribución de frecuencias simples o una
distribución de frecuencias con intervalos, en ambos casos agrupando todos aquellos que corresponden a una mismo
dato nominal o variable y expresando en una columna el número de veces que aparece esa variable.
1.2.3. Análisis de datos
El análisis de datos es un proceso de inspeccionar, limpiar y transformar datos con el objetivo de resaltar información útil, lo
que sugiere conclusiones, y apoyo a la toma de decisiones. El análisis de datos tiene múltiples facetas y enfoques, que abarca
diversas técnicas en una variedad de nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales.
1.3 Distribucion de Frecuencia
En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que
indican el número de observaciones en cada categoría.1 Esto proporciona un valor añadido a la agrupación de datos. La
distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada
clase
Definición 1.9
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se repre-
senta por fi. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. igualdad
f 1+ f 2+ f 3+...+ f n = N Para indicar resumidamente estas sumas se utiliza la letra griega
X
(sigma mayúscula) que se lee suma o sumatoria.
X
i=1
fi = N (1.1)
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
9. Estadistica Descriptiva 7
xi fi
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
Total 31
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la segunda anotamos la frecuencia
absoluta.
Definición 1.10
La frecuencia relativaes
El cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.
f r =
f i
n
(1.2)
La suma de las frecuencias relativas es igual a 1
Ejemplo
xi fi fr
27 1 0,032
28 2 0,065
29 6 0,194
30 7 0,226
31 8 0,258
32 3 0,097
33 3 0,097
34 1 0,032
Total 31 1
Definición 1.11
MARCA DE CLASE
Es el punto medio de una clase y se obtiene sumando los límites inferiores (LIA) y superiores de una clase (LSA)y
dividiendo el resultado entre dos. La marca de clase la denotaremos como:
X MoMC =
X i + X s
2
(1.3)
10. 8 Estadistica Descriptiva
Donde: M C = Marca de clase
Xi = Valor real inferior
Xs = Valor real superior
Ejemplo:
xi - xs MC
27 29 28
30 32 31
33 35 34
1.3.1. Tipos de Frecuencia
Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la variable,
la representaremos por ni
Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra
aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para
esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de
la muestra. La denotaremos por fi.
Frecuencia Absoluta Acunulada:
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cua-
litativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de
un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo
representaremos por Ni.
Frecuencia Relativa Acunulada:
Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño
de la muestra, y la denotaremos por Fi.
1.3.2. Tabla de Distribucion de Frecuencia
Definición 1.12
Tabla de Frecuencias:
Es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
11. Estadistica Descriptiva 9
1.4 Medidas de tendencia central
Definición 1.13
Las medidas representan el valor central de los datos, la media, la mediana y la moda. Cada una de estos se usa para
datos agrupados en intervalos de clase.
1.4.1. Media
Definición 1.14
Se calcula multiplicando cada frecuencia absoluta con la marca de clase de cada intevalo, luego se suman los produc-
tos y el resultado se divide entre el numero total de datos. Se denota con la X BARRA
X =
X (f i ∗ MC)
N
(1.4)
Donde: fi=Es la frecuencia absoluta.
MC=Marca de clase.
N= Numero de datos.
1.4.2. Moda
Definición 1.15
Se debe ubicar la clase Modal, es decir va a ser el valor mas alto de la frecuencia abso. Por lo tanto de este punto se va
a comenzar a calcular o a sustituir los valores en la formula. 1.- Limite inf. De la clase modal. 2.- d1= diferencia de la
clase modal menos la anterior. 3.- d2= diferencia de la clase modal menos la posterior 4.- se sustituye y se calcula
Mo = Limin f +
(d1)
di +d2
∗ A (1.5)
Donde:
Lim inf= Limite inferior de la clase medianal.
d1= Diferencia de la clase modal - la anterior a la clase modal.
d2= Diferencia de la clase modal - la post. a la clase modal.
A= Amplitud.
Ejemplo
12. 10 Estadistica Descriptiva
xi - xs lim inf - lim sup fi
27 29 27,5 - 29,5 13
30 32 29,5 - 32,5 20
33 35 32,5 - 35,5 16
Considerando la aplicacion de la formula y los procedimientos a seguir para el calculo se procede de la siguiente manera:
Se selecciona el valor mas alto en la columna de la frecuencia absoluta para ubicar la Frecuencia Modal, lo cual va a
ser el valor de referencia en la tabla para luego proceder a sustituir los valores en la formula de la moda. para el caso de
este ejemplo la frecuencia modal es el fre mod= 20
Se debe calcular d1 y d2, en este caso se utiliza la siguiente formula d1 = f remod − elvaloranter ior = 20 − 13 = 7.
Ahora se calcula d2 de la siguiente manera, d2 = f remod −elvalor poster ior = 20−16 = 4.
Aplicando la formula:
Mo = Limin f +
(d1)
di +d2
∗ A = 29,5+
(7)
7+4
∗3 = 31,40 (1.6)
1.4.3. Mediana
Definición 1.16
Es el valor central de los datos, representa el 50 porciento de los datos a derecha y el 50 porciento de los datos a la
izquierda. Consiste ubicar la clase medianal la cual es punto de partida para sustituir los valores en la formula.
MdóMe = Limin f +
(N/2−F Iant)
f i
∗ A (1.7)
Donde:
N/2= Cociente que permite determinar la clase medianal.
Lim inf= Limite inferior de la clase medianal.
FIant= Frecuencia absoluta acumulada de la clase medianal.
fi=Frecuencia absoluta de la clase medianal.
A= Amplitud.
Ejemplo:
xi - xs lim inf - lim sup fi FI
27 29 27,5 - 29,5 13 13
30 32 29,5 - 32,5 20 33
33 35 32,5 - 35,5 16 49
Considerando la aplicacion de la formula y los procedimientos a seguir para el calculo se procede de la siguiente manera:
Se debe calcular el cociente medianal, con la formula N/2=49/2=24,5
Este valor se debe ubicar en la columna de la FI. Si esta perfecto ese es el valor de la frecuencia medianal, si no esta se
ubica el valor mas alto pero proximo al valor calculado. por lo tanto el valor de la frecuencia medialnal es es el 33.
13. Estadistica Descriptiva 11
Se procede a sustituir los valores en la formula.
MdóMe = Limin f +
(N/2−F Iant)
f i
∗ A = 29,5+
(49/2−13)
20
∗3 = 31,225 (1.8)
1.5 Metodos Graficos
Definición 1.17
Se usan para representar datos cuantitativos que se encuentran organizados en una distribución de frecuencia.
Clasificación:
Graficos de barra simple.
Graficos Lineales.
Graficos circulares.
1.5.1. Graficos de barra simple
Definición 1.18
Considera una barra o rectángulo para cada variable o característica de una variable en un determinado periodo,
dentro de este tipo están:
Histograma de frecuencia. Se definen como rectángulos que tienen por base el intervalo de clase de la distribución de
frecuencia y por altura la frecuencia absoluta correspondiente a cada clase.
Ejemplo:
xi - xs fi
27 29 13
30 32 20
33 35 16
Se deben tomar los valors de xi y xs en el eje X de un plano cartesiano de manera puntual.
Se debe colocar los valores de frecuencia absoluta en le eje Y del plano, segun sea la escala, por lo que la altura del
rectangulo la representa la ¨fi¨
14. 12 Estadistica Descriptiva
1.5.2. Graficos Lineales
Definición 1.19
Son aquellos que resulta de unir mediante líneas una serie de puntos, los cuales se originan haciendo coincidir los
valores de la variables a representar con sus respectivos lapsos o periodos. Entre ellos tenemos:
- Polígono de frecuencia:
Este grafico se caracteriza por que en le eje horizontal van las marcas de clases y en el eje vertical las frecuencia
absolutas.
Ejemplo:
xi - xs MC fi
27 29 28 13
30 32 31 20
33 35 34 16
En el grafico que se muestra a continuacion está constituido por los datos de la tabla anteriormente descrita.
Definición 1.20
- Grafico Polígono de frecuencia acumulada.
En este grafico se colocan en eje vertical las frecuencias absolutas acumuladas y en el eje Horizontal los limites supe-
riores de cada clase:
Ejemplo:
xi - xs lim inf - lim sup fi FI
27 29 27,5 - 29,5 13 13
30 32 29,5 - 32,5 20 33
33 35 32,5 - 35,5 16 49
En el grafico que se muestra a continuacion está constituido por los datos de la tabla anteriormente descrita.
1.5.3. Circular o Pastel
Definición 1.21
Grafico Circulare: Considera a los 360 Grados de la circunferencia como el total a representar de la variable en estudio,
determinando luego el sector que le corresponde a la parte, según la siguiente regla de tres:
360° representan en numero total de datos (n)
Xº representa la fi de cada intervalo.
15. Estadistica Descriptiva 13
X o =
(360∗ f i)
n
(1.9)
Ejemplo:
xi - xs lim inf - lim sup fi GRADOS
27 29 27,5 - 29,5 13 95
30 32 29,5 - 32,5 20 147
33 35 32,5 - 35,5 16 118
En el grafico que se muestra a continuacion está constituido por los datos de la tabla anteriormente descrita.
1.6 Analisis de la Informacion