Docente: Andrea F. Righetti
Magister en Docencia Universitaria
FACULTAD DE CIENCIAS ECONOMICAS
UNIVERSIDAD NACIONAL DE CORDOBA
UNIVERSIDAD TECNOLOGICA NACIONAL
FACULTAD REGIONAL CÓRDOBA
Probabilidad y Estadística
Unidad 1-3: Resumen presentación
Tablas de Frecuencias, Gráficos y
Descripción
de Datos Estadísticos
¿Qué vamos a ver?
A partir de diferentes actividades de integración:
Repasar, formas de resumir la información mediante tablas de frecuencias,
gráficos
Repasar cuáles son las medidas de posición central y no central, de dispersión
y de forma
Calcular las medidas de posición central , dispersión y forma mediante el uso
de infostat
Interpretar las medias en el contexto del problema planteado
Algunas recomendaciones
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Usted está aquí
Mapa conceptual
Unidad 1
Unidad 2
Unidad 3
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Recordar
Análisis de datos
Gráficos
Medidas
Resumen
Tablas
de
Frecuencias
Estadística descriptiva
Resumen grosor
n 125,0000
Media 1,1786
D.E. 0,0270
Var(n-1) 0,0007
CV 2,2866
Mín 1,1100
Máx 1,2500
Variables
Categóricas Numéricas
Discretas Continuas
TIPOS DE VARIABLES
a) ¿Cuál es la naturaleza de la variable que estamos analizando?
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Resolver
MODA La moda o modo es el valor de la variable
que se presenta con más frecuencia
MEDIANA La mediana es el valor central de los valores de una variable ordenada
de acuerdo a su magnitud, por lo tanto será el valor de la variable que
supera a no más de la mitad de las observaciones de la variable y es
superada por no más de la mitad de las observaciones de la variable.
ESTADISTICA DESCRIPTIVA
La media aritmética o promedio es la suma de todas las
observaciones dividida por el total de datos.
MEDIA ARITMÉTICA
O PROMEDIO
Medidas de Posición Central
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
8
Cálculos de cuartiles en una serie simple
O2=( (7+1)/2=4
Me= 510
338 730 620 810 510 470 380
Datos salarios:
Ordenar de menor a mayor 338 380 470 510 620 730 810
338 380 470 510 620 730 810
n
i
x
=
M(x)
n
1
i
7
3858
=
M(x)
51,14
5
=
M(x)
ELECCIÓN ENTRE LA MEDIA Y LA MEDIANA
La media aritmética es muy sensible a la influencia de unas
pocas observaciones extremas.
La media aritmética se calcula utilizando todos los valores
que toma la variable y por ello contiene más información
que la mediana.
La mediana resiste la influencia de valores extremos.
ESTADISTICA DESCRIPTIVA
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Con Infostat:
El primer cuartil (Q1), la mediana y el tercer cuartil (Q3) al igual que cualquier otro
percentil pueden ser obtenidos mediante el ordenamiento de la muestra y la selección de uno
de los valores observados de acuerdo a su posición o bien estimados a partir de una
aproximación de función de distribución empírica.
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Cuartil 3 Q3 es el valor de la variable que supera a no más del 75% de las
observaciones y es superada por no mas del 25% de las observaciones de la
variable.
Cuartil 2 Q2 es el valor de la variable que supera a no más del 50% de las
observaciones y es superada por no mas del 50% de las observaciones de la
variable.
ESTADISTICA DESCRIPTIVA
Q1 es el valor de la variable que supera a no más del 25% de las observaciones
y es superada por no mas del 75% de las observaciones de la variable
Cuartil 1
Medidas de Posición Central no central- Cuartiles
Medidas de Posición no central- Cuartiles
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
12
Cálculos de cuartiles en una serie simple
O1=1/4(7+1)=2
Q1 = 380
O2=(2/4(7+1)=4
Q2= 510
338 730 620 810 510 470 380
338 380 470 510 620 730 810
Datos salarios:
Ordenar de menor a mayor
338 380 470 510 620 730 810
338 380 470 510 620 730 810
338 380 470 510 620 730 810
O33/4(7+1)=6
Q3= 730
Medidas descriptivas
Organización,
presentación y
Análisis de datos
Gráficos
Medidas
Resumen
Tablas
de
Frecuencias
Estadística descriptiva
Resumen grosor
n 125,0000
Media 1,1786
D.E. 0,0270
Var(n-1) 0,0007
CV 2,2866
Mín 1,1100
Máx 1,2500
Rango
Varianza
Desviación estándar
Coeficiente de variación
Rango Intercuartílico
MEDIDAS DE DISPERSION
MEDIDAS DE FORMA
• Medidas de asimetría
• Medidas de kurtosis
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Medidas de Dispersión
Se denomina rango de un conjunto de observaciones a la diferencia entre el mayor y el
menor valor de la variable.
La varianza es el promedio de las desviaciones con respecto a la media aritmética
elevadas al cuadrado.
La desviación estándar es la raíz cuadrada de la varianza
El coeficiente de variación es una medida de dispersión relativa independiente de la
unidad de medida de los datos.
El rango intercuartílico es igual a la diferencia entre el tercer y el primer cuartil. Es una
medida de variabilidad del 50% central de los datos.
1)
-
(n
)
x
-
i
(x
=
V(x)
n
1
i
2
V(x)
D(x)
100
x
D(x)
=
C.V.
1
3 Q
Q
RI
min
V
max
V
R
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Medidas de Forma
Coeficiente de Asimetría
Ca=g1
Coeficiente de Curtosis
CK=g2
Estas medidas evalúan la situación de los datos con respecto a los ejes verticales (simetría) y con
respecto a los ejes horizontales (kurtosis).
𝑔1 =
𝑥 − 𝑥 3
/𝑛
𝑠3
𝒈2 =
𝑥 − 𝑥
4
/𝑛
𝑠4
− 3
Si 𝒈𝟏 < 0, la distribución es asimétrica izquierda.
Si 𝒈𝟏 = 𝟎, la distribución es simétrica.
Si 𝒈𝟏 > 0, la distribución es asimétrica derecha.
Si 𝒈𝟐 < 0, menor concentración de la distribución (platicúrtica).
Si 𝒈𝟐 = 𝟎, la distribución es mesocúrtica.
Si 𝒈𝟐 > 0, mayor concentración de la distribución (leptocúrtica).
Medidas resumen
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana Q1 Q3 Asimetría Kurtosis
vaqueros 50 2,90 1,20 1,44 41,36 1,00 5,00 3,00 2,00 4,00 -0,10 -0,91
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Con Infostat
n
i
x
=
M(x)
n
1
i
1)
-
(n
)
x
-
i
(x
=
V(x)
n
1
i
2
𝑉 𝑥 =
𝑥𝑖
2
− 𝑛 𝑥2
𝑛
Medidas resumen
Resumen Sueldos
n 7,00
Media 551,14
D.E. 176,42
Var(n-1) 31122,48
Var(n) 26676,41
CV 32,01
Mín 338,00
Máx 810,00
Mediana 510,00
Q1 380,00
Q3 730,00
Suma 3858,00
Suma Cuad.2313044,00
Asimetría 0,34
Kurtosis -1,29
7
3858
=
M(x)
𝑉 𝑥 =
2313044 − 7 ∗ 551,14 2
7
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
𝑉 𝑥 = 26679,56
(n)
)
x
-
i
(x
=
V(x)
n
1
i
2
Con Infostat cálculos
Propiedades Media y Varianza
M(Z)= M (x+15)
M(Z)=M(x)+ 15
M(z)= 551,14+15
M(Z)= 566,14
M(Z)= M (x+x*0,15)
M(Z)= M( x*1,15)
M(Z)= M(X) * 1,15
M(Z)= 551,14*1,15
M(Z)= 633,811
M(Z)= M (x+x*0,15+15)
M(Z)= M(X)*1,15+15
M(z)=648,81
V(Z)= V (x+15)
V(Z)=V(x)
V(z)=26.679,56
V(Z)= V (x+x*0,15)
V(Z)= V( x*1,15)
V(Z)= V(X) * 1,152
V(Z)= 26.679,56*1,152
VZ)= 35.283,74
V(Z)= V (x+x*0,15+15)
V(Z)= V(X)*1,152
V( z)=35.283,74
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Medidas resumen
Resumen salario
n 7,0000
Media 551,1429
D.E. 176,4156
Var(n-1) 31122,4762
Var(n) 26676,4082
CV 32,0091
Mín 338,0000
Máx 810,0000
Mediana 510,0000
Q1 380,0000
Q3 730,0000
Suma 3858,0000
Suma Cuad.2313044,0000
Asimetría 0,3440
Kurtosis -1,2929
Casos de Integración
Unidades 1, 2 y 3
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Practicar uso de
infostat, cargar una
base de datos, obtener
las descriptivas e
interpretar
Presentación
literal
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Respuestas
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Tablas de frecuencias
Variable Clase LI LS MC FA FR FAA FRA
longitud 1 [ 50,00 75,00 ) 62,50 4 0,04 4 0,04
longitud 2 [ 75,00 100,00 ) 87,50 13 0,13 17 0,16
longitud 3 [ 100,00 125,00 ) 112,50 22 0,21 39 0,38
longitud 4 [ 125,00 150,00 ) 137,50 24 0,23 63 0,61
longitud 5 [ 150,00 175,00 ) 162,50 17 0,16 80 0,77
longitud 6 [ 175,00 200,00 ) 187,50 12 0,12 92 0,88
longitud 7 [ 200,00 225,00 ) 212,50 6 0,06 98 0,94
longitud 8 [ 225,00 250,00 ] 237,50 6 0,06 104 1,00
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Medidas resumen
Resumen longitud
n 104,00
Media 142,15
D.E. 43,48
Var(n-1) 1890,27
CV 30,58
Mín 50,00
Máx 250,00
Mediana 136,00
Q1 111,00
Q3 170,00
Suma 14784,00
Suma Cuad.2296300,00
Asimetría 0,44
Kurtosis -0,24
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
10
2000
=
M(x)
𝑉 𝑥 =
𝑥𝑖
2
− 𝑛 𝑥2
𝑛
=
462500 − 10 ∗ 2002
10
𝑉 𝑥
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC
M(Z)= M (x+x*0,15+50)
M(Z)= M(X*1,15)+50
M(z)=137,22*1,1,15+50
207,803
Ejercicio 13
M(Z)= M (x+x*0,43+1500)
M(Z)= M(X*1,43)+M(1500)
M(z)=4304,17*1,43+1500
7654,96
V(Z)= V (x+x*0,43+1500)
V(Z)= V(X)*1,432
V( z)=2704120,61*1,432
5.529656,26
Material elaborado por Andrea F. Righetti en base a material de la cátedra de Probabilidad y Estadística UTN FRC