S01 ad4001 ss

Sesión 1Sesión 1
Conceptos BásicosConceptos Básicos
Estadística en las
organizaciones CD4001
Dr. Jorge Ramírez Medina

Información del cursoInformación del curso
Dr Jorge Ramírez Medina
EGADE Business School
• Trabajo parcial 10
• Tareas 40
• Exámenes rápidos 50
• Total 100

Temario
Sesión Temas
1 Conceptos Básicos
2 Correlación y Regresión
3 Comparación de medias
4 Pruebas de Hipótesis de dos poblaciones
5 Anova
6 Repaso y evaluación final

Libro de texto
Texto:
Business Statistics in
practice.
Bowerman, O'Connell,
Murphree.

Contacto
Teléfono: (55) 5864555 ext 2244
Correo: jorge.ramirez@itesm.mx;
mssg: jorge.ramirez@itesm.mx
Skype: Karoshi.Darkside;
Second Life: Karoshi Dezno
Twitter: @KaroshiDezno
EGADE Bussines School

Estadística en el mundoEstadística en el mundo
realreal

Tiene que ver con
toma de decisiones
“Hay tres tipos de mentiras: las mentiras, las malditas mentiras
y las estadísticas”
Benjamin Disraeli
“Las cifras no mienten; los mentirosos las imaginan”
Popular
Se ha comprobado que de cada 10 televidentes, el 100% ve
televisión,

Definición de
Estadística
Es la ciencia pura y aplicada que trata
de la recolección, organización,
presentación y análisis de conjuntos de
datos con el fin de obtener
conclusiones o inferencias y establecer
su grado de incertidumbre

Datos Cualitativos
son Etiquetas o nombres que se utilizan para identificarson Etiquetas o nombres que se utilizan para identificar
un atributo de cada elemento.un atributo de cada elemento.
A menudo son conocidos como Datos CategóricosA menudo son conocidos como Datos Categóricos
Utilizan la escala ordinal o nominalUtilizan la escala ordinal o nominal
Pueden ser numéricos o no numéricosPueden ser numéricos o no numéricos
El análisis estadístico con Datos Cualitativos esEl análisis estadístico con Datos Cualitativos es
más reciente y más complejo.más reciente y más complejo.

Los Datos Cuantitativos son valores numéricos queLos Datos Cuantitativos son valores numéricos que
Que indican cuanto o cuántos:Que indican cuanto o cuántos:
discretosdiscretos, si miden cuantos, si miden cuantosdiscretosdiscretos, si miden cuantos, si miden cuantos
continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación
Entre los posibles valores de los DatosEntre los posibles valores de los Datos
continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación
Entre los posibles valores de los DatosEntre los posibles valores de los Datos
Los datos cuantitativos son siempre numéricos.Los datos cuantitativos son siempre numéricos.
Las técnicas estadísticas tradicionalmente se enfocaronLas técnicas estadísticas tradicionalmente se enfocaron
Inicalmente en datos cuantitativos..Inicalmente en datos cuantitativos..
Datos Cuantitativos

CualitativosCualitativos CuantitativosCuantitativos
NuméricosNuméricos NuméricosNuméricosNo numéricosNo numéricos
DatosDatos
NominalNominal OrdinalOrdinal NominalNominal OrdinalOrdinal IntervaloIntervalo RazónRazón
Escalas de mediciónEscalas de medición

Estadística Descriptiva
• Son los métodos tabulares , gráficos y
numéricos utilizados para sumarizar datos.

Estadística Inferencial
El propósito de esta rama es obtener
predicciones de una población con base en
información obtenida de una muestra.

Modelos estadísticos
simples
• Medidas de tendencia Central
– Media, Moda, Mediana
• Medidas de dispersión
– Varianza, Desviación estándar

Ejemplo Salarios
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615

se calcula de la siguiente manera:se calcula de la siguiente manera:
La varianza es el promedio de la diferencia de losLa varianza es el promedio de la diferencia de los
cuadrados entre cada valor de datos y la media.cuadrados entre cada valor de datos y la media.
Para una
muestra
Para una
población
Varianza
( )
1
2
2
−
−Σ
=
n
xx
s i
( )
n
xi
2
2 µ
σ
−Σ
=
NN

Se calcula de la siguiente manera:Se calcula de la siguiente manera:
Para una
muestra
Para una
población
Desviación Estándar
2
ss = σ σ= 2

se calcula como sigue:se calcula como sigue:
Coeficiente de
Variación
El coeficiente of variación indica que tan grande es laEl coeficiente of variación indica que tan grande es la
desviación estándard en relación a la media.desviación estándard en relación a la media.
Para una
muestra
Para una
población
( )%100×
x
s %100





×
µ
σ

Cálculo en el ejemplo
      × = × =   
   
54.74
100 % 100 % 11.15%
490.80
s
x
2
2996.47 54.74s s= = =
La desviaciónLa desviación
estándardestándard
es cerca deles cerca del
11% de la media11% de la media
• Varianza
• Desviación estándar
• Coeficiente de Variación
2
2 ( )
2,996.16
1
ix x
s
n
−
= =
−
∑

Cálculo en excel

Distribuciones de
frecuencia

Analizar los saldos de las tarjetas de los clientes de
un banco. (300 observaciones)
Ejemplo; cuánto gastas?

Histograma
Histograma
0
10
20
30
40
50
60
70
<
249
250-399
400-549
550-699
700-849
850-9991000-11491150-12991300-14491450-1599
Clase
Frecuencia

Distribución Normal
applet_02_v9.exe

RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = 0Sesgo = 0
Sesgo
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo =Sesgo = −− .31.31
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = .31Sesgo = .31
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = 1.25Sesgo = 1.25

Curtosis

Desviación estándar y
contorno de la distribución

Ejemplo Salarios
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Valor más bajo = 425 1er Cuartil = 445
Mediana = 475
3er Cuartil = 525 Mayor valor = 615

325 400 425 450 475 500 525 550 575 600 645
Q1 = 445 Q3 = 525
Q2 = 475
Diagrama de Caja
• Los bigotes (líneas punteadas) se dibujan del final de la caja a
los valores más grandes y pequeños dentro de los límites
Smallest value
inside limits = 425
Largest value
inside limits = 615

Diagrama de CajaDiagrama de Caja
Sentida Falsa Miserable Neutra

Diagrama de CajaDiagrama de Caja

Histogramas y
Diagramas de Caja
applet_01_v4.exe

El modelo representa el
mundo real?
• Para cuantificar el efecto en la población
seguimos un proceso de cuatro pasos:
1. Generar una hipótesis
2. Recolectar los datos
3. Ajuste del modelo
4. Evaluar el modelo

Trabajamos en el
área de la probabilidad
Ronald Fisher, 1925
2 copas, 50%
6 copas, 5%
Confianza del 95%

Trabajamos en el
área de la probabilidad
T AT T A
AT T A T A
AT T A A T
A
T T A A A
T
T A T T A
A

Estadístico de prueba
• Variación Sistemática
– Variación que puede ser explicada por el
modelo
• Variación NoSistemática
– Variación que no puede ser explicada por el
modelo
Estadístico de prueba = ------------------------
Variación explicada por el modelo
Variación no explicada por el modelo

Estadística Inferencial

Variable aleatoria
Una variable aleatoria es una descripción numérica
del resultado de un experimento.
Una variable aleatoria discreta puede asumir un
número finito de valores o una secuencia infinita de
Valores.
Una variable aleatoria continua puede asumir
cualquier valor numérico en una intervalo o un
conjunto de intervalos.

Tome x = número de TVs vendidas en la tienda
en un día. x puede tomar 5 valores (0, 1, 2, 3, 4)
Ejemplo: Tiendas de
Todo
Variable aleatoria discreta con un número
finito de valores.

Variable aleatoria discreta con un número
infinito de valores.
Podemos contar los clientes pero no hay un
límite finito de los que puedan llegar.
Tome x = número de clientes que llegan a la tienda
en un día. x puede tomar 5 valores 0, 1, 2, 3, 4…..
Ejemplo: Tiendas de
Todo

Pregunta Random Variable x Type
Tamaño de
La familia
x = Número of dependientes
reportados para el censo
Discreta
Distancia de la
casa a la escuela
x = Distancia en kms. de la
casa a la escuela
Continua
Tener mascota
perros y/o
gatos
x = 1 si no tiene mascota;
= 2 si tiene perro(s) únicamente;
= 3 si tiene gato(s) únicamente;
= 4 si tiene perro(s) y gatos(s)
Discreta
Variables aleatorias

La distribución de probabilidad de una variable
aleatoria describe como las probabilidades están
distribuidas sobre los valores de la variable.
Podemos representar la distribución discreta de
probabilidad con una tabla, una gráfica o una ecuación.
Distribuciones de
probabilidad discretas

La distribución de probabilidad está definida por una función
de probabilidad, f(x), la cuál provee la probabilidad para
cada valor de la variable aleatoria.
Las condiciones requeridas para una función de
Probabilidad discreta son;
ff((xx)) >> 00
ΣΣf(x) = 1f(x) = 1
Distribuciones de

desarrolle una representación tabular de la distribución
de probabilidad de las ventas de TVs
Utilizando los datos de ventas de TV’s
Unidades Número
Vendidas de días
0 80
1 50
2 40
3 10
4 20
200
x f(x)
0 .40
1 .25
2 .20
3 .05
4 .10
1.00
80/200
Distribuciones de

.10
.20
.30
.40
.50
0 1 2 3 4
Valores de la Variable Aleatoria x (ventas de TV)
Probabilidad
Representación gráfica de la distribución de probabilidad
Distribuciones de

Valor Esperado y
VarianzaEl valor esperado, o media, de una variable aleatoria
es una media de su localización.
La varianza resume la variabilidad en los valores de
la variable aleatoria.
La desviación estándar, , está definida como la
raíz cuadrada positiva de la varianza.
Var(x) = σ 2
= Σ(x - µ)2
f(x)
E(x) = µ = Σxf(x)

Valor esperado
Número esperado de TVsNúmero esperado de TVs
vendidas en un día.vendidas en un día.
x f(x) xf(x)
0 .40 .00
1 .25 .25
2 .20 .40
3 .05 .15
4 .10 .40
E(x) = 1.20
Valor Esperado y
Varianza

Varianza y Desviación estándar
0
1
2
3
4
-1.2
-0.2
0.8
1.8
2.8
1.44
0.04
0.64
3.24
7.84
.40
.25
.20
.05
.10
.576
.010
.128
.162
.784
x - µ (x - µ)2
f(x) (x - µ)2
f(x)
Varianza de las ventas diarias = σ 2
= 1.660
x
TVs
al cuadrado
Desviación estándar de las ventas diarias = 1.2884 TVs
Valor esperado y
varianza

Valor Esperado y
Varianza
El valor esperado, o media, de una variable aleatoriaEl valor esperado, o media, de una variable aleatoria
es una media de su localización.es una media de su localización.
La varianza resume la variabilidad en los valores deLa varianza resume la variabilidad en los valores de
la variable aleatoria.la variable aleatoria.
La desviación estándar,La desviación estándar, σσ, está definida como la, está definida como la
raíz cuadrada positiva de la varianza.raíz cuadrada positiva de la varianza.
Var(x) = σ 2
= Σ(x - µ)2
f(x)
E(x) = µ = Σxf(x)

Asignación para
la siguiente sesión

S01 ad4001 ss

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (7)

Similar a S01 ad4001 ss

Similar a S01 ad4001 ss (20)

Más de Jorge Ramírez

Más de Jorge Ramírez (20)

S01 ad4001 ss

Notas del editor