SlideShare una empresa de Scribd logo
1 de 51
Sesión 1Sesión 1
Conceptos BásicosConceptos Básicos
Estadística en las
organizaciones CD4001
Dr. Jorge Ramírez Medina
Información del cursoInformación del curso
Dr Jorge Ramírez Medina
EGADE Business School
• Trabajo parcial 10
• Tareas 40
• Exámenes rápidos 50
• Total 100
Temario
Dr. Jorge Ramírez Medina
EGADE Business School
Sesión Temas
1 Conceptos Básicos
2 Correlación y Regresión
3 Comparación de medias
4 Pruebas de Hipótesis de dos poblaciones
5 Anova
6 Repaso y evaluación final
Libro de texto
Dr. Jorge Ramírez Medina
EGADE Business School
Texto:
Business Statistics in
practice.
Bowerman, O'Connell,
Murphree.
Contacto
Teléfono: (55) 5864555 ext 2244
Correo: jorge.ramirez@itesm.mx;
mssg: jorge.ramirez@itesm.mx
Skype: Karoshi.Darkside;
Second Life: Karoshi Dezno
Twitter: @KaroshiDezno
Dr. Jorge Ramírez Medina
EGADE Bussines School
Estadística en el mundoEstadística en el mundo
realreal
Dr Jorge Ramírez Medina
EGADE Business School
Tiene que ver con
toma de decisiones
“Hay tres tipos de mentiras: las mentiras, las malditas mentiras
y las estadísticas”
Benjamin Disraeli
“Las cifras no mienten; los mentirosos las imaginan”
Popular
Se ha comprobado que de cada 10 televidentes, el 100% ve
televisión,
Dr Jorge Ramírez Medina
EGADE Business School
Definición de
Estadística
Es la ciencia pura y aplicada que trata
de la recolección, organización,
presentación y análisis de conjuntos de
datos con el fin de obtener
conclusiones o inferencias y establecer
su grado de incertidumbre
Dr Jorge Ramírez Medina
EGADE Business School
Dr Jorge Ramírez Medina
EGADE Business School
Datos Cualitativos
son Etiquetas o nombres que se utilizan para identificarson Etiquetas o nombres que se utilizan para identificar
un atributo de cada elemento.un atributo de cada elemento.
A menudo son conocidos como Datos CategóricosA menudo son conocidos como Datos Categóricos
Utilizan la escala ordinal o nominalUtilizan la escala ordinal o nominal
Pueden ser numéricos o no numéricosPueden ser numéricos o no numéricos
El análisis estadístico con Datos Cualitativos esEl análisis estadístico con Datos Cualitativos es
más reciente y más complejo.más reciente y más complejo.
Dr Jorge Ramírez Medina
EGADE Business School
Los Datos Cuantitativos son valores numéricos queLos Datos Cuantitativos son valores numéricos que
Que indican cuanto o cuántos:Que indican cuanto o cuántos:
discretosdiscretos, si miden cuantos, si miden cuantosdiscretosdiscretos, si miden cuantos, si miden cuantos
continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación
Entre los posibles valores de los DatosEntre los posibles valores de los Datos
continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación
Entre los posibles valores de los DatosEntre los posibles valores de los Datos
Los datos cuantitativos son siempre numéricos.Los datos cuantitativos son siempre numéricos.
Las técnicas estadísticas tradicionalmente se enfocaronLas técnicas estadísticas tradicionalmente se enfocaron
Inicalmente en datos cuantitativos..Inicalmente en datos cuantitativos..
Datos Cuantitativos
Dr Jorge Ramírez Medina
EGADE Business School
CualitativosCualitativos CuantitativosCuantitativos
NuméricosNuméricos NuméricosNuméricosNo numéricosNo numéricos
DatosDatos
NominalNominal OrdinalOrdinal NominalNominal OrdinalOrdinal IntervaloIntervalo RazónRazón
Escalas de mediciónEscalas de medición
Dr Jorge Ramírez Medina
EGADE Business School
Estadística Descriptiva
• Son los métodos tabulares , gráficos y
numéricos utilizados para sumarizar datos.
Dr Jorge Ramírez Medina
EGADE Business School
Estadística Inferencial
El propósito de esta rama es obtener
predicciones de una población con base en
información obtenida de una muestra.
Modelos estadísticos
simples
• Medidas de tendencia Central
– Media, Moda, Mediana
• Medidas de dispersión
– Varianza, Desviación estándar
Dr. Jorge Ramírez Medina
EGADE Business School
Ejemplo Salarios
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Dr. Jorge Ramírez Medina
EGADE Business School
Dr Jorge Ramírez Medina
EGADE Business School
se calcula de la siguiente manera:se calcula de la siguiente manera:
La varianza es el promedio de la diferencia de losLa varianza es el promedio de la diferencia de los
cuadrados entre cada valor de datos y la media.cuadrados entre cada valor de datos y la media.
Para una
muestra
Para una
población
Varianza
( )
1
2
2
−
−Σ
=
n
xx
s i
( )
n
xi
2
2 µ
σ
−Σ
=
NN
Dr Jorge Ramírez Medina
EGADE Business School
Se calcula de la siguiente manera:Se calcula de la siguiente manera:
Para una
muestra
Para una
población
Desviación Estándar
2
ss = σ σ= 2
Dr Jorge Ramírez Medina
EGADE Business School
se calcula como sigue:se calcula como sigue:
Coeficiente de
Variación
El coeficiente of variación indica que tan grande es laEl coeficiente of variación indica que tan grande es la
desviación estándard en relación a la media.desviación estándard en relación a la media.
Para una
muestra
Para una
población
( )%100×
x
s %100





×
µ
σ
Cálculo en el ejemplo
Dr Jorge Ramírez Medina
EGADE Business School
      × = × =   
   
54.74
100 % 100 % 11.15%
490.80
s
x
2
2996.47 54.74s s= = =
La desviaciónLa desviación
estándardestándard
es cerca deles cerca del
11% de la media11% de la media
• Varianza
• Desviación estándar
• Coeficiente de Variación
2
2 ( )
2,996.16
1
ix x
s
n
−
= =
−
∑
Cálculo en excel
Dr Jorge Ramírez Medina
EGADE Business School
Dr Jorge Ramírez Medina
EGADE Business School
Distribuciones de
frecuencia
Dr Jorge Ramírez Medina
EGADE Business School
Analizar los saldos de las tarjetas de los clientes de
un banco. (300 observaciones)
Ejemplo; cuánto gastas?
Dr Jorge Ramírez Medina
EGADE Business School
Histograma
Histograma
0
10
20
30
40
50
60
70
<
249
250-399
400-549
550-699
700-849
850-9991000-11491150-12991300-14491450-1599
Clase
Frecuencia
Distribución Normal
applet_02_v9.exe
Dr Jorge Ramírez Medina
EGADE Business School
Dr Jorge Ramírez Medina
EGADE Business School
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = 0Sesgo = 0
Sesgo
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo =Sesgo = −− .31.31
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = .31Sesgo = .31
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Sesgo = 1.25Sesgo = 1.25
Curtosis
Dr Jorge Ramírez Medina
EGADE Business School
Desviación estándar y
contorno de la distribución
Dr Jorge Ramírez Medina
EGADE Business School
Ejemplo Salarios
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Valor más bajo = 425 1er Cuartil = 445
Mediana = 475
3er Cuartil = 525 Mayor valor = 615
Dr Jorge Ramírez Medina
EGADE Business School
325 400 425 450 475 500 525 550 575 600 645
Q1 = 445 Q3 = 525
Q2 = 475
Diagrama de Caja
• Los bigotes (líneas punteadas) se dibujan del final de la caja a
los valores más grandes y pequeños dentro de los límites
Smallest value
inside limits = 425
Largest value
inside limits = 615
Dr Jorge Ramírez Medina
EGADE Business School
Diagrama de CajaDiagrama de Caja
Sentida Falsa Miserable Neutra
Dr Jorge Ramírez Medina
EGADE Business School
Diagrama de CajaDiagrama de Caja
Dr Jorge Ramírez Medina
EGADE Business School
Histogramas y
Diagramas de Caja
applet_01_v4.exe
Dr Jorge Ramírez Medina
EGADE Business School
El modelo representa el
mundo real?
• Para cuantificar el efecto en la población
seguimos un proceso de cuatro pasos:
1. Generar una hipótesis
2. Recolectar los datos
3. Ajuste del modelo
4. Evaluar el modelo
Dr. Jorge Ramírez Medina
EGADE Business School
Trabajamos en el
área de la probabilidad
Dr. Jorge Ramírez Medina
EGADE Business School
Ronald Fisher, 1925
2 copas, 50%
6 copas, 5%
Confianza del 95%
Trabajamos en el
área de la probabilidad
Dr. Jorge Ramírez Medina
EGADE Business School
T AT T A
AT T A T A
AT T A A T
A
T T A A A
T
T A T T A
A
Estadístico de prueba
• Variación Sistemática
– Variación que puede ser explicada por el
modelo
• Variación NoSistemática
– Variación que no puede ser explicada por el
modelo
Estadístico de prueba = ------------------------
Dr. Jorge Ramírez Medina
EGADE Business School
Variación explicada por el modelo
Variación no explicada por el modelo
Dr Jorge Ramírez Medina
EGADE Business School
Estadística Inferencial
Dr Jorge Ramírez Medina
EGADE Business School
Variable aleatoria
Una variable aleatoria es una descripción numérica
del resultado de un experimento.
Una variable aleatoria discreta puede asumir un
número finito de valores o una secuencia infinita de
Valores.
Una variable aleatoria continua puede asumir
cualquier valor numérico en una intervalo o un
conjunto de intervalos.
Dr Jorge Ramírez Medina
EGADE Business School
Tome x = número de TVs vendidas en la tienda
en un día. x puede tomar 5 valores (0, 1, 2, 3, 4)
Ejemplo: Tiendas de
Todo
Variable aleatoria discreta con un número
finito de valores.
Dr Jorge Ramírez Medina
EGADE Business School
Variable aleatoria discreta con un número
infinito de valores.
Podemos contar los clientes pero no hay un
límite finito de los que puedan llegar.
Tome x = número de clientes que llegan a la tienda
en un día. x puede tomar 5 valores 0, 1, 2, 3, 4…..
Ejemplo: Tiendas de
Todo
Dr Jorge Ramírez Medina
EGADE Business School
Pregunta Random Variable x Type
Tamaño de
La familia
x = Número of dependientes
reportados para el censo
Discreta
Distancia de la
casa a la escuela
x = Distancia en kms. de la
casa a la escuela
Continua
Tener mascota
perros y/o
gatos
x = 1 si no tiene mascota;
= 2 si tiene perro(s) únicamente;
= 3 si tiene gato(s) únicamente;
= 4 si tiene perro(s) y gatos(s)
Discreta
Variables aleatorias
Dr Jorge Ramírez Medina
EGADE Business School
La distribución de probabilidad de una variable
aleatoria describe como las probabilidades están
distribuidas sobre los valores de la variable.
Podemos representar la distribución discreta de
probabilidad con una tabla, una gráfica o una ecuación.
Distribuciones de
probabilidad discretas
Dr Jorge Ramírez Medina
EGADE Business School
La distribución de probabilidad está definida por una función
de probabilidad, f(x), la cuál provee la probabilidad para
cada valor de la variable aleatoria.
Las condiciones requeridas para una función de
Probabilidad discreta son;
ff((xx)) >> 00
ΣΣf(x) = 1f(x) = 1
Distribuciones de
probabilidad discretas
Dr Jorge Ramírez Medina
EGADE Business School
desarrolle una representación tabular de la distribución
de probabilidad de las ventas de TVs
Utilizando los datos de ventas de TV’s
Unidades Número
Vendidas de días
0 80
1 50
2 40
3 10
4 20
200
x f(x)
0 .40
1 .25
2 .20
3 .05
4 .10
1.00
80/200
Distribuciones de
probabilidad discretas
Dr Jorge Ramírez Medina
EGADE Business School
.10
.20
.30
.40
.50
0 1 2 3 4
Valores de la Variable Aleatoria x (ventas de TV)
Probabilidad
Representación gráfica de la distribución de probabilidad
Distribuciones de
probabilidad discretas
Dr Jorge Ramírez Medina
EGADE Business School
Valor Esperado y
VarianzaEl valor esperado, o media, de una variable aleatoria
es una media de su localización.
La varianza resume la variabilidad en los valores de
la variable aleatoria.
La desviación estándar, , está definida como la
raíz cuadrada positiva de la varianza.
Var(x) = σ 2
= Σ(x - µ)2
f(x)
E(x) = µ = Σxf(x)
Dr Jorge Ramírez Medina
EGADE Business School
Valor esperado
Número esperado de TVsNúmero esperado de TVs
vendidas en un día.vendidas en un día.
x f(x) xf(x)
0 .40 .00
1 .25 .25
2 .20 .40
3 .05 .15
4 .10 .40
E(x) = 1.20
Valor Esperado y
Varianza
Dr Jorge Ramírez Medina
EGADE Business School
Varianza y Desviación estándar
0
1
2
3
4
-1.2
-0.2
0.8
1.8
2.8
1.44
0.04
0.64
3.24
7.84
.40
.25
.20
.05
.10
.576
.010
.128
.162
.784
x - µ (x - µ)2
f(x) (x - µ)2
f(x)
Varianza de las ventas diarias = σ 2
= 1.660
x
TVs
al cuadrado
Desviación estándar de las ventas diarias = 1.2884 TVs
Valor esperado y
varianza
Dr Jorge Ramírez Medina
EGADE Business School
Valor Esperado y
Varianza
El valor esperado, o media, de una variable aleatoriaEl valor esperado, o media, de una variable aleatoria
es una media de su localización.es una media de su localización.
La varianza resume la variabilidad en los valores deLa varianza resume la variabilidad en los valores de
la variable aleatoria.la variable aleatoria.
La desviación estándar,La desviación estándar, σσ, está definida como la, está definida como la
raíz cuadrada positiva de la varianza.raíz cuadrada positiva de la varianza.
Var(x) = σ 2
= Σ(x - µ)2
f(x)
E(x) = µ = Σxf(x)
Asignación para
la siguiente sesión
Dr. Jorge Ramírez Medina
EGADE Business School
Fin Sesión Uno

Más contenido relacionado

Destacado (7)

Sesión 06
Sesión 06Sesión 06
Sesión 06
 
S05 ad4001
S05 ad4001S05 ad4001
S05 ad4001
 
SCRM
SCRMSCRM
SCRM
 
S03 AD4001
S03 AD4001S03 AD4001
S03 AD4001
 
S03
S03S03
S03
 
S11 ad5008
S11 ad5008S11 ad5008
S11 ad5008
 
S04 ad4001 v3_s_sb
S04 ad4001 v3_s_sbS04 ad4001 v3_s_sb
S04 ad4001 v3_s_sb
 

Similar a S01 ad4001 ss

Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupadosFercho Dominguez
 
Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupadosFercho Dominguez
 
Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupadosFercho Dominguez
 
Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupadosFercho Dominguez
 
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdfESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdfJohan Delgado Toro
 
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdfESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdfJohan Delgado Toro
 
Sesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptxSesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptxAlexSandovalReyes
 
Sesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptxSesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptxAlexSandovalReyes
 
archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...
archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...
archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...SoniaOrtega58
 
Intro a la epidemio clase 4
Intro a la epidemio clase 4Intro a la epidemio clase 4
Intro a la epidemio clase 4Ariel Aranda
 
Intro a la epidemio clase 4
Intro a la epidemio clase 4Intro a la epidemio clase 4
Intro a la epidemio clase 4Ariel Aranda
 
2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptx2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptxRosibellReniz1
 

Similar a S01 ad4001 ss (20)

S02
S02S02
S02
 
S01 ad4001 ss
S01 ad4001 ssS01 ad4001 ss
S01 ad4001 ss
 
S06 AD4001
S06 AD4001S06 AD4001
S06 AD4001
 
S02 ad4001 ss
S02 ad4001 ssS02 ad4001 ss
S02 ad4001 ss
 
Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupados
 
Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupados
 
Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupados
 
S04
S04S04
S04
 
S04 AD4001
S04 AD4001S04 AD4001
S04 AD4001
 
Ejercicio cinco datos agrupados
Ejercicio cinco datos agrupadosEjercicio cinco datos agrupados
Ejercicio cinco datos agrupados
 
S02 ad4001
S02 ad4001S02 ad4001
S02 ad4001
 
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdfESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
 
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdfESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
ESP. MATEMÁTICA G.J.O- 05-10- 2022-PPT.pdf
 
Sesión 01
Sesión 01 Sesión 01
Sesión 01
 
Sesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptxSesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptx
 
Sesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptxSesión 07 Medidas de Dispersión y Asimetría.pptx
Sesión 07 Medidas de Dispersión y Asimetría.pptx
 
archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...
archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...
archivodiapositiva_202311517462.matematicas para coeficiente de variacion rep...
 
Intro a la epidemio clase 4
Intro a la epidemio clase 4Intro a la epidemio clase 4
Intro a la epidemio clase 4
 
Intro a la epidemio clase 4
Intro a la epidemio clase 4Intro a la epidemio clase 4
Intro a la epidemio clase 4
 
2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptx2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptx
 

Más de Jorge Ramírez (20)

AD4026 BI Sesión 04
AD4026 BI Sesión 04AD4026 BI Sesión 04
AD4026 BI Sesión 04
 
Session 03 Business Intelligence
Session 03 Business IntelligenceSession 03 Business Intelligence
Session 03 Business Intelligence
 
Business Intelligence S02
Business Intelligence S02Business Intelligence S02
Business Intelligence S02
 
AD4026 BI Sesión 01
AD4026 BI Sesión 01AD4026 BI Sesión 01
AD4026 BI Sesión 01
 
S03
S03S03
S03
 
Sesión 01 FZ4013
Sesión 01 FZ4013Sesión 01 FZ4013
Sesión 01 FZ4013
 
Sesión 01 FZ4013
Sesión 01 FZ4013Sesión 01 FZ4013
Sesión 01 FZ4013
 
S11 ad5015
S11 ad5015S11 ad5015
S11 ad5015
 
Sesión 10 AD5015
Sesión 10 AD5015Sesión 10 AD5015
Sesión 10 AD5015
 
Apoyo ejercicio busqueda de-patentes
Apoyo ejercicio busqueda de-patentesApoyo ejercicio busqueda de-patentes
Apoyo ejercicio busqueda de-patentes
 
Introduccion innovacion 2013-ott-cem
Introduccion innovacion 2013-ott-cemIntroduccion innovacion 2013-ott-cem
Introduccion innovacion 2013-ott-cem
 
S04 ad4024 v2
S04 ad4024 v2S04 ad4024 v2
S04 ad4024 v2
 
S06
S06S06
S06
 
Diapositivas de la sesión 04 AD5015
Diapositivas de la sesión 04 AD5015Diapositivas de la sesión 04 AD5015
Diapositivas de la sesión 04 AD5015
 
sesión 03 AD5015
sesión 03 AD5015sesión 03 AD5015
sesión 03 AD5015
 
S05
S05S05
S05
 
S04
S04S04
S04
 
Sesión 02 AD5010
Sesión 02 AD5010Sesión 02 AD5010
Sesión 02 AD5010
 
S04
S04S04
S04
 
S03
S03S03
S03
 

S01 ad4001 ss

  • 1. Sesión 1Sesión 1 Conceptos BásicosConceptos Básicos Estadística en las organizaciones CD4001 Dr. Jorge Ramírez Medina
  • 2. Información del cursoInformación del curso Dr Jorge Ramírez Medina EGADE Business School • Trabajo parcial 10 • Tareas 40 • Exámenes rápidos 50 • Total 100
  • 3. Temario Dr. Jorge Ramírez Medina EGADE Business School Sesión Temas 1 Conceptos Básicos 2 Correlación y Regresión 3 Comparación de medias 4 Pruebas de Hipótesis de dos poblaciones 5 Anova 6 Repaso y evaluación final
  • 4. Libro de texto Dr. Jorge Ramírez Medina EGADE Business School Texto: Business Statistics in practice. Bowerman, O'Connell, Murphree.
  • 5. Contacto Teléfono: (55) 5864555 ext 2244 Correo: jorge.ramirez@itesm.mx; mssg: jorge.ramirez@itesm.mx Skype: Karoshi.Darkside; Second Life: Karoshi Dezno Twitter: @KaroshiDezno Dr. Jorge Ramírez Medina EGADE Bussines School
  • 6. Estadística en el mundoEstadística en el mundo realreal Dr Jorge Ramírez Medina EGADE Business School
  • 7. Tiene que ver con toma de decisiones “Hay tres tipos de mentiras: las mentiras, las malditas mentiras y las estadísticas” Benjamin Disraeli “Las cifras no mienten; los mentirosos las imaginan” Popular Se ha comprobado que de cada 10 televidentes, el 100% ve televisión, Dr Jorge Ramírez Medina EGADE Business School
  • 8. Definición de Estadística Es la ciencia pura y aplicada que trata de la recolección, organización, presentación y análisis de conjuntos de datos con el fin de obtener conclusiones o inferencias y establecer su grado de incertidumbre Dr Jorge Ramírez Medina EGADE Business School
  • 9. Dr Jorge Ramírez Medina EGADE Business School Datos Cualitativos son Etiquetas o nombres que se utilizan para identificarson Etiquetas o nombres que se utilizan para identificar un atributo de cada elemento.un atributo de cada elemento. A menudo son conocidos como Datos CategóricosA menudo son conocidos como Datos Categóricos Utilizan la escala ordinal o nominalUtilizan la escala ordinal o nominal Pueden ser numéricos o no numéricosPueden ser numéricos o no numéricos El análisis estadístico con Datos Cualitativos esEl análisis estadístico con Datos Cualitativos es más reciente y más complejo.más reciente y más complejo.
  • 10. Dr Jorge Ramírez Medina EGADE Business School Los Datos Cuantitativos son valores numéricos queLos Datos Cuantitativos son valores numéricos que Que indican cuanto o cuántos:Que indican cuanto o cuántos: discretosdiscretos, si miden cuantos, si miden cuantosdiscretosdiscretos, si miden cuantos, si miden cuantos continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación Entre los posibles valores de los DatosEntre los posibles valores de los Datos continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación Entre los posibles valores de los DatosEntre los posibles valores de los Datos Los datos cuantitativos son siempre numéricos.Los datos cuantitativos son siempre numéricos. Las técnicas estadísticas tradicionalmente se enfocaronLas técnicas estadísticas tradicionalmente se enfocaron Inicalmente en datos cuantitativos..Inicalmente en datos cuantitativos.. Datos Cuantitativos
  • 11. Dr Jorge Ramírez Medina EGADE Business School CualitativosCualitativos CuantitativosCuantitativos NuméricosNuméricos NuméricosNuméricosNo numéricosNo numéricos DatosDatos NominalNominal OrdinalOrdinal NominalNominal OrdinalOrdinal IntervaloIntervalo RazónRazón Escalas de mediciónEscalas de medición
  • 12. Dr Jorge Ramírez Medina EGADE Business School Estadística Descriptiva • Son los métodos tabulares , gráficos y numéricos utilizados para sumarizar datos.
  • 13. Dr Jorge Ramírez Medina EGADE Business School Estadística Inferencial El propósito de esta rama es obtener predicciones de una población con base en información obtenida de una muestra.
  • 14. Modelos estadísticos simples • Medidas de tendencia Central – Media, Moda, Mediana • Medidas de dispersión – Varianza, Desviación estándar Dr. Jorge Ramírez Medina EGADE Business School
  • 15. Ejemplo Salarios 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 Dr. Jorge Ramírez Medina EGADE Business School
  • 16. Dr Jorge Ramírez Medina EGADE Business School se calcula de la siguiente manera:se calcula de la siguiente manera: La varianza es el promedio de la diferencia de losLa varianza es el promedio de la diferencia de los cuadrados entre cada valor de datos y la media.cuadrados entre cada valor de datos y la media. Para una muestra Para una población Varianza ( ) 1 2 2 − −Σ = n xx s i ( ) n xi 2 2 µ σ −Σ = NN
  • 17. Dr Jorge Ramírez Medina EGADE Business School Se calcula de la siguiente manera:Se calcula de la siguiente manera: Para una muestra Para una población Desviación Estándar 2 ss = σ σ= 2
  • 18. Dr Jorge Ramírez Medina EGADE Business School se calcula como sigue:se calcula como sigue: Coeficiente de Variación El coeficiente of variación indica que tan grande es laEl coeficiente of variación indica que tan grande es la desviación estándard en relación a la media.desviación estándard en relación a la media. Para una muestra Para una población ( )%100× x s %100      × µ σ
  • 19. Cálculo en el ejemplo Dr Jorge Ramírez Medina EGADE Business School       × = × =        54.74 100 % 100 % 11.15% 490.80 s x 2 2996.47 54.74s s= = = La desviaciónLa desviación estándardestándard es cerca deles cerca del 11% de la media11% de la media • Varianza • Desviación estándar • Coeficiente de Variación 2 2 ( ) 2,996.16 1 ix x s n − = = − ∑
  • 20. Cálculo en excel Dr Jorge Ramírez Medina EGADE Business School
  • 21. Dr Jorge Ramírez Medina EGADE Business School Distribuciones de frecuencia
  • 22. Dr Jorge Ramírez Medina EGADE Business School Analizar los saldos de las tarjetas de los clientes de un banco. (300 observaciones) Ejemplo; cuánto gastas?
  • 23. Dr Jorge Ramírez Medina EGADE Business School Histograma Histograma 0 10 20 30 40 50 60 70 < 249 250-399 400-549 550-699 700-849 850-9991000-11491150-12991300-14491450-1599 Clase Frecuencia
  • 24. Distribución Normal applet_02_v9.exe Dr Jorge Ramírez Medina EGADE Business School
  • 25. Dr Jorge Ramírez Medina EGADE Business School RelativeFrequency .05 .10 .15 .20 .25 .30 .35 0 Sesgo = 0Sesgo = 0 Sesgo RelativeFrequency .05 .10 .15 .20 .25 .30 .35 0 Sesgo =Sesgo = −− .31.31 RelativeFrequency .05 .10 .15 .20 .25 .30 .35 0 Sesgo = .31Sesgo = .31 RelativeFrequency .05 .10 .15 .20 .25 .30 .35 0 Sesgo = 1.25Sesgo = 1.25
  • 26. Curtosis Dr Jorge Ramírez Medina EGADE Business School
  • 27. Desviación estándar y contorno de la distribución Dr Jorge Ramírez Medina EGADE Business School
  • 28. Ejemplo Salarios 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 Valor más bajo = 425 1er Cuartil = 445 Mediana = 475 3er Cuartil = 525 Mayor valor = 615 Dr Jorge Ramírez Medina EGADE Business School
  • 29. 325 400 425 450 475 500 525 550 575 600 645 Q1 = 445 Q3 = 525 Q2 = 475 Diagrama de Caja • Los bigotes (líneas punteadas) se dibujan del final de la caja a los valores más grandes y pequeños dentro de los límites Smallest value inside limits = 425 Largest value inside limits = 615 Dr Jorge Ramírez Medina EGADE Business School
  • 30. Diagrama de CajaDiagrama de Caja Sentida Falsa Miserable Neutra Dr Jorge Ramírez Medina EGADE Business School
  • 31. Diagrama de CajaDiagrama de Caja Dr Jorge Ramírez Medina EGADE Business School
  • 32. Histogramas y Diagramas de Caja applet_01_v4.exe Dr Jorge Ramírez Medina EGADE Business School
  • 33. El modelo representa el mundo real? • Para cuantificar el efecto en la población seguimos un proceso de cuatro pasos: 1. Generar una hipótesis 2. Recolectar los datos 3. Ajuste del modelo 4. Evaluar el modelo Dr. Jorge Ramírez Medina EGADE Business School
  • 34. Trabajamos en el área de la probabilidad Dr. Jorge Ramírez Medina EGADE Business School Ronald Fisher, 1925 2 copas, 50% 6 copas, 5% Confianza del 95%
  • 35. Trabajamos en el área de la probabilidad Dr. Jorge Ramírez Medina EGADE Business School T AT T A AT T A T A AT T A A T A T T A A A T T A T T A A
  • 36. Estadístico de prueba • Variación Sistemática – Variación que puede ser explicada por el modelo • Variación NoSistemática – Variación que no puede ser explicada por el modelo Estadístico de prueba = ------------------------ Dr. Jorge Ramírez Medina EGADE Business School Variación explicada por el modelo Variación no explicada por el modelo
  • 37. Dr Jorge Ramírez Medina EGADE Business School Estadística Inferencial
  • 38. Dr Jorge Ramírez Medina EGADE Business School Variable aleatoria Una variable aleatoria es una descripción numérica del resultado de un experimento. Una variable aleatoria discreta puede asumir un número finito de valores o una secuencia infinita de Valores. Una variable aleatoria continua puede asumir cualquier valor numérico en una intervalo o un conjunto de intervalos.
  • 39. Dr Jorge Ramírez Medina EGADE Business School Tome x = número de TVs vendidas en la tienda en un día. x puede tomar 5 valores (0, 1, 2, 3, 4) Ejemplo: Tiendas de Todo Variable aleatoria discreta con un número finito de valores.
  • 40. Dr Jorge Ramírez Medina EGADE Business School Variable aleatoria discreta con un número infinito de valores. Podemos contar los clientes pero no hay un límite finito de los que puedan llegar. Tome x = número de clientes que llegan a la tienda en un día. x puede tomar 5 valores 0, 1, 2, 3, 4….. Ejemplo: Tiendas de Todo
  • 41. Dr Jorge Ramírez Medina EGADE Business School Pregunta Random Variable x Type Tamaño de La familia x = Número of dependientes reportados para el censo Discreta Distancia de la casa a la escuela x = Distancia en kms. de la casa a la escuela Continua Tener mascota perros y/o gatos x = 1 si no tiene mascota; = 2 si tiene perro(s) únicamente; = 3 si tiene gato(s) únicamente; = 4 si tiene perro(s) y gatos(s) Discreta Variables aleatorias
  • 42. Dr Jorge Ramírez Medina EGADE Business School La distribución de probabilidad de una variable aleatoria describe como las probabilidades están distribuidas sobre los valores de la variable. Podemos representar la distribución discreta de probabilidad con una tabla, una gráfica o una ecuación. Distribuciones de probabilidad discretas
  • 43. Dr Jorge Ramírez Medina EGADE Business School La distribución de probabilidad está definida por una función de probabilidad, f(x), la cuál provee la probabilidad para cada valor de la variable aleatoria. Las condiciones requeridas para una función de Probabilidad discreta son; ff((xx)) >> 00 ΣΣf(x) = 1f(x) = 1 Distribuciones de probabilidad discretas
  • 44. Dr Jorge Ramírez Medina EGADE Business School desarrolle una representación tabular de la distribución de probabilidad de las ventas de TVs Utilizando los datos de ventas de TV’s Unidades Número Vendidas de días 0 80 1 50 2 40 3 10 4 20 200 x f(x) 0 .40 1 .25 2 .20 3 .05 4 .10 1.00 80/200 Distribuciones de probabilidad discretas
  • 45. Dr Jorge Ramírez Medina EGADE Business School .10 .20 .30 .40 .50 0 1 2 3 4 Valores de la Variable Aleatoria x (ventas de TV) Probabilidad Representación gráfica de la distribución de probabilidad Distribuciones de probabilidad discretas
  • 46. Dr Jorge Ramírez Medina EGADE Business School Valor Esperado y VarianzaEl valor esperado, o media, de una variable aleatoria es una media de su localización. La varianza resume la variabilidad en los valores de la variable aleatoria. La desviación estándar, , está definida como la raíz cuadrada positiva de la varianza. Var(x) = σ 2 = Σ(x - µ)2 f(x) E(x) = µ = Σxf(x)
  • 47. Dr Jorge Ramírez Medina EGADE Business School Valor esperado Número esperado de TVsNúmero esperado de TVs vendidas en un día.vendidas en un día. x f(x) xf(x) 0 .40 .00 1 .25 .25 2 .20 .40 3 .05 .15 4 .10 .40 E(x) = 1.20 Valor Esperado y Varianza
  • 48. Dr Jorge Ramírez Medina EGADE Business School Varianza y Desviación estándar 0 1 2 3 4 -1.2 -0.2 0.8 1.8 2.8 1.44 0.04 0.64 3.24 7.84 .40 .25 .20 .05 .10 .576 .010 .128 .162 .784 x - µ (x - µ)2 f(x) (x - µ)2 f(x) Varianza de las ventas diarias = σ 2 = 1.660 x TVs al cuadrado Desviación estándar de las ventas diarias = 1.2884 TVs Valor esperado y varianza
  • 49. Dr Jorge Ramírez Medina EGADE Business School Valor Esperado y Varianza El valor esperado, o media, de una variable aleatoriaEl valor esperado, o media, de una variable aleatoria es una media de su localización.es una media de su localización. La varianza resume la variabilidad en los valores deLa varianza resume la variabilidad en los valores de la variable aleatoria.la variable aleatoria. La desviación estándar,La desviación estándar, σσ, está definida como la, está definida como la raíz cuadrada positiva de la varianza.raíz cuadrada positiva de la varianza. Var(x) = σ 2 = Σ(x - µ)2 f(x) E(x) = µ = Σxf(x)
  • 50. Asignación para la siguiente sesión Dr. Jorge Ramírez Medina EGADE Business School

Notas del editor

  1. Modelos Estadísticos: Poner el caso del puente. Pp 2 Libro Discovering Statistics Using SPSS. Comentar cuando el modelo ajusta o no ajusta. Los datos representan al fenómeno o población del mundo real lo más cerca posible. Buen ajuste, ajuste moderado o ajuste pobre. Además de las reformas ya presentadas en el Congreso, es decir, la reforma laboral y la de educación, pensamos que el año que viene se podría empujar reformas en el ámbito fiscal y de seguridad social, principalmente. Hacia delante, podríamos ver también la aprobación de una reforma energética orientada a gas natural y gas lutita ( shale gas ). Esto podría incrementar en 1.75 puntos porcentuales el PIB potencial de largo plazo, lo que significaría un incremento de 3% a 4.75%, de acuerdo a nuestras estimaciones. Esto significa que a partir de 2014, México podría estar viendo tasas de crecimiento en torno al 5% anual Durante el último trimestre de 2012 las presiones inflacionarias se han reducido significativamente. En particular, destaca la caída de las tarifas de servicio de telefonía móvil, que acumulan una caída de 43.5% en lo que va del año, lo que ha permitido que la inflación de servicios se ubique en niveles de 1.7% anual en noviembre. factores que podrían afectar el desempeño de los precios en 2013 Aumento de los precios públicos : la Ley de Ingresos 2013, aprobada por el Congreso, no contiene ninguna revisión sustancial a las tasas impositivas ni a los precios públicos en general. Sin embargo, es posible que veamos incrementos al desliz del precio de la gasolina. En 2012, el gobierno mantuvo un desliz de nueve centavos por litro lo que no fue suficiente como para compensar por el diferencial de precios internos con la referencia en Estados Unidos (2 pesos por litro en promedio). En este contexto, el gobierno ha tenido que destinar 167.1 miles de millones de pesos a subsidiar este diferencial Efectos base : La inflación durante abril y mayo de 2012 fue excepcionalmente baja, apoyada por la entrada en vigor de los descuentos de verano en las tarifas eléctricas, De acuerdo a nuestros estimados, la inflación en abril de 2013 podría incrementarse hasta 4.2% anual del 3.75 que estamos previendo para finales del año (ver gráfico abajo a la derecha). Cambio de metodología en el cálculo del INPC : el INEGI ha hecho algunas consultas con respecto a un cambio de metodología en el cálculo del INPC con el fin de reflejar los resultados de la última Encuesta Nacional de Ingreso Gasto de los Hogares (ENIGH), levantada en 2010. Entre los cambios más significativos está el peso que podrían tener las tarifas eléctricas (actualmente 3.6% del total), que podría reducirse a la mitad como resultado de cambios en la medición del gasto de las familias en este rubro.
  2. 1.1 Explicar el significado de la estadística y su relación con el proceso de toma de decisiones. Efectos del Peje; encabezados de algunos diarios Tasas de desempleo % Valor de dólar Salario mínimo de un profesionista A las representaciones numéricas se les llama estadísticas. Casi todos usamos los conceptos estadísticos en diferentes facetas de nuestra vida; al abrir regadera y probar temperatura del regadera, decidir que cereal comprar. Las empresas enfrentan problemas similares: Kellog debe asegurarse que la cantidad promedio en cada paquete de cereal cumpla con las especificaciones, pasar hacerlo selecciona muestras periódicas. El peje puede; Que se cuente voto por voto Salir detener a 10 personas y preguntarles por quién votaron Selecciona en forma aleatoria 2000 electores, hablar con ellos y en base a esta selección realizar el cálculo de los que votaron por él. En este curso mostraremos porqué la 3ª es la mejor opción Abusos estadística: El promedio puede no representar la totalidad de los datos. Ejemplo de promedio de 5 salarios. $10,$15, 20$, $25, $1000 -&gt; promedio $214 Diagrama de impuestos (más dble) How to Lie with statistics. Darrel Huff.
  3. Estadística tiene 2 significados: Uso común información numérica La ciencia que se ocupa de recolectar, organizar , presentar, analizar e interpretar datos para ayudar en la toma de desiciones más efectiva. Preguntar pára que usan estadística en tu empresa
  4. Data can be further classified as being qualitative or quantitative. The statistical analysis that is appropriate depends on whether the data for the variable are qualitative or quantitative.
  5. In general, there are more alternatives for statistical analysis when the data are quantitative.
  6. http://onlinestatbook.com/2/introduction/measurement_demo.html Se encuentra que la marca 1 es más dulce que la 2 con 30-36-43-57-75-79 (ver promedios) 4- Sex, Race, and Teacher effectiveness are qualitative Age, Number of hours, and Calificación promedio are quantitative 5- Sex: nominal Race: nominal Age: ratio Number of hours: ratio Grade point average: ratio Teacher effectiveness: ordinal
  7. No rebasa el conocimiento que aportan los mismos datos Hace uso de gráficas, tablas y diagramas que muestran los datos y facilitan su interpretación Estadística deductiva (general a lo particular)
  8. – Rebasa el contenido de los datos-. Population . the set of all elements of interest in a particular study Sample . a subset of the population Inferencia estadística . the process of using data obtained from a sample to make estimates and test hypotheses about the characteristics of a population Census . collecting data for a population Sample survey . collecting data for a sample A population is a collection of all possible individuals, objects, or measurements of interest. A sample is a portion, or part, of the population of interest
  9. Hacer el ejercicio de lo que se gana en una empresa. Mejor medida la Moda Hablar sobre fórmula de desviación estándar. Desviación= Sum(observado-modelo)^2
  10. Pago mucho o poco?.... Ver que queden en el rango de la media. Hablar de dispersión aquí.
  11. The variance is a measure of variability that utilizes all the data. It is based on the difference between the value ofeach observation ( xi ) and the mean ( for a sample, m for a population). Mencionar en este momento COVARIANZA y coeficiente de covarioación , sólo mencionar r= Sxy/SxSy
  12. The standard deviation of a data set is the positive square root of the variance. It is measured in the same units as the data , making it more easily interpreted than the variance.
  13. Comentar sobre el error estándar (en muestreo)
  14. Bajar archivo Saldo en tarjetas de crédito
  15. The most common numerical descriptive statistic is the average (or mean ). Gasto promedio, based on the 300 observaciones, is $753.68 (found by summing the 300 credit card’s balance and then dividing by 300).
  16. Hay dos formas en las cuales la distribución se puede desviar de la normal; Falta de simetría : Skewness (sesgo) Falta de : Curtosos
  17. An important measure of the shape of a distribution is called skewness . The formula for computing skewness for a data set is somewhat complex. Skewness can be easily computed using statistical software. -------------------------------------------------------------------------------------- Symmetric (not skewed) Skewness is zero. Mean and median are equal. -------------------------------------------------------- Moderately Skewed Left -.31 Skewness is negative. Mean will usually be less than the median. ------------------------------------------------------------------------------- Moderately Skewed Right .31 Skewness is positive. Mean will usually be more than the median. ------------------------------------------------------------------------------ Highly Skewed Right 1.25 Skewness is positive (often above 1.0). Mean will usually be more than the median. ------------------------------------------------------------------------------
  18. El  coeficiente de  curtosis  mide cuan &apos;puntiaguda&apos; es una distribución respecto de un estándar. Este estándar es una forma acampanada denominada &apos;normal&apos;, y corresponde a una curva de gran importancia en estadística. http://www.spssfree.com/spss/analisis3.html Una curva Mesocúrtica tiene un Coeficiente de Curtosis  cercano  a cero. Una Leptocúrtica, un valor notoriamente mayor que cero y una Platicúrtica valores menores que cero.
  19. http://www.shodor.org/interactivate/activities/NormalDistribution/
  20. Pago mucho o poco?.... Ver que queden en el rango de la media. Hablar de dispersión aquí. Percentiles: p por ciento de los observaciones son menores o iguales a este valor 1er cuartil=(25/100)*70= 17.5= 18. (se redondea siempre hacia arriba) =&gt; valor de la 18ª posición = 445 3er cuartil= (75/100)*70= 52.5 = 53. =&gt; valor de la 53ª posición = 525
  21. ***** ojo Laboratorio 02 “Relating Histograms and Box and Whisper Plots******** A box is drawn with its ends located at the first and third quartiles. A vertical line is drawn in the box at the location of the median (second quartile). Limits are located (not drawn) using the interquartile range (IQR). Data outside these limits are considered outliers The locations of each outlier is shown with the symbol * The lower limit is located 1.5(IQR) below Q 1. Lower Limit: Q1 - 1.5(IQR) = 445 - 1.5(80) = 325 The upper limit is located 1.5(IQR) above Q 3 Upper Limit: Q3 + 1.5(IQR) = 525 + 1.5(80) = 645 There are no outliers (values less than 325 or greater than 645) in the apartment rent data.
  22. Dale Carnegie dijo que la sonrisa ayuda a ganar amigos e influir sobre las personas. La investigación sobre los efectos de la sonrisa ha apoyado esto y demostrado que una persona que sonríe es juzgado como más agradable, atractivo, sincero, alegre y competente que una persona no sonríe. Hay evidencia de que sonreír puede atenuar las sentencias. Este fenómeno se denomina &quot;efecto sonrisa de indulgencia&quot;, fue el foco de un estudio realizado por Marianne LaFrance y Marvin Hecht en 1995. asumir el papel de un miembro de un panel disciplinario universidad y juzgar a un estudiante acusado de hacer trampa. Cada sujeto recibió un archivo que contiene una carta supuestamente enviada por el presidente de la Comisión de Disciplina, un resumen de las pruebas, los antecedentes del sospechoso incluido el rendimiento académico previo y una foto una imagen en color de una las cuatro expresiones faciales, y las escalas de calificación para indicar los juicios. Los jurados respondieron cinco preguntas acerca de la probabilidad de la culpabilidad del sospechoso y de la gravedad de la pena debe ser. Estas preguntas se combinaron en una &quot;puntuación de clemencia&quot;. Cuatro grupos de sujetos fueron probados. Cada grupo vio a uno de los tres tipos de sonrisas o un control neutral-expresión. Los sujetos de una muestra de 136 estudiantes universitarios fueron asignados al azar a las cuatro condiciones con la restricción de que no había un número igual de sujetos (34) en cada grupo. Los tres tipos de sonrisa se ​​ilustran en una página aparte. Estos tipos de sonrisas se han estudiado y se clasifican por Paul Ekman. Las imágenes utilizadas como materiales de estímulo eran fotografías de dos mujeres universitarias de segundo año. Cada muestra se fotografió cada una de las cuatro expresiones faciales.
  23. When comparing two or more groups, it is generally a good idea to start by creating some form of side-by side  boxplots  or quantile plots. These plots reveal important information about the location, spread, and shape of the distribution of scores in each group La gráfica muestra que la sonrisa falsa dio lugar a la mayor indulgencia y la expresión neutra llevó a lo menor indulgencia. La mediana para una sonrisa falsa es más alta que el percentil 75 para la expresión neutral. Las distribuciones no parecen tener mucho sesgo: la media y la mediana son casi iguales y las medianas están a punto a mitad de camino entre los percentiles 25 y 75. Summarizing the results: (a) the average of the three smile conditions is significantly different from the neutral control condition, (b) the three smile conditions are not significantly different from each other, and (c) only the false smile condition is significantly different from the neutral control. Among the possible states of the population are: (a) All three smile conditions are different from the neutral condition and (b) Only the false-smile condition is different from the neutral condition. The former possibility appears more likely than the latter because there were at least hints of differences between the felt and neutral conditions and between the miserable and neutral conditions whereas there was no evidence of differences among the three smile conditions.
  24. Usamos un modelo que represente a la población. Usualmente los científicos prueban hipótesis: predecir acerca de los parámetros poblacionales. Hipótesis nula. Hipótesis alternativa. Lo que hacemos es probar los datos en el modelo. Si el modelo ajusta: esto es si se explica la mayor parte de la variación, entonces decimos que la hipótesis es verdadera.
  25. Nunca sabemos determinísticamente los resultados, trabajamos probabilísticamente 6 copas, en donde se sirve el té o el azúcar primero
  26. 20 combinaciones . Ver archivo excel C1 C2 C3 C4 C5 C6 1 T T T A A A 2 T T A T A A 3 T T A A T A 4 T T A A A T 5 T A T T A A 6 T A T A T A 7 T A T A A T 8 T A A T T A 9 T A A T A T 10 T A A A T T 11 A T T T A A 12 A T T A T A 13 A T T A A T 14 A T A T T A 15 A T A T A T 16 A T A A T T 17 A A T T T A 18 A A T T A T 19 A A T A T T 20 A A A T T T
  27. Como decir que el modelo es una buena representación de la realidad? Recolectamos los datos y estos tendrán una variación. Hat dos tipos de variación: sistemática y Unisistemática El calculo del estadístico dependiendo de la prueba, z, t , chi cuadrada, F Si el estadístico es mayor que uno, nuestro modelo puede explicar mayor variación de la que no puede explicar. A mayor variación que explica el modelo, menor es la probabilidad de que ocurra por casualidad. Cuando esta probabilidad es menor que 0.05 (criterio de Fisher) aceptamos que el modelo nos da la suficiente certeza que explica lo que sucede en el mundo real. Aceptamos la Ha.
  28. – Rebasa el contenido de los datos-. Population . the set of all elements of interest in a particular study Sample . a subset of the population Inferencia estadística . the process of using data obtained from a sample to make estimates and test hypotheses about the characteristics of a population Census . collecting data for a population Sample survey . collecting data for a sample A population is a collection of all possible individuals, objects, or measurements of interest. A sample is a portion, or part, of the population of interest
  29. Hablar de probabilidad aquí Chevalier de Méré, noble francés hace 300 años. Probabilidad de obtener par de 1s en un par de dados Blaise Pascal 1er intento de contestar con su amigo Pierre de Fermat 1650 Pierre-Simon de Laplace 1as obras de probabilidad 1812.Theorie Analytique des Probabilites Probabilidad as a Numerical Measure of the Likelihood of Occurrence Sum P(x) = 1 0&lt;=P(x)&lt;=1 Asignación de probabilidades M clásico M subjetivo M frecuencia relativa TODO es sobre saber contar Hacer primero el ejercicio con 4 alumnos y seleccionar un equipo de 3. 4! / 3!(4-3)! = 4 combinaciones A second useful counting rule enables us to count the number of experimental outcomes when n objects are to be selected from a set of N objects. ¿cuántas combinaciones hay en el melate? (47 6) = 10,737,537 -&gt; en excel combinat(47,6) A second useful counting rule enables us to count the number of experimental outcomes when n objects are to be selected from a set of N objects. En excel. Permutaciones(47,6) -&gt; 7,731,052,560 ¿Cuántas maneras hay de asignar los cuatro primeros lugares de un concurso de creatividad que se verifica en las instalaciones de nuestro instituto, si hay 14 participantes? Solución: Haciendo uso del principio multiplicativo, 14x13x12x11 = 24,024 maneras de asignar los primeros cuatro lugares del concurso Esta solución se debe, a que al momento de asignar el primer lugar tenemos a 14 posibles candidatos, una vez asignado ese lugar nos quedan 13 posibles candidatos para el segundo lugar, luego tendríamos 12 candidatos posibles para el tercer lugar y por último tendríamos 11 candidatos posibles para el cuarto lugar. Luego si N es el total de participantes en el concurso y n es el número de participantes que van a ser premiados, y partiendo de la expresión anterior, entonces. 14x13x12x11= N x (N - 1) x (N - 2) x ………. x (N – n + 1) si la expresión anterior es multiplicada por (N – n)! / (N – n)!, entonces = N x (N –1 ) x (N – 2) x ……… x (N – n + 1)x (N – n)! / (N – n)! = N!/ (N – n)!