1. Sesión 1Sesión 1
Conceptos BásicosConceptos Básicos
Estadística en las
organizaciones CD4001
Dr. Jorge Ramírez Medina
2. Información del cursoInformación del curso
Dr Jorge Ramírez Medina
EGADE Business School
• Trabajo parcial 10
• Tareas 40
• Exámenes rápidos 50
• Total 100
3. Temario
Dr. Jorge Ramírez Medina
EGADE Business School
Sesión Temas
1 Conceptos Básicos
2 Correlación y Regresión
3 Comparación de medias
4 Pruebas de Hipótesis de dos poblaciones
5 Anova
6 Repaso y evaluación final
4. Libro de texto
Dr. Jorge Ramírez Medina
EGADE Business School
Texto:
Business Statistics in
practice.
Bowerman, O'Connell,
Murphree.
5. Contacto
Teléfono: (55) 5864555 ext 2244
Correo: jorge.ramirez@itesm.mx;
mssg: jorge.ramirez@itesm.mx
Skype: Karoshi.Darkside;
Second Life: Karoshi Dezno
Twitter: @KaroshiDezno
Dr. Jorge Ramírez Medina
EGADE Bussines School
6. Estadística en el mundoEstadística en el mundo
realreal
Dr Jorge Ramírez Medina
EGADE Business School
7. Tiene que ver con
toma de decisiones
“Hay tres tipos de mentiras: las mentiras, las malditas mentiras
y las estadísticas”
Benjamin Disraeli
“Las cifras no mienten; los mentirosos las imaginan”
Popular
Se ha comprobado que de cada 10 televidentes, el 100% ve
televisión,
Dr Jorge Ramírez Medina
EGADE Business School
8. Definición de
Estadística
Es la ciencia pura y aplicada que trata
de la recolección, organización,
presentación y análisis de conjuntos de
datos con el fin de obtener
conclusiones o inferencias y establecer
su grado de incertidumbre
Dr Jorge Ramírez Medina
EGADE Business School
9. Dr Jorge Ramírez Medina
EGADE Business School
Datos Cualitativos
son Etiquetas o nombres que se utilizan para identificarson Etiquetas o nombres que se utilizan para identificar
un atributo de cada elemento.un atributo de cada elemento.
A menudo son conocidos como Datos CategóricosA menudo son conocidos como Datos Categóricos
Utilizan la escala ordinal o nominalUtilizan la escala ordinal o nominal
Pueden ser numéricos o no numéricosPueden ser numéricos o no numéricos
El análisis estadístico con Datos Cualitativos esEl análisis estadístico con Datos Cualitativos es
más reciente y más complejo.más reciente y más complejo.
10. Dr Jorge Ramírez Medina
EGADE Business School
Los Datos Cuantitativos son valores numéricos queLos Datos Cuantitativos son valores numéricos que
Que indican cuanto o cuántos:Que indican cuanto o cuántos:
discretosdiscretos, si miden cuantos, si miden cuantosdiscretosdiscretos, si miden cuantos, si miden cuantos
continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación
Entre los posibles valores de los DatosEntre los posibles valores de los Datos
continuoscontinuos, si mide cuánto, no existe separación, si mide cuánto, no existe separación
Entre los posibles valores de los DatosEntre los posibles valores de los Datos
Los datos cuantitativos son siempre numéricos.Los datos cuantitativos son siempre numéricos.
Las técnicas estadísticas tradicionalmente se enfocaronLas técnicas estadísticas tradicionalmente se enfocaron
Inicalmente en datos cuantitativos..Inicalmente en datos cuantitativos..
Datos Cuantitativos
11. Dr Jorge Ramírez Medina
EGADE Business School
CualitativosCualitativos CuantitativosCuantitativos
NuméricosNuméricos NuméricosNuméricosNo numéricosNo numéricos
DatosDatos
NominalNominal OrdinalOrdinal NominalNominal OrdinalOrdinal IntervaloIntervalo RazónRazón
Escalas de mediciónEscalas de medición
12. Dr Jorge Ramírez Medina
EGADE Business School
Estadística Descriptiva
• Son los métodos tabulares , gráficos y
numéricos utilizados para sumarizar datos.
13. Dr Jorge Ramírez Medina
EGADE Business School
Estadística Inferencial
El propósito de esta rama es obtener
predicciones de una población con base en
información obtenida de una muestra.
14. Modelos estadísticos
simples
• Medidas de tendencia Central
– Media, Moda, Mediana
• Medidas de dispersión
– Varianza, Desviación estándar
Dr. Jorge Ramírez Medina
EGADE Business School
16. Dr Jorge Ramírez Medina
EGADE Business School
se calcula de la siguiente manera:se calcula de la siguiente manera:
La varianza es el promedio de la diferencia de losLa varianza es el promedio de la diferencia de los
cuadrados entre cada valor de datos y la media.cuadrados entre cada valor de datos y la media.
Para una
muestra
Para una
población
Varianza
( )
1
2
2
−
−Σ
=
n
xx
s i
( )
n
xi
2
2 µ
σ
−Σ
=
NN
17. Dr Jorge Ramírez Medina
EGADE Business School
Se calcula de la siguiente manera:Se calcula de la siguiente manera:
Para una
muestra
Para una
población
Desviación Estándar
2
ss = σ σ= 2
18. Dr Jorge Ramírez Medina
EGADE Business School
se calcula como sigue:se calcula como sigue:
Coeficiente de
Variación
El coeficiente of variación indica que tan grande es laEl coeficiente of variación indica que tan grande es la
desviación estándard en relación a la media.desviación estándard en relación a la media.
Para una
muestra
Para una
población
( )%100×
x
s %100
×
µ
σ
19. Cálculo en el ejemplo
Dr Jorge Ramírez Medina
EGADE Business School
× = × =
54.74
100 % 100 % 11.15%
490.80
s
x
2
2996.47 54.74s s= = =
La desviaciónLa desviación
estándardestándard
es cerca deles cerca del
11% de la media11% de la media
• Varianza
• Desviación estándar
• Coeficiente de Variación
2
2 ( )
2,996.16
1
ix x
s
n
−
= =
−
∑
21. Dr Jorge Ramírez Medina
EGADE Business School
Distribuciones de
frecuencia
22. Dr Jorge Ramírez Medina
EGADE Business School
Analizar los saldos de las tarjetas de los clientes de
un banco. (300 observaciones)
Ejemplo; cuánto gastas?
23. Dr Jorge Ramírez Medina
EGADE Business School
Histograma
Histograma
0
10
20
30
40
50
60
70
<
249
250-399
400-549
550-699
700-849
850-9991000-11491150-12991300-14491450-1599
Clase
Frecuencia
29. 325 400 425 450 475 500 525 550 575 600 645
Q1 = 445 Q3 = 525
Q2 = 475
Diagrama de Caja
• Los bigotes (líneas punteadas) se dibujan del final de la caja a
los valores más grandes y pequeños dentro de los límites
Smallest value
inside limits = 425
Largest value
inside limits = 615
Dr Jorge Ramírez Medina
EGADE Business School
30. Diagrama de CajaDiagrama de Caja
Sentida Falsa Miserable Neutra
Dr Jorge Ramírez Medina
EGADE Business School
33. El modelo representa el
mundo real?
• Para cuantificar el efecto en la población
seguimos un proceso de cuatro pasos:
1. Generar una hipótesis
2. Recolectar los datos
3. Ajuste del modelo
4. Evaluar el modelo
Dr. Jorge Ramírez Medina
EGADE Business School
34. Trabajamos en el
área de la probabilidad
Dr. Jorge Ramírez Medina
EGADE Business School
Ronald Fisher, 1925
2 copas, 50%
6 copas, 5%
Confianza del 95%
35. Trabajamos en el
área de la probabilidad
Dr. Jorge Ramírez Medina
EGADE Business School
T AT T A
AT T A T A
AT T A A T
A
T T A A A
T
T A T T A
A
36. Estadístico de prueba
• Variación Sistemática
– Variación que puede ser explicada por el
modelo
• Variación NoSistemática
– Variación que no puede ser explicada por el
modelo
Estadístico de prueba = ------------------------
Dr. Jorge Ramírez Medina
EGADE Business School
Variación explicada por el modelo
Variación no explicada por el modelo
37. Dr Jorge Ramírez Medina
EGADE Business School
Estadística Inferencial
38. Dr Jorge Ramírez Medina
EGADE Business School
Variable aleatoria
Una variable aleatoria es una descripción numérica
del resultado de un experimento.
Una variable aleatoria discreta puede asumir un
número finito de valores o una secuencia infinita de
Valores.
Una variable aleatoria continua puede asumir
cualquier valor numérico en una intervalo o un
conjunto de intervalos.
39. Dr Jorge Ramírez Medina
EGADE Business School
Tome x = número de TVs vendidas en la tienda
en un día. x puede tomar 5 valores (0, 1, 2, 3, 4)
Ejemplo: Tiendas de
Todo
Variable aleatoria discreta con un número
finito de valores.
40. Dr Jorge Ramírez Medina
EGADE Business School
Variable aleatoria discreta con un número
infinito de valores.
Podemos contar los clientes pero no hay un
límite finito de los que puedan llegar.
Tome x = número de clientes que llegan a la tienda
en un día. x puede tomar 5 valores 0, 1, 2, 3, 4…..
Ejemplo: Tiendas de
Todo
41. Dr Jorge Ramírez Medina
EGADE Business School
Pregunta Random Variable x Type
Tamaño de
La familia
x = Número of dependientes
reportados para el censo
Discreta
Distancia de la
casa a la escuela
x = Distancia en kms. de la
casa a la escuela
Continua
Tener mascota
perros y/o
gatos
x = 1 si no tiene mascota;
= 2 si tiene perro(s) únicamente;
= 3 si tiene gato(s) únicamente;
= 4 si tiene perro(s) y gatos(s)
Discreta
Variables aleatorias
42. Dr Jorge Ramírez Medina
EGADE Business School
La distribución de probabilidad de una variable
aleatoria describe como las probabilidades están
distribuidas sobre los valores de la variable.
Podemos representar la distribución discreta de
probabilidad con una tabla, una gráfica o una ecuación.
Distribuciones de
probabilidad discretas
43. Dr Jorge Ramírez Medina
EGADE Business School
La distribución de probabilidad está definida por una función
de probabilidad, f(x), la cuál provee la probabilidad para
cada valor de la variable aleatoria.
Las condiciones requeridas para una función de
Probabilidad discreta son;
ff((xx)) >> 00
ΣΣf(x) = 1f(x) = 1
Distribuciones de
probabilidad discretas
44. Dr Jorge Ramírez Medina
EGADE Business School
desarrolle una representación tabular de la distribución
de probabilidad de las ventas de TVs
Utilizando los datos de ventas de TV’s
Unidades Número
Vendidas de días
0 80
1 50
2 40
3 10
4 20
200
x f(x)
0 .40
1 .25
2 .20
3 .05
4 .10
1.00
80/200
Distribuciones de
probabilidad discretas
45. Dr Jorge Ramírez Medina
EGADE Business School
.10
.20
.30
.40
.50
0 1 2 3 4
Valores de la Variable Aleatoria x (ventas de TV)
Probabilidad
Representación gráfica de la distribución de probabilidad
Distribuciones de
probabilidad discretas
46. Dr Jorge Ramírez Medina
EGADE Business School
Valor Esperado y
VarianzaEl valor esperado, o media, de una variable aleatoria
es una media de su localización.
La varianza resume la variabilidad en los valores de
la variable aleatoria.
La desviación estándar, , está definida como la
raíz cuadrada positiva de la varianza.
Var(x) = σ 2
= Σ(x - µ)2
f(x)
E(x) = µ = Σxf(x)
47. Dr Jorge Ramírez Medina
EGADE Business School
Valor esperado
Número esperado de TVsNúmero esperado de TVs
vendidas en un día.vendidas en un día.
x f(x) xf(x)
0 .40 .00
1 .25 .25
2 .20 .40
3 .05 .15
4 .10 .40
E(x) = 1.20
Valor Esperado y
Varianza
48. Dr Jorge Ramírez Medina
EGADE Business School
Varianza y Desviación estándar
0
1
2
3
4
-1.2
-0.2
0.8
1.8
2.8
1.44
0.04
0.64
3.24
7.84
.40
.25
.20
.05
.10
.576
.010
.128
.162
.784
x - µ (x - µ)2
f(x) (x - µ)2
f(x)
Varianza de las ventas diarias = σ 2
= 1.660
x
TVs
al cuadrado
Desviación estándar de las ventas diarias = 1.2884 TVs
Valor esperado y
varianza
49. Dr Jorge Ramírez Medina
EGADE Business School
Valor Esperado y
Varianza
El valor esperado, o media, de una variable aleatoriaEl valor esperado, o media, de una variable aleatoria
es una media de su localización.es una media de su localización.
La varianza resume la variabilidad en los valores deLa varianza resume la variabilidad en los valores de
la variable aleatoria.la variable aleatoria.
La desviación estándar,La desviación estándar, σσ, está definida como la, está definida como la
raíz cuadrada positiva de la varianza.raíz cuadrada positiva de la varianza.
Var(x) = σ 2
= Σ(x - µ)2
f(x)
E(x) = µ = Σxf(x)
Modelos Estadísticos: Poner el caso del puente. Pp 2 Libro Discovering Statistics Using SPSS. Comentar cuando el modelo ajusta o no ajusta. Los datos representan al fenómeno o población del mundo real lo más cerca posible. Buen ajuste, ajuste moderado o ajuste pobre. Además de las reformas ya presentadas en el Congreso, es decir, la reforma laboral y la de educación, pensamos que el año que viene se podría empujar reformas en el ámbito fiscal y de seguridad social, principalmente. Hacia delante, podríamos ver también la aprobación de una reforma energética orientada a gas natural y gas lutita ( shale gas ). Esto podría incrementar en 1.75 puntos porcentuales el PIB potencial de largo plazo, lo que significaría un incremento de 3% a 4.75%, de acuerdo a nuestras estimaciones. Esto significa que a partir de 2014, México podría estar viendo tasas de crecimiento en torno al 5% anual Durante el último trimestre de 2012 las presiones inflacionarias se han reducido significativamente. En particular, destaca la caída de las tarifas de servicio de telefonía móvil, que acumulan una caída de 43.5% en lo que va del año, lo que ha permitido que la inflación de servicios se ubique en niveles de 1.7% anual en noviembre. factores que podrían afectar el desempeño de los precios en 2013 Aumento de los precios públicos : la Ley de Ingresos 2013, aprobada por el Congreso, no contiene ninguna revisión sustancial a las tasas impositivas ni a los precios públicos en general. Sin embargo, es posible que veamos incrementos al desliz del precio de la gasolina. En 2012, el gobierno mantuvo un desliz de nueve centavos por litro lo que no fue suficiente como para compensar por el diferencial de precios internos con la referencia en Estados Unidos (2 pesos por litro en promedio). En este contexto, el gobierno ha tenido que destinar 167.1 miles de millones de pesos a subsidiar este diferencial Efectos base : La inflación durante abril y mayo de 2012 fue excepcionalmente baja, apoyada por la entrada en vigor de los descuentos de verano en las tarifas eléctricas, De acuerdo a nuestros estimados, la inflación en abril de 2013 podría incrementarse hasta 4.2% anual del 3.75 que estamos previendo para finales del año (ver gráfico abajo a la derecha). Cambio de metodología en el cálculo del INPC : el INEGI ha hecho algunas consultas con respecto a un cambio de metodología en el cálculo del INPC con el fin de reflejar los resultados de la última Encuesta Nacional de Ingreso Gasto de los Hogares (ENIGH), levantada en 2010. Entre los cambios más significativos está el peso que podrían tener las tarifas eléctricas (actualmente 3.6% del total), que podría reducirse a la mitad como resultado de cambios en la medición del gasto de las familias en este rubro.
1.1 Explicar el significado de la estadística y su relación con el proceso de toma de decisiones. Efectos del Peje; encabezados de algunos diarios Tasas de desempleo % Valor de dólar Salario mínimo de un profesionista A las representaciones numéricas se les llama estadísticas. Casi todos usamos los conceptos estadísticos en diferentes facetas de nuestra vida; al abrir regadera y probar temperatura del regadera, decidir que cereal comprar. Las empresas enfrentan problemas similares: Kellog debe asegurarse que la cantidad promedio en cada paquete de cereal cumpla con las especificaciones, pasar hacerlo selecciona muestras periódicas. El peje puede; Que se cuente voto por voto Salir detener a 10 personas y preguntarles por quién votaron Selecciona en forma aleatoria 2000 electores, hablar con ellos y en base a esta selección realizar el cálculo de los que votaron por él. En este curso mostraremos porqué la 3ª es la mejor opción Abusos estadística: El promedio puede no representar la totalidad de los datos. Ejemplo de promedio de 5 salarios. $10,$15, 20$, $25, $1000 -> promedio $214 Diagrama de impuestos (más dble) How to Lie with statistics. Darrel Huff.
Estadística tiene 2 significados: Uso común información numérica La ciencia que se ocupa de recolectar, organizar , presentar, analizar e interpretar datos para ayudar en la toma de desiciones más efectiva. Preguntar pára que usan estadística en tu empresa
Data can be further classified as being qualitative or quantitative. The statistical analysis that is appropriate depends on whether the data for the variable are qualitative or quantitative.
In general, there are more alternatives for statistical analysis when the data are quantitative.
http://onlinestatbook.com/2/introduction/measurement_demo.html Se encuentra que la marca 1 es más dulce que la 2 con 30-36-43-57-75-79 (ver promedios) 4- Sex, Race, and Teacher effectiveness are qualitative Age, Number of hours, and Calificación promedio are quantitative 5- Sex: nominal Race: nominal Age: ratio Number of hours: ratio Grade point average: ratio Teacher effectiveness: ordinal
No rebasa el conocimiento que aportan los mismos datos Hace uso de gráficas, tablas y diagramas que muestran los datos y facilitan su interpretación Estadística deductiva (general a lo particular)
– Rebasa el contenido de los datos-. Population . the set of all elements of interest in a particular study Sample . a subset of the population Inferencia estadística . the process of using data obtained from a sample to make estimates and test hypotheses about the characteristics of a population Census . collecting data for a population Sample survey . collecting data for a sample A population is a collection of all possible individuals, objects, or measurements of interest. A sample is a portion, or part, of the population of interest
Hacer el ejercicio de lo que se gana en una empresa. Mejor medida la Moda Hablar sobre fórmula de desviación estándar. Desviación= Sum(observado-modelo)^2
Pago mucho o poco?.... Ver que queden en el rango de la media. Hablar de dispersión aquí.
The variance is a measure of variability that utilizes all the data. It is based on the difference between the value ofeach observation ( xi ) and the mean ( for a sample, m for a population). Mencionar en este momento COVARIANZA y coeficiente de covarioación , sólo mencionar r= Sxy/SxSy
The standard deviation of a data set is the positive square root of the variance. It is measured in the same units as the data , making it more easily interpreted than the variance.
Comentar sobre el error estándar (en muestreo)
Bajar archivo Saldo en tarjetas de crédito
The most common numerical descriptive statistic is the average (or mean ). Gasto promedio, based on the 300 observaciones, is $753.68 (found by summing the 300 credit card’s balance and then dividing by 300).
Hay dos formas en las cuales la distribución se puede desviar de la normal; Falta de simetría : Skewness (sesgo) Falta de : Curtosos
An important measure of the shape of a distribution is called skewness . The formula for computing skewness for a data set is somewhat complex. Skewness can be easily computed using statistical software. -------------------------------------------------------------------------------------- Symmetric (not skewed) Skewness is zero. Mean and median are equal. -------------------------------------------------------- Moderately Skewed Left -.31 Skewness is negative. Mean will usually be less than the median. ------------------------------------------------------------------------------- Moderately Skewed Right .31 Skewness is positive. Mean will usually be more than the median. ------------------------------------------------------------------------------ Highly Skewed Right 1.25 Skewness is positive (often above 1.0). Mean will usually be more than the median. ------------------------------------------------------------------------------
El coeficiente de curtosis mide cuan 'puntiaguda' es una distribución respecto de un estándar. Este estándar es una forma acampanada denominada 'normal', y corresponde a una curva de gran importancia en estadística. http://www.spssfree.com/spss/analisis3.html Una curva Mesocúrtica tiene un Coeficiente de Curtosis cercano a cero. Una Leptocúrtica, un valor notoriamente mayor que cero y una Platicúrtica valores menores que cero.
Pago mucho o poco?.... Ver que queden en el rango de la media. Hablar de dispersión aquí. Percentiles: p por ciento de los observaciones son menores o iguales a este valor 1er cuartil=(25/100)*70= 17.5= 18. (se redondea siempre hacia arriba) => valor de la 18ª posición = 445 3er cuartil= (75/100)*70= 52.5 = 53. => valor de la 53ª posición = 525
***** ojo Laboratorio 02 “Relating Histograms and Box and Whisper Plots******** A box is drawn with its ends located at the first and third quartiles. A vertical line is drawn in the box at the location of the median (second quartile). Limits are located (not drawn) using the interquartile range (IQR). Data outside these limits are considered outliers The locations of each outlier is shown with the symbol * The lower limit is located 1.5(IQR) below Q 1. Lower Limit: Q1 - 1.5(IQR) = 445 - 1.5(80) = 325 The upper limit is located 1.5(IQR) above Q 3 Upper Limit: Q3 + 1.5(IQR) = 525 + 1.5(80) = 645 There are no outliers (values less than 325 or greater than 645) in the apartment rent data.
Dale Carnegie dijo que la sonrisa ayuda a ganar amigos e influir sobre las personas. La investigación sobre los efectos de la sonrisa ha apoyado esto y demostrado que una persona que sonríe es juzgado como más agradable, atractivo, sincero, alegre y competente que una persona no sonríe. Hay evidencia de que sonreír puede atenuar las sentencias. Este fenómeno se denomina "efecto sonrisa de indulgencia", fue el foco de un estudio realizado por Marianne LaFrance y Marvin Hecht en 1995. asumir el papel de un miembro de un panel disciplinario universidad y juzgar a un estudiante acusado de hacer trampa. Cada sujeto recibió un archivo que contiene una carta supuestamente enviada por el presidente de la Comisión de Disciplina, un resumen de las pruebas, los antecedentes del sospechoso incluido el rendimiento académico previo y una foto una imagen en color de una las cuatro expresiones faciales, y las escalas de calificación para indicar los juicios. Los jurados respondieron cinco preguntas acerca de la probabilidad de la culpabilidad del sospechoso y de la gravedad de la pena debe ser. Estas preguntas se combinaron en una "puntuación de clemencia". Cuatro grupos de sujetos fueron probados. Cada grupo vio a uno de los tres tipos de sonrisas o un control neutral-expresión. Los sujetos de una muestra de 136 estudiantes universitarios fueron asignados al azar a las cuatro condiciones con la restricción de que no había un número igual de sujetos (34) en cada grupo. Los tres tipos de sonrisa se ilustran en una página aparte. Estos tipos de sonrisas se han estudiado y se clasifican por Paul Ekman. Las imágenes utilizadas como materiales de estímulo eran fotografías de dos mujeres universitarias de segundo año. Cada muestra se fotografió cada una de las cuatro expresiones faciales.
When comparing two or more groups, it is generally a good idea to start by creating some form of side-by side boxplots or quantile plots. These plots reveal important information about the location, spread, and shape of the distribution of scores in each group La gráfica muestra que la sonrisa falsa dio lugar a la mayor indulgencia y la expresión neutra llevó a lo menor indulgencia. La mediana para una sonrisa falsa es más alta que el percentil 75 para la expresión neutral. Las distribuciones no parecen tener mucho sesgo: la media y la mediana son casi iguales y las medianas están a punto a mitad de camino entre los percentiles 25 y 75. Summarizing the results: (a) the average of the three smile conditions is significantly different from the neutral control condition, (b) the three smile conditions are not significantly different from each other, and (c) only the false smile condition is significantly different from the neutral control. Among the possible states of the population are: (a) All three smile conditions are different from the neutral condition and (b) Only the false-smile condition is different from the neutral condition. The former possibility appears more likely than the latter because there were at least hints of differences between the felt and neutral conditions and between the miserable and neutral conditions whereas there was no evidence of differences among the three smile conditions.
Usamos un modelo que represente a la población. Usualmente los científicos prueban hipótesis: predecir acerca de los parámetros poblacionales. Hipótesis nula. Hipótesis alternativa. Lo que hacemos es probar los datos en el modelo. Si el modelo ajusta: esto es si se explica la mayor parte de la variación, entonces decimos que la hipótesis es verdadera.
Nunca sabemos determinísticamente los resultados, trabajamos probabilísticamente 6 copas, en donde se sirve el té o el azúcar primero
20 combinaciones . Ver archivo excel C1 C2 C3 C4 C5 C6 1 T T T A A A 2 T T A T A A 3 T T A A T A 4 T T A A A T 5 T A T T A A 6 T A T A T A 7 T A T A A T 8 T A A T T A 9 T A A T A T 10 T A A A T T 11 A T T T A A 12 A T T A T A 13 A T T A A T 14 A T A T T A 15 A T A T A T 16 A T A A T T 17 A A T T T A 18 A A T T A T 19 A A T A T T 20 A A A T T T
Como decir que el modelo es una buena representación de la realidad? Recolectamos los datos y estos tendrán una variación. Hat dos tipos de variación: sistemática y Unisistemática El calculo del estadístico dependiendo de la prueba, z, t , chi cuadrada, F Si el estadístico es mayor que uno, nuestro modelo puede explicar mayor variación de la que no puede explicar. A mayor variación que explica el modelo, menor es la probabilidad de que ocurra por casualidad. Cuando esta probabilidad es menor que 0.05 (criterio de Fisher) aceptamos que el modelo nos da la suficiente certeza que explica lo que sucede en el mundo real. Aceptamos la Ha.
– Rebasa el contenido de los datos-. Population . the set of all elements of interest in a particular study Sample . a subset of the population Inferencia estadística . the process of using data obtained from a sample to make estimates and test hypotheses about the characteristics of a population Census . collecting data for a population Sample survey . collecting data for a sample A population is a collection of all possible individuals, objects, or measurements of interest. A sample is a portion, or part, of the population of interest
Hablar de probabilidad aquí Chevalier de Méré, noble francés hace 300 años. Probabilidad de obtener par de 1s en un par de dados Blaise Pascal 1er intento de contestar con su amigo Pierre de Fermat 1650 Pierre-Simon de Laplace 1as obras de probabilidad 1812.Theorie Analytique des Probabilites Probabilidad as a Numerical Measure of the Likelihood of Occurrence Sum P(x) = 1 0<=P(x)<=1 Asignación de probabilidades M clásico M subjetivo M frecuencia relativa TODO es sobre saber contar Hacer primero el ejercicio con 4 alumnos y seleccionar un equipo de 3. 4! / 3!(4-3)! = 4 combinaciones A second useful counting rule enables us to count the number of experimental outcomes when n objects are to be selected from a set of N objects. ¿cuántas combinaciones hay en el melate? (47 6) = 10,737,537 -> en excel combinat(47,6) A second useful counting rule enables us to count the number of experimental outcomes when n objects are to be selected from a set of N objects. En excel. Permutaciones(47,6) -> 7,731,052,560 ¿Cuántas maneras hay de asignar los cuatro primeros lugares de un concurso de creatividad que se verifica en las instalaciones de nuestro instituto, si hay 14 participantes? Solución: Haciendo uso del principio multiplicativo, 14x13x12x11 = 24,024 maneras de asignar los primeros cuatro lugares del concurso Esta solución se debe, a que al momento de asignar el primer lugar tenemos a 14 posibles candidatos, una vez asignado ese lugar nos quedan 13 posibles candidatos para el segundo lugar, luego tendríamos 12 candidatos posibles para el tercer lugar y por último tendríamos 11 candidatos posibles para el cuarto lugar. Luego si N es el total de participantes en el concurso y n es el número de participantes que van a ser premiados, y partiendo de la expresión anterior, entonces. 14x13x12x11= N x (N - 1) x (N - 2) x ………. x (N – n + 1) si la expresión anterior es multiplicada por (N – n)! / (N – n)!, entonces = N x (N –1 ) x (N – 2) x ……… x (N – n + 1)x (N – n)! / (N – n)! = N!/ (N – n)!