SlideShare una empresa de Scribd logo
1 de 122
ESTADISTICA GENERAL
Acompañamiento examen complexivo
Mariela Sánchez Alejandro
Tema: Estadística General
1. Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
2. Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia
central
3. Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de
dispersión, concentración, asimetría y curtosis.
4. Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua
5. Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis.
Bibliografía:
Lind, Marchal, Wathen, 2012, Estadística aplicada a los negocios y la economía, McGraw Hill.
Webster, Allen, 2001, Estadística aplicada a los negocios y la economía.
La estadística es una de las herramientas más ampliamente utilizadas; su aplicación en instituciones gubernamentales y
educativas, en los negocios, en la industria, en la banca y en otros quehaceres diarios hacen de la estadística una
herramienta indispensable.
Sin embargo el término “Estadística” tiene varios
significados para diferentes personas; para la gente
común y corriente la estadística solamente significa
números.
En el diario de la mañana se puede encontrar la
estadística más reciente sobre los delitos de la ciudad
que hayan sido denunciados en determinado periodo
de tiempo; de los nacimientos y muertes que han
ocurrido, o en relación con el deporte, el número de
partidos ganados y perdidos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Para otras personas es un método para obtener, presentar y
escribir grandes cantidades de datos, y para otras es un
método para tomar decisiones en situaciones difíciles.
La estadística también sirve para examinar el riesgo en el
análisis de inversiones, los estudios de probabilidad nos
permiten predecir, en cierta medida, los comportamientos de
las inversiones, o al menos, las posibles ganancias o pérdidas
en cualquier caso. Esto resulta muy útil para decidir cuándo
invertir o no y de qué manera hacerlo. La necesidad de valorar
algo que puede o no suceder ha llevado a aplicar conceptos
como el valor esperado o la varianza a las finanzas. Las
estadísticas de las finanzas públicas miden las actividades
financieras de un gobierno en una economía.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
1.- La estadística como disciplina o área de estudio.
2. - La estadística o las estadísticas como resultados que presentan organismos de estadística oficiales.
3. - Un estadístico como un procedimiento para obtener un número a partir de valores de una encuesta.
Como área de estudio, la Estadística proporciona los métodos que ayudan a resolver los problemas correspondientes, para
ello es necesario conocer los conceptos básicos que conforman los contenidos de esta materia tales como:
a) Población.
b) Muestra.
c) Variable.
d) Datos u observaciones.
e) Parámetros.
f) Estadígrafos o Estadísticos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Población: es un conjunto de personas, entidades u objetos del cual se quiere saber algo que nos interesa para tomar una
determinación acertada.
La población puede ser finita o infinita.
Muestra: es un subconjunto de la población que se estudia para determinar el parámetro que describe la característica
deseada de la misma.
Muestra aleatoria es aquella que se obtiene de tal manera que cada posible observación disponible en la población, tiene
la misma probabilidad de ser seleccionada
Para poder obtener estas muestras es necesario que no intervenga la preferencia del investigador por algún elemento de
la población; es decir, cada elemento de la población deberá tener igual oportunidad de ser seleccionado
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Variable: característica observable de un suceso, objeto o hecho que es susceptible a medición.
Las variables se clasifican en cualitativas y cuantitativas.
Variable aleatoria: es una función que asocia un numero a cada resultado del espacio muestral.
Datos u observaciones: Es el elemento primario de la información, los datos reunidos pueden cobrar significación. Solo o
aislado el dato no posee relevancia, pero utilizado en las premisas de un razonamiento puede llevarnos a una conclusión.
Surgen de la observación o la experiencia.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Parámetros: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún
atributo.
Intenta resumir toda la información que hay en la población en unos pocos números.
Estadígrafos o Estadísticos: Es la cantidad numérica calculada sobre una muestra que resume su información en algún
aspecto.
Los promedios y proporciones muestrales son características medibles de las muestras respectivas.
Los indicadores que permiten hallar un valor numérico, el mismo que representa a toda la población o muestra en estudio
se les denomina estadígrafos.
Si un estadístico se usa para aproximar un parámetro suele llamarse estimador.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
“La Estadística Descriptiva es el estudio que incluye la obtención, organización, presentación y descripción de
información numérica”.
“La inferencia estadística es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a
una información obtenida mediante técnicas descriptivas”.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que pueden tomar las variables, la
primera tarea de la Estadística es la de ordenar y presentar los datos en tablas que permitan ver la tendencia de los
mismos. Ordenados los datos se facilita su representación en diagramas y gráficas de diferentes tipos.
Existen diferentes formas de describir, presentar, ordenar, resumir la información en tablas y su presentación en
diferentes tipos de gráficas.
Escalas de Medición.
La clasificación de las variables depende del nivel de medición de la característica deseada.
El nivel de medición también denominado escalas de medición, se lo puede clasificar en:
1. Nominal: es la que se usa para asignarle una etiqueta a las categorías que se construyen de la variable con el único fin
de distinguir unas de otras.
2. Ordinal: es la que permite ordenar o jerarquizar las categorías que se construyen de la variable que se evalúa.
3. Por intervalo: es la que permite clasificar, ordenar y cuantificar las categorías que se establecen de la variable.
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
Definición de variable:
Número de caballo
Lugar que ocupó
Tiempo que hizo
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
Definición de variable: Tipo de variable:
Número de caballo Variable cualitativa nominal
Lugar que ocupó Variable cualitativa ordinal
Tiempo que hizo Variable cuantitativa continua
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
Definición de variable: Tipo de variable: Escalas de medición:
Número de caballo Variable cualitativa nominal Nominal (numeración de los caballos).
Lugar que ocupó Variable cualitativa ordinal Ordinal (lugar ocupado en la carrera).
Tiempo que hizo Variable cuantitativa continua Por intervalos (tiempo durante el recorrido).
La escala de medición por intervalos es la de mayor nivel de medición e incluye las dos anteriores; para poder usarse
con la precisión deseada es necesario fijar un patrón de medida que cuantifique a la variable con la misma exactitud,
cuantas veces sea medida.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Distribución de Frecuencias
Los datos agrupados en tablas, nos permiten ver con facilidad el número de observaciones iguales o comprendidos en un
intervalo, a este número de repeticiones iguales de la variable se llama frecuencia y se denota por fi. Otros valores
relacionados con la frecuencia son:
 La frecuencia relativa que se denota por fr.
 La frecuencia acumulada que se denota por Fi.
 La frecuencia relativa acumulada que se denota Fr.
Distribución de Frecuencias Absolutas y Relativas
Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los
datos obtenidos en la investigación de campo, para ello se concentran en tablas de
frecuencia y éstas pueden ser:
 Absoluta.
 Relativa.
 Acumulada.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las características y bondades de las
carreras de Ingeniería, Química, Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario
donde especificaron además de los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados:
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q
a) ¿Qué variable que se analiza?
b) ¿Qué tipo de variable es?
c) ¿Qué tipo de escala define la variable?
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las características y bondades de las
carreras de Ingeniería, Química, Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario
donde especificaron además de los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados:
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q
a) ¿Qué variable que se analiza? Carrera de preferencia
b) ¿Qué tipo de variable es? Cualitativa nominal
c) ¿Qué tipo de escala define la variable? Nominal
CATEGORÍAS
NÚMERO DE
ALUMNOS ( f )
I 8
Q 14
M 13
A 10
Total 45
Frecuencia absoluta es el número
de veces que se repite la misma
observación. Se simboliza con ( f )
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
a) ¿Cuál categoría es la de mayor frecuencia?
b) ¿Qué información podemos determinar con la categoría de mayor frecuencia?
c) ¿Qué carrera es la menos solicitada?
CATEGORÍAS
NÚMERO DE
ALUMNOS ( f )
I 8
Q 14
M 13
A 10
Total 45
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
a) ¿Cuál categoría es la de mayor frecuencia? Química
b) ¿Qué información podemos determinar con la categoría de mayor frecuencia? La carrera de Química es la mas
solicitada
c) ¿Qué carrera es la menos solicitada? Ingeniería
CATEGORÍAS
NÚMERO DE
ALUMNOS ( f )
I 8
Q 14
M 13
A 10
Total 45
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
El gerente de una Empresa, Kimberly preocupado por el pago de energía consumida solicito al jefe de planta, un estudio
del consumo diario durante el mes de agosto. Los resultados obtenidos. KW/hr (kilowatts por hora) son los siguientes:
Consumo de energía en KW/hr de la empresa Kimberly correspondiente al mes de agosto de 2015
Consumo
(KW/hr) ( f )
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
a) Define la variable del problema
b) ¿Qué tipo de variable es?
c) ¿Qué valores toma la variable?
d) ¿Qué tipo de escala define la variable?
e) ¿Cuál es la mayor frecuencia de la variable?
f) ¿Qué frecuencia tiene la variable cuya categoría es 10?
Consumo
(KW/hr) ( f )
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
a) Define la variable del problema: Consumo en KW/hr
b) ¿Qué tipo de variable es? Cuantitativa contínua
c) ¿Qué valores toma la variable? Los valores de la variable se encuentran en un rango de 5 a 12 KW/hr
d) ¿Qué tipo de escala define la variable? Por intervalos
e) ¿Cuál es la mayor frecuencia de la variable? La mayor frecuencia es 6 y significa en 6 días del mes se tiene consumo
de 9 KW/hr.
f) ¿Qué frecuencia tiene la variable cuya categoría es 10? La frecuencia de la categoría 10 es 5 lo cual significa que en 5
días del mes hubo un consumo de 10 KW/hr.
Consumo
(KW/hr) ( f )
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Otro parámetro importante es la frecuencia relativa que simbolizaremos con “fr”, ésta se obtiene dividiendo la
frecuencia absoluta (fi) entre el número de elementos de la muestra que simbolizaremos con (n).
La frecuencia relativa se puede expresar como una razón, como una proporción o como un porcentaje.
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
Frecuencia relativa (fr) es la proporción de
elementos que pertenecen a una categoría y
ésta se obtiene dividiendo su frecuencia
absoluta entre el número total de elementos
de la muestra.
Consumo
(KW/hr) ( f )
( fr )
Razón Proporción Porcentaje
5 2 2/5 0,07 7%
6 3 3/30 0,10 10%
7 4 4/30 0,13 13%
8 5 5/30 0,17 17%
9 6 6/30 0,20 20%
10 5 5/30 0,17 17%
11 3 3/30 0,10 10%
12 2 2/30 0,07 7%
Total 30 30/30 1,00 100%
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Gráficas
Al representar en una gráfica la información concentrada en la tabla de frecuencias, ésta es un recurso visual que nos
permite tener una idea clara, precisa, global y rápida acerca de las observaciones de una muestra o población.
Existen muchos tipos de gráficas en las que se pueden representar la frecuencia absoluta (fi), relativa (fr) y acumulada
(Fi) y con ellas podemos estimar algunos valores con la simple observación.
Los diferentes tipos de gráfica que podemos usar para representar las observaciones de un determinado problema y la
selección de este tipo, dependen de la variable en estudio.
Si la variable en estudio es del tipo cualitativo, los gráficos pueden ser:
a) De barras; horizontales o verticales
b) Circulares
c) Pictogramas
Si la variable en estudio es de tipo cuantitativo, los gráficos que podemos usar para su representación gráfica son:
a) Histogramas
b) Polígonos de frecuencias
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de
frecuencias de una variable continua.
Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo
que le indica al gerente de personal que realice un análisis del problema.
El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad:
13, 19, 22, 14, 13, 16, 19, 21
23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
21, 17, 18, 24, 21, 20, 19, 26
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de
frecuencias de una variable continua.
Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo
que le indica al gerente de personal que realice un análisis del problema.
El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad:
13, 19, 22, 14, 13, 16, 19, 21
23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
21, 17, 18, 24, 21, 20, 19, 26
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
 La mayor frecuencia es f4 = 16
 Los años de antigüedad no inician desde cero
 Las líneas verticales punteadas corresponden al punto medio o marca de clase y éste nos indica el promedio de las
puntuaciones en cada clase.
 Para la tercera barra, el promedio en años
cumplidos de los obreros de la empresa
ubicados en esa clase es de M3 =17 años
y como la frecuencia es f3 = 10 obreros con
la misma antigüedad.
Años de servicio
Frecuencia (numero
de obreros)
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Polígono de Frecuencia
El polígono de frecuencia se construye a partir de los datos de la tabla de frecuencias.
Sobre el eje horizontal se levanta por el punto medio segmentos verticales punteados que terminan a la altura de su
frecuencia de clase, se unen los puntos superiores con un segmento de recta que empieza medio punto antes del límite
superior de la última clase.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Polígono de Frecuencia acumulada relativa
Si en la escala vertical en lugar de representar las frecuencias absolutas, se representa la frecuencia relativa, se obtiene
un polígono de frecuencia acumulada
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Polígono de Frecuencia acumulada (Ojiva)
La gráfica de la frecuencia acumulada es muy útil porque en ella podemos determinar cuántas observaciones hay por
arriba o por debajo de algún valor que nos interese.
La gráfica que se obtiene de la frecuencia acumulada también se conoce con el nombre de ojiva.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas
Gráficas Circulares.
Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. es un
recurso estadístico que se utiliza para representar porcentajes y proporciones. Consisten en subgrupos que son
combinados para formar una unidad entera.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas
Diagrama de barras.
Los gráficos de barras, que también llamados gráficos de columnas, muestran observaciones hechas a lo largo del
tiempo. Son principalmente utilizados para mostrar el cambio de una variable en el tiempo.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas
Pictograma
Es otra forma de representación gráfica de la información de un determinado problema.
En este tipo de gráfica se usa la imagen de la variable, por ejemplo:
a) Árboles: si la variable representa árboles.
b) Libros: si la variable representa libros.
c) Casas: si la variable representa casas.
d) Figuras de personas: si la variable son personas, etcétera.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
En Estadística Descriptiva el material de trabajo lo constituyen los datos, que son los resultados de las observaciones.
Una vez obtenidos los datos hay que ordenarlos y clasificarlos mediante algún criterio racional de modo que sea posible
una visión crítica de los mismos.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Medidas de tendencia central: se refieren a los valores de la variable que suelen estar en el centro de la distribución.
Análisis estadísticos sencillos que se usan para describir características, o elementos típicos, de la información que se
recoge con el fin de resumir los datos e indicar similitudes o diferencias entre ellos que permita comparar dos grupos de
datos.
Moda:
La moda de una muestra x1, x 2,…xn es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el
valor que más se repite, y se denota por Mo.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
EDAD mi fi fri fri% Fi Fri Fri%
50-60 55 10 0,2 20% 10 0,2 20%
60-70 65 18 0,36 36% 28 0,56 56%
70-80 75 14 0,28 28% 42 0,84 84%
80-90 85 6 0,12 12% 48 0,96 96%
90-100 95 2 0,04 4% 50 1 100%
EJEMPLO: Edad de jubilados encuestados
Cálculo de la moda para datos agrupados
Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase que tiene mayor
frecuencia llamado clase modal.
Para determinar un solo valor de este intervalo para la moda utilizamos la siguiente ecuación:
Mo = Moda
LMo = Límite inferior de la clase modal
d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior a ella (d1 = fi – fi-1 )
d2 = frecuencia de la clase modal menos la frecuencia de la clase posterior a ella (d2 = fi – fi+1 )
h = amplitud del intervalo de clase
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
EDAD mi fi fri fri% Fi Fri Fri%
50-60 55 10 0,2 20% 10 0,2 20%
60-70 65 18 0,36 36% 28 0,56 56%
70-80 75 14 0,28 28% 42 0,84 84%
80-90 85 6 0,12 12% 48 0,96 96%
90-100 95 2 0,04 4% 50 1 100%
EJEMPLO: Edad de jubilados encuestados
La clase modal es 60-70 , ya que es la que presenta la mayor frecuencia
LMo = 60
fi = 18
fi-1= 10
fi+1 = 14
d1 = 18 – 10 =8
d2 = 18-14 = 4
h = 10
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Mediana: Dado un conjunto de n observaciones x1, x 2,…., xn, de la variable x, se define la mediana de este conjunto de
valores, como aquel valor que no es superado ni supera a más de la mitad de las n observaciones, arregladas en orden
de magnitud creciente o decreciente.
Cálculo de la Mediana: Ordenar los datos en orden de magnitud creciente, X(1) X(2) X(n) entonces la mediana esta
definida mediante la siguiente fórmula:
Nota: En general, la mediana no se ve afectada por valores muy grandes o por valores muy pequeños en los datos en
comparación a la media. Por ejemplo, si x 3= 40, la media es 1/3(1+2+40)=14.33, sin embargo la mediana es Me=2.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
x1 2
x2 3
x3 5
x4 6
x5 8
La mitad de las observaciones son menores o iguales que 5 y la otra mitad son mayores o iguales que 5.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
x1 2
x2 3
x3 5
x4 6
x5 8
x6 9
La mitad de las observaciones son menores o iguales que 5,5 y la otra mitad son mayores o iguales que 5,5.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Cálculo de la mediana para datos agrupados
Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase que contiene a la
mediana llamado clase mediana. Para ello, debemos determinar la frecuencia acumulada absoluta que contenga al
elemento número
El valor de este intervalo para la mediana se calcula utilizando la siguiente ecuación:
Me = Mediana
Lm = Límite inferior de la clase mediana
n = cantidad de datos
Fi-1 = frecuencia acumulada absoluta de la clase anterior al intervalo mediana
fi = frecuencia absoluta de la clase mediana
h = amplitud del intervalo de clase
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
EDAD mi fi fri fri% Fi Fri Fri%
50-60 55 10 0,2 20% 10 0,2 20%
60-70 65 18 0,36 36% 28 0,56 56%
70-80 75 14 0,28 28% 42 0,84 84%
80-90 85 6 0,12 12% 48 0,96 96%
90-100 95 2 0,04 4% 50 1 100%
La clase mediana es la que contenga el elemento en la posición (50+1)/2 =25,5 es el intervalo 60-70
Buscamos en la frecuencia acumulada Fi y vemos que se halla en el intervalo [60, 70)
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Media:
La media (o promedio) de una muestra x1, x 2,…xn de tamaño n de una variable x, se define como la suma de todos los
valores observados en la muestra, dividida por el número total de observaciones n, es decir:
Por ejemplo si los datos son x1 = 1, x 2 =2, x3=3, entonces la media es 1/3(1+2+3)=2.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
El Departamento de Acción Social ofrece un estímulo especial a aquellas agrupaciones en las que la edad promedio de
los niños que asisten está por debajo de 9 años. Si los siguientes datos corresponden a las edades de los niños que
acuden de manera regular al Centro ¿calificará éste para el estímulo?
8
5
9
10
9
12
7
12
13
7
8
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Cálculo de la media para datos agrupados
Para calcular la media para datos agrupados, primero calculamos el punto medio de cada clase (marca de clase mi ).
Después se multiplica cada punto medio por la frecuencia absoluta de cada intervalo
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA
Entre las medidas de tendencia central, la media requiere variables cuantitativas (de intervalo, aunque también suele
calcularse con datos ordinales).
La mediana es un estadístico típicamente ordinal (requiere valores ordinales al menos). Al contrario de lo que ocurre con
la media, la mediana es insensible a la presencia de valores extremos, por lo tanto es preferible a la media cuando la
distribución es asimétrica.
La moda sirve para todo tipo de variables, pero es mas apropiada para caracterizar datos categóricos porque es un
estadístico que aprovecha información nominal.
Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA
En una distribución con sesgo positivo, la moda se halla en el punto más alto de la distribución, la mediana está hacia la
derecha de la moda y la media más a la derecha. Es decir Mo < Me < x
En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la izquierda de la moda y la
media está a la izquierda de la mediana. Es decir, x < Me < Mo
Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser la mejor medida de posición,
debido a que está siempre entre la media y la moda.
La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.
- Variables cualitativas: Solo podremos calcular la moda
- Variables ordinales: moda y mediana
- Variables cuantitativas: Podemos calcular las 3
El salario medio es de 34419,57 dólares ( media).
La mitad de los encuestados tienen salarios por debajo de
28875 dólares (mediana, percentil 50).
La diferencia entre en encuestado de mayor sueldo y el que
menos gana es 119250 dólares (rango).
El 50% de los encuestados tienen salarios comprendidos entre
24000 y 37162,5 dólares. (percentiles 25 y 75)
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Medidas de posición: en ocasiones es necesario saber que ocurre no solo en el centro sino también en otros puntos de
la población. Las medidas de posición no ayudarán a encontrar otros puntos dentro de la distribución de datos y desde
ahí poder tomar decisiones.
Cuartiles: divide la población en 4 partes iguales, calcula los percentiles 25, 50 y 75, es decir los valores por debajo de los
cuales se encuentra el 25%, el 50% y el 75% de los casos.
Deciles: divide la población en 10 partes iguales
Percentiles: divide la población en 100 partes iguales, se usa también como genérico para dividir en valores concretos
(valores que acumulan un determinado porcentaje de casos)
Medidas de tendencia central: Nota media de un examen en una clase de 30 niños
Medidas de posición: ¿Qué nota debe sacar un alumno para superar al 50% de compañeros?
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por
parte de una clínica, de reportes clínicos para realizar estudios de glucosa.
Intervalos
Promedio de
días
Número de
pacientes
Frecuencia
acumulada
1 día a 9 días 5 5 5
10 día a 19 días 14.5 6 11
20 día a 29 días 24.5 8 19
30 día a 39 días 34.5 8 27
40 día a 49 días 44.5 4 31
50 día a 59 días 54.5 5 36
60 día a 69 días 64.5 7 43
70 día a 79 días 74.5 8 51
80 día a 89 días 84.5 4 55
90día a 100 días 94.5 8 63
¿Cuál es el numero de datos a considerar?
¿En que intervalo se ubica el primer cuartil?
¿En que intervalo se ubica el segundo cuartil?
¿En que intervalo se ubica el tercer cuartil?
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por
parte de una clínica, de reportes clínicos para realizar estudios de glucosa.
Intervalos
Promedio de
días
Número de
pacientes
Frecuencia
acumulada
1 día a 9 días 5 5 5
10 día a 19 días 14.5 6 11
20 día a 29 días 24.5 8 19
30 día a 39 días 34.5 8 27
40 día a 49 días 44.5 4 31
50 día a 59 días 54.5 5 36
60 día a 69 días 64.5 7 43
70 día a 79 días 74.5 8 51
80 día a 89 días 84.5 4 55
90día a 100 días 94.5 8 63
¿Cuál es el numero de datos a considerar? 63
¿En que intervalo se ubica el primer cuartil? 3
¿En que intervalo se ubica el segundo cuartil? 6
¿En que intervalo se ubica el tercer cuartil? 8
Si el primer cuartil es 15,75 y representa 25,34
días ¿qué significa esto?
Si el segundo cuartil es 31,5 y representa 50,9
días ¿a que conclusiones se puede llegar?
Si el tercer cuartil es 47,25 y representa 74,78
días ¿Qué puede concluir?
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por
parte de una clínica, de reportes clínicos para realizar estudios de glucosa.
Intervalos
Promedio de
días
Número de
pacientes
Frecuencia
acumulada
1 día a 9 días 5 5 5
10 día a 19 días 14.5 6 11
20 día a 29 días 24.5 8 19
30 día a 39 días 34.5 8 27
40 día a 49 días 44.5 4 31
50 día a 59 días 54.5 5 36
60 día a 69 días 64.5 7 43
70 día a 79 días 74.5 8 51
80 día a 89 días 84.5 4 55
90día a 100 días 94.5 8 63
Si el primer cuartil es 15,75 y representa 25,34 días ¿qué
significa esto?
El 25% de los pacientes fueron mandados a valoración en
25,34 días y el 75% de los pacientes lo hicieron después
de 25,34 días
Si el segundo cuartil es 31,5 y representa 50,9 días ¿a
que conclusiones se puede llegar?
Que en 50,9 días se habían atendido al 50 % de los
pacientes a ser valorados de los niveles de glucosa
Si el tercer cuartil es 47,25 y representa 74,78 días ¿Qué
puede concluir?
El 75% de pacientes que envió la clínica a realizarse
estudios de glucosa lo realizo en 74,78días y el resto en
los otros días restantes
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Las medidas de dispersión estudian la distribución de los valores de la serie, analizando si estos se encuentran más o
menos concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor
más bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la media.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la
serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.
4.- Coeficiente de variación de Pearson: Se calcula como cociente entre la desviación típica y la media.
El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de dispersión de dos
muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra
serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene vienes expresada en cm y la
otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En
concreto, podemos estudiar las siguientes características de la curva:
a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la
muestra. Para medir el nivel de concentración de una distribución de frecuencia se pueden utilizar distintos indicadores,
entre ellos el Indice de Gini.
El Indice Gini (IG) puede tomar valores entre 0 y 1
IG = 0 : concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango.
IG = 1 : concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados.
b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría)
los segmentos de curva que quedan a derecha e izquierda son similares.
c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la
muestra.
Ejemplo 1: vamos a calcular el índice de Gini de una serie de datos con los sueldos de los empleados de una
empresa.
Sueldos
(miles de €)
Empleados
20 10
27 12
36 8
48 5
60 3
90 1
120 1
Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi
20 10 10 25,0 200 200 13,8 11,2
27 12 22 55,0 324 524 36,3 18,7
36 8 30 75,0 288 812 56,3 18,7
48 5 35 87,5 240 1052 73,0 14,5
60 3 38 95,0 180 1232 85,4 9,6
90 1 39 97,5 90 1322 91,7 5,8
120 1 40 100,0 120 1442 100,0 0
X x x x x x x x
Σpi (entre 1 y n-1) = 435,0 Σ(pi - qi) (entre 1 y n-1 )= 78,5
Datos: Calculamos los valores que necesitamos para aplicar la fórmula:
Por lo tanto:
G=78,5/435,0=0,18 (18%)
Un coeficiente de Gini de 0,18 indica que la muestra está bastante uniformemente repartida, es decir, su nivel de
concentración no es excesivamente alto.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos).
1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno).
Ejemplo 2: el mismo ejemplo pero considerando que hay más personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor
concentración de renta en unas pocas personas.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos).
1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno).
Sueldos
(miles de €)
Empleados
20 10
27 10
36 8
48 5
60 3
90 0
120 4
Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi
20 10 10 25,0 200 200 10,9 14,1
27 10 20 50,0 270 470 25,6 24,4
36 8 28 70,0 288 758 41,2 28,8
48 5 33 82,5 240 998 54,3 28,2
60 0 33 82,5 0 998 54,3 28,2
90 0 33 82,5 0 998 54,3 28,2
120 7 40 100,0 840 1838 100,0 0,00
x x x x x x x x
Σpi (entre 1 y n-1) = 392,5 Σ(pi - qi) (entre 1 y n-1 ) = 151,9Por tanto:
G=151,9/392,5=0,39 (39%)
Datos: Calculamos los valores que necesitamos para aplicar la fórmula:
El coeficiente de Gini se ha elevado considerablemente, reflejando la mayor concentración de rentas en la empresa.
Ejemplo 3: INDICE DE GINI DE LA UNIÓN EUROPEA (2001, 15 países)
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
CONCLUSIÓN: se puede observar que Portugal, España y Grecia son los países con mayores desigualdades.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Ejemplo 3: INDICE DE GINI DE LA UNIÓN EUROPEA (2001, 15 países)
Asimetría o sesgo
Es un estadístico que describe la simetría de la distribución alrededor de la media.
Si el sesgo es igual a cero, la distribución es simétrica (normal), ambas colas será iguales.
Si no existe una cola o sesgo, la asimetría tendrá un valor de cero.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Existe asimetría negativa (o a la izquierda) si
la "cola" a la izquierda de la media es más
larga que la de la derecha, es decir, si hay
valores más separados de la media a la
izquierda.
Decimos que hay asimetría positiva (o
a la derecha) si la "cola" a la derecha
de la media es más larga que la de la
izquierda, es decir, si hay valores más
separados de la media a la derecha.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
La siguiente afirmación es verdadera o falsa:
Una curva asimétrica con skewness (sesgo) positivo, indica que los valores tienden a reunirse en la zona de los valores
menores a la media.
Si los valores están más reunidos en niveles superiores a la media ¿qué tipo de sesgo tenemos?
Curtosis, es un estadístico que describe el grado de “punta” o “achatamiento” de la distribución de una variable con
relación a la distribución normal.
El uso del coeficiente de la Curtosis es muy importante para establecer el grado en el que la distribución de los valores se
acerca o aleja de la curva normal.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
La curtosis positiva indica una distribución
que perfila un gráfico “más en punta”, tal
como vemos en la curva del centro, con
relación a la normal; será Leptocúrtica.
En una distribución normal, la media, la mediana y la moda son iguales entre sí.
Una curtosis negativa indica una
distribución relativamente más
achatada, como la que vemos a la
derecha; será Platicúrtica.
Si el coeficiente es positivo, quiere decir que
hay una mayor concentración de los datos en
torno a la media. (Leptocurtica)
Si el coeficiente es negativo, la distribución se
llama Platicúrtica y muestra que hay una menor
concentración de datos en torno a la media;
sería más achatada.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
El Error típico es una disposición de ajuste, la cual nos informa
que estas medidas pueden variar entre el rango de más o
menos el error típico.
Entre mayor sea el valor de error, mayor será la variación de los
datos.
Por ejemplo para la Asimetría = -0.179 el error es 0.141, es
decir, la asimetría va desde -0.320 hasta -0.038.
De igual manera, se puede emplear el valor del error típico con
la Curtosis y la Media.
N = 70 significa que se tomó en cuenta 70 valores de la muestra; no
hay valores perdidos
La Media, da el promedio de las ventas en todos los departamentos
de la firma; en este caso, el promedio es de $54.
La Mediana, es de $24; de inmediato se nota la diferencia que hay
con la media.
La Desviación Típica, $103.9394; muestra la dispersión media de las
ventas.
El valor que nos da la tabla para el análisis sobre las ventas es de
5,325; el error típico de la Asimetría es 0,287
Es un valor positivo, por lo tanto las ventas en general, en los
departamentos, se reúnen en valores menores a la media,
mostrando un desempeño no eficiente.
El valor de la curtosis en la tabla es 34,2920, lo que indica que los
valores están concentrados alrededor de la media.
El Rango es la diferencia entre el valor mínimo y máximo; el Mínimo
es$6; el Máximo es 776.50
El Rango es 770.5
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
σBσA
Se realizan los gráficos del comportamiento probabilístico de dos inversiones. Luego de analizarlos ¿en cuál de las dos
invertiría?
¿Cuál de las dos inversiones es más rentable? ¿cómo lo deduce?
¿cuál de las dos inversiones es menos riesgosa?
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
σBσA
Se realizan los gráficos del comportamiento probabilístico de dos inversiones. Luego de analizarlos ¿en cuál de las dos
invertiría?
¿Cuál de las dos inversiones es más rentable? La inversión más rentable es la inversión B ¿cómo lo deduce? Debido
a que la media de B es mayor que la media de A
¿cuál de las dos inversiones es menos riesgosa? La inversión A es menos riesgosa, debido a que tiene lo datos
menos dispersos alrededor de la media.
ESPACIO MUESTRAL : S ó Ω
Es un conjunto que corresponde a todos los resultados posibles de un experimento listados de modo completo y
mutuamente excluyente. A cada elemento que forma parte del espacio muestral se le denomina suceso elemental.
Ejemplos:
1.- Experimento: Lanzar una moneda.
S= {sale cara, sale sello} ó S = {c,s}.
2.- Experimento: Lanzar dos monedas
S = {(c,c), (c,s), (s,c), (s,s)}.
3.- Experimento: Lanzar un dado
S = { 1, 2, 3, 4, 5, 6}
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
EVENTO O SUCESO: Es un subconjunto del espacio muestral. Es un suceso aleatorio.
Experimento: Se lanza un dado
S = {1, 2, 3, 4, 5, 6}
1. Evento A: Obtener un número primo A = {2, 3, 5}
2. Evento B: Obtener un número primo y par B = {2}
3. Evento C: Obtener un número mayor o igual a 5 C = {5, 6}
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
¿Cómo obtener una probabilidad? Si realizamos un experimento aleatorio en el que hay n sucesos, todos
igualmente probables, equiprobables; entonces si A es un suceso, la
probabilidad de que ocurra el suceso A es:
EJEMPLO 1
Supongamos que se quiere estudiar la incidencia del hecho de ser fumador como factor de riesgo en el desarrollo de
una enfermedad en una determinada población. Para ello se diseñó un estudio prospectivo y, tras seleccionar una
muestra de 180 sujetos, los resultados se muestran en la (Tabla de contingencia).
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
¿Cuál es la probabilidad de
desarrollar una enfermedad ?
¿Cuál es la probabilidad de
seleccionar un sujeto fumador?
E: Desarrollar una enfermedad
Número de sujetos enfermos 80
Elementos tiene la muestra 180
P(E) 80/180
Respuesta 0,444444444
F: Seleccionar un fumador
Número de fumadores 70
Elementos tiene la muestra 180
P(F) 70/180
Respuesta 0,38888889
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
c. ¿ Cuál es la probabilidad de
seleccionar un sujeto no fumador?
Fc: No sea fumador
Número de fumadores 70
Número de no fumadores 110
Elementos tiene la muestra 180
Probabilidad 110/180
Respuesta 0,61111111
E y F: Desarrollar una enfermedad y sea
fumador
Número de sujetos enfermos y
fumadores 60
Elementos tiene la muestra 180
P (E y F) 60/180
Respuesta 0,333333333
d. ¿Cuál es la probabilidad de que el sujeto desarrolle una
enfermedad y sea fumador?
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
f. ¿Cuál es la probabilidad de que el
sujeto desarrolle una enfermedad o
sea fumador?
E: Desarrollar una enfermedad
F: Seleccionar un fumador
E o F: Desarrollar una enfermedad o sea fumador
Número de sujetos enfermos 80
Número de fumadores 70
Número de sujetos enfermos y
fumadores 60
Número de sujetos enfermos o
fumadores 80 + 70 - 60
Elementos tiene la muestra 180
Formula: P[E o F] = P[E] + P [F] - P[E y F]
P[E o F]
(80 + 70 -
60)/180
Respuesta 0,50
e. ¿Cuál es la probabilidad de que el sujeto desarrolle
una enfermedad y no sea fumador?
E y Fc: Desarrollar una enfermedad y no sea
fumador
Número de sujetos enfermos y
no fumadores 20
Elementos tiene la muestra 180
P(E y Fc) 20/180
Respuesta 0,111111111
Si se sabe que no es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad?
1.- ¿Cuáles son los eventos?
2.- ¿Cuántos sujetos no son fumadores?
3.- ¿Cuántos de esos no fumadores, están enfermos?
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
Si se sabe que no es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad?
1.- ¿Cuáles son los eventos? E: Desarrollar una enfermedad
F : No sea un fumador
2.- ¿Cuántos sujetos no son fumadores? 110
3.- ¿Cuántos de esos no fumadores, están enfermos? 20
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
¿Cuál es la probabilidad de que un fumador desarrolle una enfermedad?
Si se sabe que es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad?
¿Cuál es la probabilidad de que desarrolle una enfermedad? Si se sabe que es fumador.
1.- ¿Cuáles son los eventos?
2.- ¿Cuántos sujetos son fumadores?
3.- ¿Cuántos de esos fumadores están enfermos?
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
¿Cuál es la probabilidad de que un fumador desarrolle una enfermedad?
Si se sabe que es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad?
¿Cuál es la probabilidad de que desarrolle una enfermedad? Si se sabe que es fumador.
1.- ¿Cuáles son los eventos?
E: Desarrollar una enfermedad
F: Sea un fumador
2.- ¿Cuántos sujetos son fumadores? 70
3.- ¿Cuántos de esos fumadores están enfermos? 60
En una cadena de televisión se hizo una encuesta a 2500 personas para saber la audiencia que tuvieron en un programa
de debate y de una película que se emitieron en horas distintas: 2100 vieron la película, 1500 vieron el debate y 350 no
vieron ninguno de los dos programas. Si elegimos al azar a uno de los encuestados:
a. ¿Cuál es la probabilidad de que viera la película y el debate?
b. ¿Cuál es la probabilidad de que viera la película, dado que no vio el debate?
c. Si vio la película, ¿cuál es la probabilidad de que viera también el debate?
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
En una cadena de televisión se hizo una encuesta a 2500 personas en total para saber la audiencia que tuvieron en un
programa de debate y de una película que se emitieron en horas distintas: 2100 vieron la película, 1500 vieron el debate
y 350 no vieron ninguno de los dos programas. Si elegimos al azar a uno de los encuestados:
a. ¿Cuál es la probabilidad de que viera la película y el debate? 1450/2500
b. ¿Cuál es la probabilidad de que viera la película, dado que no vio el debate? 1000/2100
c. Si vio la película, ¿cuál es la probabilidad de que viera también el debate? 1450/2100
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
DEBATE NO DEBATE TOTAL
PELICULA 1450 650 2100
NO PELICULA 50 350 400
TOTAL 1500 1000 2500
Distribución de
probabilidad discreta
Distribución Binomial
86
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
¿Qué es la distribución Binomial?
Es una distribución de probabilidad discreta.
1. Solo tienen dos posibles resultados, a los que se les pueden nombrar éxito o fracaso.
2. Los datos son resultado de un conteo, razón por la cual se clasifica como discreta.
3. El experimento consiste de varias pruebas y en cada una la probabilidad de éxito es la misma.
4. Las pruebas que se repiten son independientes.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
Para construir una distribución Binomial es necesario conocer el número de pruebas que se repiten y la Probabilidad de que
suceda un éxito en cada una de ellas.
La fórmula que describe la distribución es la siguiente:
Donde: n = número de pruebas
x = número de éxitos
p = probabilidad de obtener un éxito
q = probabilidad de obtener un fracaso, que se calcula q = 1 - p
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
Distribución Binomial: media y varianza
En una variable aleatoria binomial B (n , p)
Media:
Varianza:
Desviación típica: qpnσ 
qpnσ 2

Ejemplo.- X = "número 6 al tirar un dado 10 veces” es B(10 , 1/6)
Media = 10 * 1/6 = 10/6
Varianza = 10 * 1/6 * 5/6 = 50/36
Desviación típica = √50 / 6
μ = n p
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
Distribución de
probabilidad continua
Distribución Normal
90
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
 Se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de
probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.
 Estas variables aleatorias presentan una distribución que es aproximadamente simétrica y cuya gráfica tiene forma de
campana (mesocúrtica).
 Se utilizada en aplicaciones estadísticas como modelo o parámetro de comparación dada la frecuencia o normalidad con
la que ciertos fenómenos tienden a parecerse a esta distribución.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
El área total bajo la curva :
 Es igual a 100 % o 1.
 Comprendida entre los valores situados a una desviaciones estándar de la media es aproximadamente igual al 68,3%.
 Comprendida entre los valores situados a dos desviaciones estándar de la media es aproximadamente igual al 95,5%.
 Comprendida entre los valores situados a dos desviaciones estándar de la media es aproximadamente igual al 99,7%.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
CARACTERISTICAS DE LA DISTRIBUCIÓN NORMAL
 La distribución normal es simétrica alrededor de su media.
 Es asintótica - la curva se acerca a eje x pero nunca lo toca.
 La curva normal es acampanada y tiene un solo pico en toda la distribución.
 La media, mediana, y moda de la distribución son las mismas y están localizadas
en el pico.
 La mitad del área de la curva esta arriba del punto central (pico), y la otra mitad
esta abajo.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
1. Identificar la variable de interés.
2. Identificar los parámetros de la variable (su media y desviación estándar).
3. ¿Cual es la pregunta: área bajo la curva de la campana de Gauss?
4. Convertir los valores a la distribución normal estándar (estandarización Z =
(X-Media)/S)
5. Encuentre la probabilidad en tabla de la normal estándar o por Excel.
Calculo de Probabilidades normales
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
Aplicación de la distribución Normal : El Riesgo en el análisis de inversiones
Distribuciones de Probabilidad de los Flujos de Caja
 El VAN (Valor actual neto) en un modelo de incertidumbre puede considerarse una variable aleatoria. Por tanto, la
suma de variables independientes, según el Teorema Central de Límite, tiende a seguir una distribución normal
cuando el número de sumandos tiende a ∞ , en la práctica el VAN puede aproximarse a una normal cuando el
número de sumandos (Flujos de efectivo) es ≥ 10.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
Aplicación de la distribución Normal : El Riesgo en el análisis de inversiones
Una valoración financiera en un caso de certidumbre con un desembolso inicial de 14. 000 y flujos de caja de 7.000,
8.000 y 9.000 € (razón aritmética de 1.000) .
Se puede estimar que el VAN de esta inversión al 7% de costo de oportunidad es de 6.876,25€.
Pero supongamos que la situación es inestable rodeada de un ambiente de incertidumbre a causa de la desconfianza y
el alto riesgo que tomaron algunas bancas de inversión. Esto hace que los flujos de caja ya no sean seguros.
Al no tener los flujos de caja seguros, sólo se pueden hacer hipótesis sobre la posesión de los mismos. En este caso, y
en la mayoría de las inversiones, el mejor término cuantitativo para valorar la inversión es la PROBABILIDAD.
4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad
discreta y continua.
Distribuciones Muestrales
Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles.
Dos muestras aleatorias del mismo tamaño y tomadas de la misma población pueden no tener los mismos estadísticos.
Por las razones antes mencionadas se quiere estudiar la distribución de todos los valores posibles de un estadístico.
Las inferencias sobre las poblaciones se harán usando estadísticas muestrales.
Los valores de un estadístico de una muestra aleatoria puede considerarse como una variable aleatoria con su
correspondiente distribución de frecuencias.
La distribución de frecuencia de un estadístico muestral se denomina distribución muestral.
En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del
mismo tamaño.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la madia
muestral x para cada muestra; el conjunto de todas estas medias muestrales recibe el nombre de distribución muestral
de medias
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Una distribución muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la población y
calculándoles a éstas su estadístico. Si la población de la que se extraen las muestras es normal, la distribución
muestral de medias será normal sin importar el tamaño de la muestra.
Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la muestra debe ser mayor o
igual a 30, para que la distribución muestral tenga una forma acampanada.
Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución muestral de ser normal. Para muchos
propósitos, la aproximación normal se considera buena si se cumple n=30.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Distribución Muestral de Medias
La distribución normal, es una distribución continua en forma de campana en donde la media, la mediana y la moda
tienen un mismo valor y es simétrica. Con esta distribución se puede calcular la probabilidad de algún evento
relacionado con la variable aleatoria, mediante la siguiente fórmula:
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta fórmula se pueden a
hacer los cálculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribución z.
Cuando n > 30
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal,
con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de
16 focos tenga una vida promedio de menos de 775 horas.
Este valor se ubica en la
tabla z y ese valor
representa la
probabilidad buscada
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5
centímetros y una desviación estándar de 6.9 775 800 0.0062 14 centímetros. Si se extraen 200 muestras aleatorias de
tamaño 25 sin reemplazo de esta población, determine
a) El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b) El número de medias muestrales que caen por debajo de 172 centímetros.
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo, por lo que
se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en
cada inciso.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Distribución muestral de proporciones
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra
aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma
cigarrillos sea menor que 0.55.
Este valor se ubica en la
tabla z y ese valor
representa la
probabilidad buscada
Respuesta: La probabilidad de que al extraer una muestra de
800 estudiantes de esa universidad, la proporción de
estudiantes que fuman cigarrillos sea menor al 55% es del
0.18%.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción
adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de
150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra
de los usuarios que realmente presentan una reacción adversa, exceda el 4%.
Datos: n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción
adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de
150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra
de los usuarios que realmente presentan una reacción adversa, exceda el 4%.
Datos: n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
Respuesta: Existe una probabilidad del 17% de que al
tomar una muestra de 150 personas se tenga una
proporción mayor de 0.04 presentando una reacción
adversa.
0.1685
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la
probabilidad de que una muestra aleatoria de tamaño 60 tenga: a) Menos del 3% de los componentes defectuosos. b)
Más del 1% pero menos del 5% de partes defectuosas.
Datos:
n= 60 artículos
P=0.04
p= 0.03
p(p<0,03=?
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
ESTIMACION
El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra de una
población se quiere generalizar las conclusiones al total de la misma. Como vimos en la sección anterior, los estadísticos
varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el error estándar de un estadístico, más
cercanos serán unos de otros sus valores.
Estimación Puntual: El objetivo de la estimación puntual es seleccionar sólo un número, basados en datos de la muestra,
que represente el valor más razonable de ϴ
Una estimación puntual de un parámetro ϴ es un sólo número que se puede considerar como el valor más razonable de
ϴ. La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a partir de datos de la
muestra dada. La estadística seleccionada se llama estimador puntual de ϴ.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Propiedades de un Buen Estimador
Insesgado.- En otras palabras, un estimador insesgado es aquel para el cual la media de la distribución muestral es el
parámetro estimado
Eficiente o con varianza mínima.- Entre todos los estimadores de ϴ que son insesgados, se selecciona al que tenga
varianza mínima.
Consistencia.- Una estadística es un estimador consistente de un parámetro de población, si al aumentar el tamaño de la
muestra se tiene casi la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de la
población. Si un estimador es consistente se vuelve mas confiable si tenemos tamaños de muestras mas grandes.
Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la información contenida de la muestra que ningún
otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se esta
estimando.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Estimación por Intervalos
Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información alguna sobre la precisión y
confiabilidad de la estimación.
Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida de el
grado de fiabilidad en el intervalo.
Un nivel de confianza de 95% implica que 95% de todas las muestras daría lugar a un intervalo que incluye µ y sólo 5%
de las muestras producirá un intervalo erróneo.
Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro del
intervalo.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Encuentre el valor de z para un nivel de confianza del 95%
Se utilizará la tabla que tiene el área bajo la curva de –α hasta z.
El nivel de confianza bilateral está dividido en partes iguales bajo la curva
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
En base a la tabla que se esta utilizando, se tendrá que buscar el área de 0.975, ya que cada extremo o cola de la
curva tiene un valor de 0.025.
Por lo que el valor de z es de 1.96.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una muestra de mediciones de
zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la
concentración media de zinc en el río. Suponga que la desviación estándar de la población es 0.3.
La estimación puntual de m es x = 2.6. El valor de z para un nivel de confianza del 95% es 1.96, por lo tanto
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más amplio
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
PRUEBA DE HIPOTESIS
Se ha mostrado cómo puede estimarse un parámetro a partir de los datos contenidos en una muestra.
Puede encontrarse ya sea un sólo número (estimador puntual) o un intervalo de valores posibles (intervalo de
confianza).
En ocasiones se requiere que se tome una decisión entre aceptar o rechazar una proposición sobre algún
parámetro.
Esta proposición recibe el nombre de hipótesis. Este es uno de los aspectos más útiles de la inferencia estadística.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de poblaciones que al inicio
se supone cierta (es decir, la “creencia a priori”).
La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta es la hipótesis del
investigador.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que Ho es falsa.
Si la muestra no contradice decididamente a Ho, se continúa creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar Ho o no rechazar Ho.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
1. Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo
general tiene como resultado un aumento en la probabilidad del otro.
2. El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre se
puede reducir al ajustar el o los valores críticos.
3. Un aumento en el tamaño muestral n reducirá α y β de forma simultánea
Tipos de Ensayo
Se pueden presentar tres tipos de ensayo de hipótesis que son:
• Unilateral Derecho
• Unilateral Izquierdo
• Bilateral
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el
parámetro, en este caso el nivel de significancia se carga todo hacia el lado derecho,
para definir las regiones de aceptación y de rechazo.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución
en el parámetro, en este caso el nivel de significancia se carga todo hacia el lado
izquierdo, para definir las regiones de aceptación y de rechazo
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro.
El nivel de significancia se divide en dos y existen dos regiones de rechazo
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida
promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar
que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.
Solución:
1. Se trata de una distribución muestral de medias con desviación estándar conocida.
2. Datos:
µ=70 años
σ = 8.9 años
x = 71.8 años
n = 100
α = 0.05
3. Ensayo de hipótesis
Ho; α = 70 años.
H1; α > 70 años.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma aproximadamente normal con
una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 30 focos tiene una
duración promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media ha
cambiado? Utilice un nivel de significancia del 0.04.
1. Se trata de una distribución muestral de medias con desviación estándar conocida.
2. Datos:
µ=800 horas
σ = 40 horas
x = 788 horas
n = 30
α = 0.04
2. Ensayo de hipótesis
Ho; µ = 800 horas
H1; µ ≠ 800 horas
1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y
prueba de hipótesis.

Más contenido relacionado

La actualidad más candente

EstadÍstica Descriptiva
EstadÍstica DescriptivaEstadÍstica Descriptiva
EstadÍstica Descriptiva
jpgv84
 
ESTADISTICA DESCRIPTIVA E INFERENCIAL
ESTADISTICA DESCRIPTIVA E INFERENCIALESTADISTICA DESCRIPTIVA E INFERENCIAL
ESTADISTICA DESCRIPTIVA E INFERENCIAL
Luis Angel Vanegas
 
Resumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenResumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumen
Carlo Herrera
 
Introducción a la Estadística
Introducción a la EstadísticaIntroducción a la Estadística
Introducción a la Estadística
Mago016
 
Diapositivas Estadistica Descriptiva
Diapositivas Estadistica DescriptivaDiapositivas Estadistica Descriptiva
Diapositivas Estadistica Descriptiva
VIVIANAR19
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
LauraOspina49
 

La actualidad más candente (20)

Estadistica Jorge Rincòn
Estadistica Jorge RincònEstadistica Jorge Rincòn
Estadistica Jorge Rincòn
 
EstadíStica Descriptiva Para La InvestigacióN
EstadíStica Descriptiva Para La InvestigacióNEstadíStica Descriptiva Para La InvestigacióN
EstadíStica Descriptiva Para La InvestigacióN
 
Estadistica general
Estadistica generalEstadistica general
Estadistica general
 
EstadÍstica Descriptiva
EstadÍstica DescriptivaEstadÍstica Descriptiva
EstadÍstica Descriptiva
 
ESTADISTICA DESCRIPTIVA E INFERENCIAL
ESTADISTICA DESCRIPTIVA E INFERENCIALESTADISTICA DESCRIPTIVA E INFERENCIAL
ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
Resumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenResumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumen
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Introducción a la Estadística
Introducción a la EstadísticaIntroducción a la Estadística
Introducción a la Estadística
 
Introducción a la estadistica
Introducción a la estadisticaIntroducción a la estadistica
Introducción a la estadistica
 
Tarea de tecnologia (1)
Tarea de tecnologia (1)Tarea de tecnologia (1)
Tarea de tecnologia (1)
 
La estadistica
La estadistica La estadistica
La estadistica
 
Tarea de tecnologia (1)
Tarea de tecnologia (1)Tarea de tecnologia (1)
Tarea de tecnologia (1)
 
Diapositivas Estadistica Descriptiva
Diapositivas Estadistica DescriptivaDiapositivas Estadistica Descriptiva
Diapositivas Estadistica Descriptiva
 
2009 Ii 01 Estadistica Descriptiva Ii
2009 Ii 01 Estadistica Descriptiva Ii2009 Ii 01 Estadistica Descriptiva Ii
2009 Ii 01 Estadistica Descriptiva Ii
 
Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologia
 
Estadística, gráficos, tablas y estadígrafos.
Estadística, gráficos, tablas y estadígrafos.Estadística, gráficos, tablas y estadígrafos.
Estadística, gráficos, tablas y estadígrafos.
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Tarea de tecnologia
Tarea de tecnologiaTarea de tecnologia
Tarea de tecnologia
 
Tarea de tecnologia
Tarea de tecnologiaTarea de tecnologia
Tarea de tecnologia
 
Probabilidad y estadística
Probabilidad y estadísticaProbabilidad y estadística
Probabilidad y estadística
 

Similar a Presentación estadistica general 18 12-2015

Excel grupo para mp se nor lola drone tec
Excel grupo para mp se nor lola drone tecExcel grupo para mp se nor lola drone tec
Excel grupo para mp se nor lola drone tec
MaicolDorado
 
Excel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfExcel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdf
ssuserec44061
 
Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024
SofiaMurillo27
 

Similar a Presentación estadistica general 18 12-2015 (20)

Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel taller
 
Excel grupo para mp se nor lola drone tec
Excel grupo para mp se nor lola drone tecExcel grupo para mp se nor lola drone tec
Excel grupo para mp se nor lola drone tec
 
Excel (1).pdf trabajo en grupo 11-3....
Excel  (1).pdf trabajo en grupo 11-3....Excel  (1).pdf trabajo en grupo 11-3....
Excel (1).pdf trabajo en grupo 11-3....
 
Trabajo de excel tecnologia grado once tres
Trabajo de excel tecnologia grado once tresTrabajo de excel tecnologia grado once tres
Trabajo de excel tecnologia grado once tres
 
Excel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfExcel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdf
 
Excel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfExcel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdf
 
Excel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfExcel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdf
 
Excel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfExcel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdf
 
Excel avanzado y métodos estadísticos (1).pdf
Excel avanzado y métodos estadísticos (1).pdfExcel avanzado y métodos estadísticos (1).pdf
Excel avanzado y métodos estadísticos (1).pdf
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
estadisticas.pdf
estadisticas.pdfestadisticas.pdf
estadisticas.pdf
 
Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024Excel trabajo de estadística año lectivo 2024
Excel trabajo de estadística año lectivo 2024
 
Estadistica iii semana 1
Estadistica iii   semana 1Estadistica iii   semana 1
Estadistica iii semana 1
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011
 
manual de estadistica aplicado con ejercicios
manual de estadistica aplicado con ejerciciosmanual de estadistica aplicado con ejercicios
manual de estadistica aplicado con ejercicios
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 

Último

CA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdf
CA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdfCA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdf
CA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdf
AnghieQuiquiaContrer
 
Presentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptx
Presentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptxPresentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptx
Presentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptx
JulissaValderramos
 
INTRODUCCION A LA SEGMENTACIÓN MERCADO.pptx
INTRODUCCION A LA SEGMENTACIÓN MERCADO.pptxINTRODUCCION A LA SEGMENTACIÓN MERCADO.pptx
INTRODUCCION A LA SEGMENTACIÓN MERCADO.pptx
danielzabala41
 
Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...
Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...
Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...
lucerito39
 
empresa aje gropu trabajo grupal periodo 2024
empresa aje gropu trabajo grupal periodo 2024empresa aje gropu trabajo grupal periodo 2024
empresa aje gropu trabajo grupal periodo 2024
aldo678996
 

Último (20)

Grupo07_USIL_FIN2_BoMunLima_02_atuncar.ppt
Grupo07_USIL_FIN2_BoMunLima_02_atuncar.pptGrupo07_USIL_FIN2_BoMunLima_02_atuncar.ppt
Grupo07_USIL_FIN2_BoMunLima_02_atuncar.ppt
 
Que son y los tipos de costos predeterminados
Que son y los tipos de costos predeterminadosQue son y los tipos de costos predeterminados
Que son y los tipos de costos predeterminados
 
CA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdf
CA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdfCA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdf
CA152-UPC-Impuesto a la Renta-Sesión 4-2024-1.pdf
 
Presentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptx
Presentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptxPresentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptx
Presentación Seccion 5 -Estado de Resultado Integral y Estado de Resultados.pptx
 
Seguridad Ciudadana.pptx situación actual del país
Seguridad Ciudadana.pptx situación actual del paísSeguridad Ciudadana.pptx situación actual del país
Seguridad Ciudadana.pptx situación actual del país
 
COMPRENSION HISTORICA DEL IMPACTO DEL CAPITALISMO EN LA ECONOMIA DE VENEZUELA...
COMPRENSION HISTORICA DEL IMPACTO DEL CAPITALISMO EN LA ECONOMIA DE VENEZUELA...COMPRENSION HISTORICA DEL IMPACTO DEL CAPITALISMO EN LA ECONOMIA DE VENEZUELA...
COMPRENSION HISTORICA DEL IMPACTO DEL CAPITALISMO EN LA ECONOMIA DE VENEZUELA...
 
Lecturas de Historia del Pensamiento Económico (Adrian Ravier).pdf
Lecturas de Historia del Pensamiento Económico (Adrian Ravier).pdfLecturas de Historia del Pensamiento Económico (Adrian Ravier).pdf
Lecturas de Historia del Pensamiento Económico (Adrian Ravier).pdf
 
JOSE URBINA - Presentacion Sistema Endeudamiento.pptx
JOSE URBINA - Presentacion Sistema Endeudamiento.pptxJOSE URBINA - Presentacion Sistema Endeudamiento.pptx
JOSE URBINA - Presentacion Sistema Endeudamiento.pptx
 
Cálculo de portafolio, Rendimiento y riesgo.pptx
Cálculo de portafolio, Rendimiento y riesgo.pptxCálculo de portafolio, Rendimiento y riesgo.pptx
Cálculo de portafolio, Rendimiento y riesgo.pptx
 
flujogramadepoliconsultorio-policlínico-pampas
flujogramadepoliconsultorio-policlínico-pampasflujogramadepoliconsultorio-policlínico-pampas
flujogramadepoliconsultorio-policlínico-pampas
 
INTRODUCCION A LA SEGMENTACIÓN MERCADO.pptx
INTRODUCCION A LA SEGMENTACIÓN MERCADO.pptxINTRODUCCION A LA SEGMENTACIÓN MERCADO.pptx
INTRODUCCION A LA SEGMENTACIÓN MERCADO.pptx
 
Un plan de cuentas de una empresa comercial
Un plan de cuentas de una empresa comercialUn plan de cuentas de una empresa comercial
Un plan de cuentas de una empresa comercial
 
CHARLA SOBRE CONTROL INTERNO - COSO III.pptx
CHARLA SOBRE CONTROL INTERNO - COSO III.pptxCHARLA SOBRE CONTROL INTERNO - COSO III.pptx
CHARLA SOBRE CONTROL INTERNO - COSO III.pptx
 
Procedimientos Concursales y Disoluciones
Procedimientos Concursales y DisolucionesProcedimientos Concursales y Disoluciones
Procedimientos Concursales y Disoluciones
 
Guia appto bancor para creditos inmobiliarios en Cordoba
Guia appto bancor para creditos inmobiliarios en CordobaGuia appto bancor para creditos inmobiliarios en Cordoba
Guia appto bancor para creditos inmobiliarios en Cordoba
 
CLASIFICACION ECONOMICA INGRESOS Y GASTOS.ppt
CLASIFICACION ECONOMICA  INGRESOS Y GASTOS.pptCLASIFICACION ECONOMICA  INGRESOS Y GASTOS.ppt
CLASIFICACION ECONOMICA INGRESOS Y GASTOS.ppt
 
Encuesta Expectativas - Informe Mayo 2024.pdf
Encuesta Expectativas - Informe Mayo 2024.pdfEncuesta Expectativas - Informe Mayo 2024.pdf
Encuesta Expectativas - Informe Mayo 2024.pdf
 
Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...
Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...
Doctrina y Filosofía contable - Epistemología contable, fundamentos, conceptu...
 
empresa aje gropu trabajo grupal periodo 2024
empresa aje gropu trabajo grupal periodo 2024empresa aje gropu trabajo grupal periodo 2024
empresa aje gropu trabajo grupal periodo 2024
 
Nulidad y Resolución del Contrato de los Contratos Públicos del Estado
Nulidad y Resolución del Contrato  de los Contratos Públicos del EstadoNulidad y Resolución del Contrato  de los Contratos Públicos del Estado
Nulidad y Resolución del Contrato de los Contratos Públicos del Estado
 

Presentación estadistica general 18 12-2015

  • 1. ESTADISTICA GENERAL Acompañamiento examen complexivo Mariela Sánchez Alejandro
  • 2. Tema: Estadística General 1. Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos 2. Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central 3. Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. 4. Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua 5. Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Bibliografía: Lind, Marchal, Wathen, 2012, Estadística aplicada a los negocios y la economía, McGraw Hill. Webster, Allen, 2001, Estadística aplicada a los negocios y la economía.
  • 3. La estadística es una de las herramientas más ampliamente utilizadas; su aplicación en instituciones gubernamentales y educativas, en los negocios, en la industria, en la banca y en otros quehaceres diarios hacen de la estadística una herramienta indispensable. Sin embargo el término “Estadística” tiene varios significados para diferentes personas; para la gente común y corriente la estadística solamente significa números. En el diario de la mañana se puede encontrar la estadística más reciente sobre los delitos de la ciudad que hayan sido denunciados en determinado periodo de tiempo; de los nacimientos y muertes que han ocurrido, o en relación con el deporte, el número de partidos ganados y perdidos. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
  • 4. Para otras personas es un método para obtener, presentar y escribir grandes cantidades de datos, y para otras es un método para tomar decisiones en situaciones difíciles. La estadística también sirve para examinar el riesgo en el análisis de inversiones, los estudios de probabilidad nos permiten predecir, en cierta medida, los comportamientos de las inversiones, o al menos, las posibles ganancias o pérdidas en cualquier caso. Esto resulta muy útil para decidir cuándo invertir o no y de qué manera hacerlo. La necesidad de valorar algo que puede o no suceder ha llevado a aplicar conceptos como el valor esperado o la varianza a las finanzas. Las estadísticas de las finanzas públicas miden las actividades financieras de un gobierno en una economía. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
  • 5. 1.- La estadística como disciplina o área de estudio. 2. - La estadística o las estadísticas como resultados que presentan organismos de estadística oficiales. 3. - Un estadístico como un procedimiento para obtener un número a partir de valores de una encuesta. Como área de estudio, la Estadística proporciona los métodos que ayudan a resolver los problemas correspondientes, para ello es necesario conocer los conceptos básicos que conforman los contenidos de esta materia tales como: a) Población. b) Muestra. c) Variable. d) Datos u observaciones. e) Parámetros. f) Estadígrafos o Estadísticos. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
  • 6. Población: es un conjunto de personas, entidades u objetos del cual se quiere saber algo que nos interesa para tomar una determinación acertada. La población puede ser finita o infinita. Muestra: es un subconjunto de la población que se estudia para determinar el parámetro que describe la característica deseada de la misma. Muestra aleatoria es aquella que se obtiene de tal manera que cada posible observación disponible en la población, tiene la misma probabilidad de ser seleccionada Para poder obtener estas muestras es necesario que no intervenga la preferencia del investigador por algún elemento de la población; es decir, cada elemento de la población deberá tener igual oportunidad de ser seleccionado 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
  • 7. Variable: característica observable de un suceso, objeto o hecho que es susceptible a medición. Las variables se clasifican en cualitativas y cuantitativas. Variable aleatoria: es una función que asocia un numero a cada resultado del espacio muestral. Datos u observaciones: Es el elemento primario de la información, los datos reunidos pueden cobrar significación. Solo o aislado el dato no posee relevancia, pero utilizado en las premisas de un razonamiento puede llevarnos a una conclusión. Surgen de la observación o la experiencia. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
  • 8. Parámetros: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún atributo. Intenta resumir toda la información que hay en la población en unos pocos números. Estadígrafos o Estadísticos: Es la cantidad numérica calculada sobre una muestra que resume su información en algún aspecto. Los promedios y proporciones muestrales son características medibles de las muestras respectivas. Los indicadores que permiten hallar un valor numérico, el mismo que representa a toda la población o muestra en estudio se les denomina estadígrafos. Si un estadístico se usa para aproximar un parámetro suele llamarse estimador. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos
  • 9. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos “La Estadística Descriptiva es el estudio que incluye la obtención, organización, presentación y descripción de información numérica”. “La inferencia estadística es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información obtenida mediante técnicas descriptivas”.
  • 10. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que pueden tomar las variables, la primera tarea de la Estadística es la de ordenar y presentar los datos en tablas que permitan ver la tendencia de los mismos. Ordenados los datos se facilita su representación en diagramas y gráficas de diferentes tipos. Existen diferentes formas de describir, presentar, ordenar, resumir la información en tablas y su presentación en diferentes tipos de gráficas. Escalas de Medición. La clasificación de las variables depende del nivel de medición de la característica deseada. El nivel de medición también denominado escalas de medición, se lo puede clasificar en: 1. Nominal: es la que se usa para asignarle una etiqueta a las categorías que se construyen de la variable con el único fin de distinguir unas de otras. 2. Ordinal: es la que permite ordenar o jerarquizar las categorías que se construyen de la variable que se evalúa. 3. Por intervalo: es la que permite clasificar, ordenar y cuantificar las categorías que se establecen de la variable. En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la siguiente forma: 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
  • 11. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la siguiente forma: 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos. Definición de variable: Número de caballo Lugar que ocupó Tiempo que hizo
  • 12. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la siguiente forma: 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos. Definición de variable: Tipo de variable: Número de caballo Variable cualitativa nominal Lugar que ocupó Variable cualitativa ordinal Tiempo que hizo Variable cuantitativa continua
  • 13. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la siguiente forma: 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos. Definición de variable: Tipo de variable: Escalas de medición: Número de caballo Variable cualitativa nominal Nominal (numeración de los caballos). Lugar que ocupó Variable cualitativa ordinal Ordinal (lugar ocupado en la carrera). Tiempo que hizo Variable cuantitativa continua Por intervalos (tiempo durante el recorrido). La escala de medición por intervalos es la de mayor nivel de medición e incluye las dos anteriores; para poder usarse con la precisión deseada es necesario fijar un patrón de medida que cuantifique a la variable con la misma exactitud, cuantas veces sea medida.
  • 14. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Distribución de Frecuencias Los datos agrupados en tablas, nos permiten ver con facilidad el número de observaciones iguales o comprendidos en un intervalo, a este número de repeticiones iguales de la variable se llama frecuencia y se denota por fi. Otros valores relacionados con la frecuencia son:  La frecuencia relativa que se denota por fr.  La frecuencia acumulada que se denota por Fi.  La frecuencia relativa acumulada que se denota Fr. Distribución de Frecuencias Absolutas y Relativas Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los datos obtenidos en la investigación de campo, para ello se concentran en tablas de frecuencia y éstas pueden ser:  Absoluta.  Relativa.  Acumulada.
  • 15. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las características y bondades de las carreras de Ingeniería, Química, Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario donde especificaron además de los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados: I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M, Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I, M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q a) ¿Qué variable que se analiza? b) ¿Qué tipo de variable es? c) ¿Qué tipo de escala define la variable?
  • 16. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las características y bondades de las carreras de Ingeniería, Química, Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario donde especificaron además de los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados: I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M, Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I, M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q a) ¿Qué variable que se analiza? Carrera de preferencia b) ¿Qué tipo de variable es? Cualitativa nominal c) ¿Qué tipo de escala define la variable? Nominal CATEGORÍAS NÚMERO DE ALUMNOS ( f ) I 8 Q 14 M 13 A 10 Total 45 Frecuencia absoluta es el número de veces que se repite la misma observación. Se simboliza con ( f )
  • 17. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos a) ¿Cuál categoría es la de mayor frecuencia? b) ¿Qué información podemos determinar con la categoría de mayor frecuencia? c) ¿Qué carrera es la menos solicitada? CATEGORÍAS NÚMERO DE ALUMNOS ( f ) I 8 Q 14 M 13 A 10 Total 45
  • 18. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos a) ¿Cuál categoría es la de mayor frecuencia? Química b) ¿Qué información podemos determinar con la categoría de mayor frecuencia? La carrera de Química es la mas solicitada c) ¿Qué carrera es la menos solicitada? Ingeniería CATEGORÍAS NÚMERO DE ALUMNOS ( f ) I 8 Q 14 M 13 A 10 Total 45
  • 19. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos El gerente de una Empresa, Kimberly preocupado por el pago de energía consumida solicito al jefe de planta, un estudio del consumo diario durante el mes de agosto. Los resultados obtenidos. KW/hr (kilowatts por hora) son los siguientes: Consumo de energía en KW/hr de la empresa Kimberly correspondiente al mes de agosto de 2015 Consumo (KW/hr) ( f ) 5 2 6 3 7 4 8 5 9 6 10 5 11 3 12 2 Total 30 Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
  • 20. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos a) Define la variable del problema b) ¿Qué tipo de variable es? c) ¿Qué valores toma la variable? d) ¿Qué tipo de escala define la variable? e) ¿Cuál es la mayor frecuencia de la variable? f) ¿Qué frecuencia tiene la variable cuya categoría es 10? Consumo (KW/hr) ( f ) 5 2 6 3 7 4 8 5 9 6 10 5 11 3 12 2 Total 30 Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
  • 21. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos a) Define la variable del problema: Consumo en KW/hr b) ¿Qué tipo de variable es? Cuantitativa contínua c) ¿Qué valores toma la variable? Los valores de la variable se encuentran en un rango de 5 a 12 KW/hr d) ¿Qué tipo de escala define la variable? Por intervalos e) ¿Cuál es la mayor frecuencia de la variable? La mayor frecuencia es 6 y significa en 6 días del mes se tiene consumo de 9 KW/hr. f) ¿Qué frecuencia tiene la variable cuya categoría es 10? La frecuencia de la categoría 10 es 5 lo cual significa que en 5 días del mes hubo un consumo de 10 KW/hr. Consumo (KW/hr) ( f ) 5 2 6 3 7 4 8 5 9 6 10 5 11 3 12 2 Total 30 Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
  • 22. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Otro parámetro importante es la frecuencia relativa que simbolizaremos con “fr”, ésta se obtiene dividiendo la frecuencia absoluta (fi) entre el número de elementos de la muestra que simbolizaremos con (n). La frecuencia relativa se puede expresar como una razón, como una proporción o como un porcentaje. Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015 Frecuencia relativa (fr) es la proporción de elementos que pertenecen a una categoría y ésta se obtiene dividiendo su frecuencia absoluta entre el número total de elementos de la muestra. Consumo (KW/hr) ( f ) ( fr ) Razón Proporción Porcentaje 5 2 2/5 0,07 7% 6 3 3/30 0,10 10% 7 4 4/30 0,13 13% 8 5 5/30 0,17 17% 9 6 6/30 0,20 20% 10 5 5/30 0,17 17% 11 3 3/30 0,10 10% 12 2 2/30 0,07 7% Total 30 30/30 1,00 100%
  • 23. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Gráficas Al representar en una gráfica la información concentrada en la tabla de frecuencias, ésta es un recurso visual que nos permite tener una idea clara, precisa, global y rápida acerca de las observaciones de una muestra o población. Existen muchos tipos de gráficas en las que se pueden representar la frecuencia absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos estimar algunos valores con la simple observación. Los diferentes tipos de gráfica que podemos usar para representar las observaciones de un determinado problema y la selección de este tipo, dependen de la variable en estudio. Si la variable en estudio es del tipo cualitativo, los gráficos pueden ser: a) De barras; horizontales o verticales b) Circulares c) Pictogramas Si la variable en estudio es de tipo cuantitativo, los gráficos que podemos usar para su representación gráfica son: a) Histogramas b) Polígonos de frecuencias
  • 24. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de frecuencias de una variable continua. Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo que le indica al gerente de personal que realice un análisis del problema. El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad: 13, 19, 22, 14, 13, 16, 19, 21 23, 11, 27, 25, 17, 17, 13, 20 23, 17, 26, 20, 24, 15, 20, 21 23, 17, 29, 17, 19, 14, 20, 20 10, 22, 18, 25, 16, 23, 19, 20 21, 17, 18, 24, 21, 20, 19, 26
  • 25. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de frecuencias de una variable continua. Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo que le indica al gerente de personal que realice un análisis del problema. El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad: 13, 19, 22, 14, 13, 16, 19, 21 23, 11, 27, 25, 17, 17, 13, 20 23, 17, 26, 20, 24, 15, 20, 21 23, 17, 29, 17, 19, 14, 20, 20 10, 22, 18, 25, 16, 23, 19, 20 21, 17, 18, 24, 21, 20, 19, 26
  • 26. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos  La mayor frecuencia es f4 = 16  Los años de antigüedad no inician desde cero  Las líneas verticales punteadas corresponden al punto medio o marca de clase y éste nos indica el promedio de las puntuaciones en cada clase.  Para la tercera barra, el promedio en años cumplidos de los obreros de la empresa ubicados en esa clase es de M3 =17 años y como la frecuencia es f3 = 10 obreros con la misma antigüedad. Años de servicio Frecuencia (numero de obreros)
  • 27. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Polígono de Frecuencia El polígono de frecuencia se construye a partir de los datos de la tabla de frecuencias. Sobre el eje horizontal se levanta por el punto medio segmentos verticales punteados que terminan a la altura de su frecuencia de clase, se unen los puntos superiores con un segmento de recta que empieza medio punto antes del límite superior de la última clase.
  • 28. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Polígono de Frecuencia acumulada relativa Si en la escala vertical en lugar de representar las frecuencias absolutas, se representa la frecuencia relativa, se obtiene un polígono de frecuencia acumulada
  • 29. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Polígono de Frecuencia acumulada (Ojiva) La gráfica de la frecuencia acumulada es muy útil porque en ella podemos determinar cuántas observaciones hay por arriba o por debajo de algún valor que nos interese. La gráfica que se obtiene de la frecuencia acumulada también se conoce con el nombre de ojiva.
  • 30. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas Gráficas Circulares. Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. es un recurso estadístico que se utiliza para representar porcentajes y proporciones. Consisten en subgrupos que son combinados para formar una unidad entera.
  • 31. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas Diagrama de barras. Los gráficos de barras, que también llamados gráficos de columnas, muestran observaciones hechas a lo largo del tiempo. Son principalmente utilizados para mostrar el cambio de una variable en el tiempo.
  • 32. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas Pictograma Es otra forma de representación gráfica de la información de un determinado problema. En este tipo de gráfica se usa la imagen de la variable, por ejemplo: a) Árboles: si la variable representa árboles. b) Libros: si la variable representa libros. c) Casas: si la variable representa casas. d) Figuras de personas: si la variable son personas, etcétera.
  • 33. 1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos En Estadística Descriptiva el material de trabajo lo constituyen los datos, que son los resultados de las observaciones. Una vez obtenidos los datos hay que ordenarlos y clasificarlos mediante algún criterio racional de modo que sea posible una visión crítica de los mismos.
  • 34. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Medidas de tendencia central: se refieren a los valores de la variable que suelen estar en el centro de la distribución. Análisis estadísticos sencillos que se usan para describir características, o elementos típicos, de la información que se recoge con el fin de resumir los datos e indicar similitudes o diferencias entre ellos que permita comparar dos grupos de datos. Moda: La moda de una muestra x1, x 2,…xn es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el valor que más se repite, y se denota por Mo.
  • 35.
  • 36.
  • 37. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central EDAD mi fi fri fri% Fi Fri Fri% 50-60 55 10 0,2 20% 10 0,2 20% 60-70 65 18 0,36 36% 28 0,56 56% 70-80 75 14 0,28 28% 42 0,84 84% 80-90 85 6 0,12 12% 48 0,96 96% 90-100 95 2 0,04 4% 50 1 100% EJEMPLO: Edad de jubilados encuestados
  • 38. Cálculo de la moda para datos agrupados Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase que tiene mayor frecuencia llamado clase modal. Para determinar un solo valor de este intervalo para la moda utilizamos la siguiente ecuación: Mo = Moda LMo = Límite inferior de la clase modal d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior a ella (d1 = fi – fi-1 ) d2 = frecuencia de la clase modal menos la frecuencia de la clase posterior a ella (d2 = fi – fi+1 ) h = amplitud del intervalo de clase 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central
  • 39. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central EDAD mi fi fri fri% Fi Fri Fri% 50-60 55 10 0,2 20% 10 0,2 20% 60-70 65 18 0,36 36% 28 0,56 56% 70-80 75 14 0,28 28% 42 0,84 84% 80-90 85 6 0,12 12% 48 0,96 96% 90-100 95 2 0,04 4% 50 1 100% EJEMPLO: Edad de jubilados encuestados La clase modal es 60-70 , ya que es la que presenta la mayor frecuencia LMo = 60 fi = 18 fi-1= 10 fi+1 = 14 d1 = 18 – 10 =8 d2 = 18-14 = 4 h = 10
  • 40. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Mediana: Dado un conjunto de n observaciones x1, x 2,…., xn, de la variable x, se define la mediana de este conjunto de valores, como aquel valor que no es superado ni supera a más de la mitad de las n observaciones, arregladas en orden de magnitud creciente o decreciente. Cálculo de la Mediana: Ordenar los datos en orden de magnitud creciente, X(1) X(2) X(n) entonces la mediana esta definida mediante la siguiente fórmula: Nota: En general, la mediana no se ve afectada por valores muy grandes o por valores muy pequeños en los datos en comparación a la media. Por ejemplo, si x 3= 40, la media es 1/3(1+2+40)=14.33, sin embargo la mediana es Me=2.
  • 41. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central x1 2 x2 3 x3 5 x4 6 x5 8 La mitad de las observaciones son menores o iguales que 5 y la otra mitad son mayores o iguales que 5.
  • 42. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central x1 2 x2 3 x3 5 x4 6 x5 8 x6 9 La mitad de las observaciones son menores o iguales que 5,5 y la otra mitad son mayores o iguales que 5,5.
  • 43. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Cálculo de la mediana para datos agrupados Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase que contiene a la mediana llamado clase mediana. Para ello, debemos determinar la frecuencia acumulada absoluta que contenga al elemento número El valor de este intervalo para la mediana se calcula utilizando la siguiente ecuación: Me = Mediana Lm = Límite inferior de la clase mediana n = cantidad de datos Fi-1 = frecuencia acumulada absoluta de la clase anterior al intervalo mediana fi = frecuencia absoluta de la clase mediana h = amplitud del intervalo de clase
  • 44. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central EDAD mi fi fri fri% Fi Fri Fri% 50-60 55 10 0,2 20% 10 0,2 20% 60-70 65 18 0,36 36% 28 0,56 56% 70-80 75 14 0,28 28% 42 0,84 84% 80-90 85 6 0,12 12% 48 0,96 96% 90-100 95 2 0,04 4% 50 1 100% La clase mediana es la que contenga el elemento en la posición (50+1)/2 =25,5 es el intervalo 60-70 Buscamos en la frecuencia acumulada Fi y vemos que se halla en el intervalo [60, 70)
  • 45. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Media: La media (o promedio) de una muestra x1, x 2,…xn de tamaño n de una variable x, se define como la suma de todos los valores observados en la muestra, dividida por el número total de observaciones n, es decir: Por ejemplo si los datos son x1 = 1, x 2 =2, x3=3, entonces la media es 1/3(1+2+3)=2.
  • 46. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central El Departamento de Acción Social ofrece un estímulo especial a aquellas agrupaciones en las que la edad promedio de los niños que asisten está por debajo de 9 años. Si los siguientes datos corresponden a las edades de los niños que acuden de manera regular al Centro ¿calificará éste para el estímulo? 8 5 9 10 9 12 7 12 13 7 8
  • 47. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Cálculo de la media para datos agrupados Para calcular la media para datos agrupados, primero calculamos el punto medio de cada clase (marca de clase mi ). Después se multiplica cada punto medio por la frecuencia absoluta de cada intervalo
  • 48. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA Entre las medidas de tendencia central, la media requiere variables cuantitativas (de intervalo, aunque también suele calcularse con datos ordinales). La mediana es un estadístico típicamente ordinal (requiere valores ordinales al menos). Al contrario de lo que ocurre con la media, la mediana es insensible a la presencia de valores extremos, por lo tanto es preferible a la media cuando la distribución es asimétrica. La moda sirve para todo tipo de variables, pero es mas apropiada para caracterizar datos categóricos porque es un estadístico que aprovecha información nominal. Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
  • 49. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA En una distribución con sesgo positivo, la moda se halla en el punto más alto de la distribución, la mediana está hacia la derecha de la moda y la media más a la derecha. Es decir Mo < Me < x En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir, x < Me < Mo Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser la mejor medida de posición, debido a que está siempre entre la media y la moda. La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores extremos como la media. - Variables cualitativas: Solo podremos calcular la moda - Variables ordinales: moda y mediana - Variables cuantitativas: Podemos calcular las 3
  • 50.
  • 51. El salario medio es de 34419,57 dólares ( media). La mitad de los encuestados tienen salarios por debajo de 28875 dólares (mediana, percentil 50). La diferencia entre en encuestado de mayor sueldo y el que menos gana es 119250 dólares (rango). El 50% de los encuestados tienen salarios comprendidos entre 24000 y 37162,5 dólares. (percentiles 25 y 75)
  • 52.
  • 53. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Medidas de posición: en ocasiones es necesario saber que ocurre no solo en el centro sino también en otros puntos de la población. Las medidas de posición no ayudarán a encontrar otros puntos dentro de la distribución de datos y desde ahí poder tomar decisiones. Cuartiles: divide la población en 4 partes iguales, calcula los percentiles 25, 50 y 75, es decir los valores por debajo de los cuales se encuentra el 25%, el 50% y el 75% de los casos. Deciles: divide la población en 10 partes iguales Percentiles: divide la población en 100 partes iguales, se usa también como genérico para dividir en valores concretos (valores que acumulan un determinado porcentaje de casos) Medidas de tendencia central: Nota media de un examen en una clase de 30 niños Medidas de posición: ¿Qué nota debe sacar un alumno para superar al 50% de compañeros?
  • 54. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por parte de una clínica, de reportes clínicos para realizar estudios de glucosa. Intervalos Promedio de días Número de pacientes Frecuencia acumulada 1 día a 9 días 5 5 5 10 día a 19 días 14.5 6 11 20 día a 29 días 24.5 8 19 30 día a 39 días 34.5 8 27 40 día a 49 días 44.5 4 31 50 día a 59 días 54.5 5 36 60 día a 69 días 64.5 7 43 70 día a 79 días 74.5 8 51 80 día a 89 días 84.5 4 55 90día a 100 días 94.5 8 63 ¿Cuál es el numero de datos a considerar? ¿En que intervalo se ubica el primer cuartil? ¿En que intervalo se ubica el segundo cuartil? ¿En que intervalo se ubica el tercer cuartil?
  • 55. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por parte de una clínica, de reportes clínicos para realizar estudios de glucosa. Intervalos Promedio de días Número de pacientes Frecuencia acumulada 1 día a 9 días 5 5 5 10 día a 19 días 14.5 6 11 20 día a 29 días 24.5 8 19 30 día a 39 días 34.5 8 27 40 día a 49 días 44.5 4 31 50 día a 59 días 54.5 5 36 60 día a 69 días 64.5 7 43 70 día a 79 días 74.5 8 51 80 día a 89 días 84.5 4 55 90día a 100 días 94.5 8 63 ¿Cuál es el numero de datos a considerar? 63 ¿En que intervalo se ubica el primer cuartil? 3 ¿En que intervalo se ubica el segundo cuartil? 6 ¿En que intervalo se ubica el tercer cuartil? 8 Si el primer cuartil es 15,75 y representa 25,34 días ¿qué significa esto? Si el segundo cuartil es 31,5 y representa 50,9 días ¿a que conclusiones se puede llegar? Si el tercer cuartil es 47,25 y representa 74,78 días ¿Qué puede concluir?
  • 56. 2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia central Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por parte de una clínica, de reportes clínicos para realizar estudios de glucosa. Intervalos Promedio de días Número de pacientes Frecuencia acumulada 1 día a 9 días 5 5 5 10 día a 19 días 14.5 6 11 20 día a 29 días 24.5 8 19 30 día a 39 días 34.5 8 27 40 día a 49 días 44.5 4 31 50 día a 59 días 54.5 5 36 60 día a 69 días 64.5 7 43 70 día a 79 días 74.5 8 51 80 día a 89 días 84.5 4 55 90día a 100 días 94.5 8 63 Si el primer cuartil es 15,75 y representa 25,34 días ¿qué significa esto? El 25% de los pacientes fueron mandados a valoración en 25,34 días y el 75% de los pacientes lo hicieron después de 25,34 días Si el segundo cuartil es 31,5 y representa 50,9 días ¿a que conclusiones se puede llegar? Que en 50,9 días se habían atendido al 50 % de los pacientes a ser valorados de los niveles de glucosa Si el tercer cuartil es 47,25 y representa 74,78 días ¿Qué puede concluir? El 75% de pacientes que envió la clínica a realizarse estudios de glucosa lo realizo en 74,78días y el resto en los otros días restantes
  • 57. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. Las medidas de dispersión estudian la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes: 1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. 2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están. 3.- Desviación típica: Se calcula como raíz cuadrada de la varianza. 4.- Coeficiente de variación de Pearson: Se calcula como cociente entre la desviación típica y la media. El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie. Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene vienes expresada en cm y la otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
  • 58. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva: a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra. Para medir el nivel de concentración de una distribución de frecuencia se pueden utilizar distintos indicadores, entre ellos el Indice de Gini. El Indice Gini (IG) puede tomar valores entre 0 y 1 IG = 0 : concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango. IG = 1 : concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados. b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares. c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra.
  • 59. Ejemplo 1: vamos a calcular el índice de Gini de una serie de datos con los sueldos de los empleados de una empresa. Sueldos (miles de €) Empleados 20 10 27 12 36 8 48 5 60 3 90 1 120 1 Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi 20 10 10 25,0 200 200 13,8 11,2 27 12 22 55,0 324 524 36,3 18,7 36 8 30 75,0 288 812 56,3 18,7 48 5 35 87,5 240 1052 73,0 14,5 60 3 38 95,0 180 1232 85,4 9,6 90 1 39 97,5 90 1322 91,7 5,8 120 1 40 100,0 120 1442 100,0 0 X x x x x x x x Σpi (entre 1 y n-1) = 435,0 Σ(pi - qi) (entre 1 y n-1 )= 78,5 Datos: Calculamos los valores que necesitamos para aplicar la fórmula: Por lo tanto: G=78,5/435,0=0,18 (18%) Un coeficiente de Gini de 0,18 indica que la muestra está bastante uniformemente repartida, es decir, su nivel de concentración no es excesivamente alto. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. 0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos). 1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno).
  • 60. Ejemplo 2: el mismo ejemplo pero considerando que hay más personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor concentración de renta en unas pocas personas. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. 0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos). 1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno). Sueldos (miles de €) Empleados 20 10 27 10 36 8 48 5 60 3 90 0 120 4 Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi 20 10 10 25,0 200 200 10,9 14,1 27 10 20 50,0 270 470 25,6 24,4 36 8 28 70,0 288 758 41,2 28,8 48 5 33 82,5 240 998 54,3 28,2 60 0 33 82,5 0 998 54,3 28,2 90 0 33 82,5 0 998 54,3 28,2 120 7 40 100,0 840 1838 100,0 0,00 x x x x x x x x Σpi (entre 1 y n-1) = 392,5 Σ(pi - qi) (entre 1 y n-1 ) = 151,9Por tanto: G=151,9/392,5=0,39 (39%) Datos: Calculamos los valores que necesitamos para aplicar la fórmula: El coeficiente de Gini se ha elevado considerablemente, reflejando la mayor concentración de rentas en la empresa.
  • 61. Ejemplo 3: INDICE DE GINI DE LA UNIÓN EUROPEA (2001, 15 países) 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
  • 62. CONCLUSIÓN: se puede observar que Portugal, España y Grecia son los países con mayores desigualdades. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. Ejemplo 3: INDICE DE GINI DE LA UNIÓN EUROPEA (2001, 15 países)
  • 63. Asimetría o sesgo Es un estadístico que describe la simetría de la distribución alrededor de la media. Si el sesgo es igual a cero, la distribución es simétrica (normal), ambas colas será iguales. Si no existe una cola o sesgo, la asimetría tendrá un valor de cero. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
  • 64. Existe asimetría negativa (o a la izquierda) si la "cola" a la izquierda de la media es más larga que la de la derecha, es decir, si hay valores más separados de la media a la izquierda. Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la media es más larga que la de la izquierda, es decir, si hay valores más separados de la media a la derecha. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
  • 65. La siguiente afirmación es verdadera o falsa: Una curva asimétrica con skewness (sesgo) positivo, indica que los valores tienden a reunirse en la zona de los valores menores a la media. Si los valores están más reunidos en niveles superiores a la media ¿qué tipo de sesgo tenemos? Curtosis, es un estadístico que describe el grado de “punta” o “achatamiento” de la distribución de una variable con relación a la distribución normal. El uso del coeficiente de la Curtosis es muy importante para establecer el grado en el que la distribución de los valores se acerca o aleja de la curva normal. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
  • 66. La curtosis positiva indica una distribución que perfila un gráfico “más en punta”, tal como vemos en la curva del centro, con relación a la normal; será Leptocúrtica. En una distribución normal, la media, la mediana y la moda son iguales entre sí. Una curtosis negativa indica una distribución relativamente más achatada, como la que vemos a la derecha; será Platicúrtica. Si el coeficiente es positivo, quiere decir que hay una mayor concentración de los datos en torno a la media. (Leptocurtica) Si el coeficiente es negativo, la distribución se llama Platicúrtica y muestra que hay una menor concentración de datos en torno a la media; sería más achatada. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
  • 67. El Error típico es una disposición de ajuste, la cual nos informa que estas medidas pueden variar entre el rango de más o menos el error típico. Entre mayor sea el valor de error, mayor será la variación de los datos. Por ejemplo para la Asimetría = -0.179 el error es 0.141, es decir, la asimetría va desde -0.320 hasta -0.038. De igual manera, se puede emplear el valor del error típico con la Curtosis y la Media.
  • 68.
  • 69. N = 70 significa que se tomó en cuenta 70 valores de la muestra; no hay valores perdidos La Media, da el promedio de las ventas en todos los departamentos de la firma; en este caso, el promedio es de $54. La Mediana, es de $24; de inmediato se nota la diferencia que hay con la media. La Desviación Típica, $103.9394; muestra la dispersión media de las ventas. El valor que nos da la tabla para el análisis sobre las ventas es de 5,325; el error típico de la Asimetría es 0,287 Es un valor positivo, por lo tanto las ventas en general, en los departamentos, se reúnen en valores menores a la media, mostrando un desempeño no eficiente. El valor de la curtosis en la tabla es 34,2920, lo que indica que los valores están concentrados alrededor de la media. El Rango es la diferencia entre el valor mínimo y máximo; el Mínimo es$6; el Máximo es 776.50 El Rango es 770.5
  • 70.
  • 71.
  • 72. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. σBσA Se realizan los gráficos del comportamiento probabilístico de dos inversiones. Luego de analizarlos ¿en cuál de las dos invertiría? ¿Cuál de las dos inversiones es más rentable? ¿cómo lo deduce? ¿cuál de las dos inversiones es menos riesgosa?
  • 73. 3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de dispersión, concentración, asimetría y curtosis. σBσA Se realizan los gráficos del comportamiento probabilístico de dos inversiones. Luego de analizarlos ¿en cuál de las dos invertiría? ¿Cuál de las dos inversiones es más rentable? La inversión más rentable es la inversión B ¿cómo lo deduce? Debido a que la media de B es mayor que la media de A ¿cuál de las dos inversiones es menos riesgosa? La inversión A es menos riesgosa, debido a que tiene lo datos menos dispersos alrededor de la media.
  • 74. ESPACIO MUESTRAL : S ó Ω Es un conjunto que corresponde a todos los resultados posibles de un experimento listados de modo completo y mutuamente excluyente. A cada elemento que forma parte del espacio muestral se le denomina suceso elemental. Ejemplos: 1.- Experimento: Lanzar una moneda. S= {sale cara, sale sello} ó S = {c,s}. 2.- Experimento: Lanzar dos monedas S = {(c,c), (c,s), (s,c), (s,s)}. 3.- Experimento: Lanzar un dado S = { 1, 2, 3, 4, 5, 6} 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 75. EVENTO O SUCESO: Es un subconjunto del espacio muestral. Es un suceso aleatorio. Experimento: Se lanza un dado S = {1, 2, 3, 4, 5, 6} 1. Evento A: Obtener un número primo A = {2, 3, 5} 2. Evento B: Obtener un número primo y par B = {2} 3. Evento C: Obtener un número mayor o igual a 5 C = {5, 6} 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua. ¿Cómo obtener una probabilidad? Si realizamos un experimento aleatorio en el que hay n sucesos, todos igualmente probables, equiprobables; entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:
  • 76. EJEMPLO 1 Supongamos que se quiere estudiar la incidencia del hecho de ser fumador como factor de riesgo en el desarrollo de una enfermedad en una determinada población. Para ello se diseñó un estudio prospectivo y, tras seleccionar una muestra de 180 sujetos, los resultados se muestran en la (Tabla de contingencia). 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 77. ¿Cuál es la probabilidad de desarrollar una enfermedad ? ¿Cuál es la probabilidad de seleccionar un sujeto fumador? E: Desarrollar una enfermedad Número de sujetos enfermos 80 Elementos tiene la muestra 180 P(E) 80/180 Respuesta 0,444444444 F: Seleccionar un fumador Número de fumadores 70 Elementos tiene la muestra 180 P(F) 70/180 Respuesta 0,38888889 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 78. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua. c. ¿ Cuál es la probabilidad de seleccionar un sujeto no fumador? Fc: No sea fumador Número de fumadores 70 Número de no fumadores 110 Elementos tiene la muestra 180 Probabilidad 110/180 Respuesta 0,61111111 E y F: Desarrollar una enfermedad y sea fumador Número de sujetos enfermos y fumadores 60 Elementos tiene la muestra 180 P (E y F) 60/180 Respuesta 0,333333333 d. ¿Cuál es la probabilidad de que el sujeto desarrolle una enfermedad y sea fumador?
  • 79. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua. f. ¿Cuál es la probabilidad de que el sujeto desarrolle una enfermedad o sea fumador? E: Desarrollar una enfermedad F: Seleccionar un fumador E o F: Desarrollar una enfermedad o sea fumador Número de sujetos enfermos 80 Número de fumadores 70 Número de sujetos enfermos y fumadores 60 Número de sujetos enfermos o fumadores 80 + 70 - 60 Elementos tiene la muestra 180 Formula: P[E o F] = P[E] + P [F] - P[E y F] P[E o F] (80 + 70 - 60)/180 Respuesta 0,50 e. ¿Cuál es la probabilidad de que el sujeto desarrolle una enfermedad y no sea fumador? E y Fc: Desarrollar una enfermedad y no sea fumador Número de sujetos enfermos y no fumadores 20 Elementos tiene la muestra 180 P(E y Fc) 20/180 Respuesta 0,111111111
  • 80. Si se sabe que no es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad? 1.- ¿Cuáles son los eventos? 2.- ¿Cuántos sujetos no son fumadores? 3.- ¿Cuántos de esos no fumadores, están enfermos? 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 81. Si se sabe que no es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad? 1.- ¿Cuáles son los eventos? E: Desarrollar una enfermedad F : No sea un fumador 2.- ¿Cuántos sujetos no son fumadores? 110 3.- ¿Cuántos de esos no fumadores, están enfermos? 20 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 82. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua. ¿Cuál es la probabilidad de que un fumador desarrolle una enfermedad? Si se sabe que es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad? ¿Cuál es la probabilidad de que desarrolle una enfermedad? Si se sabe que es fumador. 1.- ¿Cuáles son los eventos? 2.- ¿Cuántos sujetos son fumadores? 3.- ¿Cuántos de esos fumadores están enfermos?
  • 83. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua. ¿Cuál es la probabilidad de que un fumador desarrolle una enfermedad? Si se sabe que es fumador, ¿Cuál es la probabilidad de que desarrolle una enfermedad? ¿Cuál es la probabilidad de que desarrolle una enfermedad? Si se sabe que es fumador. 1.- ¿Cuáles son los eventos? E: Desarrollar una enfermedad F: Sea un fumador 2.- ¿Cuántos sujetos son fumadores? 70 3.- ¿Cuántos de esos fumadores están enfermos? 60
  • 84. En una cadena de televisión se hizo una encuesta a 2500 personas para saber la audiencia que tuvieron en un programa de debate y de una película que se emitieron en horas distintas: 2100 vieron la película, 1500 vieron el debate y 350 no vieron ninguno de los dos programas. Si elegimos al azar a uno de los encuestados: a. ¿Cuál es la probabilidad de que viera la película y el debate? b. ¿Cuál es la probabilidad de que viera la película, dado que no vio el debate? c. Si vio la película, ¿cuál es la probabilidad de que viera también el debate? 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 85. En una cadena de televisión se hizo una encuesta a 2500 personas en total para saber la audiencia que tuvieron en un programa de debate y de una película que se emitieron en horas distintas: 2100 vieron la película, 1500 vieron el debate y 350 no vieron ninguno de los dos programas. Si elegimos al azar a uno de los encuestados: a. ¿Cuál es la probabilidad de que viera la película y el debate? 1450/2500 b. ¿Cuál es la probabilidad de que viera la película, dado que no vio el debate? 1000/2100 c. Si vio la película, ¿cuál es la probabilidad de que viera también el debate? 1450/2100 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua. DEBATE NO DEBATE TOTAL PELICULA 1450 650 2100 NO PELICULA 50 350 400 TOTAL 1500 1000 2500
  • 86. Distribución de probabilidad discreta Distribución Binomial 86 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 87. ¿Qué es la distribución Binomial? Es una distribución de probabilidad discreta. 1. Solo tienen dos posibles resultados, a los que se les pueden nombrar éxito o fracaso. 2. Los datos son resultado de un conteo, razón por la cual se clasifica como discreta. 3. El experimento consiste de varias pruebas y en cada una la probabilidad de éxito es la misma. 4. Las pruebas que se repiten son independientes. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 88. Para construir una distribución Binomial es necesario conocer el número de pruebas que se repiten y la Probabilidad de que suceda un éxito en cada una de ellas. La fórmula que describe la distribución es la siguiente: Donde: n = número de pruebas x = número de éxitos p = probabilidad de obtener un éxito q = probabilidad de obtener un fracaso, que se calcula q = 1 - p 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 89. Distribución Binomial: media y varianza En una variable aleatoria binomial B (n , p) Media: Varianza: Desviación típica: qpnσ  qpnσ 2  Ejemplo.- X = "número 6 al tirar un dado 10 veces” es B(10 , 1/6) Media = 10 * 1/6 = 10/6 Varianza = 10 * 1/6 * 5/6 = 50/36 Desviación típica = √50 / 6 μ = n p 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 90. Distribución de probabilidad continua Distribución Normal 90 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 91.  Se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.  Estas variables aleatorias presentan una distribución que es aproximadamente simétrica y cuya gráfica tiene forma de campana (mesocúrtica).  Se utilizada en aplicaciones estadísticas como modelo o parámetro de comparación dada la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse a esta distribución. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 92. El área total bajo la curva :  Es igual a 100 % o 1.  Comprendida entre los valores situados a una desviaciones estándar de la media es aproximadamente igual al 68,3%.  Comprendida entre los valores situados a dos desviaciones estándar de la media es aproximadamente igual al 95,5%.  Comprendida entre los valores situados a dos desviaciones estándar de la media es aproximadamente igual al 99,7%. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 93. CARACTERISTICAS DE LA DISTRIBUCIÓN NORMAL  La distribución normal es simétrica alrededor de su media.  Es asintótica - la curva se acerca a eje x pero nunca lo toca.  La curva normal es acampanada y tiene un solo pico en toda la distribución.  La media, mediana, y moda de la distribución son las mismas y están localizadas en el pico.  La mitad del área de la curva esta arriba del punto central (pico), y la otra mitad esta abajo. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 94. 1. Identificar la variable de interés. 2. Identificar los parámetros de la variable (su media y desviación estándar). 3. ¿Cual es la pregunta: área bajo la curva de la campana de Gauss? 4. Convertir los valores a la distribución normal estándar (estandarización Z = (X-Media)/S) 5. Encuentre la probabilidad en tabla de la normal estándar o por Excel. Calculo de Probabilidades normales 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 95. Aplicación de la distribución Normal : El Riesgo en el análisis de inversiones Distribuciones de Probabilidad de los Flujos de Caja  El VAN (Valor actual neto) en un modelo de incertidumbre puede considerarse una variable aleatoria. Por tanto, la suma de variables independientes, según el Teorema Central de Límite, tiende a seguir una distribución normal cuando el número de sumandos tiende a ∞ , en la práctica el VAN puede aproximarse a una normal cuando el número de sumandos (Flujos de efectivo) es ≥ 10. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 96. Aplicación de la distribución Normal : El Riesgo en el análisis de inversiones Una valoración financiera en un caso de certidumbre con un desembolso inicial de 14. 000 y flujos de caja de 7.000, 8.000 y 9.000 € (razón aritmética de 1.000) . Se puede estimar que el VAN de esta inversión al 7% de costo de oportunidad es de 6.876,25€. Pero supongamos que la situación es inestable rodeada de un ambiente de incertidumbre a causa de la desconfianza y el alto riesgo que tomaron algunas bancas de inversión. Esto hace que los flujos de caja ya no sean seguros. Al no tener los flujos de caja seguros, sólo se pueden hacer hipótesis sobre la posesión de los mismos. En este caso, y en la mayoría de las inversiones, el mejor término cuantitativo para valorar la inversión es la PROBABILIDAD. 4.- Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua.
  • 97. Distribuciones Muestrales Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. Dos muestras aleatorias del mismo tamaño y tomadas de la misma población pueden no tener los mismos estadísticos. Por las razones antes mencionadas se quiere estudiar la distribución de todos los valores posibles de un estadístico. Las inferencias sobre las poblaciones se harán usando estadísticas muestrales. Los valores de un estadístico de una muestra aleatoria puede considerarse como una variable aleatoria con su correspondiente distribución de frecuencias. La distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis.
  • 98. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la madia muestral x para cada muestra; el conjunto de todas estas medias muestrales recibe el nombre de distribución muestral de medias
  • 99. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Una distribución muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la población y calculándoles a éstas su estadístico. Si la población de la que se extraen las muestras es normal, la distribución muestral de medias será normal sin importar el tamaño de la muestra. Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la muestra debe ser mayor o igual a 30, para que la distribución muestral tenga una forma acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución muestral de ser normal. Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30.
  • 100. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Distribución Muestral de Medias La distribución normal, es una distribución continua en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simétrica. Con esta distribución se puede calcular la probabilidad de algún evento relacionado con la variable aleatoria, mediante la siguiente fórmula: En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribución z. Cuando n > 30
  • 101. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Este valor se ubica en la tabla z y ese valor representa la probabilidad buscada
  • 102. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 775 800 0.0062 14 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine a) El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros. b) El número de medias muestrales que caen por debajo de 172 centímetros. Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en cada inciso.
  • 103. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Distribución muestral de proporciones Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55. Este valor se ubica en la tabla z y ese valor representa la probabilidad buscada Respuesta: La probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.18%.
  • 104. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%. Datos: n=150 personas P=0.03 p= 0.04 p(p>0.04) = ?
  • 105. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%. Datos: n=150 personas P=0.03 p= 0.04 p(p>0.04) = ? Respuesta: Existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una reacción adversa. 0.1685
  • 106. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga: a) Menos del 3% de los componentes defectuosos. b) Más del 1% pero menos del 5% de partes defectuosas. Datos: n= 60 artículos P=0.04 p= 0.03 p(p<0,03=?
  • 107. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. ESTIMACION El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra de una población se quiere generalizar las conclusiones al total de la misma. Como vimos en la sección anterior, los estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el error estándar de un estadístico, más cercanos serán unos de otros sus valores. Estimación Puntual: El objetivo de la estimación puntual es seleccionar sólo un número, basados en datos de la muestra, que represente el valor más razonable de ϴ Una estimación puntual de un parámetro ϴ es un sólo número que se puede considerar como el valor más razonable de ϴ. La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a partir de datos de la muestra dada. La estadística seleccionada se llama estimador puntual de ϴ.
  • 108. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Propiedades de un Buen Estimador Insesgado.- En otras palabras, un estimador insesgado es aquel para el cual la media de la distribución muestral es el parámetro estimado Eficiente o con varianza mínima.- Entre todos los estimadores de ϴ que son insesgados, se selecciona al que tenga varianza mínima. Consistencia.- Una estadística es un estimador consistente de un parámetro de población, si al aumentar el tamaño de la muestra se tiene casi la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de la población. Si un estimador es consistente se vuelve mas confiable si tenemos tamaños de muestras mas grandes. Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la información contenida de la muestra que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se esta estimando.
  • 109. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Estimación por Intervalos Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información alguna sobre la precisión y confiabilidad de la estimación. Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida de el grado de fiabilidad en el intervalo. Un nivel de confianza de 95% implica que 95% de todas las muestras daría lugar a un intervalo que incluye µ y sólo 5% de las muestras producirá un intervalo erróneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro del intervalo.
  • 110. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Encuentre el valor de z para un nivel de confianza del 95% Se utilizará la tabla que tiene el área bajo la curva de –α hasta z. El nivel de confianza bilateral está dividido en partes iguales bajo la curva
  • 111. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. En base a la tabla que se esta utilizando, se tendrá que buscar el área de 0.975, ya que cada extremo o cola de la curva tiene un valor de 0.025. Por lo que el valor de z es de 1.96.
  • 112. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la desviación estándar de la población es 0.3. La estimación puntual de m es x = 2.6. El valor de z para un nivel de confianza del 95% es 1.96, por lo tanto
  • 113. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más amplio
  • 114. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. PRUEBA DE HIPOTESIS Se ha mostrado cómo puede estimarse un parámetro a partir de los datos contenidos en una muestra. Puede encontrarse ya sea un sólo número (estimador puntual) o un intervalo de valores posibles (intervalo de confianza). En ocasiones se requiere que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Este es uno de los aspectos más útiles de la inferencia estadística. Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones. La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir, la “creencia a priori”). La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta es la hipótesis del investigador. La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar Ho o no rechazar Ho.
  • 115. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. 1. Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. 2. El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede reducir al ajustar el o los valores críticos. 3. Un aumento en el tamaño muestral n reducirá α y β de forma simultánea Tipos de Ensayo Se pueden presentar tres tipos de ensayo de hipótesis que son: • Unilateral Derecho • Unilateral Izquierdo • Bilateral
  • 116. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el parámetro, en este caso el nivel de significancia se carga todo hacia el lado derecho, para definir las regiones de aceptación y de rechazo.
  • 117. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución en el parámetro, en este caso el nivel de significancia se carga todo hacia el lado izquierdo, para definir las regiones de aceptación y de rechazo
  • 118. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro. El nivel de significancia se divide en dos y existen dos regiones de rechazo
  • 119. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05. Solución: 1. Se trata de una distribución muestral de medias con desviación estándar conocida. 2. Datos: µ=70 años σ = 8.9 años x = 71.8 años n = 100 α = 0.05 3. Ensayo de hipótesis Ho; α = 70 años. H1; α > 70 años.
  • 120. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis.
  • 121. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado? Utilice un nivel de significancia del 0.04. 1. Se trata de una distribución muestral de medias con desviación estándar conocida. 2. Datos: µ=800 horas σ = 40 horas x = 788 horas n = 30 α = 0.04 2. Ensayo de hipótesis Ho; µ = 800 horas H1; µ ≠ 800 horas
  • 122. 1. 4.- Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis.