Este documento presenta información sobre el desarrollo del programa de Estadística I. Incluye definiciones de conceptos básicos como población, muestra, variable y dato. Explica los tipos de escalas de medición y variables. Además, describe los procedimientos para organizar y presentar datos usando tablas y gráficos, y las medidas de tendencia central, variabilidad y posición. El objetivo es que los estudiantes obtengan las bases de la estadística descriptiva y probabilidades.
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
Estadística I - Para Ciencias Económicas
1.
2. DOCUMENTO DE APOYO PARA EL
DESARROLLO DEL PROGRAMA DE
ESTADÍSTICA I
FACULTAD REGIONAL MULTIDISCIPLINARIA ESTELI
FAREM ESTELI
RECINTO UNIVERSITARIO “LEONEL RUGAMA RUGAMA”
Departamento de Ciencias Económicas y Administrativas
2019: Año de la Reconciliación
Estadística I
Documento de Referencia
Elaborado: M.Sc. Cliffor Jerry Herrera Castrillo
Mayo, 2019
3. Índice
Introducción_____________________________________________________________ 1
Unidad I. Estadística Descriptiva ____________________________________________ 2
Estadística ____________________________________________________________ 3
Ramas de la estadística__________________________________________________ 3
Estadística descriptiva ________________________________________________ 3
Estadística inferencial_________________________________________________ 3
Población _____________________________________________________________ 3
Muestra ______________________________________________________________ 4
Variable ______________________________________________________________ 4
Tipos de Variable ____________________________________________________ 5
Dato _________________________________________________________________ 5
Medición y escalas de medidas ___________________________________________ 6
Tipos de escalas ______________________________________________________ 6
Medición y escalas de medidas__________________________________________ 7
Distribución de frecuencias _____________________________________________ 12
Procedimiento a seguir en un estudio estadístico__________________________ 12
Tabla para datos no agrupados ________________________________________ 12
Tabla para datos agrupados___________________________________________ 13
Tipos de Gráficos _____________________________________________________ 18
Medidas de tendencia central ___________________________________________ 27
Datos no agrupados__________________________________________________ 27
Datos agrupados ____________________________________________________ 30
Formas de la distribución_______________________________________________ 33
Medidas de variabilidad o dispersión _____________________________________ 33
Datos agrupados.____________________________________________________ 34
4. Medidas de posición ___________________________________________________ 38
Coeficiente de curtosis (K) ______________________________________________ 40
UNIDAD II. PROBABILIDADES __________________________________________ 48
Definiciones __________________________________________________________ 49
Probabilidades______________________________________________________ 49
Experimento________________________________________________________ 49
Espacio Muestral____________________________________________________ 50
Suceso aleatorio _____________________________________________________ 52
Suceso elemental ____________________________________________________ 52
Suceso compuesto ___________________________________________________ 52
Algunas definiciones y operaciones con conjuntos_________________________ 52
Definición clásica de probabilidad (modelo clásico o a priori)_________________ 54
Tipos de probabilidad__________________________________________________ 54
Sucesos independientes_________________________________________________ 56
Sucesos dependientes __________________________________________________ 56
Probabilidad condicional _______________________________________________ 56
Regla de la multiplicación ______________________________________________ 58
Probabilidad total _____________________________________________________ 59
Regla de Bayes________________________________________________________ 59
UNIDAD III. DISTRIBUCIONES DE PROBABILIDAD _______________________ 64
Concepto y definición de variable aleatoria ________________________________ 65
La distribución acumulada____________________________________________ 68
Valor esperado______________________________________________________ 69
Varianza___________________________________________________________ 69
Distribución geométrica ______________________________________________ 71
Distribución híper – geométrica _______________________________________ 72
Teorema de Chebyshev_______________________________________________ 73
5. Distribución híper – geométrica multii - variada__________________________ 74
La distribución binomial _______________________________________________ 77
Proceso de Bernoulli _________________________________________________ 77
Distribución binomial ________________________________________________ 77
Media, varianza y desviación estándar de la distribución binomial _________ 78
Distribución binomial negativa.________________________________________ 79
La distribución de Poisson ______________________________________________ 79
Media, varianza y desviación estándar de la distribución de Poisson________ 81
UNIDAD IV. DISTRIBUCION NORMAL ___________________________________ 82
La distribución normal_________________________________________________ 83
Áreas bajo la curva normal ___________________________________________ 83
Estandarización_____________________________________________________ 84
Uso de la tabla ______________________________________________________ 84
Bibliografía ____________________________________________________________ 97
6.
7. Estadística I – Contaduría Pública y Finanzas
1
M.Sc. Cliffor Jerry Herrera Castrillo
Introducción
La estadística I está estrechamente relacionada con el método científico, en la recopilación,
organización, presentación y análisis de datos; tanto para obtener conclusiones como para
tomar decisiones con base en los análisis efectuados.
La importancia de la estadística radica en su aplicación en todas las carreras que ofrece la
Facultad de Ciencias Económicas, por lo que se pretende que el estudiante logre obtener las
bases de la estadística descriptiva y las probabilidades para que en un futuro pueda realizar
inferencias estadísticas.
El módulo está organizado en contenidos que están relacionados entre sí como son: El
Conceptual, las teorías, definiciones, propiedades y teoremas. El Procedimental, que
desarrolla habilidades y destrezas tales como: capacidades para argumentar, analiza, criticar
y tomar decisiones. El actitudinal que proporciona valores, como la responsabilidad, el orden,
y compañerismo. (Universidad Nacional Autonoma de Nicaragua, 2013)
Se espera que este módulo pueda contribuir a tu formación profesional con una concepción
científica y humanista, capaz de interpretar los fenómenos sociales y naturales con un sentido
crítico, reflexivo y propositivo.
8. Estadística I – Contaduría Pública y Finanzas
2
M.Sc. Cliffor Jerry Herrera Castrillo
Objetivos conceptuales
Explicar los conceptos, definiciones, propiedades fundamentales de la Estadística
Descriptiva.
Objetivos procedimentales
Aplicar conceptos, definiciones, y propiedades fundamentales de la Estadística
descriptiva en la resolución de ejercicios.
Objetivos actitudinales
Valorar la importancia de la Estadística descriptiva como herramienta para la
solución de problemas de su entorno social.
Participar activamente en las distintas formas organizativas del proceso enseñanza-
aprendizaje basada en la cooperación grupal.
Contenidos Cognitivos Contenidos Procedimentales Contenidos Actitudinales
Conceptos y definiciones de
la estadística
Conceptos de población,
variable, datos, parámetros,
estimación de un parámetro,
muestreo y censo
Recopilación, organización,
presentación y análisis de datos
Medios que permiten la
recopilación de datos:
publicaciones, registros y
encuestas.
Datos agrupados en clases, datos
repetidos.
Tablas y gráficos de datos: Tablas
de frecuencias, histogramas,
polígonos de frecuencias, gráficas
de barras, de sectores y lineales.
Medidas de posición: media
aritmética, mediana, moda y
percentiles.
Valoración de la importancia
de la Estadística descriptiva
como herramienta para la
solución de problemas de su
entorno social.
Participación activa en las
distintas formas organizativas
del proceso enseñanza-
aprendizaje basada en la
cooperación grupal.
Medidas de dispersión:
varianza, desviación estándar,
coeficiente de variación.
Medidas de asimetría y
curtosis: Coeficientes de Fisher
9. Estadística I – Contaduría Pública y Finanzas
3
M.Sc. Cliffor Jerry Herrera Castrillo
Estadística
Es una rama de las matemáticas que se ocupa de reunir, organizar, y analizar datos numéricos
a partir de la observación de diferentes fenómenos. Ofrece una serie de técnicas que
posibilitan hacer conclusiones como el diseño de experimentos. El eje central en todo el
campo de la estadística, es la toma de decisiones.
Ramas de la estadística
Estadística descriptiva
Consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende
cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin
factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como
tales.
Estadística inferencial
Se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto
numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van
más allá de los datos. Como consecuencia, la característica más importante del reciente
crecimiento de la estadística ha sido un cambio en el énfasis de los métodos que describen a
métodos que sirven para hacer generalizaciones. La Estadística Inferencial investiga o analiza
una población partiendo de una muestra tomada.
Para estudiar la estadística, se necesita estar en condiciones de hablar su lenguaje, es decir
familiarizarse con los términos básicos que ella emplea tales como:
Población
Una población es un conjunto de mediciones de interés en las que se estudia una característica
dada. Puede estar referido a datos sobre personas, animales, empresas ciudades, inventarios,
etc.
Ejemplo:
- En un estudio sobe los costos de construcción, la población puede consistir en los
precios unitarios de los materiales de construcción.
10. Estadística I – Contaduría Pública y Finanzas
4
M.Sc. Cliffor Jerry Herrera Castrillo
- En un estudio socioeconómico, la población puede consistir en un conjunto de
personas que habitan en una región o en un municipio.
- En un estudio de control de calidad la población puede consistir en la valoración
numérica o cualitativa de cada artículo que contiene un lote.
Muestra
Es un subconjunto de la población que contiene las mediciones obtenidas mediante un
experimento estadístico. La muestra debe ser representativa y tomada de manera aleatoria.
Ejemplo:
- Tomar unos granos de frijol de un saco para averiguar la calidad del grano.
- La muestra de sangre para estudiar sobre el tipo sanguíneo en una persona.
- Una cucharadita de café para valorar su grado de acidez.
Individuo: Cualquier elemento que posea la propiedad o característica que se desea estudiar.
Ejemplo: Si deseamos hacer un estudio con todos los estudiantes de nuevo ingreso de la
FAREM-Estelí, esta será la población suponiendo que fueran mil estudiantes y de esto
elegimos al azar a 200 estudiantes, entonces se ha elegido una muestra del 20% de la
población.
Variable
Característica que se desea estudiar. Las distintas observaciones de la variable constituyen
los datos de la investigación.
Una variable estadística es el conjunto de valores que puede tomar cierta característica de la
población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición.
Ejemplo: El peso de un embarque, la rapidez de una impresora, el número de artículos
defectuosos que se elaboran en una fábrica, la calidad de café que se produce en Nicaragua,
etc.
11. Estadística I – Contaduría Pública y Finanzas
5
M.Sc. Cliffor Jerry Herrera Castrillo
Tipos de Variable
Variable cualitativa
Son aquellas que se ordenan en categorías debido a su carácter subjetivo y absoluto. Pueden
ser de dos tipos nominales y ordinales.
Variables Nominales Variables Ordinales
Los valores no pueden ser sometidos a
criterios de orden o importancia. Ejemplo:
“El sexo de una persona”, La nacionalidad,
etc.
Las variables pueden tomar distintos valores
ordenados siguiendo una escala estadística.
Clasifica a los elementos en distintas
categorías. Ejemplo: Los estratos sociales,
(baja, media alta) La satisfacción al adquirir
un artículo (No me gusta, es regular, bueno,
muy bueno, excelente).
Variable cuantitativa
Son las que sus características están expresadas en valores numéricos. Se dividen en
continuas y en discretas.
Variables Continuas Variables Discretas
Pueden adquirir cualquier valor dentro de
un intervalo especificado. Resultan del
proceso de medición. Ejemplo; La estatura
de una persona, los ingresos mensuales de
los trabajadores, el consumo de energía
eléctrica en un centro de trabajo, la duración
de una llamada telefónica, Etc.
Los valores de las variables son enteros y
resultan del proceso del conteo. Ejemplo: El
número de letras de una palabra, el número
de estudiantes que asistieron hoy a clases, el
número de llamadas telefónicas registradas
en un teléfono celular, etc.
Dato
Valor de una variable asociado a un elemento de una población o de una muestra.
Ejemplo. Al lanzar una moneda cinco veces, obtenemos cinco datos: cara, cara, sol, sol, cara.
12. Estadística I – Contaduría Pública y Finanzas
6
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplo: El costo unitario de los artículos producidos en una fábrica.
Medición y escalas de medidas
La medición puede definirse como la asignación de números a objetos y eventos de acuerdo
con ciertas reglas; la manera como se asignan esos números determina el tipo de escala de
medición. Esto conduce a la existencia de diferentes tipos de escalas, por lo que el problema
se transforma en explicitar
a) Las reglas para asignar números
b) Las propiedades matemáticas de las escalas resultantes
c) Las operaciones estadísticas aplicables a las medidas hechas con cada tipo de escala.
Las escalas de medición se clasifican en cuatro grupos: escala nominal, ordinal, intervalo y
escala de razón.
Tipos de escalas
Escalas nominales
Son aquellas que dividen a una población en dos o más grupos a partir de una categoría.
Son mutuamente excluyentes. Se le puede asignar a cada clase o grupo, un número.
Ejemplo: Variable discreta Sexo. Mujer 0 hombre 1
Escalas ordinales
Las escalas ordinales son escalas nominales en donde existe una elación de orden.
Ejemplo Ordenar los ingresos en tres niveles: “Alto 1, medio, 2, bajo 3”
Ejemplo: El número de placa de los vehículos.
Ejemplo: El número de carnet de los estudiantes matriculados en la Universidad.
13. Estadística I – Contaduría Pública y Finanzas
7
M.Sc. Cliffor Jerry Herrera Castrillo
Escalas de intervalo
Las escalas de intervalo son escalas ordinales. Poseen un cero arbitrario el cual no indica
ausencia del atributo en cuestión. Es relativa. Ejemplo. La temperatura registrada en los
termómetros.
Escalas de razones o proporciones
Las escalas de razones o proporciones son escalas de intervalo. Poseen un cero absoluto el
cual indica ausencia del atributo en cuestión.
Ejemplo: Las medidas de longitud
Ejemplo: Las medidas de peso
Ejemplo: Las medidas de velocidad, etc.
Medición y escalas de medidas
La medición puede definirse como la asignación de números a objetos y eventos de acuerdo
con ciertas reglas; la manera como se asignan esos números determina el tipo de escala de
medición. Esto conduce a la existencia de diferentes tipos de escalas, por lo que el problema
se transforma en explicitar
a) las reglas para asignar números
b) las propiedades matemáticas de las escalas resultantes
c) las operaciones estadísticas aplicables a las medidas hechas con cada tipo de escala.
Las escalas de medición se clasifican en cuatro grupos: escala nominal, ordinal, intervalo
y escala de razón.
Escala nominal.
El nivel nominal de medición, describe variables de naturaleza categórica que difieren en
cualidad más que en cantidad. Ante las observaciones que se realizan de la realidad, es
posible asignar cada una de ellas exclusivamente a una categoría o grupo. Cada grupo o
categoría se denomina con un nombre o número de forma arbitraria, es decir, que se etiqueta
en función de los deseos o conveniencia del investigador. Este nivel de medición es
exclusivamente cualitativo y sus variables son por lo tanto cualitativas.
14. Estadística I – Contaduría Pública y Finanzas
8
M.Sc. Cliffor Jerry Herrera Castrillo
Por ejemplo, los sujetos que son del curso de A de 2º de eso y los de B generan dos grupos.
Cada sujeto se asigna a un grupo, y las variables son de tipo cualitativo (de cualidad) y no
cuantitativo puesto que indica donde está cada sujeto y no "cuanto es de un curso y no de
otro". En este ejemplo los números 2 y 3 pueden sustituir las letras A y B, de forma que 2 y
3 son simples etiquetas que no ofrecen una valoración numérica sino que actúan como
nominativos.
En esta escala hay que tener en cuenta dos condiciones:
No es posible que un mismo valor o sujeto esté en dos grupos a la vez. No se puede ser de 2º
y 3º a la vez. Por lo tanto este nivel exige que las categorías sean mutuamente excluyentes
entre sí. Los números no tienen valor más que como nombres o etiquetas de los grupos.
El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un número es para
identificar. Un número no tiene mayor valor que otro. Un ejemplo son los números de las
camisetas de los jugadores de un equipo de béisbol. El número mayor no significa que tiene
el mayor atributo que el número menor, es aleatorio o de capricho personal a quien otorga el
número. Para el procesamiento de datos, los nombres pueden ser remplazados por números,
pero en ese caso el valor numérico de los números dados es irrelevante.
Los números se usan como identificadores o nombres. La operación matemática permitida
es el conteo.
Ejemplos de medidas nominales son algunas de estas variables: estado marital, género, raza,
credo religioso, afiliación política, lugar de nacimiento, el número de seguro social, el sexo,
los números de teléfono, entre otros.
Escala ordinal: Surge a partir de la operación de ordenamiento; en esta escala se habla de
primero, segundo, tercero. No se sabe si quien obtiene el primer puesto está cerca o lejos del
segundo puesto. Los valores de la escala representan categorías o grupos de pertenencia,
concierto orden asociado, pero no una cantidad mensurable. La escala ordinal tiene las
propiedades de identidad y magnitud. Los números representan una cualidad que se está
midiendo, y expresan si una observación tiene más de la cualidad medida que otra. La
distancia entre puntos de la escala no es constante: no se puede determinar la distancia entre
15. Estadística I – Contaduría Pública y Finanzas
9
M.Sc. Cliffor Jerry Herrera Castrillo
las categorías, sólo es interpretable el orden entre sus valores. Ejemplos: situación
socioeconómica, nivel educativo.
Escala de intervalos. Esta escala representa magnitudes, con la propiedad de igualdad de la
distancia entre puntos de escala de la misma amplitud. Aquí puede establecerse orden entre
sus valores, hacerse comparaciones de igualdad, y medir la distancia existente entre cada
valor de la escala. El valor cero de la escala no es absoluto, sino un cero arbitrario: no refleja
ausencia de la magnitud medida, por lo que las operaciones aritméticas de multiplicación y
división no son apropiadas. Cumple con las propiedades de identidad, magnitud e igual
distancia. La igual distancia entre puntos de la escala significa que puede saberse cuántas
unidades de más tiene una UO comparada con otra, con relación a cierta característica
analizada. Por ejemplo, en la escala de temperatura centígrada puede decirse que la distancia
entre 25° y 30°C es la misma que la existente entre 20° y 25° C, pero no puede afirmarse que
una temperatura de 40° C equivale al doble de 20° C en cuanto a intensidad de calor se refiere,
debido a la ausencia de cero absoluto.
Escala de razón. Corresponde al nivel de medición más completo. Tiene las mismas
propiedades que la escala intervalos, y además posee el cero ab- soluto. Aquí el valor cero
no es arbitrario, pues representa la ausencia total de la magnitud que se está midiendo. Con
esta escala se puede realizar cualquier operación lógica (ordenamiento, comparación) y
aritmética. A iguales diferencias entre los números asignados corresponden iguales
diferencias en el grado de atributo presente en el objeto de estudio. Ejemplos: longitud, peso,
distancia, ingresos, precios.
Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un trabajo,
la velocidad; el cero significa ausencia de movimiento. Otros ejemplos de variables
racionales son la edad, y otras medidas de tiempo. En otras palabras, la escala de razón
comienza desde el cero y aumenta en números sucesivos iguales a cantidades del atributo
que está siendo medido.
16. Estadística I – Contaduría Pública y Finanzas
10
M.Sc. Cliffor Jerry Herrera Castrillo
Resumen
Ejercicios
Ejercicios 1.1: Determine en cada una de las siguientes situaciones: la población y la
muestra.
Un fabricante de medicamentos desea conocer la proporción de personas cuya hipertensión
(presión alta) puede ser controlada por un nuevo producto fabricado por la compañía. Al
realizar un estudio a 5000 individuos hipertensos se obtuvo que el 80 % de ellos pudo
controlar su hipertensión utilizando el nuevo medicamento. Suponiendo que estas 5000
personas son representativas del grupo de pacientes hipertensos.
Ejercicios 1.2: Construya variables relacionadas con su carrera, 4 nominales, 4 ordinales, 4
continuas y 4 discretas.
Ejercicio 1.3: Indica qué variables son cualitativas (ordinal o nominal) y cuales cuantitativas
(continuas o discretas):
a) Censo anual de los nicaragüenses:
b) Temperaturas en grados Celsius registradas cada hora en un observatorio:
c) Tu comida favorita:
d) Cuántos goles ha marcados tu equipo favorito en la última temporada:
e) El color de los ojos de tus compañeros de clase:
Tipos de
variables
Cualitativas
Nominales
No orden
Ordinales
Existe orden
Cuantitativas
Continuas
No entero
Discretas
Entero
17. Estadística I – Contaduría Pública y Finanzas
11
M.Sc. Cliffor Jerry Herrera Castrillo
f) Coeficiente intelectual de los alumnos de esta clase:
g) Asignatura favorita:
h) Cuántas acciones se han vendido hoy en la Bolsa:
i) Profesiones militares (tropa, suboficiales, oficiales, jefes, generales):
j) Duración del viaje en coche a ciudades de Nicaragua:
k) El diámetro de las ruedas de varios coches:
l) La nacionalidad de una persona:
m) Número de litros de agua contenidos en un depósito:
n) La calificación de un examen (suspenso, aprobado, notable, sobresaliente):
o) Número de libros en un estante de librería:
p) Suma de puntos tenidos en el lanzamiento de un par de dados:
q) La profesión de una persona:
r) Cuántos estudiantes se han matriculado en este curso:
s) La superficie de un edificio:
t) Puesto conseguido en una prueba deportiva (1º, 2º, 3º,…):
u) Número de hijos de 50 familias:
v) Medallas de una prueba deportiva (oro, plata, bronce):
Ejercicio. 1.4: Indique el nivel de medición de las siguientes variables. Teniendo en cuenta
que las variables se pueden clasificar en nominales, ordinales, de intervalo y razón:
a) Altura física en centímetros:
b) Estatus laboral (inexperto/semiexperto/experto):
c) Peso físico en Kilogramos:
d) Sexo:
e) Calidad percibida del cuidado proporcionado (excelente/bueno/suficiente/pobre):
f) Diagnóstico “sobrecarga del rol del cuidador”:
g) ¿Se puede bañar sólo?
h) Temperatura corporal:
i) Estado civil:
j) ¿Tiene alguna preferencia religiosa?
(católica/protestante/judía/islámica/protestante/otra):
18. Estadística I – Contaduría Pública y Finanzas
12
M.Sc. Cliffor Jerry Herrera Castrillo
Distribución de frecuencias
Después de la recopilación de los datos, es necesario resumirlos y presentarlos en forma tal,
que faciliten su comprensión y su posterior análisis y utilización. Para ello, se ordenan en
cuadros numéricos y luego se representan en gráficos.
Todo cuadro numérico debe tener:
- Un título adecuado para evitar confusiones y para expresar brevemente su contenido.
- La fuente de los datos, si no son datos propios.
- Las unidades en que se expresan los datos.
Los cuadros numéricos de una sola variable estadística se denominan distribución de
frecuencias.
En el procedimiento para construir distribuciones de frecuencias nos referiremos a
muestras, mientras no se diga lo contrario.
Procedimiento a seguir en un estudio estadístico
Recogida de datos: Planteado el test o encuesta oportuno y recogidos los datos que
correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos
estudiar (Cualitativa o Cuantitativa; Discreta o Continua). Esto condicionará en gran medida
su posterior tratamiento.
Organización de los datos: determinado el modo de agrupamiento de las observaciones,
procedemos a su recuento, construyendo la tabla de frecuencias. Posteriormente podremos
visualizar tales frecuencias de forma gráfica con el diagrama estadístico apropiado.
Análisis final: La obtención de muy diversas conclusiones respecto de la variable estudiada,
se podrá realizar con auxilio de los diferentes parámetros estadísticos (de centralización,
posición, dispersión, etc.)
Tabla para datos no agrupados
Frecuencias
Frecuencia absoluta (f): Para datos no agrupados en intervalos, es el número de veces que se presenta
cada valor de la variable. Si los datos se agrupan en intervalos, es el número de observaciones que
pertenecen a dicho intervalo.
19. Estadística I – Contaduría Pública y Finanzas
13
M.Sc. Cliffor Jerry Herrera Castrillo
Frecuencia absoluta acumulada (fa): Para un cierto valor de la variable, la frecuencia absoluta
acumulada nos da el número de observaciones menores o iguales que dicho valor.
Frecuencia relativa (fr): Cociente entre la frecuencia absoluta y el número total de observaciones
(N).
Frecuencia relativa porcentual (fr%): Frecuencia relativa multiplicada por 100 (es la expresión de
las frecuencias en %).
Frecuencias relativas acumuladas (fra): Es la relación de la frecuencia acumulada de una clase
expresada respecto al total de observaciones
Ejemplo
Las puntuaciones obtenidas por un grupo en una prueba de matemáticas han sido:
15; 20; 15; 18; 22; 13; 13; 16; 15; 19; 18; 15; 16; 20; 16; 15; 18; 16; 14; 13.
Construir la tabla de distribución de frecuencias
xi Recuento
Frecuencia
Absoluta
(f)
Frecuencia
absoluta
acumulada
Frecuencia
relativa
Frecuencia
relativa
porcentual
Frecuencia relativa
acumulada
(fra%)
13 III 3 3 320=0,15 0,15x100=15 0,15 15
14 I 1 3+1=4 120=0,05 0,05x100=5 0,15+0,05=0,2 20
15 IIIII 5 4+5=9 520=0,25 0,25x100=25 0,2+0,25=0,45 45
16 IIII 4 9+4=13 420=0,2 0,2x100=20 0,45+0,2=0,65 65
18 III 3 13+3=16 320=0,15 0,15x100=15 0,65+0,15=0,8 80
19 I 1 16+1=17 120=0,05 0,05x100=5 0,8+0,05=0,85 85
20 II 2 17+2=19 220=0,1 0,1x100=10 0,85+0,1=0,95 95
22 I 1 19+1=20 120=0,05 0,05x100=5 0,95+0,05=1 100
Σ 20 1 100
Tabla para datos agrupados
Pasos para la construcción de una tabla de distribución de frecuencias
1) Ordenar los datos de menor a mayor. Se puede usar el diagrama de tallo y hojas.
2) Calcular el rango. Para esto se resta al valor mayor menos el valor menor. Es decir
R = VM – Vm
20. Estadística I – Contaduría Pública y Finanzas
14
M.Sc. Cliffor Jerry Herrera Castrillo
3) Se determina el valor de K (número de clases o grupos que se desean) en caso de que
no dispongamos de este dato se puede usar la fórmula K = 1 + 3.32 log(n).
4) Hallar el cociente
k
R
5) Determinar la amplitud del intervalo de clases C. C = U
k
R
TRUNCADO )(
U significa las unidades decimales.
Otra manera de encontrar el valor de C es dividiendo R entre 5 y R entre 20. Después se
escoge un valor entre esos dos cocientes, preferiblemente entero impar siempre y cuando sea
posible. Esto es,
205
R
C
R
(Lo anterior se debe a que no es aconsejable hacer tablas
con menos de 5 grupos ni mayor de 20. Cualquier cantidad de clases entre 5 y 20 es aceptable.
6) Construir la tabla de distribución de frecuencias Se toma el valor menor de los datos
como el límite inferior de la primera clase. Para calcular el límite superior se aplica
la fórmula
Nota 1: Para determinar los límites inferiores de las clases siguientes, sólo se le suma el valor
de C al límite inferior anterior. De igual manera se trabaja con los límites superiores. La
última clase debe contener al valor mayor de los datos.
Ejemplo1.
En una cooperativa de taxis de Managua se midió el rendimiento en el consumo de la gasolina
en km / gal, a 40 unidades. Los resultados fueron.
45 38,4 44,3 44,2 43,6 45,3 44,5 39,8 44,2 44,4
43,2 44,0 43,8 43,8 45,5 44,5 44,6 44 45,2 38,7
Si los datos tienen cero cifras decimales, se usa u =1
Si los datos tienen una cifra decimal, se usa u = 0,1
Si los datos tienen dos cifras decimales, se usa u = 0,01
LS = Li + C -- U
21. Estadística I – Contaduría Pública y Finanzas
15
M.Sc. Cliffor Jerry Herrera Castrillo
44,4 44.7 44,1 44,3 43,9 44,1 45,8 42,2 41,2 40,6
42,1 45,6 44,5 39,7 40,7 42,3 45,2 43,3 44,7 38,6
Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 7 clases.
Paso 1. Diagrama de tallo y hojas.
Tallo hojas
38 4; 6; 7
39 7; 8
40 6; 7
41 2
42 1; 2; 3
43 2; 3; 6; 8; 8; 9
44 0; 0; 1; 1; 2; 2; 3; 3; 4; 4; 5; 5; 5; 6; 7; 7
45 0; 2; 2; 3; 5; 6; 8
38,4 39,8 42,1 43,3 43,9 44,1 44,3 44,5 44,7 45,3
38,6 40,6 42,2 43,6 44,0 44,2 44,4 44,5 45,0 45,5
38,7 40,7 42,3 43,8 44,0 44,2 44,4 44,6 45,2 45,6
39,7 41,2 43,2 43,8 44,1 44,3 44,5 44,7 45,2 45,8
Paso 2. R = 45,8 – 38,4
R = 7,4
Paso 3. El valor de K= 7 clases (dato proporcionado en el ejercicio)
Paso 4. Cociente
𝑅
𝑘
=
7,4
7
= 1,05714286 Se trunca a una cifra decimal, queda en 1.0
Paso 5. C = 1.0 + 0.1 (ya que los datos tienen una cifra decimal u = 0.1) Resulta
C = 1.1
Paso 6.
22. Estadística I – Contaduría Pública y Finanzas
16
M.Sc. Cliffor Jerry Herrera Castrillo
Kilómetros por
galón de gasolina
Li LS
Cantidad de
vehículos
f
38,4 - 39,4 3
39,5 - 40,5 2
40,6 - 41,6 3
41,7 - 42,7 3
42,8 - 43,8 5
43,9 - 44,9 17
45,0 - 46,0 7
n = f = 40
Para la primera clase, LS = 38,4+ 1,1 - 0,1 LS = 39.4 Se completa la tabla con la
información de la nota 1. (Ver página anterior)
Se procede ahora a calcular la frecuencia acumulada, frecuencia relativa, porcentaje de
frecuencia relativa, porcentaje de frecuencia acumulada, marca de clases y límites reales.
Frecuencia acumulada: Se encuentra sumando a la frecuencia de la clase, la frecuencia de
las clases anteriores.
Frecuencia relativa: Es la proporción de casos que hay en cada clase. Se encuentra
dividiendo la frecuencia de la clase entre el total de datos n.
Porcentaje de frecuencia relativa: Para hallar el porcentaje de frecuencia relativa, se
multiplica la frecuencia relativa por 100. . O sea:
Porcentaje de frecuencia acumulada: Se puede calcular acumulando el porcentaje de la
frecuencia relativa, o aplicando la expresión:
fr =
n
f
%fr = fr x 100
23. Estadística I – Contaduría Pública y Finanzas
17
M.Sc. Cliffor Jerry Herrera Castrillo
Marca de clases: Es el punto medio de la clase. Se representa por Xc Se encuentra aplicando
la fórmula
Límites reales: Para encontrar los límites reales se aplican las fórmulas:
y
Kilómetros
por galón de
gasolina
Li LS
Cantidad
de
vehículos
fi
fa fr %fr %fa Xc
Kilómetros
por galón de
gasolina
Lir Lsr
38.4 - 39.4 3 3 0.075 7.5 7.5 38.9 38.35 - 39.45
39.5 - 40.5 2 5 0.05 5 12.5 40 39.45 - 40.55
40.6 - 41.6 3 8 0.075 7.5 20 41.1 40.55 - 41.65
41.7 - 42.7 3 11 0.075 7.5 27.5 42.2 41.65 - 42.75
42.8 - 43.8 5 16 0.125 12.5 40 43.3 42.75 - 43.85
43.9 - 44.9 17 33 0.425 42.5 82.5 44.4 43.85 - 44.95
45.0 - 46.0 7 40 0.175 17.5 100 45.5 44.95 - 46.05
n = f = 40 1 100
En este ejemplo, los datos tienen una cifra decimal, por eso se toma u = 0.1
Interpretación de la quinta clase:
Puede observarse que hay una frecuencia de 5 vehículos que tienen un rendimiento de 42.8
a 43,8 kilómetros por galón de gasolina, esto equivale al 12,5% de las unidades en estudio.
%fa =,
n
fa
x 100
xC =
2
LSLi
Lir = Li -
2
U
Lsr = Ls +
24. Estadística I – Contaduría Pública y Finanzas
18
M.Sc. Cliffor Jerry Herrera Castrillo
En relación a la frecuencia acumulada, hay 16 unidades cuyo rendimiento es menor o igual
a 43,8 kilómetros por galón. Dicho de otra manera, el 40%de las unidades estudiadas
reflejan un rendimiento menor o igual a 43,8 kilómetros por galón.
Ejercicio 1.5
Construya una tabla de frecuencias para la edad en años cumplidos de 40 estudiantes de
nuevo ingreso de la FAREM-Estelí.
21 20 19 23 22 19 16 22 24 17
19 18 20 27 20 23 18 19 17 24
18 19 21 25 23 21 22 20 17 23
22 20 19 26 18 20 18 17 22 21
Tipos de Gráficos
Un gráfico (o gráfica) es el recurso de representar los datos numéricos por medio de líneas,
diagramas, dibujos, etc. La representación
gráfica es un importante suplemento al análisis
y estudio estadístico.
Los gráficos llaman la atención del lector y
hacen que de un vistazo éste tenga una mayor
comprensión de los datos. Un buen gráfico
puede captar al lector para que a continuación
lea todo el estudio. Si un estudio se compone
únicamente de texto y tablas, posiblemente no todos los lectores lean el estudio.
Técnicas de representación gráfica El uso de gráficas permite al observador, tener una
apreciación de manera rápida sobre los altibajos de la gráfica, para analizar luego, las causas
posibles del comportamiento de la misma.
Regla de los ¾ de altura.
Se aplica la ecuación Y = ¾ x
25. Estadística I – Contaduría Pública y Finanzas
19
M.Sc. Cliffor Jerry Herrera Castrillo
Por ejemplo si el eje X mide 12 cm, entonces el eje Y mide ¾ de (12) = 9 cm.
Con los datos de la tabla de distribución de frecuencias se pueden construir:
1) Histograma de frecuencias
Consiste en una serie de rectángulos continuos cuya base en el eje x está determinada por los
límites reales y la altura de cada barra, es la frecuencia absoluta de la clase.
2) Polígono de frecuencias
Es un diagrama formado por segmentos de recta que une los puntos de las alturas
(frecuencia de cada clase) Para graficar se escriben en el eje X, las marcas de clase
y en el eje Y las frecuencias.
3
2
3 3
5
17
7
0
2
4
6
8
10
12
14
16
18
38.35 39.45 40.55 41.65 42.75 43.85 44.95
Unidadesdetaxi
Km / Galón
Rendimiento de la gasolina
Coop. de Taxis de Managua
I semestre 2016
26. Estadística I – Contaduría Pública y Finanzas
20
M.Sc. Cliffor Jerry Herrera Castrillo
3) Polígono de frecuencia acumulada
Es un diagrama donde se ubican los límites reales superiores en el eje X y la
frecuencia acumulada en el eje Y .La línea que se forma solamente crece.
Los gráficos fueron construidos con el programa EXCEL
3
2
3 3
5
17
7
0
2
4
6
8
10
12
14
16
18
38.9 40 41.1 42.2 43.3 44.4 45.5
Unidadesdetaxi
Km. / galón
Rendimiento de la gasolina
Coop. de Taxis de Managua
I semestre 2016
3
5
8
11
16
33
40
0
5
10
15
20
25
30
35
40
45
39.45 40.55 41.65 42.75 43.85 44.95 46.05
Unidadesdetaxi
Km / galón
Rendimiento de la gasolina
Coop. de Taxis de Managua
I Semestre 2016
27. Estadística I – Contaduría Pública y Finanzas
21
M.Sc. Cliffor Jerry Herrera Castrillo
Otros Gráficos
En una gráfica de barras los datos de cada una de las modalidades iC se representan por
una barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcional a su
frecuencia. Las barras se dibujan dejando un espacio entre ellas.
Si la escala es nominal las categorías pueden ser colocadas en cualquier orden. Pero, si el
nivel es ordinal las categorías deben ir ordenadas.
En una gráfica circular, los datos de cada categoría iC se representan por un sector circular
cuyo ángulo en el centro es igual a hi360.
Si la gráfica por sectores circulares es tridimensional es denominada de pastel.
Ejemplo:
En una encuesta de opinión acerca de las preferencias de una marca de bebida gaseosa por
sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes
respuestas:
B, N, N, B, R, N, N, B, B, N,
B, N, N, R, B, N, B, R, B, N.
Construir la distribución de frecuencias. Graficar la distribución
SOLUCION.
La tabulación de estos datos, donde la variable cualitativa es X: Color de bebida gaseosa, es
la distribución de frecuencias del cuadro 1.2.
La figura 1.1 es la representación gráfica por medio de barras de la distribución de personas
por el color de su bebida gaseosa preferida.
.
28. Estadística I – Contaduría Pública y Finanzas
22
M.Sc. Cliffor Jerry Herrera Castrillo
Cuadro 1.2. Distribución de personas por su color
preferido de una marca de bebida gaseosa.
Valores de Frecuencias Frecuencias Frecuencias
X Absolutas: if Relativas: ih Porcentajes:
ip
Negro (N) 9 0,45 45
Blanco (B) 8 0,40 40
Rojo (R) 3 0,15 15
Total 20 1,00 100
0
1
2
3
4
5
6
7
8
9
Negro Blanco Rojo
Personas
0.45
0.40
0.15
Fig. 1.1 Gráfica de barras
La figura 1.2 es la representación mediante gráfica de sectores circulares del cuadro 1.2.
La frecuencia 45% es equivalente a 0 45 360 162. , la frecuencia 40% es equivalente a
0 40 360 144. , y la frecuencia 15% es equivalente a 0 15 360 54.
29. Estadística I – Contaduría Pública y Finanzas
23
M.Sc. Cliffor Jerry Herrera Castrillo
B
15%
45%
40%
N
R
Fig. 1.2 Gráfica circular
Gráfica de barras agrupadas
Si se trata de comparar solamente las componentes o las frecuencias en cada modalidad, se
puede utilizar un gráfico de barras agrupadas. En cada modalidad se trazan tantas barras
adjuntas como componentes hay. Por ejemplo, la figura 1.3 representa las frecuencias de
cada componente en cada modalidad del cuadro 1.9.
0
5
10
15
20
25
30
1975 1980 1985 1990
Hombres
Mujeres
Fig. 1.3. Población de una ciudad de 1975 a 1990
Gráfica de barras componentes
a) Si se quiere resaltar a la vez el total y las frecuencias de cada componente en cada
modalidad, entonces, conviene utilizar un gráfico de barras componentes como el de la
figura 1.4. En cada modalidad se traza una barra cuyo largo es proporcional al total de sus
datos. La gráfica 1.14 de barras componentes, del cuadro resume la variación de la
población de una ciudad desde 1975 hasta 1990, resaltando el total y los parciales en cada
modalidad.
30. Estadística I – Contaduría Pública y Finanzas
24
M.Sc. Cliffor Jerry Herrera Castrillo
0
10
20
30
40
50
1975 1980 1985 1990
Mujeres
Hombres
Fig. 1.4. Población de una ciudad de 1975 a 1990
b) Si se trata de destacar la importancia relativa de sus componentes, se puede utilizar un
gráfico, como la figura 1.15, donde todas las barras son de igual longitud y equivalentes al
100% en cada categoría.
El cuadro, tiene los mismos datos del cuadro, sólo que ahora se consideran los porcentajes o
valores relativos, en vez de los valores absolutos.
Cuadro. Población (en %) de una ciudad de 1975 a 1990
Año Hombres Mujeres Total
1975 32,0 68,0 100
1980 37,5 62,5 100
1985 25,0 75,0 100
1990 40,0 60,0 100
La proporción de cada componente respecto al total en cada categoría, se representa en
la figura 1.5.
31. Estadística I – Contaduría Pública y Finanzas
25
M.Sc. Cliffor Jerry Herrera Castrillo
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1975 1980 1985 1990
Mujeres
Hombres
Fig. 1.5. Población de una ciudad de 1975 a 1990 en porcentajes
Cuando se utilizan figuras de igual tamaño para reflejar la característica que se quiere
representar, al gráfico estadístico, se denomina pictografía. En una pictografía el número de
figuras en cada categoría o modalidad es proporcional a la frecuencia absoluta respectiva.
Existe otra gran variedad de gráficas o diagramas para mostrar datos ó para mostrar
relaciones entre varios grupos de datos. Aquí la imaginación del dibujante juega un papel
muy importante.
Ejercicio 1.6
Se realiza un estudio para conocer el número de computadoras que hay en cada vivienda del
municipio de Ocotal, Nueva Segovia y se obtienen los siguientes datos:
0, 1, 2, 4, 2, 2, 0, 0, 4, 3, 1, 3, 4, 3, 4, 1, 1, 1, 2, 1, 3, 4, 2, 2, 4,
2, 2, 1, 4, 1, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 1, 1, 3, 3, 1, 1, 2, 2, 1
Construye un diagrama de barras, con la información dada.
Ejercicio 1.7
Los puntos obtenidos por los jugadores de dos equipos de baloncesto han sido los siguientes:
9 12 6 11 19 5 8 13 2 8 5 12 0 9 4 15 18 10 6 16
Construye el histograma asociado a dichos datos tomando las puntuaciones en intervalos de
5 puntos.
32. Estadística I – Contaduría Pública y Finanzas
26
M.Sc. Cliffor Jerry Herrera Castrillo
Ejercicio 1.8
La superficie arbolada afectada por incendios forestales en España, para el período 2005-
2014, se da en la siguiente tabla:
Representa mediante un polígono de frecuencias la
superficie arbolada afectada por los incendios.
33. Estadística I – Contaduría Pública y Finanzas
27
M.Sc. Cliffor Jerry Herrera Castrillo
Medidas de tendencia central
Las medidas de tendencia central tienden a ocupar la parte central de la distribución de datos.
Entre ellas tenemos la media aritmética, mediana y moda, y pueden ser calculadas tanto para
datos no agrupados como para datos agrupados.
Datos no agrupados
Media aritmética:
Es el promedio de los valores de las observaciones, es decir, se suman los datos y se divide
entre el número de datos. En símbolo, se escribe así:
n
x
X
Ejemplo 2.
Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9
n
x
X
11
94769484753
X
11
66
X X = 6
Mediana:
Es el puntaje central de la distribución de datos. Esto es que el 50% de los valores de la
muestra se encuentra por encima del valor de la mediana y el otro 50%, se encuentra por
debajo de ella.
Para calcular la mediana se busca el valor que se encuentra en el centro de los datos ordenados
de menor a mayor. Si el número de datos (n) es impar, quedará un número solo en el centro.
Ese valor es la mediana. Pero si (n) es par, quedarán dos valores centrales., entonces se
promedian los dos valores y el resultado es el valor de la mediana.
Ejemplo 3.
Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9
Primero se ordena de menor a mayor.
3, 4, 4, 4, 5, 6, 7, 7, 8, 9, 9 La mediana es Me = 6
34. Estadística I – Contaduría Pública y Finanzas
28
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplo 4.
La mediana para el conjunto de datos 1, 2, 4, 6, 7, 8, 9, 10 es
2
76
Me = 6.5ya que n es
par.
Moda
De una serie de datos es el valor que ocurre con mayor frecuencia. Es decir, es el dato más
repetido.
La moda de una serie de datos es el valor Mo , que se define como el dato que más veces
se repite.
La moda no siempre existe y si existe, no siempre es única.
En matemática, la moda es el valor de la variable en el que existe un máximo absoluto (o dos
o más máximos relativos iguales).
La moda es una medida promedio que se usa cuando se quiere señalar el valor más común
de una serie de datos. Por ejemplo, los comerciantes se estoquean con productos que están
de moda.
La moda es el promedio menos importante debido a su ambigüedad.
Ejemplo5.
Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9
Se repiten tres valores el 4, el 7 y el 9. Pero el 4 se repite más veces por tanto la moda es
Mo = 4.
Ejercicios Propuestos
Ejercicio 1.9
Calcular la mediana para las siguientes series de datos.
a) 120, 3, 14, 1, 99, 7, 30, 2,000, 16
b) 30, 77, 3, 300, 36, 11, 10,000, 29
Ejercicio 1.10
35. Estadística I – Contaduría Pública y Finanzas
29
M.Sc. Cliffor Jerry Herrera Castrillo
Determine la moda en la siguiente serie de datos:
a) 7, 9, 7, 8, 7, 4, 7, 13, 7
b) 5, 3, 4, 5, 7, 3, 5, 6, 3
c) 31, 11, 12, 19
Ejercicio 1.11
Calcular la media aritmética de la distribución del número de hijos por familia, según la tabla
presentada
Valores de X frecuencias Productos
xi fi f xi i
0 1 0
1 4 4
2 7 14
3 6 18
4 2 8
Total 20 44
Calcular la moda de los 45 ingresos quincenales
36. Estadística I – Contaduría Pública y Finanzas
30
M.Sc. Cliffor Jerry Herrera Castrillo
Datos agrupados
Media
n
fX
X
c
Mediana Me = Lir + C
f
Af
n
c
a
.2
Moda Mo = Lir + C.
21
1
Donde:
Lir: Es el límite inferior real
n: Es el tamaño de la muestra
fc: Frecuencia de la clase
faA: Frecuencia acumulada
anterior
C: Amplitud del intervalo de clase
:1 Se resta la mayor frecuencia
menos la frecuencia de la clase
anterior.
:2 Se resta la mayor frecuencia
menos la frecuencia de la clase
siguiente.
Ejemplo 6. Calcular la media aritmética, mediana y moda con los datos del ejemplo (1) sobre
el combustible de la cooperativa de taxis de Managua.
Lir Lsr f fa Xc fXc
38,35 39,45 3 3 38,9 116,7
39,45 40,55 2 5 40,0 80
40,55 41,65 3 8 41,1 123,3
41,65 42,75 3 11 42,2 126,6
42,75 43,85 5 16 43,3 216,5
43,85 44,95 17 33 44,4 754,8
44,95 46,05 7 40 45,5 318,5
Total 1 736,40
37. Estadística I – Contaduría Pública y Finanzas
31
M.Sc. Cliffor Jerry Herrera Castrillo
a) Media
n
fX
X
c 𝑋̅ =
1 736,40
40
X = 43.41 kilómetros por galón
b) Mediana: Se encuentra en la primera clase de arriba hacia abajo cuya frecuencia
acumulada es mayor o igual que la mitad de los datos de la muestra
2
n
o sea
2
n
2
40
= 20 Se encuentra en la sexta clase.
Me = 43,85 + )1.1.(
17
1620
Me = 44,10kilómetros por galón
c) Moda: Se encuentra en la clase que tiene la mayor frecuencia.
:1 = 17 – 5 = 12 y :2 = 17 – 7 = 10 Mo = Lir + C.
21
1
Mo = 43,85 + )1.1.(
1012
12
= 44,45 Mo = 44,45 kilómetros por galón
Se puede concluir que el rendimiento promedio en el combustible es de 43.41 kilómetros por
galón, que el 50% de las unidades muestreadas refleja un rendimiento menor o igual a 44.10
y el otro 50%mantiene un rendimiento superior a 44.10, kilómetros por galón y que el
rendimiento más repetido es de 44.45 kilómetros por galón.
Ejercicio 1.12
Calcular la mediana, moda y media aritmética para la muestra de los 45 ingresos quincenales
tabulados en la siguiente tabla:
38. Estadística I – Contaduría Pública y Finanzas
32
M.Sc. Cliffor Jerry Herrera Castrillo
Ingresos Número de personas Frec. acumuladas
iI if iF
[26,34[ 1 1
[34,42[ 2 3
[42,50[ 4 7
[50,58[ 10 17
[58,66[ 16 33
[66,74[ 8 41
[74,82[ 3 44
[82,90] 1 45
Total 45
Ejercicio 1.13 Calcular la media aritmética de la distribución del número de hijos por familia
Valores de X frecuencias Productos
xi fi f xi i
0 1 0
1 4 4
2 7 14
3 6 18
4 2 8
Total 20 44
39. Estadística I – Contaduría Pública y Finanzas
33
M.Sc. Cliffor Jerry Herrera Castrillo
Formas de la distribución
Muchas distribuciones de variables continuas se pueden representar de manera gráfica
mediante una curva en forma de campana.
Simétrica:
Se dice que una distribución es simétrica, si se puede doblar a lo largo de un eje vertical de
modo que los lados coincidan. En este caso la media, mediana y la moda coinciden con el eje
de simetría. El sesgo es igual a cero.
X = Me = Mo
Asimétrica
Si la curva no es simétrica se dice que es sesgada, ya sea positiva o negativamente.
Una distribución es “sesgada a la derecha” o tiene asimetría positiva, si Mo
< Me < X
Mo < Me < X
Una distribución es “sesgada a la izquierda” o tiene asimetría negativa, si
X < Me< Mo
X < Me< Mo
Respecto al problema (el caso de la gasolina) la media es menor que la mediana y menor que
la moda, por tanto tiene una asimetría negativa.
Medidas de variabilidad o dispersión
40. Estadística I – Contaduría Pública y Finanzas
34
M.Sc. Cliffor Jerry Herrera Castrillo
Datos agrupados.
a) La varianza: La varianza se calcula mediante la fórmula S2
=
1
2
1
n
XXf
n
u
c
b) Desviación estándar:
Es la raíz cuadrada de la Varianza. S =
2
S
c) Coeficiente de variación:
Se calcula mediante la fórmula CV = 100x
X
S
Es útil siempre que no será mayor del 20%.
d) Coeficiente de asimetría. Sesgo =
S
MX e3
Ejemplo 7. Con los datos del problema (6), calcular:
a) La varianza
b) La desviación estándar
c) El coeficiente de variación
d) El coeficiente de asimetría.
Lir Lsr f fa Xc fXc ( Xc- X) ( Xc- X)2
f ( Xc- X) 2
38,35 39,45 3 3 38,9 116,7 -4,51 20,3401 61,0203
39,45 40,55 2 5 40,0 80,0 -3,41 11,6281 23,2562
40,55 41,65 3 8 41,1 123,3 -2,31 5,3361 16,0083
41,65 42,75 3 11 42,2 126,6 -1,21 1,4641 4,3923
42,75 43,85 5 16 43,3 216,5 -0,11 0,0121 0,0605
43,85 44,95 17 33 44,4 754,8 0,99 0,9801 16,6617
44,95 46,05 7 40 45,5 318,5 2,09 4,3681 30,5767
Total 40 1 736,40 151,9760
41. Estadística I – Contaduría Pública y Finanzas
35
M.Sc. Cliffor Jerry Herrera Castrillo
a) S2 =
1
2
1
n
XXf
n
u
c
S2
=
39
9760.151
S2 = 3.8968
b) S =
2
S S = 8968.3 S = 1.97 km. por galón.
c) CV = 100x
X
S
CV = 100
41.43
97.1
x Cv = 4.54 %
d) Sesgo =
S
MX e3
Sesgo =
97.1
10.4441.433
Sesgo = - 1.05
Interpretación:
La desviación estándar: La dispersión que presentan los datos es de 1,97 kilómetros por
galón, con respecto al rendimiento promedio.
El coeficiente de variación: Representa en términos porcentuales la relación de la
desviación estándar con respecto a la media, es decir, que los datos se desvían respecto a la
media aritmética en un 4,54 %
Coeficiente de asimetría o Sesgo: Nos da un valor negativo lo que comprueba el análisis
anterior, puesto que los datos tienen una mayor frecuencia al final de la distribución. Tiene
asimetría negativa.
EJERCICIO (1)
1) En la zona baja de Managua hay 27 pozos para suministrar agua a la ciudad Capital.
Los caudales de dichos pozos se miden en galones por minuto. (GPM) y sus
mediciones son las siguientes.
800 2200 1212 1200 2230 1115 1100 511 1100
1000 800 800 1000 1200 800 750 710 700
1200 600 550 450 400 380 350 1200 1000
42. Estadística I – Contaduría Pública y Finanzas
36
M.Sc. Cliffor Jerry Herrera Castrillo
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que
tenga 6 clases.
b) Calcular la media, mediana y moda
c) Calcular la varianza y la desviación estándar
d) Trazar el histograma de frecuencias.
2) Los datos son mediciones de la intensidad solar directas (en Watts / m2
) realizados en
diferentes días en una localidad.
562 869 708 775 704 775 809
856 655 806 878 909 918 558
768 870 918 940 946 661 820
898 935 952 957 693 835 905
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que
tenga 5 clases.
b) Calcular la media, mediana y moda
c) Calcular la varianza y la desviación estándar
d) Trazar el polígono de frecuencias.
3) Los contenidos de nicotina, en miligramos de 40 cigarrillos de cierta marca son:
1.09 1.79 2.03 1.63 1.69 0.85 1.64 1.51
1.74 1.37 1.86 2.31 1.88 2.17 1.75 1.82
1.58 1.75 0.72 1.97 1.40 1.68 2.28 1.67
2.11 1.92 2.46 1.70 2.37 1.85 1.24 2.09
1.64 1.47 1.93 1.90 1.79 2.08 2.55 1.69
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que
tenga 6 clases.
b) Calcular la media, mediana y moda
43. Estadística I – Contaduría Pública y Finanzas
37
M.Sc. Cliffor Jerry Herrera Castrillo
c) Calcular la varianza y la desviación estándar
d) Trazar el polígono de frecuencia acumulada.
4) En la redacción de un diario, el tiempo requerido para formar la página completa fue
registrada durante 50 días. El dato redondeado a la décima de un minuto más cercana
se da a continuación.
20.8 22.8 21.9 22 20.7 20.9 25 22.2 22.8 20.1
25.3 20.7 22.5 21.2 23.8 20.9 22.9 23.3 23.5 19.5
23.7 20.3 23.6 19 25.1 19.5 24.1 24.2 25 21.8
21.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 22.7
19.7 24.5 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que
tenga 7 clases.
b) Interprete la quinta clase.
5) Los precios en dólares de un repuesto para computadora en una ciudad son:
32 38 42 39 41 35.4
47.8 40 36.7 38.3 36.7 41.5
39.6 41.52 15.7 43.6 39.4 45.6
49.4 48 43.7 42.6 45.6 44
48.6 34.2 31.2 47.6 43.5 30.4
a) Construya una tabla de distribución de frecuencias.
b) Interprete la frecuencia absoluta y acumulada de la cuarta clase.
c) Interprete el porcentaje de frecuencia relativa y el porcentaje acumulado de la
clase de mayor frecuencia.
44. Estadística I – Contaduría Pública y Finanzas
38
M.Sc. Cliffor Jerry Herrera Castrillo
Medidas de posición
Deciles: Son valores posicionales que dividen a la información en diez partes iguales.
El primer decil deja 10% de la información por debajo de él y el 90% por encima de
él. Los deciles se representan por Di donde i = 1, 2, 3, . . . 10
Cuartiles: Son valores posicionales que dividen a la información en cuatro partes
iguales, el primer cuartil deja el 25% de la información por debajo y el 75% por
encima. El segundo cuartil al igual que la mediana divide a la información en dos
partes iguales. Por último, el tercer cuartil deja 75% por debajo y el 25% por encima.
Los cuartiles se representan por Qi donde i= 1, 2, 3, 4.
Percentiles: Son valores posicionales que dividen a la información en cien partes
iguales. Los percentiles se representan por Pi donde 1 < i < 100.
Representación gráfica
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
P 10% 20% 30% 40% 60% 70% 80% 90%
100%
Q1 Q2 Q3
25% 50% 75%
Deciles Di = Lir + C
f
Af
in
c
a
.10
Cuartiles Qi = Lir + C
f
Af
in
c
a
.4
45. Estadística I – Contaduría Pública y Finanzas
39
M.Sc. Cliffor Jerry Herrera Castrillo
Percentiles Pi = Lir + C
f
Af
in
c
a
.100
Ejemplo 8. Con los datos de la tabla del ejemplo (7);
Lir Lsr f fa
38,35 39,45 3 3
39,45 40,55 2 5
40,55 41,65 3 8
41,65 42,75 3 11
42,75 43,85 5 16
43,85 44,95 17 33
44,95 46,05 7 40
Total 40
Calcular:
a) El decil 2 d) Percemtil 10
b) Cuartil 1 e) Percentil 90
c) Cuartil 3
a) Di = Lir + C
f
Af
in
c
a
.10
D2 = 40.55 + )1.1.(
3
5
10
)40(2
D2 = 41.65
46. Estadística I – Contaduría Pública y Finanzas
40
M.Sc. Cliffor Jerry Herrera Castrillo
b) Qi = Lir + C
f
Af
in
c
a
.4
Q3= 43.85 + )1.1.(
17
16
4
)40(3
Q3 = 44.76
c) Qi= Lir + C
f
Af
in
c
a
.4
Q1= 41.65 + )1.1.(
3
8
4
)40(1
Q1 = 42.38
d) Pi = Lir + C
f
Af
in
c
a
.100
P10 = 39.45 + )1.1.(
2
3
100
)40(10
P10 = 40.00
e) Pi = Lir + C
f
Af
in
c
a
.100
P90 = 44.95 + )1.1.(
7
33
100
)40(90
P90 = 45.42
Interpretación:
El D2 significa que el 20% de los datos de la muestra, tienen un rendimiento de 41.65 km
por galón o menos. El Q1indica que el 25% de los datos de la muestra tienen un rendimiento
menor o igual a 42.38 km por galón. De manera similar se interpretan las otras medidas.
Coeficiente de curtosis (K)
Otra manera de medir la forma de la distribución es con la curtosis, la cual nos dice qué tan
puntiaguda es la gráfica de una distribución y se presenta en tres tipos:
Platicúrtica: La forma geométrica es aplanada
Mesocúrtica: Tiene una forma que no es ni aplanada ni puntiaguda. Leptocúrtica: La forma
geométrica es puntiaguda o esbelta.
47. Estadística I – Contaduría Pública y Finanzas
41
M.Sc. Cliffor Jerry Herrera Castrillo
Platicúrtica Mesocúrtica Leptocúrtica
K =
1090 PP
Q
Q =
2
13 QQ
Q =
2
38.4276.44
Q = 1.19
K =
4042.45
19.1
K = 0,2195A Q se le conoce como rango semi intercuartil.
Ejemplo 9.La siguiente distribución de frecuencia representa el tiempo promedio en minutos
que 20 clientes de un banco, llevan a cabo una transacción bancaria.
Tiempo en
minutos
Li Ls
Lir Lsr
Cantidad de
clientes (f)
Tiempo
promedio
3
4 2,1
6
3
2 6,0
2
Total 20
a) Completar la tabla de distribución de frecuencias.
b) Calcular la desviación estándar S e interpretarla.
c) ¿Qué porcentaje de clientes realizó su transacción bancaria entre 1.95 y 5.50 minutos.
2,1 + C + C + C = 6,0 3C = 6,0 – 2,1 = 3,9 C = 1,3
Lir = Xc -
2
C
Se usa para calcular el límite inferior real.
48. Estadística I – Contaduría Pública y Finanzas
42
M.Sc. Cliffor Jerry Herrera Castrillo
Lsr = Xc +
2
C
Se usa para calcular el límite superior real.
a)
Li Ls Lir Lsr f Xc fa fXc Xc - X (Xc - X)2 f (Xc - X)2
0,2 1,4 0,15 1,45 3 0,8 3 2,4 -2,795 7,812 23,436
1,5 2,7 1,45 2,75 4 2,1 7 8,4 -1,495 2,235 8,9401
2,8 4,0 2,75 4,05 6 3,4 13 20,4 -0,195 0,038 0,2282
4,1 5,3 4,05 5,35 3 4,7 16 14,1 1,105 1,221 3,6631
5,4 6,6 5,35 6,65 2 6 18 12 2,405 5,784 11,568
6,7 7,9 6,65 7,95 2 7,3 20 14,6 3,705 13,727 27,454
20 Σ 71,9 Σ 75,29
b)
Media aritmética
n
fX
X
c
20
9.71
X X = 3,595 minutos
La varianza S2 =
1
2
n
XXf c
S 2 = 3,9626 S = 1,9906 minutos
c) Pi = Lir + C
f
Af
in
c
a
.100
1.95 está en la segunda clase y 5.50 en la quinta.
1,95 = 1.45 + )3.1.(
4
3
100
)20(
i
i = 22.69 %
5.50 = 5.35 + )3.1.(
2
16
100
)20(
i
i = 81.15 %
Por tanto el porcentaje es 81.15% – 22.69 % = 58.46%
49. Estadística I – Contaduría Pública y Finanzas
43
M.Sc. Cliffor Jerry Herrera Castrillo
Interpretación
Inciso (b) El tiempo promedio que los clientes se tardan en realizar sus transacciones
bancarias es de 3.595 minutos con una desviación estándar de 1.99. Esto quiere decir que la
variación de los tiempos que se tardan los clientes en realizar sus operaciones bancarias es
de 1.99 minutos con respecto al tiempo promedio.
Inciso (c) El 58.46 % de los clientes se tardan entre 1.95 y 5.50 minutos en realizar las
operaciones bancarias.
EJERCICIO (2)
1) Una compañía de computadoras recopiló datos con respecto al tiempo (en minutos)
que requerían cada uno de los 40 vendedores para realizar una venta. La siguiente
tabla representa la distribución de tiempo requerido por vendedor.
Li Ls F fr
1 10 0.075
11 20 1
21 30 4
31 40
41 50 2
51 60 0.375
61 70 0.225
71 80 5
a) Completar la tabla
b) Calcular el coeficiente de asimetría
c) Calcular el coeficiente de curtosis
d) Interpretar la forma de la distribución.
2) Una fábrica de cremalleras manufactura 15 productos básicos. La compañía tiene
registros del número de elementos de cada producto fabricado al mes con el fin de
50. Estadística I – Contaduría Pública y Finanzas
44
M.Sc. Cliffor Jerry Herrera Castrillo
examinar los niveles relativos de producción. A partir de los datos obtenidos, la
dirección de la Compañía construyó la siguiente tabla.
Clases frecuencia
9,700 9,899 3
9,900 10,099 8
10,100 10,299 2
10,300 10,499 0
10,500 10,699 2
a) ¿Qué nivel de producción excedió el 75% de sus productos durante ese mes?
b) ¿Qué nivel de producción excedió el 90% de sus productos durante ese mes?
c) Analice la forma de la distribución.
3) La responsable de la biblioteca de una Universidad ordenó un estudio del tiempo que
un estudiante tiene que esperar (en minutos) para que le sea entregado el libro
solicitado para consulta. Se tomó una muestra a 20 estudiantes en un día normal. Los
datos fueron:
12, 16, 11, 10, 14, 3, 11, 17, 9, 18, 16, 4, 7, 14, 15, 16, 5, 6, 7, 7
a) Hallar la media aritmética, media geométrica, media armónica, mediana y moda.
b) ¿Cuánto tiempo máximo se debe suponer que el 75 % de los estudiantes debe esperar
para obtener su libro de consulta?
8- Gráficas para datos que representan variables ordinales o nominales.
1- Diagramas de barras
Se elabora mediante la utilización de barras rectangulares de ancho igual y con la misma
distancia de separación entre una y otra. Puede ser simple o compuesto.
Ejemplo 10.
La tabla siguiente muestra los datos sobre las preferencias de algunos deportes como
Baloncesto, fútbol, natación y atletismo, para hombre y mujeres.
51. Estadística I – Contaduría Pública y Finanzas
45
M.Sc. Cliffor Jerry Herrera Castrillo
Hombres % Mujeres %
Baloncesto 6 31.58 13 68.42
Fútbol 15 78.95 4 21.05
Natación 11 57.89 8 42.11
Atletismo 8 42.11 11 57.89
2- Diagrama Circular con los datos del ejemplo 10.
0
2
4
6
8
10
12
14
16
Baloncesto Fútbol Natación Atletismo
Cant.deatletas
Disciplina
Preferencia de algunos deportes
según el sexo
Homres
mujeres
52. Estadística I – Contaduría Pública y Finanzas
46
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplo 11. El Banco Central de Nicaragua registró las exportaciones en el período
2001 - 2004 (en millones de dólares)
Exportaciones
Rubro 2001 2002 2003 2004
Café 103 74 86 124
Carne 66 78 84 110
Mariscos 76 79 69 88
Oro 30 35 35 47
Azúcar 49 29 26 29
.
Baloncesto
15%
Fútbol
37%
Natación
28%
Atletismo
20%
Preferencia por algunos deportes
según el sexo
53. Estadística I – Contaduría Pública y Finanzas
47
M.Sc. Cliffor Jerry Herrera Castrillo
0
20
40
60
80
100
120
140
2001 2002 2003 2004
MIllones$
Años
Exportaciones de Nicaragua Fuente:
Banco Central de Nicaragua
Café
Carne
Marisco
Oro
Azúcar
54. Estadística I – Contaduría Pública y Finanzas
48
M.Sc. Cliffor Jerry Herrera Castrillo
UNIDAD II. PROBABILIDADES
Objetivos conceptuales
Explicar los conceptos y definiciones de las probabilidades
Identificar para cada situación el enfoque de probabilidad apropiado.
Objetivos procedimentales
Aplicar las reglas básicas de probabilidad en la resolución de problemas reales
Resolver problemas de la vida real utilizando probabilidades condicionales
Objetivos actitudinales
Valorar la importancia de las probabilidades, como herramienta para la solución de
problemas de su entorno social
Contenidos Conceptuales Contenidos Procedimentales Contenidos Actitudinales
Conceptos y definiciones de
las probabilidades
Experimento aleatorio,
eventos, tipos de eventos
Probabilidad de un evento
Enfoques de probabilidad: a
priori, a posteriori y
subjetivo
Reglas básicas de probabilidad
Probabilidad del evento imposible
y seguro, valores que puede tomar
una probabilidad, regla del
complemento y la adición
Probabilidad condicional
Regla de la multiplicación,
independencia estadística,
teorema de la probabilidad total,
teorema de Bayes.
Valoración de la importancia
de las probabilidades, como
herramienta para la solución
de problemas de su entorno
social.
55. Estadística I – Contaduría Pública y Finanzas
49
M.Sc. Cliffor Jerry Herrera Castrillo
Introducción:
Sin tener en cuenta la profesión que se haya elegido, en algún momento se deben tomar
decisiones. Con mucha frecuencia esto tendrá que hacerse sin conocer todas las
consecuencias de tales decisiones. Por ejemplo, los inversionistas deben decidir sobre la
conveniencia de invertir en una acción en particular, con base a las expectativas sobre
rendimientos futuros. Los empresarios, al decidir comercializar un producto, enfrentan la
incertidumbre sobre la posibilidad de éxito.
En la actualidad, vemos que la teoría de las probabilidades ocupa un lugar importante en
asuntos de negocios. La póliza de seguros de vida, por ejemplo, se basa en tablas de
mortalidad y éstas a su vez, se basan en la teoría de las probabilidades. Otras tasas de seguros
tales como seguros de bienes raíces y de automóviles se determinan de manera similar. La
probabilidad también juega un papel importante en la estimación del número de unidades
defectuosas en un proceso de fabricación.
La probabilidad de recibir pagos sobre cuentas por cobrar, las venta potenciales de un nuevo
producto, los apostadores profesionales, un evento deportivo, etc son ejemplos de aplicación
de la teoría de las probabilidades.
Definiciones
Probabilidades
Se define probabilidades como el estudio de experimentos aleatorios o de libre determinación
Experimento
En estadística la palabra experimento se utiliza para describir un proceso que genera un
conjunto de datos cualitativos o cuantitativos. En la mayoría de los casos, los resultados del
experimento dependen del azar, por lo tanto no pueden pronosticarse con exactitud.
Experimento aleatorio
Definición. Un experimento aleatorio es todo proceso que consiste de la ejecución de un
acto (o prueba) una o más veces, cuyo resultado en cada prueba depende del azar y en
consecuencia no se puede predecir con certeza.
56. Estadística I – Contaduría Pública y Finanzas
50
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplos 1, son experimentos aleatorios: lanzar un dado y observar el resultado, contar
objetos defectuosos producidos diariamente por cierto proceso, aplicar una encuesta para
obtener opiniones, etc.
Experimento no aleatorio
Son aquellos en donde el resultado sí puede predecirse con toda certeza
Ejemplo 2. En condiciones normales elevamos la temperatura del agua a 100 grados en la
escala centígrada, de hecho sabemos que se evaporará.
Ejemplo 3. Tomamos un dado y marcamos con un mismo número en todas sus caras, al
lanzarlo sabemos con toda seguridad cuál número va a caer.
Espacio Muestral
Definición. Se denomina espacio muestral al conjunto que consiste de todos los resultados
posibles de un experimento aleatorio. Este conjunto se denotará por S.
Cada resultado posible de un experimento aleatorio es un elemento del espacio muestral. A
cada elemento del espacio muestral se denomina también punto muestral. Esto es, el espacio
muestral se describe por
𝑆 = { 𝑥
𝑥⁄ 𝑒𝑠 𝑢𝑛 𝑝𝑢𝑛𝑡𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙}
Si el espacio muestral tiene un número finito de elementos es posible enlistar a todos estos,
y si el número de elementos es grande o infinito el espacio muestral se describirá mediante
un enunciado o regla.
Ejemplo 4.
A continuación se dan algunos experimentos aleatorios y sus correspondientes espacios
muéstrales:
1) El experimento aleatorio de lanzar un dado y observar el resultado obtenido, es de una
sola prueba, cuyo espacio muestral se puede escribir como el siguiente conjunto de puntos
muéstrales:
57. Estadística I – Contaduría Pública y Finanzas
51
M.Sc. Cliffor Jerry Herrera Castrillo
S1 = {1, 2, 3, 4, 5, 6}.
2) El experimento aleatorio de lanzar una moneda 3 veces, consiste de 3 pruebas, cuyo
espacio muestral puede escribirse como el conjunto de ternas ordenadas:
S2 = {CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS}.
NOTA. Los espacios muestrales de experimentos aleatorios que consisten de dos o más
pruebas sucesivas se obtienen también de un diagrama tipo árbol, como el de la figura para
S2.
S
C
C
S
C
S
C
S
C
S
C
S
C
S
Puntos muestrales
CCC
CCS
CSC
CSS
SCC
SCS
SSC
SSS
1a.Prueba
2a.prueba
3a.prueba
Diagrama del árbol.
3) Si el experimento aleatorio es lanzar una moneda tantas veces como sea necesario hasta
que aparezca la primera cara, su espacio muestral es el conjunto:
S4 = {C, SC, SSC, SSSC,...etc.}.
4) Si el experimento aleatorio es medir la vida útil (en horas) de una marca de artefacto
eléctrico, su espacio muestral es el conjunto:
𝑆5 = {𝑡 ∈ ℝ/𝑡 ≥ 0}
(Aquí, ℝ representa a los números reales).
Clasificación de los espacios muestrales. Por el número de elementos o puntos muestrales,
los espacios muestrales se clasifican en:
1) Discretos finitos, consisten de un número finito de elementos, por ejemplo, los espacios
S1, S2, S3.
58. Estadística I – Contaduría Pública y Finanzas
52
M.Sc. Cliffor Jerry Herrera Castrillo
2) Discretos infinitos, consisten de un número infinito numerable de elementos, por
ejemplo, el espacio S4.
3) Continuos, consisten de un número infinito no numerable de elementos, por ejemplo,
los espacios S5, y S6
Suceso aleatorio
Se llama suceso aleatorio a todo suceso que puede ocurrir o puede no ocurrir como resultado
de la realización de un fenómeno.
Suceso elemental
Se llama suceso elemental a aquel suceso A que no se puede expresar como suma de dos
sucesos diferentes de A. Los sucesos elementales se identifican con los elementos del espacio
muestral y éstos son los resultados posibles del hecho o experimento.
𝑆 = {𝑐, 𝑠}
Ejemplo 5.
Suceso elemental {𝑐}
Suceso elemental {𝑠}
Suceso compuesto
Es el resultado de dos o más sucesos elementales.
Ejemplo 6.
Al lanzar un dado corriente el espacio muestral, es S = 1, 2, 3, 4, 5, 6 luego:
1 ,2 3 4 5 6 Son elementales: en cambio, los sucesos:
1,2 1, 2, 3 2, 3, 5 etc. Son sucesos compuestos.
Algunas definiciones y operaciones con conjuntos
Conjunto universo: Comprende la totalidad de los elementos. Se representa por U.
Ejemplo 7.
a) El conjunto formado por las letras vocales. U = a, e, i, o, u
b) El conjunto formado por los números dígitos. U = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
59. Estadística I – Contaduría Pública y Finanzas
53
M.Sc. Cliffor Jerry Herrera Castrillo
Conjunto unión: Se define como el conjunto formado por los elementos que pertenezcan al
primer conjunto, al segundo conjunto y a ambos.
Se denota por A U B = x/ x Є A, x Є B y x Є (A∩B)
Conjunto intersección: Se define como el conjunto formado por los elementos que
pertenecen a ambos conjuntos. Se denota por A ∩ B = x / x Є A y x Є B
Conjunto complemento: Se define el complemento de A como el conjunto formado por los
elementos que están en el universo pero que no están en el conjunto A.
Se denota por Ac = x / x Є U y x Є A
Diferencia de conjuntos: La diferencia de dos conjuntos denotada por A – B se define
como el conjunto formado por los elementos que pertenecen al conjunto A pero que no
pertenecen al conjunto B.
A – B = x / x Є A y x Є B
Conjunto vacío: El conjunto vacío se caracteriza por la carencia de elementos. Se denota
por Ø o bien por.
Ejemplo 8.
Sean los conjuntos:
U = 1, 3, 4, 5, 7, 8, 9 A = 1, 4, 7 B = 3, 4, 5, 8 C = 1, 7, 8
Calcular:
1) A U B, 3) (A ∩ B) - (B ∩ C) 5) Ac
∩ Bc
2) A U (B – C), 4) (A U B) c
,
Solución:
1) A U B = 1, 3, 4, 5, 7, 8
2) A u (B – C) = 1, 3, 4, 5, 7
3) (A ∩ B) - (B ∩ C) = 4
60. Estadística I – Contaduría Pública y Finanzas
54
M.Sc. Cliffor Jerry Herrera Castrillo
4) (A U B)c = 9
5) A ∩ B′ = 3, 5, 8, 9 ∩ 1, 7, 9 = 9
Definición clásica de probabilidad (modelo clásico o a priori)
Si un experimento aleatorio tiene n resultados igualmente posibles (n > 0) de los cuales m
son favorables a la ocurrencia de un suceso A, entonces se llama probabilidad de un suceso
A al cociente m / n y se denota por P(A); es decir:
m: Son casos favorables al suceso A
n: Son casos posibles (o totales) del experimento.
Propiedades
1- 0 ≤ P(A) ≤ 1
2- P (S) = 1
3- P (A U B) = P (A) + P (B) si (A ∩ B) = Ø
4- P (A U B) = P (A) + P (B) – P (A ∩ B) si (A ∩ B) ≠ Ø
5- P (Ø) = 0
6- P (Ac
) = 1 - P (A)
Tipos de probabilidad
Probabilidad Objetiva: La probabilidad objetiva se divide en dos:
1) Probabilidad clásica (O A PRIORI): Esta se basa en la suposición de que los
resultados de los experimentos son igualmente probables. Usando el punto de vista
clásico la probabilidad de que un evento ocurra, se calcula dividiendo el número de
casos favorables, entre el número de posibles resultados. Esto es:
Ejemplo9.:
P(A) =
n
m
Número de casos favorables
Probabilidad de un evento = -------------------------------------------
Número de resultados posibles
Probabilidad de un evento = ----------------------------------------------
Número de resultados posibles
61. Estadística I – Contaduría Pública y Finanzas
55
M.Sc. Cliffor Jerry Herrera Castrillo
Se lanza un dado corriente ¿Cuál es la probabilidad de obtener un número par?
Solución: P(par) = 3 / 6 = 1 / 2 = 0.50 o bien 50 %
Otros ejemplos cásicos son:
Lotería estatal
Juegos de cartas, etc.
2) Probabilidad empírica (MODELO A POSTERIORI): Se basan en la frecuencia
relativa histórica. Esto es, la probabilidad de que un evento ocurra a lo largo del
tiempo, se determina observando el número de veces que eventos similares ocurrieron
en el pasado.
Ejemplo 10.
Un estudio de 751 administradores graduados en una Universidad, mostraron que 383
no fueron empleados en su área principal de estudio. Como ilustración, una persona
que se especializó en contabilidad, es ahora Gerente de mercadotecnia en una empresa
procesadora de tomates. ¿Cuál es la probabilidad de de que un determinado graduado de
negocios, sea empleado en un área distinta a su área principal de la escuela?
P(A) =
751
383
Por tanto, P(A) = 51 %
Otros ejemplos empíricos son:
Establecer tasas de seguros
Reportear índices de curación de varias enfermedades y condiciones, etc.
3) Probabilidad Subjetiva: La probabilidad de que un evento particular ocurra, que es
asignada por un individuo, basándose en la información que tenga disponible.
Número de veces que ocurrió
el evento en el pasado
Probabilidad de que un evento ocurra = ----------------------------------------------
Número de observaciones
62. Estadística I – Contaduría Pública y Finanzas
56
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplo 11.
Apostar en eventos atléticos.
Estimar el futuro de una industria.
4) Probabilidad Conjunta: Es una probabilidad que mide la posibilidad de que dos o más
eventos ocurran simultáneamente. No son mutuamente excluyentes:
P (A U B) = P (A) + P (B) – P (A ∩ B)
Ejemplo 12.
Las probabilidades de que la recepcionista de un dentista, su asistente o ambos se enfermen
cierto día son 0.04, 0.07 y 0.02 respectivamente. ¿Cuál es la probabilidad de que cuando
menos uno de los dos se enferme ese día?
P(A U B) = 0,04 + 0,07 – 0,02
P(A U B) = 0,09
Sucesos independientes
Si la ocurrencia de un suceso A no altera la probabilidad de ocurrencia de otro suceso B, se
puede adoptar el término de independencia para describir esta situación y decir que A y B
son independientes. Dos sucesos A y B de llaman independientes si y sólo si:
P (A ∩ B) = P (A) . P (B)
Sucesos dependientes
Se dice que dos sucesos son dependientes si la ocurrencia de uno de ellos, afecta la ocurrencia
del otro.
Probabilidad condicional
Se llama probabilidad condicional o probabilidad de un suceso A condicionada por la
ocurrencia de otro suceso B al cociente.
)(
)(
)/(
BP
BAP
BAP
P(B) ≠ 0.P(A / B): Léase “Probabilidad de A dado B”.
63. Estadística I – Contaduría Pública y Finanzas
57
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplo 13.
La probabilidad de que un vuelo de programación regular despegue a tiempo es P(D) = 0,83;
la de que llegue a tiempo es P(A) = 0,82 y la de que despegue y llegue a tiempo es P AD
= 0,78. Encuentre la probabilidad de que un avión:
a) Llegue a tiempo dado que despegó a tiempo.
b) Despegue a tiempo dado que llegó a tiempo.
a) P(A / D) =
DP
DAP
P(A / D) =
0,78
0,83
= 0,94
b)P(D / A) =
AP
ADP
P(D / A) =
0,78
0,82
= 0,9512
Ejemplo 14.
Una universidad que proporciona educación para ambos sexos tiene tres carreras: ciencias,
administración e ingeniería. La inscripción es la siguiente:
Ciencias Administración Ingeniería Total
Hombre 250 350 200 800
Mujer 100 50 50 200
Total 350 400 250 1,000
Si se ha de seleccionar aleatoriamente un estudiante:
a) ¿Cuál es la probabilidad de que estudie ciencias dado que es varón?
b) ¿Cuál es la probabilidad de que sea mujer dado que es estudiante de ingeniería?
a) P(C / H) =
HP
HCP
P(C / H) =
1000
800
1000
250
=
800
250
= 0,3125
64. Estadística I – Contaduría Pública y Finanzas
58
M.Sc. Cliffor Jerry Herrera Castrillo
b) P(M / I) =
IP
IMP
P(M / I) =
1000
250
1000
50
=
250
50
= 0,20
Regla de la multiplicación
Sean A y B dos eventos contenidos en S (espacio muestral), entonces la probabilidad de que
se dé A y B es igual al producto de la probabilidad de B por la probabilidad de A dado B; es
decir: P (A ∩ B) =P(B) . P (A / B)
Ejemplo 15.
Una urna contiene 5 pelotas rojas, 3 azules y 2 blancas. Si se extraen dos de ellas (primero
una y después la otra) y sin remplazamiento. Hallar la probabilidad de que:
a) ambas sean rojas
b) una sea roja
c) la primera sea roja
d) al menos una sea roja
e) ninguna sea roja.
a) P (RR) = P(R) . P(R) = (5/10) . (4/9) = 20 / 90 = 2/9
R
4/9
R 3/9 A
5/10
2/9 B
R
5/9
3/10 2/9 A
A
2/9
B
2/10 R
5/9
3/9
B A
1/9
B
65. Estadística I – Contaduría Pública y Finanzas
59
M.Sc. Cliffor Jerry Herrera Castrillo
b) P (una sea roja) = P (RA) + P (RB) + P (AR) + P/BR)
= (5/10) (3/9 ) + (5/10) ( 2/9 ) + (3/10) (5/9) + (2/10) (5/9)
= 15/90 + 10/90 + 15/90 + 10/90 = 50/90 = 5/9
c) P (la primera es roja) = P(RR) + P/RA) + P(RB)
= (5/10) (4/9) + (5/10) (3/9) + (5/10) (2/9)
= 20/90 + 15/90 + 10/90 = 45/90= 1 / 2
d) P (al menos una sea roja) = P(1 roja) + P(2 rojas) = 5 / 9 + 2 / 9 = 7 / 9
e) P (ninguna sea roja) = P (AA) + P (AB) + P (BA) + P (BB)
= (3/10) (2/9) + (3/10) (2/9) + (2/10) (3/9) + (2/10) (1/9)
= 6 / 90 + 6 / 90 + 6 / 90 + 2 / 90 = 20 / 90 = 2/9
Probabilidad total
Si B1, B2, . . . . .Bn representa una partición de S y se B es un evento arbitrario sobre S,
entonces la probabilidad total sobre A está dado por:
P(A) = P(B1) . P/A / B1) + P(B2) . P/A / B2) + . . . . . P(Bk) . P/A / Bk)
Este teorema es muy útil ya que existen numerosas situaciones prácticas en las cuales P(A)
no puede calcularse directamente, sin embargo con la información de que B ha ocurrido, es
posible evaluar P(A / B) y por tanto, determinar a P(A) cuando se obtienen los valores de
P(B). Otro resultado importante de la ley total de probabilidad es conocida como teorema de
Bayes.
Regla de Bayes
Si B1, B2, . . . . Bk constituye una partición del espacio de muestreo S y si A es un evento
arbitrario sobre S, entonces para r = 1, 2, . . . . . k.
66. Estadística I – Contaduría Pública y Finanzas
60
M.Sc. Cliffor Jerry Herrera Castrillo
P (Br / A) =
i
k
i
rr
BAPBP
BAPBP
/
/
1
o bien:
Ejemplo 16.
Tres compañías suministran transistores NPN a un fabricante de equipo de telemetría.
Supuestamente todos los transistores están hechos de acuerdo a las mismas especificaciones.
Sin embargo, el fabricante ha probado durante varios años dos parámetros de calidad de los
transistores. Y los registros indican la siguiente información, declarándose defectuoso a un
transistor si cualquiera de los parámetros está fuera de especificación.
__________________________________________________________________
Firma Proporción de defectuoso Proporción suministrada por
_________________________________________________________________
1 0,02 0,15
2 0,01 0,80
3 0,03 0,05
--------------------------------------------------------------------------------------------------------------
Debido a los costos involucrados el fabricante ha cesado las pruebas, y puede considerarse
de manera razonable que las fracciones de defectos y la mezcla en inventario son las mismas
que durante el período en que se realizaron los registros. El director de producción selecciona
aleatoriamente un transistor, lo lleva al departamento de prueba y descubre que es defectuoso.
Si A es el evento de que un elemento es defectuoso, y si B es el evento de que el elemento
proviene de la compañía i (i = 1, 2, 3), entonces es posible evaluar P (Bi /A). Por ejemplo,
suponga que se desea determinar P(B3 / A). Entonces:
P (B3/ A) =
332211
33
/)()/()()/().(
/
BAPBBAPBPBAPBP
BAPBP
P(Br / A) =
kk
rr
BAPBPBAPBPBAPBP
BAPBP
/)(.............)/()()/().(
/
2211
67. Estadística I – Contaduría Pública y Finanzas
61
M.Sc. Cliffor Jerry Herrera Castrillo
P (B3/ A) =
03.005.001.080.002.015..0
03.005.0
P (B3/ A) = 12.0
25
3
Ejercicio
1.- Las probabilidades de que una estación de televisión reciba 0, 1, 2, 3, 4, . . . 7 o cuando
menos 8 quejas después de transmitir un programa de controversia son, respectivamente
0.02, 0.04, 0.07, 0.12, 0.15, 0.19, 0.18, 0.14 y 0.09: ¿Cuáles son las probabilidades de que
después de transmitir un programa la estación reciba:
a) Cuando menos 5 quejas?
b) Cuando mucho 3 quejas?
c) De dos a cuatro quejas?.
2.-Las probabilidades de que la utilidad de una nueva máquina de escribir se clasifique como
difícil, muy difícil, promedio, fácil o muy fácil son respectivamente 0,11; 0,16; 0,35; 0,28 y
0,10. Determine las probabilidades de que la utilidad de la nueva máquina de escribir se
clasifique como:
a) difícil o muy difícil.
b) difícil, promedio o fácil.
c) fácil o muy fácil.
3.- Un artista que ha introducido una pintura al óleo grande y una pequeña a una exposición,
siente que las probabilidades son respectivamente 0,15; 0,18 y 0,11 de que venderá el óleo
grande, el pequeño o ambos. ¿Cuál es la probabilidad de que venderá alguna de las dos
pinturas?.
4.- La probabilidad de que un conductor imprudente será multado, se le revocará la licencia
o ambas son, respectivamente; 0,88; 0,60 y 0,55; ¿Cuál es la probabilidad de que será
multado o de que se le revocará la licencia?.
68. Estadística I – Contaduría Pública y Finanzas
62
M.Sc. Cliffor Jerry Herrera Castrillo
5.- La probabilidad de que un concierto dado reciba la publicidad adecuada es 0,80; y la
probabilidad de que recibirá la publicidad adecuada y también será un gran éxito es 0,76.
¿Cuál es la probabilidad de que si el concierto recibe la publicidad adecuada será un gran
éxito?.
6.- La profesora de inglés piensa que la probabilidad es 0,60 de que un examen final por
escrito que recibe estará bien redactado. Si la probabilidad es 0,51 de que este examen final
estará bien escrito y también recibirá una buena calificación. ¿Cuál es la probabilidad de que
un examen final bien escrito recibirá una buena calificación?.
7.- En dos tiros de un dado equilibrado, determine las probabilidades de obtener:
a) Dos seis.
b) Primero un seis y después algún otro número.
8.- Un zoólogo tiene cuatro cerdos de guinea machos y ocho hembras y elige a dos de ellos
al azar para realizar un experimento; ¿cuáles son las probabilidades de que:
a) ambos animalitos sean machos.
b) ambos animalitos sean hembras.
c) habrá uno de cada sexo.
9.- La probabilidad es 0,70 de que una rara enfermedad tropical se diagnostique
correctamente. Si ésta se diagnostica en forma correcta la probabilidad es 0,90 de que el
paciente se sanará. Si no, la probabilidad es 0,40 de que el paciente se sanará. Si se cura un
paciente que tiene esta enfermedad, ¿cuál es la probabilidad de que se haya diagnosticado
correctamente?.
10.- En una fábrica de zapatos se sabe por experiencia pasada que la probabilidad es 0,82 de
que un trabajador que ha asistido a un programa de capacitación de la fábrica, cumplirá con
la cuota de producción, y que la probabilidad correspondiente es 0,53 para un trabajador que
no asistió al programa de capacitación. El 60 % de los trabajadores asisten al programa de
69. Estadística I – Contaduría Pública y Finanzas
63
M.Sc. Cliffor Jerry Herrera Castrillo
capacitación de la fábrica. ¿Cuál es la probabilidad de que un trabajador que cumple con la
cuota de producción habrá asistido al curso?.
11) En una ciudad se seleccionó una muestra de 500 personas para determinar diversas
informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas
hechas se encontraba ¿Prefiere comprar productos nacionales o importados?. De 240
hombres, 140 contestaron que prefieren comprar productos importados y 80 mujeres
expresaron que prefieren productos nacionales.
a) Elabore una tabla de contingencias en donde las variables cualitativas son sexo y
preferencias por sus productos.
b) Se selecciona una persona de manera aleatoria. Determinar la probabilidad de que el
entrevistado:
1) Sea hombre
2) Sea mujer
3) Prefiera comprar productos importados
4) Prefiera comprar productos nacionales
70. Estadística I – Contaduría Pública y Finanzas
64
M.Sc. Cliffor Jerry Herrera Castrillo
UNIDAD III. DISTRIBUCIONES DE PROBABILIDAD
Objetivos conceptuales
Explicar el concepto de variable aleatoria.
Objetivos procedimentales
Construir la distribución de probabilidad y la función de distribución acumulada de
una variable aleatoria y calcular la esperanza y varianza de una variable aleatoria.
Aplicar los modelos: binomial, hipergeométrica y de Poisson en la resolución de
problemas reales
Objetivos actitudinales
Valorar la importancia de la aplicación de los modelos probabilidad en situaciones
reales
Mostrar compromiso y cooperación en el trabajo grupal
Contenidos Conceptuales Contenidos Procedimentales Contenidos Actitudinales
Concepto y definición de
variable aleatoria
Variable aleatoria, eventos
definidos por variable
aleatorias
Distribuciones de probabilidad
de variables aleatorias discretas
Función de distribución y función
de distribución acumulada de una
variable aleatoria. Esperanza y
varianza de una variable aleatoria,
propiedades.
Modelos de probabilidad
Distribución binomial,
distribución hipergeométrica y
distribución de Poisson.
Valoración de la importancia
de las funciones en la vida
cotidiana.
Compromiso y cooperación en
el trabajo grupal
71. Estadística I – Contaduría Pública y Finanzas
65
M.Sc. Cliffor Jerry Herrera Castrillo
Concepto y definición de variable aleatoria
Ejemplo 1.
Lance una moneda al aire tres veces y anote el número de caras que se obtiene.
El espacio muestral es S = ccc, ccs, csc, css, scc, scs, ssc, sss
Suponga que la variable aleatoria está formada por el número de caras. Entonces los
resultados posibles son 0 caras, 1 cara, 2 caras o 3 caras. Estos son los valores de la variable
aleatoria.
Ejemplo 2.
Los pesos de envío de la leche en recipientes oscilan entre 10 a 25 kilogramos.
Los pesos reales de los recipientes llenos de leche, en kilogramos, son los valores de la
variable aleatoria “peso”.
Las variables aleatorias pueden ser discretas o continuas.
Una variable aleatoria discreta puede asumir sólo ciertos valores. Con frecuencia son
números enteros. Resultan principalmente del conteo.
El número de caras en el experimento de lanzamiento de la moneda es un ejemplo de una
variable aleatoria discreta. Los valores de la variable se restringen sólo a ciertos números: 0,
1, 2 y 3.
Ejemplo 3.
El empleado de un almacén regresa tres cascos de seguridad al azar a tres empleados de un
taller siderúrgico que ya los había probado. Si Smith, Jones y Brown, en ese orden reciben
uno de los tres cascos. Liste los puntos muestrales para los posibles órdenes de regreso de
los cascos y encuentre el valor de la variable aleatoria X que representa el número de
asociaciones correctas.
Solución: Si S, J y B representan los cascos de Smith, Jones y Brown, respectivamente,
entonces los posibles arreglos en los que se pueden regresar los cascos y el número de
asociaciones correctas son:
72. Estadística I – Contaduría Pública y Finanzas
66
M.Sc. Cliffor Jerry Herrera Castrillo
Espacio muestral m
SJB 3
SBJ 1
JSB 1
JBS 0
BSJ 0
BJS 1
Una variable aleatoria continua resulta principalmente de la medición y puede tomar
cualquier valor, al menos dentro de un rango dado.
Un ejemplo son los pesos del agua mineral. Los recipientes llenos de agua pueden tomar
cualquier valor entre 10 y 25 Kg.
Otros ejemplos:
Estatura de clientes en una tienda de ropa
Ingresos de los empleados de una camaronera
Tiempo transcurrido entre la llegada de cada cliente en una granja agropecuaria.
Definición:
Si un espacio muestral contiene un número finito den posibilidades o una serie
interminable con tantos elementos como números enteros existen, se llama espacio
muestral discreto.
Definición:
Si un espacio muestral contiene un número infinito de posibilidades igual al número
de puntos en un segmento de línea, se llama espacio muestral continuo.
Distribuciones discretas de probabilidad
Una variable aleatoria discreta toma cada uno de sus valores con cierta probabilidad. En el
caso de lanzar una moneda tres veces, la variable X que representa el número de caras, toma
73. Estadística I – Contaduría Pública y Finanzas
67
M.Sc. Cliffor Jerry Herrera Castrillo
el valor 2 con probabilidad de
8
3
, puestres de los ocho puntos muestrales igualmente posibles
tienen como resultado dos caras y un sol.
X 0 1 2 3 Σ
P(x)
8
1
8
3
8
3
8
1 1
En el caso de los cascos (ejemplo 3), la distribución de probabilidad es:
X 0 1 3 Σ
P(x)
3
1
2
1
6
1 1
Ejemplo 4.
Un embarque de ocho microcomputadoras similares para una tienda, contiene tres que están
defectuosos. Si una escuela hace una compra al azar, de dos de estas computadoras, encuentre
la distribución de probabilidad para el número de defectuosas.
La variable aleatoria puede tomar cualquiera de los números 0, 1, y 2.
f(0) = P(X = 0) =
2
8
2
5
0
3
=
28
10
f(1) = P(X = 1) =
2
8
1
5
1
3
=
28
15
f(1) = P(X = 2) =
2
8
0
5
2
3
=
28
3 X 0 1 2 Σ
P(x)
28
10
28
15
28
3 1
74. Estadística I – Contaduría Pública y Finanzas
68
M.Sc. Cliffor Jerry Herrera Castrillo
La distribución acumulada
La distribución acumulada F(x) de una variable aleatoria discreta X con distribución de
probabilidad f(x) es:
Ejemplo 5.
Si una agencia de autos vende 50% de su inventario de cierto vehículo equipado con bolsas
de aire, encuentre:
a) Una fórmula para la distribución de probabilidad del número de autos con bolsas de
aire entre los siguientes cuatro autos que venda la agencia.
b) La distribución acumulada de la variable aleatoria X.
Solución
a) El evento de vender x modelos con bolsas de aire y 4 – x modelos sin bolsas de aire,
puede ocurrir de
x
4
formas, donde x puede ser 0, 1, 2, 3, o 4. Entonces la
distribución de probabilidad es:
f(x) =
16
4
x
para0, 1, 2, 3, o 4
b) F(0) = f(0) = 1 / 16
F(1) = f(0) + f(1) = 5 / 16
F(2) = f(0) + f(1) + f(2) = 11 / 16
F(3) = f(0) + f(1) + f(2) + f(3) = 15 / 16
F(4) = f(0) + f(1) + f(2) + f(3) + f(4) = 1
x 0 1 2 3 4 Σ
P(x) 1/16 4/16 6/16 4/16 1/16 1
F(x) 1/16 5/16 11/16 15/16 1
F(x) = P(X< x) = xt
tf )( para < x <
75. Estadística I – Contaduría Pública y Finanzas
69
M.Sc. Cliffor Jerry Herrera Castrillo
Histograma de probabilidad
Distribución acumulada discreta
16/16
12/16
8/16
4/16
0 1 2 3 4
Valor esperado
El valor esperado (o media) se encuentra multiplicando cada resultado posible de la variable
por su probabilidad y luego se suman esos productos.
Varianza
La varianza de una distribución de probabilidad es la suma del cuadrado de las desviaciones
de cada valor de la variable aleatoria con respecto a la media, multiplicada por sus
probabilidades respectivas.
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0 1 2 3 4
0.06
0.25
0.38
0.25
0.06
)()()( ii xPxXE
)()( 22
ii xPx
76. Estadística I – Contaduría Pública y Finanzas
70
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplo 6.
La distribución de probabilidad de lanzar un dado se muestra en las primeras dos columnas
de la siguiente tabla.
Calcular el valor esperado (o media), varianza y desviación estándar.
(1)
Solución
(xi)
(2)
P(xi)
(3)
(xi).P (xi)
(4)
1 1/6 1/6 (1-3.5)
2
. 1/6= 1.04166
2 1/6 2/6 (2-3.5)
2
. 1/6 = 0.37500
3 1/6 3/6 (3-3.5)
2
. 1/6 = 0.04166
4 1/6 4/6 (4-3.5)
2
. 1/6 = 0.04166
5 1/6 5/6 (5-3.5)
2
. 1/6 = 0.37500
6 1/6 6/6 (6-3.5)
2
. 1/6 =1.04166
1
6
21
= 3.5 Σ = 2.91664
a) Media = 3.5
b) Varianza
c) Desviación estándar
)()( 2
ii xPx
91664.22
7078.1
6
21
)( XE
77. Estadística I – Contaduría Pública y Finanzas
71
M.Sc. Cliffor Jerry Herrera Castrillo
Distribución geométrica
Si pruebas independientes repetidas pueden tomar como resultado un éxito con probabilidad
p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la
variable aleatoria X, el número de la prueba en el que ocurre el primer éxito, es:
x = 1, 2, 3, . . . .
Ejemplo 7.
Se sabe que en cierto proceso de fabricación, en promedio, uno de cada 100 artículos está
defectuoso. ¿Cuál es la probabilidad de que el quinto artículo que se inspecciona, sea el
primer defectuoso que se encuentra?.
Solución p = 0.01, q = 0.99, x = 5g(5, 0.01) = (0.0.1) (0,99) 5 – 1
= 0,0096
Ejemplo 8.
En “tiempo ocupado” un conmutador telefónico está muy cerca de su capacidad, por lo que
los usuarios tienen dificultad al hacer sus llamadas. Puede ser de interés conocer el número
de intentos necesarios a fin de conseguir un enlace telefónico. Suponga que p = 0,05 es la
probabilidad de conseguir un enlace durante el tiempo ocupado. Nos interesa conocer la
probabilidad de que se necesiten 5 intentos para una llamada exitosa.
Solución
g(5, 0.05) = (0.05) (0.95) 5 – 1
= 0,0407
Media, varianza y desviación estándar de una variable aleatoria que sigue una
distribución geométrica.
Media Varianza Desviación estándar
G(x,p) = p . qx – 1
2
1
p
2
2 1
p
p
2
78. Estadística I – Contaduría Pública y Finanzas
72
M.Sc. Cliffor Jerry Herrera Castrillo
Ejemplo 9.
Calcular la media, la varianza y la desviación estándar con los datos del problema (8).
Solución:
P = 0.05
= 400
a) Media
b) Varianza = 380
c) Desviación estándar = 19.49
Distribución híper – geométrica
La distribución de probabilidad de la variable aleatoria híper geométrica x, el número de
éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos de los que K se
denominan éxitos y N – K fracaso, es:
X = 0, 1, 2, . . . .n
Ejemplo 10.
Lotes de 40 componentes cada uno se denominan aceptables si no contienen más de 3
defectuosos. El procedimiento para muestrear el lote es la selección de 5 componentes al azar
y rechazar el lote si se encuentra un componente defectuoso.
a) ¿Cuál es la probabilidad de que se encuentre exactamente 1 defectuoso en la muestra
si hay 3 defectuosos en todo el lote?
b) ¿Cuál es la probabilidad de que no haya más de un defectuoso?
h(x) =
n
N
xn
kN
x
k
2
2 1
p
p
2
1
p
2
2
05.0
05.01
2
05.0
1
2
2
380
79. Estadística I – Contaduría Pública y Finanzas
73
M.Sc. Cliffor Jerry Herrera Castrillo
c) ¿Cuál es la probabilidad de que por lo menos hayan dos defectuosos?
Solución.
N = 40, n = 5, K = 3,
a) P(1) =
5
40
4
37
1
3
= 0,30111
b) P(x < 1) = P(0) + P(1) =
5
40
5
37
0
3
+
5
40
4
37
1
3
= 0,66245 + 0,30111 = 0,96356
c) P(x > 2) = P(2) + P(3) =
5
40
3
37
2
3
+
5
40
2
37
3
3
= 0,03543 + 0,00101 = 0,03644
Media, varianza y desviación estándar de una variable aleatoria que sigue una
distribución híper geométrica.
Media Varianza Desviación estándar
Teorema de Chebyshev
Las probabilidades de que cualquier variable aleatoria X tome un valor dentro de k
desviaciones estándar de la media es al menos 1 – 1 / k2, es decir:
P ( ) 2
1
1
k
Ejemplo 11.
Con respecto a los datos del ejemplo (10), calcular:
a) La media, la varianza y la desviación estándar.
b) Aplicare interpretar el teorema de Chebyshev.
N
kn.
N
k
N
k
n
N
nN
1
1
2
2
kXk
80. Estadística I – Contaduría Pública y Finanzas
74
M.Sc. Cliffor Jerry Herrera Castrillo
Solución
N = 40, n = 5, K = 3
a)
= 0,375
= 0,311298
0.5579
= 0.5579
b) 0.375 – 1.1158, 0.375 + 1.1158
-0.7408, 1.4908
Interpretación:
El teorema de Chebyshev establece que el número de componentes defectuosos que se
obtienen cuando se seleccionan al azar n de un lote de N componentes de los que k son
defectuosos tiene una probabilidad de al menos 1 – 1/k2
de caer en el intervalo
Es decir, para k = 2, hay ¾ de probabilidad de caer entre O sea
“Al menos ¾ de las veces los cinco componentes incluirán 1.49, es decir, menos de dos
componentes defectuosos”. La parte izquierda del intervalo no interesa, por resultar
negativo.
Distribución híper – geométrica multii - variada
Si N artículos se pueden dividir en las k celdas A1, A2,. . . . Ak con a1, a2,. . . .ak elementos,,
respectivamente, entonces la distribución de probabilidad de las variables aleatorias X1,
X2, . . . . Xk, que representan el número de elementos que se seleccionan de A1, A2 . . . . Ak
en una muestra aleatoria de tamaño n es:
N
kn.
40
35
N
k
N
k
n
N
nN
1
1
2
40
3
1
40
3
5
140
5402
2
311298.0
2 5579.02375.0
2
k
2
81. Estadística I – Contaduría Pública y Finanzas
75
M.Sc. Cliffor Jerry Herrera Castrillo
f(X1, X2, . . . . Xk, a1, a2,. . . . ak, N, n) =
n
N
x
a
x
a
x
a
k
k
......
2
2
1
1
Ejemplo 12.
Un grupo de 10 individuos se usa para un estudio biológico. El grupo contiene tres personas
con sangre tipo O, cuatro con sangre tipo A y tres con sangre tipo B. ¿Cuál es la probabilidad
de que una muestra de cinco, contenga una persona con sangre tipo O, dos personas con
tipo A y dos personas con tipo B.
Solución.
f(1, 2, 2; 3, 4, 3; 10; 5) = 21428.0
14
3
5
10
2
3
.
2
4
1
3
82. Estadística I – Contaduría Pública y Finanzas
76
M.Sc. Cliffor Jerry Herrera Castrillo