SlideShare una empresa de Scribd logo
1 de 63
Descargar para leer sin conexión
UNIVERSIDAD CATÓLICA DE TRUJILLO
BENEDICTO XVI
Programa de Complementación Académica
Asignatura:
ESTADÍSTICA Y PROBABILIDAD APLICADA A LA EDUCACIÓN
Ing. JOHAN HERBERT NARRO VARGAS
Trujillo, Perú
2013
UNIVERSIDAD CATÓLICA DE TRUJILLO BENEDICTO XVI
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
ii
E-mail: jhnv1977@hotmail.com
AUTORIDADES UNIVERSITARIAS
Gran Canciller y Fundador de la UCT: Mons. Dr. Héctor Miguel Cabrejos Vidarte, OFM.
Vice Gran Canciller: Rvdo Padre Francisco Castro Lalupú.
Rector: Dr. Alcibíades Helí Miranda Chávez.
Vicerrector Académico: Mg. José Andrés Cruzado Albarrán.
Gerente General: Rvdo Padre César Lázaro Lescano.
Delegado de la Asociación Civil ante la UCT: Mons. Ricardo Exequiel Angulo Bazauri
Gerente de Administración y Finanzas: Ing. Marco Antonio Dávila Cabrejos.
Secretario General: Lic. Jorge Isaac Manrique Catalán
FACULTAD DE HUMANIDADES
Decano: Dr. José Theódulo Esquivel Grados.
PROGRAMA DE COMPLEMENTACIÓN ACADÉMICA
Director General: Mg. José Andrés Cruzado Albarrán.
.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
iii
E-mail: jhnv1977@hotmail.com
Contenidos
Presentación ............................................................................................................................................ 1
Capítulo I: Conceptos y Generalidades................................................................................................... 2
1.1. Aspectos generales de Estadística ........................................................................................... 2
1.1.1. Definición de Estadística................................................................................................. 2
1.1.2. Áreas del Análisis Estadístico ......................................................................................... 2
1.1.3. Población......................................................................................................................... 4
1.1.4. Muestra............................................................................................................................ 4
1.1.5. Variable ........................................................................................................................... 5
1.2. Obtención de información....................................................................................................... 5
1.2.1. Muestreo.......................................................................................................................... 6
1.2.2. Muestreo No Probabilístico............................................................................................. 6
1.2.3. Muestreo Probabilístico................................................................................................... 7
1.3. Tablas de frecuencia................................................................................................................ 9
1.4. Gráficos estadísticos.............................................................................................................. 11
1.4.1. Barras............................................................................................................................. 12
1.4.2. Histogramas y Polígonos de frecuencias....................................................................... 12
1.4.3. Circulares....................................................................................................................... 13
1.4.4. Barras subliminales ....................................................................................................... 13
1.4.5. Pictogramas ................................................................................................................... 13
Ejercicios del Capítulo I................................................................................................................ 14
Capítulo II: Medidas Resúmenes .......................................................................................................... 16
2.1. Medidas de Posición.............................................................................................................. 16
2.1.1. Media aritmética............................................................................................................ 16
2.1.2. Mediana......................................................................................................................... 17
2.1.3. Moda.............................................................................................................................. 19
2.1.4. Percentiles ..................................................................................................................... 20
2.2. Medidas de Dispersión.......................................................................................................... 20
2.2.1. Desviación Media.......................................................................................................... 20
2.2.2. Varianza y Desviación típica......................................................................................... 22
2.2.3. Coeficiente de variación y asimetría de Pearson........................................................... 24
Ejercicios del Capítulo II............................................................................................................... 25
Capítulo III: Probabilidad...................................................................................................................... 26
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
iv
E-mail: jhnv1977@hotmail.com
3.1. Conjuntos y Probabilidad ...................................................................................................... 26
3.1.1. Generalidades de Conjuntos.......................................................................................... 26
3.1.2. Operaciones con Conjuntos........................................................................................... 27
3.1.3. Experimentos aleatorios ................................................................................................ 29
3.1.4. Espacio muestral............................................................................................................ 29
3.1.5. Probabilidad, axiomas y teoremas................................................................................. 30
3.1.6. Probabilidad Condicional.............................................................................................. 31
3.1.7. Sucesos Independientes................................................................................................. 32
3.1.8. Teorema de Bayes ......................................................................................................... 32
3.1.9. Análisis Combinatorio................................................................................................... 32
3.2. Variables Aleatorias y distribuciones de probabilidad.......................................................... 34
3.2.1. Variable aleatoria .......................................................................................................... 34
3.2.2. Distribución de Probabilidad discreta ........................................................................... 35
3.2.3. Función de Distribución discreta................................................................................... 35
3.2.4. Distribución de Probabilidad continua .......................................................................... 36
3.2.5. Función de Distribución continua ................................................................................. 37
3.3. Varianza y desviación típica de variables aleatorias ............................................................. 37
3.3.1. Varianza y desviación típica de una VA discreta.......................................................... 37
3.3.2. Varianza y desviación típica de una VA continua......................................................... 37
3.4. Distribuciones de Probabilidad con nombre Propio.............................................................. 38
3.4.1. Distribución Binomial o de Bernoulli ........................................................................... 38
3.4.2. Distribución Normal...................................................................................................... 38
3.4.3. Distribución de Poisson................................................................................................. 39
3.4.4. Distribución Hipergeométrica ....................................................................................... 39
3.4.5. Distribución Chi-Cuadrado ........................................................................................... 39
3.4.6. Distribución t de Student............................................................................................... 39
Ejercicios del Capítulo III ............................................................................................................. 40
Capítulo IV: Estadísticos para la prueba de Hipótesis .......................................................................... 42
4.1. Ensayos de Hipótesis y significación .................................................................................... 42
4.1.1. Decisiones Estadísticas.................................................................................................. 42
4.1.2. Hipótesis estadísticas. Hipótesis nula............................................................................ 42
4.1.3. Errores de Tipo I y Tipo II ............................................................................................ 43
4.1.4. Nivel de significación.................................................................................................... 43
4.1.5. Ensayos referentes a Distribuciones Normales ............................................................. 43
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
v
E-mail: jhnv1977@hotmail.com
4.1.6. Ensayos de una y dos colas ........................................................................................... 45
4.1.7. Ensayos relacionados con diferencias de medias y proporciones ................................. 46
4.1.8. Ensayos relacionados con la Distribución t de Student................................................. 48
4.1.9. Ensayos relacionados con la Distribución chi-Cuadrado .............................................. 48
4.2. Curva de ajuste, regresión y correlación ............................................................................... 49
4.2.1. Curva de Ajuste............................................................................................................. 49
4.2.2. Método de mínimos cuadrados...................................................................................... 50
4.2.3. Recta de Mínimos cuadrados en términos de varianzas y covarianzas muestrales ....... 51
4.2.4. Error típico de la estima ................................................................................................ 51
Ejercicios del Capítulo IV ............................................................................................................. 53
Apéndice A............................................................................................................................................ 54
Apéndice B............................................................................................................................................ 55
Apéndice C............................................................................................................................................ 56
Apéndice D............................................................................................................................................ 57
Referencias............................................................................................................................................ 58
Presentación
Permanentemente recibimos información referente al área en que trabajamos y es necesario
hacer uso de ella, puesto que será útil para el proyecto en que deseemos embarcarnos.
La información es importante para la toma de decisiones en muchos problemas. Para esto
necesitamos un procesamiento adecuado de los datos que nos permita obtener conclusiones
certeras. En caso contrario, si no se aplica un buen procesamiento, es posible que en base a los
resultados tomemos una mala decisión.
La estadística es un campo del conocimiento que permite al investigador deducir y evaluar
conclusiones acerca de una población a partir de información proporcionada por una muestra.
Específicamente, la estadística trata de teoremas, herramientas, métodos y técnicas que se
pueden usar en: Recolección, selección y clasificación de datos; Interpretación y análisis de
datos; Deducción y evolución de conclusiones y de su confiabilidad, basada en datos
muéstrales.
Los métodos de la estadística fueron desarrollados para el análisis de datos muestreados, así
como para propósitos de inferencia sobre la población de la que se seleccionó la muestra. La
estadística como ciencia, cubre un extenso campo donde poder aplicarla. Se divide en:
estadística descriptiva y estadística inferencial, que desempeñan funciones distintivas, pero
complementarias en el análisis.
Es importante que todo profesional que utilice la estadística como herramienta auxiliar de
trabajo, posea un mínimo de conocimientos y habilidades prácticas en aquellas técnicas que le
facilitarán el buen desarrollo de esta actividad.
El presente módulo tiene como objetivo general dar a conocer de forma concisa los teoremas,
herramientas, métodos y técnicas necesarios para el correcto análisis de los datos y que nos
permita obtener correctos resultados. Para ello se han estructurado los contenidos en cuatro
capítulos.
El primer capítulo trata sobre definición, historia y tipos de Estadística, así como los
conceptos de los términos a ser utilizados, terminando el capítulo con tablas de frecuencia y
gráficos estadísticos.
El segundo capítulo tratará sobre estadígrafos de posición y dispersión, mientras que el tercer
capítulo estará dedicado a las probabilidades.
En el cuarto capítulo concluiremos con el estudio de ensayos de hipótesis y significación.
El Autor.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
2
E-mail: jhnv1977@hotmail.com
Capítulo I: Conceptos y Generalidades
La educación es un factor crucial de desarrollo social y económico, así como un factor
esencial para la cohesión social, el diseño de políticas educativas exige que los actores
involucrados en las mismas tengan acceso a información pertinente, confiable y valida. Es
aquí donde la estadística educativa empieza a ser de gran importancia para la educación
porque mediante la interpretación de los datos se elaboran los objetivos del sector educativo,
se diseñan los proyectos y/o programas y, asignan las responsabilidades de cada componente
del sistema educativo del país.
Mediante un análisis cuantitativo podemos conocer el sistema escolarizado, las escuelas,
alumnos, personal docente y administrativo e indicadores, describir los movimientos y el
aprovechamiento de los alumnos por nivel educativo, sostenimiento y modalidad con
representaciones gráficas, tanto a nivel país como por regiones; también se registrar los
principales indicadores de retención, deserción, aprobación, reprobación y eficiencia terminal,
lo que permite conocer la situación de cada una de las regiones en materia educativa, así como
también, identificar cuáles presentan indicadores deficientes y qué regiones alcanzaron
mejores resultados.
1.1. Aspectos generales de Estadística
Resulta importante conocer los fundamentos básicos de la estadística, ya que
constituye una excelente herramienta de trabajo que nos permitirá conocer de manera
certera datos sobre los cuales tomar decisiones y así seguir progresando.
1.1.1. Definición de Estadística
La estadística es una rama de la matemática que
se refiere a la recolección, análisis e
interpretación de los datos obtenidos en un
estudio. Es aplicable a una amplia variedad de
disciplinas, desde la física hasta las ciencias
sociales, ciencias de la salud como la Psicología y
la Medicina, y usada en la toma de decisiones en áreas de negocios e
instituciones gubernamentales.
1.1.2. Áreas del Análisis Estadístico
Describiremos brevemente cada una de las áreas en que puede dividirse el
análisis estadístico:
a. Diseño: Planeamiento y desarrollo de investigaciones.
b. Descripción: Resumen y exploración de datos.
c. Inferencia: Hacer predicciones o generalizaciones acerca de
características de una población en base a la información de una muestra
de la población.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
3
E-mail: jhnv1977@hotmail.com
a. Diseño
Es una actividad crucial. Consiste en definir como se desarrollará la
investigación para dar respuesta a las preguntas que motivaron la misma.
La recolección de los datos requiere en general de un gran esfuerzo, por lo
que, dedicar especial cuidado a la etapa de planificación de la
investigación ahorra trabajo en las siguientes etapas. Un estudio bien
diseñado resulta simple de analizar y las conclusiones suelen ser obvias.
Un experimento pobremente diseñado o con datos inapropiadamente
recolectados o registrados puede ser incapaz de dar respuesta a las
preguntas que motivaron la investigación, más allá de lo sofisticado que
sea el análisis estadístico.
Aún en los casos en que se estudian datos ya registrados, en que estamos
restringidos a la información existente, los principios del buen diseño de
experimentos, pueden ser útiles para ayudar a seleccionar un conjunto
razonable de datos que esté relacionado con el problema de interés.
b. Descripción
Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos
ayudan a presentar los datos de modo tal que sobresalga su estructura. Hay
varias formas simples e interesantes de organizar los datos en gráficos que
permiten detectar tanto las características sobresalientes como las
características inesperadas. El otro modo de describir los datos es
resumirlos en uno o dos números que pretenden caracterizar el conjunto
con la menor distorsión o pérdida de información posible.
Explorar los datos, debe ser la primera etapa de todo análisis de datos.
¿Por qué no analizarlos directamente? En primer lugar porque las
computadoras no son demasiado hábiles (sólo son rápidas), hacen aquello
para lo que están programadas y actúan sobre los datos que les ofrecemos.
Datos erróneos o inesperados serán procesados de modo inapropiado y ni
usted, ni la computadora se darán cuenta a menos que realice previamente
un análisis exploratorio de los datos.
c. Inferencia
Inferencia Estadística hace referencia a un conjunto de métodos que
permiten hacer predicciones acerca de características de un fenómeno
sobre la base de información parcial acerca del mismo. Los métodos de la
inferencia nos permiten proponer el valor de una cantidad desconocida
(estimación) o decidir entre dos teorías contrapuestas cuál de ellas explica
mejor los datos observados (test de hipótesis). El fin último de cualquier
estudio es aprender sobre las poblaciones. Pero es usualmente necesario, y
más práctico, estudiar solo una muestra de cada una de las poblaciones.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
4
E-mail: jhnv1977@hotmail.com
1.1.3. Población
Es el conjunto de todos los elementos (individuos) que presentan una
característica común determinada, observable y medible. Por ejemplo, si el
elemento es una persona, se puede estudiar las características edad, peso,
nacionalidad, sexo, etc.
Los elementos que integran una población pueden corresponder a personas,
objetos o grupos (por ejemplo, familias, fábricas, empresas, etc.).
Las características de la población se resumen en valores llamados parámetros.
1.1.4. Muestra
Muestra es un subconjunto, extraído de la población (mediante técnicas de
muestreo), cuyo estudio sirve para inferir características de toda la población.
Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la
muestra para datos globales es la siguiente:
Donde:
 n: es el tamaño de la muestra.
 z: es es una constante que depende del nivel de confianza que asignemos.
El nivel de confianza indica la probabilidad de que los resultados de
nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo
que decir que nos podemos equivocar con una probabilidad del 4,5%. Los
valores de z más utilizados y sus niveles de confianza son:
Valor de k 1,15 1,28 1,44 1,65 1,96 2,24 2,58
Nivel de confianza 75% 80% 85% 90% 95% 97,5% 99%
 e: es el error muestral deseado. El error muestral es la diferencia que puede
haber entre el resultado que obtenemos preguntando a una muestra de la
población y el que obtendríamos si preguntáramos al total de ella.
Ejemplo: si los resultados de una encuesta dicen que 100 personas
comprarían un producto y tenemos un error muestral del 5%, entonces
comprarán el producto entre 95 y 105 personas.
 p: es la proporción de individuos que poseen en la población la
característica de estudio. Este dato es generalmente desconocido y se suele
suponer que p=q=0.5 que es la opción más segura.
Si el tamaño de la población es pequeño, entonces el tamaño de la muestra se
tendrá que reajustar de acuerdo a la siguiente fórmula:
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
5
E-mail: jhnv1977@hotmail.com
Donde:
 n´: Tamaño de la muestra necesario, reajustado.
 n: Tamaño de la muestra según la primera fórmula.
 N: Tamaño de la población.
1.1.5. Variable
Se llama variable a una característica que se observa en una población o
muestra, y a la cual se desea estudiar. La variable puede tomar diferentes
valores dependiendo de cada individuo. Una variable se puede clasificar de la
siguiente manera:
a. Variable cuantitativa: es aquella que toma valores numéricos. Dentro de
ella, se subdividen en:
 Continua: son valores reales. Pueden tomar cualquier valor dentro de
un intervalo. Ej. Peso, estatura, sueldos.
 Discreta: toma valores enteros. Ej. N° de hijos de una familia, n° de
alumnos de un curso.
b. Variable cualitativa: es aquella que describe cualidades. No son numéricas
y se subdividen en:
 Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por
una marca, sexo, lugar de residencia.
 Ordinal: son cualidades que representan un orden y jerarquía. Ej.
Nivel educacional, días de la semana, calidad de la atención, nivel
socioeconómico.
1.2. Obtención de información
Los datos son generalmente imperfectos en el sentido que aun cuando posean
información útil no nos cuentan la historia completa. Es necesario contar con métodos
que nos permitan extraer información a partir de los datos observados para
comprender mejor las situaciones que los mismos representan.
Algunas técnicas de análisis de datos son sorprendentemente simples de aprender y
usar más allá del hecho que la teoría matemática que las sustentan puede ser muy
complejo. Todos, aún los estadísticos, tenemos problemas al enfrentarnos con listados
de datos. Existen muchos métodos estadísticos cuyo propósito es ayudarnos a poner de
manifiesto las características sobresalientes e interesantes de nuestros datos que
pueden ser usados en casi todas las áreas del conocimiento.
Los métodos estadísticos pueden y deberían ser usados en todas las etapas de una
investigación, desde el comienzo hasta el final. Existe el convencimiento de que la
estadística trata con el ANÁLISIS DE DATOS (quizás porque esta es la contribución
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
6
E-mail: jhnv1977@hotmail.com
más visible de la estadística), pero este punto de vista excluye aspectos vitales
relacionados con el DISEÑO DE LAS INVESTIGACIONES. Es importante tomar
conciencia que la elección del método de análisis para un problema, se basa tanto en el
tipo de datos disponibles como en la forma en que fueron recolectados.
1.2.1. Muestreo
En ocasiones en que no es posible o conveniente realizar un censo (analizar a
todos los elementos de una población), se selecciona una muestra, entendiendo
por tal una parte representativa de la población. El muestreo es por lo tanto una
herramienta de la investigación científica, cuya función básica es determinar
que parte de una población debe examinarse, con la finalidad de hacer
inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que
se reproduzca de la mejor manera los rasgos esenciales de dicha población que
son importantes para la investigación. Para que una muestra sea representativa,
y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en
la población, es decir ejemplificar las características de ésta.
Los errores más comunes que se pueden cometer son:
 Hacer conclusiones muy generales a partir de la observación de sólo una
parte de la Población, se denomina error de muestreo.
 Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomó la muestra. Error de Inferencia.
Recordar: En estadística se usa la palabra población para referirse no sólo a
personas sino a todos los elementos que han sido escogidos para su estudio y el
término muestra se usa para describir una porción escogida de la población.
1.2.2. Muestreo No Probabilístico
A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones
inferenciales sobre la población), pues no se tiene certeza de que la muestra
extraída sea representativa, ya que no todos los sujetos de la población tienen la
misma probabilidad de ser elegidos. En general se seleccionan a los sujetos
siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa.
En algunas circunstancias los métodos estadísticos permiten resolver los
problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
7
E-mail: jhnv1977@hotmail.com
Entre los métodos de muestreo no probabilísticos más utilizados en
investigación encontramos:
a. Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la población y/o
de los individuos más "representativos" o "adecuados" para los fines de la
investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un
número de individuos que reúnen unas determinadas condiciones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en
Gijón. Una vez determinada la cuota se eligen los primeros que se
encuentren que cumplan esas características. Este método se utiliza mucho
en las encuestas de opinión.
b. Muestreo intencional o de conveniencia:
Éste tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras "representativas" mediante la inclusión en la muestra de grupos
supuestamente típicos. Es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores votaciones han marcado
tendencias de voto.
También puede ser que el investigador seleccione directa e
intencionadamente los individuos de la población. El caso más frecuente
de este procedimiento el utilizar como muestra los individuos a los que se
tiene fácil acceso (los profesores de universidad o colegios emplean con
mucha frecuencia a sus propios alumnos).
c. Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a
otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea
muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
d. Muestreo Discrecional:
A criterio del investigador los elementos son elegidos sobre los que él cree
que pueden aportar al estudio.
1.2.3. Muestreo Probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
8
E-mail: jhnv1977@hotmail.com
una muestra y, consiguientemente, todas las posibles muestras de tamaño n
tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra
extraída y son, por tanto, los más recomendables. Dentro de los métodos de
muestreo probabilísticos encontramos los siguientes tipos:
a. Muestreo aleatorio simple:
El procedimiento empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de algún medio mecánico (bolas
dentro de una bolsa, tablas de números aleatorios, números aleatorios
generados con una calculadora u ordenador, etc.) se eligen tantos sujetos
como sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande.
b. Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos los elementos
de la población, pero en lugar de extraer n números aleatorios sólo se
extrae uno. Se parte de ese número aleatorio i, que es un número elegido al
azar, y los elementos que integran la muestra son los que ocupa los lugares
i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamaño de la población entre el tamaño
de la muestra: k= N/n. El número i que empleamos como punto de partida
será un número al azar entre 1 y k.
El riesgo este tipo de muestreo está en los casos en que se dan
periodicidades en la población ya que al elegir a los miembros de la
muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 últimos mujeres, si empleamos un muestreo
aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o
sólo mujeres, no podría haber una representación de los dos sexos.
c. Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que
simplifican los procesos y suelen reducir el error muestral para un tamaño
dado de la muestra. Consiste en considerar categorías típicas diferentes
entre sí (estratos) que poseen gran homogeneidad respecto a alguna
característica (se puede estratificar, por ejemplo, según la profesión, el
municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende
con este tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
9
E-mail: jhnv1977@hotmail.com
Cada estrato funciona independientemente, pudiendo aplicarse dentro de
ellos el muestreo aleatorio simple o el estratificado para elegir los
elementos concretos que formarán parte de la muestra. En ocasiones las
dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la población. (Tamaño geográfico, sexos,
edades,...).
La distribución de la muestra en función de los diferentes estratos se
denomina afijación, y puede ser de diferentes tipos:
 Afijación Simple: A cada estrato le corresponde igual número de
elementos muéstrales.
 Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
 Afijación Óptima: Se tiene en cuenta la previsible dispersión de los
resultados, de modo que se considera la proporción y la desviación
típica. Tiene poca aplicación ya que no se suele conocer la desviación.
d. Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que las unidades
muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., son conglomerados
naturales. En otras ocasiones se pueden utilizar conglomerados no
naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son áreas geográficas suele hablarse de "muestreo por
áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un
cierto número de conglomerados (el necesario para alcanzar el tamaño
muestral establecido) y en investigar después todos los elementos
pertenecientes a los conglomerados elegidos.
1.3. Tablas de frecuencia
La estadística descriptiva o análisis exploratorio de datos ofrece modos de presentar y
evaluar las características principales de los datos a través de tablas, gráficos y
medidas resúmenes.
El modo más simple de presentar datos categóricos es por medio de una tabla de
frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una
de las clases de la variable cualitativa.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
10
E-mail: jhnv1977@hotmail.com
Cuando los datos estadísticos de que se dispone son numerosos, es difícil realizar
cálculos sobre ellos. Por esta razón se organizan en tablas de manera de facilitar el
trabajo.
Una tabla de frecuencia es la ordenación de la información obtenida de una muestra,
en el estudio de una sola variable.
Cuando se dispone de un gran número de datos, es útil distribuirlos en categorías
dentro de una tabla para facilitar el análisis. Se explicara con un ejemplo:
Ejemplo 01: en una encuesta de presupuesto familiar, se ha obtenido la siguiente
información respecto al número de hijos en 21 familias:
3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3
Variable X: Número de hijos
Observamos que la variable X toma valores entre 0 y 4, es decir existen en éste grupo
5 categorías o clases.
Contamos el número de familias en cada categoría y construimos la tabla
Clase
Xi
Frecuencia
fi
Frec. Acumulada
Fi=fi-1+fi
Frec. Relativa
hi=fi/n
Frec. Rel. Acum.
Hi=hi-1+hi
0 2 0+2=2 2/21=0.095 0+0.095=0.095
1 4 2+4=6 4/21=0.190 0.095+0.190=0.286
2 7 6+7=13 7/21=0.333 0.286+0.333=0.619
3 6 13+6=19 6/21=0.286 0.619+0.286=0.905
4 2 19+2=21 2/21=0.095 0.905+0.095=1
Total n = 21 1
Tabla 01: Distribución de frecuencias de la variable X, número de hijos por familia.
Observamos algunos detalles importantes:
o n es la suma de la columna fi, es decir, siempre debe dar como resultado el tamaño
de la muestra.
o En la columna de frecuencia absoluta acumulada se va sumando los valores de la
columna fi, por lo tanto el último valor debe ser igual a n.
o La columna frecuencia relativa (hi) representa en % de familias en cada categoría.
Por ejemplo, en la categorías con 3 hijos a un 28.6% de familias. Esta columna
debe sumar 1.
o La Hi acumula los valores de la frecuencia relativa, por lo tanto el último valor
debe ser 1. Ejemplo H4: el 90.5% de las familias encuestadas tienen a los más 3
hijos.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
11
E-mail: jhnv1977@hotmail.com
En el caso de analizar una variable continua, la tabla de frecuencia cambia sólo en el
comienzo. También se verá en un ejemplo:
Ejemplo 02: Salarios semanales de 40 personas en nuevos soles:
90 62 102 85 92 106 110 95 105 112
108 86 110 68 118 99 98 74 91 80
80 100 79 93 93 104 77 106 98 73
95 85 91 83 67 119 108 115 74 88
Se efectúan los siguientes pasos:
a. Se buscan los valores mínimo (Xmin=……) y máximo (Xmax=……)
b. Se calcula el rango (R). R = Xmax - Xmin = …… - ……. = ……
c. La cantidad de intervalos no debe ser menor de 5 ni mayor de 18. Por lo general
tiene el mismo ancho. Una forma de calcular el nº de intervalos para generar la
tabla de frecuencias es mediante la siguiente formula: k = 1 + 3.322log(n).
Para nuestro ejemplo entonces el número de intervalos “k” será:
k = 1 + 3.322log(……)
k = …….
d. Se calcula la amplitud de cada intervalo c = R / k. Para nuestro caso será:
c = …
e. Se construye la tabla:
Intervalos
[Xinf – Xsup>
Marca de Clase
fi Fi hi Hi
61 - .
. - 121
Total
Tabla 02: Distribución de frecuencias de la variable X, salarios semanales
1.4. Gráficos estadísticos
En este apartado presentaremos formas simples de resumir
y representar gráficamente conjuntos de datos.
El objetivo de construir gráficos es poder apreciar los datos
como un todo e identificar sus características sobresalientes.
El tipo de gráfico a seleccionar depende del tipo de variable que nos interese
representar por esa razón distinguiremos en la presentación gráficos para variables
categóricas y para variables numéricas.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
12
E-mail: jhnv1977@hotmail.com
1.4.1. Barras
Se construye sobre el sistema de ejes cartesianos. Es un procedimiento gráfico
para representar los datos nominales u ordinales. Para cada categoría se traza
una barra vertical en que la altura es la frecuencia absoluta de la categoría. El
ancho de la barra es arbitrario.
Imagen 02: Gráfico de barras
También se utiliza si la variable en estudio es numérica discreta.
1.4.2. Histogramas y Polígonos de frecuencias
Se construyen sobre el sistema de coordenadas cartesianas. Se utiliza cuando la
variable en estudio es continua o esta agrupada en una tabla de frecuencia con
intervalos en cada categoría.
En el eje X se identifica la variable en estudio y en el eje Y sé gráfica la
frecuencia absoluta o la frecuencia relativa. Consiste en una serie de
rectángulos en donde su altura depende del valor de cada frecuencia.
Cada categoría de la variable se representa por una barra. El ancho de cada
barra depende de la amplitud del intervalo.
Tomando como referencia los datos del ejemplo 02, se tiene el siguiente
gráfico:
Imagen 02: Polígono de frecuencias
0
20
40
60
80
100
120
140
1 2 3 4 5 6
0
2
4
6
8
10
12
56 66 76 86 96 106 116 126
frecuencia
Salario semanal en S/.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
13
E-mail: jhnv1977@hotmail.com
El polígono se gráfica uniendo la punta superior de cada barra por segmento de
recta. Para que el polígono quede cerrado se considera un punto en la recta
horizontal, antes y después de las anotadas.
1.4.3. Circulares
Esta es otra forma de representar los datos, en especial cuando se trata de
cualidades. En un gráfico dibujado dentro de un círculo.
Es necesario en primer lugar calcular el porcentaje de cada categoría respecto
del total y luego repartir proporcionalmente estos porcentajes en los 360° del
círculo.
Imagen 03: Gráfico de torta
1.4.4. Barras subliminales
Es un gráfico de barras muy apropiado para comprobar subdivisiones en la
variable. Por ejemplo: % de estudiantes en diferentes carreras, separadas por
sexo. Cada barra es un 100%.
100%
80%
60% Hombres
40% Mujeres
20%
0%
A B C D
Imagen 04: Barras subliminales
1.4.5. Pictogramas
Un pictograma es la representación de datos estadísticos por medio de
símbolos que por su forma sugieren la naturaleza del dato. Así: podemos
representar el número de conferencias realizadas por las Universidades A (100
conferencias) y B (40 conferencias).
Imagen 05: Pictograma
7%
12%
18%
28%
20%
15%
66
76
86
96
106
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
14
E-mail: jhnv1977@hotmail.com
Ejercicios del Capítulo I
i. Clasificar las siguientes variables:
- Número de alumnos por carrera.
- Comuna en que viven los alumnos del curso de estadística
- Color de ojos de un grupo de niños
- Notas de unidad
- Monto de pagos por concepto de aranceles en la universidad
- Sumas posibles de los números obtenidos al lanzar dos dados
- Estatura de los alumnos
- Peso del contenido de un paquete de cereal
- Monto de la venta de un artículo en $
- Número de acciones vendidas
- Nivel de atención en el Banco
- Nivel de actitud académica
- AFP a que pertenece un individuo
- Edad de los alumnos
ii. Se desea conocer el tamaño de la muestra de la Población de estudiantes de nivel
secundario de la urbanización Primavera de la ciudad de Trujillo con un nivel de
confianza de 97.5 % y un error de 5%.
n =
iii. Con los datos del ejercicio anterior reajustar la muestra sabiendo que el tamaño de la
población es de 1500 alumnos.
n´ =
iv. En la tabla de frecuencia siguiente faltan datos, complételos.
Valores fi Fi hi Hi
0 2
1 5
2 9
3 14 0.7
4 0,2
5
Totales
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
15
E-mail: jhnv1977@hotmail.com
v. En la tabla de frecuencia siguiente faltan datos, complételos.
Yi-1 - Yi Yi fi Fi hi Hi
- 100 2
150 7
0,2
0,8
30
Total
vi. Los datos de la tabla de frecuencia que se presenta a continuación muestran los
resultados obtenidos por un grupo de alumnos en una prueba de habilidad de lectura,
Xi-1 – Xi+1 Xi fi Fi hi Hi
[32 - 35) 33,5 5 5 0,04 0,04
35 – 38 36,5 12 17 0,11 0,15
38 – 41 39,5 18 35 0,16 0,31
41 – 44 42,5 19 54 0,17 0,48
44 – 47 45,5 26 80 0,23 0,71
47 – 50 48,5 19 99 0,17 0,88
50 – 53 51,5 13 112 0,12 1,00
n = 112 1,00
¿Cómo interpretas los números en negrita?
vii. Realizar para cada una de las tablas de frecuencias de los ejercicios iv y vi sus
respectivos gráficos.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
16
E-mail: jhnv1977@hotmail.com
Capítulo II: Medidas Resúmenes
En este capítulo introduciremos distintas formas de resumir la
distribución muestral o poblacional de una variable NUMÉRICA.
Resumir un conjunto de datos es pasar de una visión detallada a
una generalización simple e informativa tratando de preservar las
características esenciales.
¿Por qué resumir? Para simplificar la comprensión y la comunicación de los datos.
Las medidas resúmenes son útiles para comparar conjuntos de datos cuantitativos y para
presentar los resultados de un estudio y se clasifican en dos grupos principales:
 Medidas de posición o localización o tendencia central ⇒ describen un valor
alrededor del cual se encuentran las observaciones.
 Medidas de dispersión o escala ⇒ pretenden expresar cuan variable es un conjunto de
datos.
2.1. Medidas de Posición
Son estadígrafos de tendencia central que son interpretados como valores que permiten
resumir a un conjunto de datos dispersos, podría asumirse que estas medidas equivalen
a un centro de gravedad que adoptan un valor representativo para todo un conjunto de
datos predeterminados.
2.1.1. Media aritmética
La media aritmética de una variable estadística es la suma de todos sus
posibles valores, ponderada por las frecuencias de los mismos.
a. Para datos no tabulados
̅
Ejemplo 03: Se tienen las notas de una prueba de matemáticas de los
alumnos del 5° grado de educación primaria de la I.E. Buena Educación.
15, 12, 08, 18, 13, 11, 09, 16, 20, 19, 17, 15, 14, 16, 18. La media
aritmética será:
̅
̅
̅
La media de notas de los alumnos del 5° grado de primaria de la I.E.
Buena Educación es 14.73.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
17
E-mail: jhnv1977@hotmail.com
b. Para datos tabulados
̅ ∑
Ejemplo 04: Con los datos de la Tabla 02, calculamos el promedio de los
salarios semanales.
̅
̅
̅
̅
El salario semanal de los 40 trabajadores es en promedio de S/. 93.00 nuevos
soles.
2.1.2. Mediana
Es otra medida de posición o tendencia central. Se define como aquel valor de
la variable que supera la mitad de las observaciones y a su vez es superado por
la otra mitad de ellas. Por esta razón, se la considera como el valor central, ya
que se divide a los datos en 2 grupos (las observaciones deben estar ordenadas
de mayor a menor).
a. Para datos no tabulados
Se ordenan las observaciones de menor a mayor y se ubica el valor central.
Si la constante de datos (n) es par, se promedian los 2 valores centrales. En
cambio, si n es impar habrá solo un valor en el centro.
Ejemplo 05: Sean los datos
4 5 5 6 8 9 9 10
n=8 (par)
Ejemplo 06: Sean los datos
14 15 15 16 17 18 19 19 20
n = 9 (impar)
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
18
E-mail: jhnv1977@hotmail.com
b. Para datos tabulados
Si los datos están tabulados no es posible individualizar el valor de la
mediana, pero si es factible determinar el intervalo donde se encuentra.
La fórmula para encontrar la mediana es:
( )
Donde:
 Xinf : es el valor inferior del intervalo mediano.
 c : es la amplitud del intervalo.
 Fi-1 : es la frecuencia acumulada anterior al intervalo mediano.
 fi : es la frecuencia del intervalo mediano
 n : es el número total de datos.
Ejemplo 07: Obtener la mediana de la distribución adjunta:
Xinf – Xsup fi Xi Fi
0 - 10 60 5 60
10 - 20 80 15 140
20 - 30 30 25 170
30 - 40 20 65 190
40 - 50 10 300 200
n=200
Calculamos n/2 para poder determinar el intervalo mediano n/2= 200/2 =
100.
La Fi más próxima que supera al valor calculado n/2=100 es F2=140, por
lo tanto el intervalo mediano será 10 – 20>. Entonces:
( )
De lo que se puede afirmar que el 50% de los datos es mayor a 15,
mientras que el 50% restante es menor a 15.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
19
E-mail: jhnv1977@hotmail.com
2.1.3. Moda
Llamaremos moda a cualquier máximo relativo de la distribución de
frecuencias, es decir, cualquier valor de la variable que posea una frecuencia
mayor que su anterior y su posterior.
a. Para datos no tabulados
Se busca el valor más repetido.
Ejemplo 08: Para los datos
2 5 3 4 1 5 3
4 6 4 3 2 1 4
La Moda será, Mo = 4
b. Para datos tabulados
Se utiliza la siguiente fórmula:
( )
Donde:
 Xinf : es el valor inferior del intervalo con mayor frecuencia.
 c : es la amplitud del intervalo.
 fi-1 : es la frecuencia anterior al intervalo modal.
 fi : es la frecuencia del intervalo modal.
 fi+1 : es la frecuencia posterior del intervalo modal.
 n : es el número total de datos.
Ejemplo 09: Utilizando los datos de la Tabla 02, calculamos la moda
( )
( )
De lo cual podemos afirmar que el salario semanal más frecuente de los
trabajadores es de S/. 98.14 nuevos soles.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
20
E-mail: jhnv1977@hotmail.com
2.1.4. Percentiles
Para una variable discreta, se define el percentil de orden k, como la
observación, Pk, que deja por debajo de si el k% de la población. Se calcula
con la siguiente fórmula:
( )
2.2. Medidas de Dispersión
Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo
de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o
valores están próximas entre sí o si por el contrario están o muy dispersas.
Una medida razonable de la variabilidad podría ser la amplitud o rango, que se
obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto.
Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee
varios inconvenientes:
 No utiliza todas las observaciones (sólo dos de ellas);
 Se puede ver muy afectada por alguna observación extrema;
 El rango aumenta con el número de observaciones, o bien se queda igual. En
cualquier caso nunca disminuye.
En el transcurso de esta sección, veremos medidas de dispersión mejores que la
anterior. Estas se determinan en función de la distancia entre las observaciones y
algún estadístico de tendencia central.
2.2.1. Desviación Media
Se define la desviación media como la media de las diferencias en valor
absoluto de los valores de la variable a la media, es decir, si tenemos un
conjunto de n observaciones, x1, ..., xn, entonces
∑| ̅|
Si los datos están agrupados en una tabla estadística es más sencillo usar la
relación
∑| ̅|
Como se observa, la desviación media guarda las mismas dimensiones que las
observaciones. La suma de valores absolutos es relativamente sencilla de
calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista
geométrico, la distancia que induce la desviación media en el espacio de
observaciones no es la natural. Esto hace que sea muy engorroso trabajar con
ella a la hora de hacer inferencia a la población.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
21
E-mail: jhnv1977@hotmail.com
Ejemplo 10: Para el siguiente conjunto de datos, calcular su desviación media.
2 5 3
4 6 4
Entonces, primero calculamos la media
̅
̅
Luego, la desviación media será
∑| ̅|
| | | | | | | | | | | |
Ejemplo 11: Sea la siguiente tabla de distribución de frecuencias
correspondiente a la variable X, estatura de los alumnos de un determinado
colegio.
Xinf Xsup Xi fi
0.99 1.16 1.075 4
1.16 1.33 1.245 6
1.33 1.50 1.415 8
1.50 1.67 1.585 9
1.67 1.84 1.755 8
1.84 2.01 1.925 5
Total 40
Tabla 03: Distribución de frecuencias de estaturas de alumnos
Calculamos la media, y completamos la tabla de distribución
Xinf Xsup Xi fi Xi.fi |Xi-Xprom| |Xi-Xprom|*fi
0.99 1.16 1.075 4 4.3 0.4505 1.8020
1.16 1.33 1.245 6 7.47 0.2805 1.6830
1.33 1.50 1.415 8 11.32 0.1105 0.8840
1.50 1.67 1.585 9 14.265 0.0595 0.5355
1.67 1.84 1.755 8 14.04 0.2295 1.8360
1.84 2.01 1.925 5 9.625 0.3995 1.9975
Total 40 61.02 8.7380
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
22
E-mail: jhnv1977@hotmail.com
̅ ∑
̅
̅
Luego la desviación media será,
∑| ̅|
2.2.2. Varianza y Desviación típica
La Desviación estándar, también llamada desviación típica, es una medida
de dispersión usada en estadística que nos dice cuánto tienden a alejarse los
valores puntuales del promedio en una distribución. Específicamente, la
desviación estándar es "el promedio de la distancia de cada punto respecto del
promedio". Se suele representar por una S o con la letra sigma  según se
calcule en una muestra o en la población.
Una desviación estándar grande indica que los puntos están lejos de la media, y
una desviación pequeña indica que los datos están agrupados cerca de la media.
Imagen 06: Nivel de dispersión de datos
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
23
E-mail: jhnv1977@hotmail.com
La fórmula para calcular la desviación típica en datos no tabulados es:
√
∑ ̅
Mientras que en datos tabulados se calcula con la siguiente fórmula:
√∑
(∑ )
Ejemplo 12: Con los datos de la tabla 03, determinar la desviación típica, para
ello completamos la tabla
Xinf Xsup Xi fi Xi.fi fi.
0.99 1.16 1.075 4 4.3 4.6225
1.16 1.33 1.245 6 7.47 9.3002
1.33 1.50 1.415 8 11.32 16.0178
1.50 1.67 1.585 9 14.265 22.6100
1.67 1.84 1.755 8 14.04 24.6402
1.84 2.01 1.925 5 9.625 18.5281
Total 40 61.02 95.7188
Luego con los datos obtenidos calculamos la desviación típica:
√∑
(∑ )
√
√
El valor de la varianza es S2
, entonces para nuestro caso, la varianza será:
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
24
E-mail: jhnv1977@hotmail.com
2.2.3. Coeficiente de variación y asimetría de Pearson
El coeficiente de variación elimina la dimensionalidad de las variables y tiene
en cuenta la proporción existente entre medias y desviación típica. Se define
del siguiente modo:
̅
Las distribuciones pueden tener diferentes formas, y una manera de
caracterizar la forma es observar su simetría. Una distribución de frecuencias
puede ser simétrica o asimétrica. Para saber si es simétrica tenemos que tomar
una referencia, es decir, ver respecto a qué es simétrica. El coeficiente de
asimetría de Pearson, mide la desviación de la simetría, expresando la
diferencia entre la media y la mediana con respecto a la desviación estándar del
grupo de mediciones. Su fórmula es:
̅
 Si As = 0 diremos que la distribución es simétrica, en ese caso las
desviaciones a la derecha y a la izquierda de la media se compensan.
 Si As < 0 diremos que es asimétrica negativa ya que la mayoría de las
observaciones están a la derecha de la proyección de la media.
 Si As > 0 diremos que es asimétrica positiva ya que la mayoría de las
observaciones están a la izquierda de la proyección de la media.
Imagen 07: Tipos de asimetría
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
25
E-mail: jhnv1977@hotmail.com
Ejercicios del Capítulo II
i. Una empresa ha realizado un test físico entre sus empleados para comprobar la
capacidad de esfuerzo que posee cada uno de ellos. Una de las medidas que componen
el mismo es el número de pulsaciones después de una determinada actividad física,
que está altamente relacionada con las que se realizan a lo largo de una jornada
laboral. Los datos conseguidos han sido distribuidos en una tabla de frecuencias. La
tabla resultante es la que se presenta:
Número de pulsaciones Número de empleados
70 - 75 3
75 – 80 3
80 – 85 7
85 – 90 10
90 – 95 12
95 - 100 8
Se pide:
a) media aritmética, mediana, cuartil inferior, percentil 60 y desviación típica.
b) ¿Qué tanto por cien de empleados tuvieron menos de 83 pulsaciones?
ii. Sea la siguiente tabla de distribución de frecuencias:
Intervalos Xi fi
160 – 162 161 2
163 – 165 164 5
166 – 168 167 7
169 – 171 170 9
172 – 174 173 12
175 – 177 176 13
178 – 180 179 14
181 – 183 182 15
184 – 186 185 20
187 – 189 188 22
TOTAL 119
Determinar:
a) Promedio
b) Mediana
c) Moda
d) Percentil 60
e) Desviación media
f) Desviación típica
g) Coeficiente de variación y coeficiente de asimetría
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
26
E-mail: jhnv1977@hotmail.com
Capítulo III: Probabilidad
Si el único propósito del investigador es describir los
resultados de un experimento concreto, los métodos
analizados en los capítulos anteriores pueden considerarse
suficientes. No obstante, si lo que se pretende es utilizar la
información obtenida para extraer conclusiones generales
sobre todos aquellos objetos del tipo de los que han sido
estudiados, entonces estos métodos constituyen sólo el
principio del análisis, y debe recurrirse a métodos de
inferencia estadística, los cuales implican el uso inteligente
de la teoría de la probabilidad.
Comenzamos este bloque interpretando la noción de probabilidad y la terminología
subyacente a esta área de las matemáticas, ya que la probabilidad constituye por sí misma un
concepto básico que refleja su relación con la faceta del mundo exterior que pretende estudiar:
los fenómenos aleatorios, los cuales obedecen unas ciertas reglas de comportamiento. De
alguna manera, el concepto de probabilidad, se relaciona o nos recuerda las propiedades de la
frecuencia relativa.
A partir de ella, y junto con las definiciones de probabilidad condicionada y la de sucesos
independientes, se deducen los teoremas fundamentales del Cálculo de Probabilidades. Nos
centraremos posteriormente en el eslabón que une la teoría de la probabilidad y la estadística
aplicada: la noción de variable aleatoria, mostrando de esta manera, como puede emplearse la
teoría de la probabilidad para sacar conclusiones precisas acerca de una población en base a
una muestra extraída de ella, y que muchos de los estudios estadísticos son de hecho, estudio
de las propiedades de una o más variables aleatorias.
Tal como hemos citado anteriormente, en las aplicaciones prácticas es importante poder
describir los rasgos principales de una distribución, es decir, caracterizar los resultados del
experimento aleatorio mediante unos parámetros. Llegamos así al estudio de las
características asociadas a una variable aleatoria introduciendo los conceptos de esperanza y
varianza matemática, relacionándolos con los conceptos de media y varianza de una variable
estadística.
3.1. Conjuntos y Probabilidad
El concepto de conjunto es un pilar fundamental de la probabilidad y la estadística y
de la matemática en general. Un conjunto puede considerarse como una colección de
objetos, llamados miembros o elementos.
3.1.1. Generalidades de Conjuntos
a. Notación de un conjunto
En general se denota un conjunto con las letras del alfabeto en mayúsculas
(A, B, C, …, Z) y los elementos con las letras en minúsculas.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
27
E-mail: jhnv1977@hotmail.com
Si un elemento “a” pertenece a un determinado conjunto “A” se representa
así: a  A y si un elemento “x” no pertenece a un conjunto “B” se
representa así: x  B.
Un conjunto puede estar expresado por extensión, o por comprensión.
Ejemplo: sea el conjunto A de las vocales.
Por extensión
A = {a, e, i, o, u}
Por Comprensión
A = {x
/x es una vocal}
b. Subconjunto
Si todos los elementos de un conjunto A también pertenecen a B, llamamos
a A un subconjunto de B, el cual se denota A  B y se lee “A está
contenido en B”.
c. Conjunto universal y conjunto vacío
El conjunto Universo se denota con U, mientras que el conjunto nulo o
vacío se denota con .
d. Representación Gráfica de un conjunto
Un conjunto puede ser representado gráficamente por cualquier figura
geométrica, así:
Imagen 08: Representaciones gráficas de un Conjunto
3.1.2. Operaciones con Conjuntos
a. Unión
Ejemplo 13: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se
determinará A  B.
A  B = {1,2,3,4,5}  {1,3,5,7}
A  B = {1,2,3,4,5,1,3,5,7} se omiten los elementos repetidos, entonces
A  B = {1,2,3,4,5,7}
A B C D E F G
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
28
E-mail: jhnv1977@hotmail.com
b. Intersección
Ejemplo 13: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se
determinará A  B.
A  B = {1,2,3,4,5}  {1,3,5,7}, sólo se consideran los elementos
comunes a ambos conjuntos.
A  B = {1,3,5}
c. Diferencia
Ejemplo 14: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se
determinará A - B.
A - B = {1,2,3,4,5} - {1,3,5,7}, sólo se consideran los elementos del
conjunto A que no se repiten en B.
A - B = {2,4}
d. Complemento
Ejemplo 15: Sea el conjunto universal U = {c,a,m,o,t,e} y sea el conjunto
A = {m,o,t,e}, el complemento de A respecto al universo U será:
A’ = U – A
A’ = {c,a,m,o,t,e} - {m,o,t,e}
A’ = {c,a}
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
29
E-mail: jhnv1977@hotmail.com
3.1.3. Experimentos aleatorios
Todos estamos familiarizados con la importancia de los experimentos en la
ciencia y en la ingeniería.
Sin embargo, hay experimentos en los cuales los resultados no son
esencialmente los mismos a pesar de que las condiciones sean
aproximadamente idénticas. Tales experimentos se denominan experimentos
aleatorios. Los siguientes son algunos ejemplos:
Ejemplo 16: Si lanzamos una moneda el resultado del experimento es un sello,
simbolizado por S, o una cara, simbolizado por C, es decir uno de los
elementos del conjunto {S,C}
Ejemplo 17: Si lanzamos un dado, el resultado es un número perteneciente al
siguiente conjunto {1,2,3,4,5,6}
Ejemplo 18: Se tiene un lector óptico para revisar examenes, el resultado del
experimento es que algunos examenes tendrán nota desaprobatoria. Así,
cuando se revise un examen el resultado es un elemento del conjunto
{0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}
Ejemplo 19: Si lanzamos un dado dos veces, el resultado es un elemento
perteneciente al siguiente conjunto {CC,CS,SC,SS}
Hasta aquí podemos decir que un experimento es aleatorio si se verifican las
siguientes condiciones:
1. Se puede repetir indefinidamente, siempre en las mismas condiciones;
2. Antes de realizarlo, no se puede predecir el resultado que se va a obtener;
3. El resultado que se obtenga, e, pertenece a un conjunto conocido
previamente de resultados posibles.
3.1.4. Espacio muestral
Al conjunto, de resultados posibles de un experimento, lo denominaremos
espacio muestral y lo denotaremos normalmente mediante la letra δ. Los
elementos del espacio muestral se denominan sucesos elementales. Cualquier
subconjunto de δ será denominado suceso aleatorio, y se denotará
normalmente con las letras A, B,...
Obsérvese que los sucesos elementales son sucesos aleatorios compuestos por
un sólo elemento. Por supuesto los sucesos aleatorios son más generales que
los elementales, ya que son conjuntos que pueden contener no a uno sólo, sino
a una infinidad de sucesos elementales y también no contener ninguno.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
30
E-mail: jhnv1977@hotmail.com
Ejemplo 20: Si se lanza un dado, el espacio muestral será δ = {1,2,3,4,5,6}.
Son sucesos aleatorios A = {1,2}, B = {1,3}, C = {1,4}, D = {x
/x es un número
par menor que 7}, …
Suceso Seguro: es el mismo δ
Suceso imposible: es aquel que nunca se verifica como resultado del
experimento aleatorio. Se representa con .
Ejemplo 21: Si se lanza una moneda 2 veces, se puede determinar:
El espacio muestral, δ = {CC,CS,SC,SS}
Los siguientes sucesos aleatorios:
A el suceso “por lo menos se obtenga una cara”. A = {CS,SC,SS}
B el suceso “el segundo lanzamiento sea un sello”. B = {CS,SS}
Nota a tener en cuenta: A los sucesos se les puede aplicar operaciones con
conjuntos.
3.1.5. Probabilidad, axiomas y teoremas
En cualquier experimento aleatorio siempre hay incertidumbre sobre si un
suceso específico ocurrirá o no. Como medida de la oportunidad o probabilidad
con la que podemos esperar que un suceso ocurra es conveniente asignar un
número entre 0 y 1. Si estamos seguros de que el suceso ocurrirá decimos que
su probabilidad es 100% ó 1, pero si estamos seguros de que el suceso no
ocurrirá decimos que su probabilidad es cero.
Existen dos procedimientos importantes por medio de los cuales podemos
obtener estimativos para la probabilidad de un suceso, a saber:
a. Enfoque clásico o a priori
Si un suceso A puede ocurrir en h maneras diferentes de un número total
de n maneras posibles, todos igualmente factibles, entonces la probabilidad
del suceso es:
Ejemplo 22: Supóngase que deseamos la probabilidad de que resulte una
cara en un solo lanzamiento de una moneda. Puesto que hay dos maneras
igualmente factibles del resultado de la moneda (n=2), simplemente "cara"
y “sello” (suponiendo que la moneda no se pierda ni caiga verticalmente),
y de estas dos maneras una cara puede aparecer en una sola manera (h=1),
entonces la probabilidad requerida es:
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
31
E-mail: jhnv1977@hotmail.com
La probabilidad de que resulte una cara en un lanzamiento es de 50%.
b. Enfoque como frecuencia relativa o a posteriori
Si después de n repeticiones de un experimento, donde n es muy grande,
un suceso ocurre h veces, entonces la probabilidad del suceso es h/n. Esto
también se llama la probabilidad empírica del suceso.
Ejemplo 23: Si lanzamos una moneda 1000 veces y hallamos que 532
veces resultan caras estimamos que la probabilidad de una cara es:
c. Axiomas de la Probabilidad
 P(A) ≥ 0
 P(δ) = 1
 P(AB) = P(A) + P(B), si A y B son mutuamente excluyentes.
d. Teoremas importantes sobre Probabilidad
- Si A1  A2. P(A1)  P(A2) y P(A2 – A1) = P(A2) - P(A1)
- Para cada suceso 0  P(A)  1
- P() = 0
- P(A’) = 1 - P(A)
- Si A y B son sucesos cualesquiera, entonces P(AB) = P(A) + P(B) –
P(AB)
3.1.6. Probabilidad Condicional
Sean A y B dos sucesos tales que P(A)> 0. Denotamos por P(B|A) la
probabilidad de B dado que A ha ocurrido. Puesto que se sabe que A ha
ocurrido, se convierte en el nuevo espacio muestral remplazando el original δ.
De aquí llegamos a la definición
|

Ejemplo 24: Hallar la probabilidad de que en un sólo lanzamiento de un dado
resulte un número menor que 4, (a) no se da ninguna otra información, (b) se
da que el lanzamiento resultó en un número impar,
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
32
E-mail: jhnv1977@hotmail.com
(a) Si B es el suceso {menor que 4}, entonces
(b) Si A es el suceso {número impar} observamos que P(A)=3/6=1/2.
También P(AB)=2/6:1/3. Entonces
|
|
3.1.7. Sucesos Independientes
Si P(B|A) = P(B), es decir la probabilidad de que B ocurra no está afectada por
la ocurrencia o no ocurrencia de A, entonces decimos que A y B son sucesos
independientes. Esto es equivalente a:
P(AB) = P(A).P(B)
3.1.8. Teorema de Bayes
Supóngase que A1, A2,..., An son sucesos mutuamente excluyentes cuya unión
es el espacio muestral δ, es decir uno de los sucesos debe ocurrir. Entonces si A
es cualquier suceso tenemos el siguiente teorema importante:
|
|
∑ |
3.1.9. Análisis Combinatorio
En muchos casos el número de puntos muestrales en un espacio muestral no es
muy grande y así la enumeración o cuenta directa de los puntos del muestreo
necesarios para obtener las probabilidades no es difícil. Sin embargo, surgen
problemas cuando la cuenta directa se convierte en una imposibilidad práctica.
En tales casos se emplea el análisis combinatorio, que podría llamarse una
forma sofisticada de contar.
a. Principio fundamental de cuenta
Si una cosa puede realizarse en n1 maneras diferentes y después de esto
una segunda cosa puede realizarse en n2 maneras diferentes,…, y
finalmente una k-ésima cosa puede realizarse en nk maneras diferentes,
entonces todas las k cosas pueden realizarse en el orden especificado en n1
n2 … nk maneras diferentes.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
33
E-mail: jhnv1977@hotmail.com
Ejemplo 25: Si un hombre tiene 2 camisas y 4 corbatas entonces tiene
2*4=8 maneras de escoger una camisa y luego una corbata.
b. Permutaciones
Supóngase que se dan n objetos diferentes y deseamos ordenar r de estos
objetos en una línea puesto que hay n maneras de escoger el primer objeto,
y luego de hacer esto n - 1 maneras de escoger el segundo objeto, … , y
finalmente n - r + 1 formas de escoger el r-ésimo objeto, se deduce por el
principio fundamental de cuenta que el número de ordenaciones, o
permutaciones diferentes como generalmente se les llama está dado por:
nPr = n(n - l)(n - 2). . . (n - r + l)
Ésta fórmula también puede ser expresada en términos de factoriales, a
saber:
Ejemplo 26: El número de ordenaciones o permutaciones diferentes que
consisten de 3 letras cada una y que pueden formarse de las 7 letras A, B,
C, D, E, F, G es
Supóngase ahora que un conjunto que consiste de n objetos de los cuales
n1 son de un tipo (es decir no pueden distinguirse entre sí), n2 son de un
segundo tipo,…, nk son del k-ésimo tipo. Lógicamente n = n1 + n2 +… + nk
Así el número de permutaciones diferentes de los objetos es:
nPn1, n2, … , nk
c. Combinaciones
En una permutación estamos interesados en el orden de la distribución de
los objetos. Así abc es una permutación diferente a cba. Sin embargo, en
muchos problemas estamos interesados solamente en seleccionar o escoger
los objetos sin interesar su orden. Dichas selecciones se llaman
combinaciones. Así abc y cba son la misma combinación.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
34
E-mail: jhnv1977@hotmail.com
El número total de combinaciones de r objetos seleccionados de n, se
denota por:
( )
Ejemplo 27: El número de maneras en las cuales 3 cartas pueden
escogerse de un total de 8 cartas diferentes es
( )
( )
( )
3.2. Variables Aleatorias y distribuciones de probabilidad
3.2.1. Variable aleatoria
Supóngase que a cada punto de un espacio muestral asignamos un número. Así
definimos una función en el espacio muestral. Esta función se llama variable
aleatoria (o variable estocástica) o más precisamente función aleatoria (función
estocástica). Comúnmente se denota por una letra mayúscula como X o Y. En
general una variable aleatoria tiene algún significado físico, geométrico u otro.
Ejemplo 28: Supóngase que se lanza una moneda dos veces de tal forma que el
espacio muestral es δ = {CC,CS,SC,SS}. Represéntese por X el número de
caras que pueden resultar. Con cada punto muestral podemos asociar un
número para X como se muestra en la Tabla 04. Así en el caso de CC (es decir
2 caras) X = 2 en tanto que para SC (1 cara) X = 1. Se concluye que X es una
variable aleatoria.
Punto Muestral CC CS SC SS
X 2 1 1 0
Tabla 04: Asociación de suceso X con puntos muestrales
Debe observare que también podrían definirse otras muchas variables
aleatorias en este espacio muestral, por ejemplo el cuadrado del número de
caras, el número de caras menos el número de sellos, etc.
Una variable aleatoria que tiene un número finito de valores se denomina
variable aleatoria discreta, mientras que si una variable aleatoria tiene un
número infinito no contable de valores se denomina variable aleatoria continua.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
35
E-mail: jhnv1977@hotmail.com
3.2.2. Distribución de Probabilidad discreta
Es conveniente introducir la función de probabilidad, también conocida como
la distribución de probabilidad, definida por
P(X = x) =
En general es una función de probabilidad si
- ≥ 0
- ∑
Ejemplo 29: Hallar la función de probabilidad correspondiente a la variable X
del ejemplo 28. Supóngase que la moneda es honrada. Entonces tenemos:
Luego: Recordar que X es la variable aleatoria que representa el número de
caras, así:

Así, la función de probabilidad está dada en la Tabla 05
x 0 1 2
f(x)
Tabla 05
3.2.3. Función de Distribución discreta
La función de distribución acumulada, o simplemente la función de
distribución, para una variable aleatoria X se define por
P(X  x) = F(x)
Si X únicamente toma un número finito de valores x1, x2, … , xn entonces la
función de distribución está dada por
{
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
36
E-mail: jhnv1977@hotmail.com
Ejemplo 30: Hallar la función de Probabilidad para la variable aleatoria X del
ejemplo 29.
Así, con los datos de la Tabla 05 la función de probabilidad es:
{
{
3.2.4. Distribución de Probabilidad continua
Se define mediante la existencia de una función f(x) tal que:
- ≥ 0
- ∫
Entonces definimos la probabilidad de que X se encuentre entre a y b como:
∫
Una función f(x) que satisface los requisitos anteriores se llama función de
probabilidad o distribución de probabilidad para una variable aleatoria
continua, pero con mayor frecuencia se denomina función de densidad de
probabilidad o simplemente función de densidad.
Ejemplo 31: Sea la función de densidad f(x) = , 0  x  3. Determinar
P(1X2)
∫
|
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
37
E-mail: jhnv1977@hotmail.com
3.2.5. Función de Distribución continua
Definimos la función de distribución F(x) para una variable aleatoria continua
por:
F(x) = P(X  x) = P( ) ∫
Ejemplo 32: Halla la función de distribución para la variable aleatoria
continua X del ejemplo 31
Tenemos:
F(x) = P(X  x) = ∫
Si x < 0, entonces F(x)=0
Si 0  x  3, entonces
∫ ∫
Si x ≥ 3, entonces
∫ ∫ ( )
Por lo tanto la función de distribución será:
{
3.3. Varianza y desviación típica de variables aleatorias
3.3.1. Varianza y desviación típica de una VA discreta
Si X es una variable aleatoria discreta con función de probabilidad f(x),
entonces la varianza es
∑
Y la desviación típica es:
√
3.3.2. Varianza y desviación típica de una VA continua
Si X es una variable aleatoria continua con función de probabilidad f(x),
entonces la varianza es
∫
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
38
E-mail: jhnv1977@hotmail.com
3.4. Distribuciones de Probabilidad con nombre Propio
3.4.1. Distribución Binomial o de Bernoulli
Supóngase que tenemos un experimento como lanzar una moneda o un dado
repetidamente, extraer una bola de una urna repetidamente, etc. Cada
lanzamiento o escogencia se llama una prueba. Con cada prueba hay una
probabilidad asociada con un suceso particular como la cara en la moneda, el 4
en el dado o la selección de una bola roja. En algunos casos la probabilidad no
cambia de una prueba a la siguiente (como en el lanzamiento de la moneda o
del dado). A estas pruebas se les llama independientes y se conocen como las
pruebas de Bernoulli en memoria de James Bernoulli quien las investigó a
finales del siglo XVII.
Sea p la probabilidad de que un suceso ocurra en una sola prueba de Bernoulli
(llamada la probabilidad de éxito). Entonces q = 1 – p es la probabilidad de que
el suceso no ocurra en una sola prueba (llamada la probabilidad de fracaso). La
probabilidad de que el suceso ocurra x veces en n pruebas (es decir que ocurran
x éxitos y n – x fracasos) está dada por la función de probabilidad
donde la variable aleatoria discreta X denota el número de éxitos en n pruebas.
Ejemplo 33: La probabilidad de obtener exactamente 2 caras en 6
lanzamientos de una moneda es
( ) ( )
A tener en cuenta: Propiedades de la distribución binomial:
3.4.2. Distribución Normal
Uno de los más importantes ejemplos de una distribución de probabilidad
continua es la distribución normal, algunas veces denominada la distribución
gaussiana. La función de densidad para la distribución está dada por
√
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
39
E-mail: jhnv1977@hotmail.com
donde y son la media y la desviación típica respectivamente. La función de
distribución correspondiente está dada por
√
∫
Los valores de la distribución normal pueden ser encontrados en el Apéndice
A.
3.4.3. Distribución de Poisson
Sea X una variable aleatoria discreta que puede tomar los valores 0, 1, 2, . . . tal
que la función de probabilidad de X esté dada por
Donde es una constante positiva dada. Los valores de f(x) pueden obtenerse
empleando el Apéndice B.
A tener en cuenta: Propiedades de la distribución binomial:
3.4.4. Distribución Hipergeométrica
Sea X una variable aleatoria discreta, su función de probabilidad es:
( )( )
( )
3.4.5. Distribución Chi-Cuadrado
Sean X1, X2, … , Xv, v variables aleatorias independientes distribuidas
normalmente con media cero y varianza 1. Considérese la variable aleatoria
Donde se llama chi-cuadrado. Se define la distribución chi-cuadrado con v
grados de libertad como
∫
( )
3.4.6. Distribución t de Student
Los valores de la distribución t pueden obtenerse empleando el Apéndice C.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
40
E-mail: jhnv1977@hotmail.com
Ejercicios del Capítulo III
i. Sea A el conjunto de todos los números reales cuyos cuadrados son iguales a 25.
Indique cómo describir en A por (a) el método de comprensión y (b) el método de
extensión.
ii. Determinar cuáles de las proposiciones siguientes son verdaderas y corregir las que
son falsas.
{x
/x  x} = {}
Si A = {x
/x2
= 4, x>9} y B = {x
/x  l}, entonces A  B.
iii. Se extrae una carta aleatoriamente de una baraja de 52 cartas. Describir el espacio
muestral si (a) no se tiene en consideración el palo (b) si se tiene en cuenta el palo.
iv. Refiriéndose al experimento del Problema iii sea, A el suceso {se extrae un rey} o
sencillamente {rey} y B el suceso {se extrae un trébol} o sencillamente {trébol}.
Describir los sucesos (a) A  B, (b) A  B, (c) A  B', (d) A’  B’, (e) A - B, (f) A’ –
B’, (g) (AB)  (AB’).
v. Una carta se extrae aleatoriamente de una baraja de 52 cartas. Encontrar la
probabilidad de que sea (a) un as, (b) una jota de corazones, (c) un tres de tréboles o
un seis de diamantes, (d) un corazón, (e) cualquier palo excepto corazones, (f) un diez
o una pica (g) ni un cuatro ni un trébol.
vi. Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4 bolas
blancas y 5 bolas azules. Determinar la probabilidad de que sea (a) roja, (b) blanca, (c)
azul, (d) no roja, (e) roja o blanca.
vii. Encontrar la probabilidad de no obtener un total de 7 u 11 en ninguno de los dos
lanzamientos de un par de dados honrados.
viii. Se va a conformar un comité de 3 miembros compuesto por un representante de los
trabajadores, uno de la administración y uno del gobierno. Si hay 3 candidatos de los
trabajadores, 2 de la administración y 4 del gobierno, determinar cuántos comités
diferentes pueden conformarse, empleando el principio fundamental de cuenta.
ix. ¿De cuántas maneras pueden 10 personas sentarse en una banca si sólo hay 4 puestos
disponibles?
x. Se quieren sentar 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen
los sitios pares. ¿De cuántas formas pueden sentarse?
xi. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules: Si las bolas de
igual color no se distinguen entre sí ¿de cuántas formas posibles pueden ordenarse?
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
41
E-mail: jhnv1977@hotmail.com
xii. De un total de 5 matemáticos y 7 físicos, se forma un comité de 2 matemáticos y 3
físicos. ¿De cuántas formas puede formarse, si (a) puede pertenecer a él cualquier
matemático y físico, (b) un físico determinado debe pertenecer al comité, (c) dos
matemáticos determinados no pueden estar en el comité?
xiii. ¿Cuántos números artísticos se pueden preparar con 5 alumnos (Juan, Jorge, Luis,
Miguel y Lidia) de mi sección?
xiv. Organizo un torneo de ajedrez en el aula. Daniel y María juegan 12 partidas de ajedrez
de las cuales Daniel gana 6, María gana 4 y 2 terminan en tablas. María pide la
revancha y acuerdan jugar un torneo consistente en 3 partidas. Hallar la probabilidad
de que (a) Daniel gane las tres partidas, (b) dos partidas terminen en tablas, (c) Daniel
y María ganen alternativamente, (d) María gane al menos una partida.
xv. Si el 20 % de los alumnos egresados de una institución educativa emigran al
extranjero, determinar la probabilidad de que de 4 alumnos escogidos aleatoriamente
(a) 1, (b) 0, (c) menos de 2, emigren.
xvi. El peso medio de 500 estudiantes varones de una universidad es de 68.5 kg y la
desviación tipificada es de 10 kg. Suponiendo que los pesos están distribuidos
normalmente, hallar el número de estudiantes que pesan (a) entre 48 y 71 kg, (b) más.
de 91 kg.
xvii. Si la probabilidad de que un alumno sufra un desmayo debido a la manifestación de un
movimiento telúrico, es 0.001, determinar la probabilidad de que de un total de 2000
alumnos (a) exactamente 3, (b) más de 2 individuos sufran desmayo durante un sismo.
xviii. Luego de un incidente de mal comportamiento en una institución educativa se han
detenido en un aula a 10 alumnos involucrados, de los cuales 6 si participaron del
incidente y 4 de ellos no. Se realiza un experimento en el cual se selecciona un alumno
del aula aleatoriamente y se determina su responsabilidad. Hallar la probabilidad de
que después de 5 pruebas del experimento se hallan escogido 3 alumnos responsables
del mal comportamiento.
xix. Hallar para (a) v = 60 y (b) v = 100 grados de libertad.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
42
E-mail: jhnv1977@hotmail.com
Capítulo IV: Estadísticos para la prueba de Hipótesis
4.1. Ensayos de Hipótesis y significación
4.1.1. Decisiones Estadísticas
Muy a menudo, en la práctica se tienen que tomar decisiones sobre
poblaciones, partiendo de la información muestral de las mismas. Tales
decisiones se llaman decisiones estadísticas Por ejemplo, se puede querer
decidir a partir de los datos del muestreo, si un suero nuevo es realmente
efectivo para la cura de una enfermedad, si un sistema educacional es mejor
que otro, si una moneda determinada está o no cargada, etc.
4.1.2. Hipótesis estadísticas. Hipótesis nula
Para llegar a tomar decisiones, conviene hacer determinados supuestos o
conjeturas acerca de las poblaciones que se estudian. Tales supuestos que
pueden ser o no ciertos se llaman hipótesis estadísticas y, en general, lo son
sobre las distribuciones de probabilidad de las poblaciones.
En muchos casos se formulan las hipótesis estadísticas con el solo propósito de
rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está
cargada, se formula la hipótesis de que la moneda está bien, es decir, p : 0.5;
donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si
un procedimiento es mejor que otro, se formula la hipótesis de que no hay
diferencia entre los procedimientos (es decir, cualquier diferencia observada se
debe meramente a fluctuaciones en el muestreo de la misma población). Tales
hipótesis se llaman también hipótesis nulas y se denotan por H0.
Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis
alternativa. Por ejemplo, si una hipótesis es p=0.5, hipótesis alternativas son
p=0.7; p=0.56; p>0.5. Una hipótesis alternativa de la hipótesis nula se denota
por H1.
Si en el supuesto de que una hipótesis determinada es cierta, se encuentra que
los resultados observados en una muestra aleatoria difieren marcadamente de
aquellos que cabía esperar con la hipótesis y con la variación propia del
muestreo, se diría que las diferencias observadas son significativas y se estaría
en condiciones de rechazar la hipótesis (o al menos no aceptarla de acuerdo
con la evidencia obtenida). Por ejemplo, si en 20 lanzamientos de una moneda
se obtienen 16 caras, se estaría inclinado a rechazar la hipótesis de que la
moneda está bien, aunque sería posible que fuese un rechazamiento erróneo.
Los procedimientos que facilitan el decidir si una hipótesis se acepta o se
rechaza o el determinar si las muestras observadas difieren significativamente
de los resultados esperados se llaman ensayos de hipótesis, ensayos de
significación o reglas de decisión.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
43
E-mail: jhnv1977@hotmail.com
4.1.3. Errores de Tipo I y Tipo II
Si se rechaza una hipótesis cuando debería ser aceptada, se dice que se comete
un error del Tipo I. Si por el contrario, se acepta una hipótesis que debería ser
rechazada, se dice que se comete un error del Tipo II. En cualquiera de los dos
casos se comete un error al tomar una decisión equivocada.
Para que cualquier ensayo de hipótesis o reglas de decisión sea bueno, debe
diseñarse de forma que minimice los errores de decisión. Esto no es tan
sencillo como pueda parecer puesto que para un tamaño de muestra dado, un
intento de disminuir un tipo de error, va generalmente acompañado por un
incremento en el otro tipo de error.
En la práctica, un tipo de error puede tener más importancia que el otro, y así
se tiende a conseguir poner una limitación al error de mayor importancia. La
única forma de reducir al tiempo ambos tipos de error es incrementar el tamaño
de la muestra, lo cual puede ser o no ser posible.
4.1.4. Nivel de significación
La probabilidad máxima con la que en el ensayo de una hipótesis se puede
cometer un error del Tipo I se llama nivel de significación del ensayo. Esta
probabilidad se denota frecuentemente por α; generalmente se fija antes de la
extracción de las muestras, de modo que los resultados obtenidos no influyen
en la elección.
En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01,
aunque igualmente pueden emplearse otros valores.
Si, por ejemplo se elige un nivel de significación del 0.05 ó 5%, al diseñar un
ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que
se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un
95% de confianza de que se toma la decisión adecuada. En tal caso se dice que
la hipótesis ha sido rechazada al nivel de significación del 0.05, lo que significa
que se puede cometer error con una probabilidad de 0.05.
4.1.5. Ensayos referentes a Distribuciones Normales
Para aclarar las ideas anteriores, supóngase que con una hipótesis dada, la
distribución muestral de un estadístico S es una distribución normal con media
y desviación típica . Entonces la distribución de la variable tipificada dada
por
es una normal tipificada (media 0, varianza 1) y se muestra en la Imagen 09.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
44
E-mail: jhnv1977@hotmail.com
Imagen 09
Como se indica en la figura, se puede estar con el 95% de confianza de que, si
la hipótesis es cierta, el valor de z obtenido de una muestra real para el
estadístico S se encontrará entre - 1.96 y 1.96 (puesto que el área bajo la curva
normal entre estos valores es 0.95).
Sin embargo, si al elegir una muestra aleatoria se encuentra que z para ese
estadístico se halla fuera del recorrido - 1.96 a 1.96, lo que quiere decir que es
un suceso con probabilidad de solamente 0.05 (área sombreada de la figura) si
la hipótesis fuese verdadera. Entonces puede decirse que esta z difiere
significativamente de la que cabía esperar bajo esta hipótesis y se estaría
inclinado a rechazar la hipótesis.
El área total sombreada 0.05 es el nivel de significación del ensayo. Representa
la probabilidad de cometer error al rechazar la hipótesis es decir, la
probabilidad de cometer error del Tipo I. Así pues, se dice que la hipótesis se
rechaza al nivel de significación del 0.05 o que la z obtenida del estadístico
muestral dado es significativa al nivel de significación del 0.05.
El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen
lo que se llama región crítica o región de rechazo de la hipótesis o región de
significación. El conjunto de las z que se encuentran dentro del recorrido - 1.96
a 1.96 puede entonces llamarse región de aceptación de la hipótesis o región de
no significación.
De acuerdo con lo dicho hasta ahora, se puede formular la siguiente regla de
decisión o ensayo de hipótesis o significación:
o Se rechaza la hipótesis al nivel de significación del 0.05 si la z obtenida
para el estadístico S se encuentra fuera del recorrido - 1.96 a 1.96 (es decir,
z > 1.96 ó z  - 1.96). Esto equivale a decir que el estadístico muestral
observado es significativo al nivel del 0.05.
o Se acepta la hipótesis (o si se desea no se toma decisión alguna) en caso
contrario.
Debe ponerse de manifiesto que pueden igualmente emplearse otros niveles de
significación.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
45
E-mail: jhnv1977@hotmail.com
Ejemplo 34: Para ensayar la hipótesis de que una moneda está bien hecha, se
toma la siguiente regla de decisión:
o Se acepta la hipótesis si el número de caras en una serie de 100
lanzamientos se encuentra entre 40 y 60, ambos inclusive;
o De otro modo, se rechaza.
(a) Determinar la probabilidad de aceptar la hipótesis y la probabilidad de
rechazar la hipótesis, siendo ésta cierta.
La probabilidad de obtener entre 40 y 60 caras inclusive en 100 lanzamientos
de una moneda, según la distribución binomial, es:
∑
La media y la desviación típica está dado por:
( )
√ ( ) ( )
En una escala discreta, entre 40 y 60 caras inclusive es lo mismo que entre 39.5
y 60.5 caras.
Entonces la probabilidad pedida es = área bajo la curva normal entre z=-2.10 y
z=2.10 = 2(área entre z=0 y z=2.10), dato que es extraído del Apéndice A. Así:
Probabilidad pedida = 2(0.4821) = 0.9642
Entonces la probabilidad de aceptar la hipótesis es de 96.42%, mientras que la
probabilidad de rechazar la hipótesis será:
1-0.9642 = 0.0358 = 3.58%
4.1.6. Ensayos de una y dos colas
En el ensayo anterior se atendía a los valores extremos del estadístico S o su
correspondiente z a ambos lados de la media, es decir, en las dos "colas" de la
distribución. Por esta raz6n, tales ensayos se llaman ensayos de dos colas o
ensayos bilaterales.
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
46
E-mail: jhnv1977@hotmail.com
Sin embargo, con frecuencia se puede estar solamente interesado en los valores
extremos a un solo lado de la media, es decir, en una "cola" de la distribución,
como por ejemplo, cuando se está ensayando la hipótesis de que un proceso es
mejor que otro (que es diferente a ensayar si un proceso es mejor o peor que
otro). Tales ensayos se llaman ensayos de una cola o ensayos unilaterales. En
tales casos, la región crítica es una región a un lado de la distribución, con área
igual al nivel de significación.
La Tabla 06, que da los valores críticos de z para ensayos de una y dos colas a
distintos niveles de significación, será de utilidad para propósitos de referencia.
Valores críticos de z para otros niveles de significación, se pueden encontrar
utilizando la tabla que da las áreas bajo la curva normal.
Nivel de significación α 0.10 0.05 0.01 0.005 0.002
Valores críticos de z para
ensayos unilaterales
-1.28 ó
1.28
-1.645 ó
1.645
-2.33 ó
2.33
-2.58 ó
2.58
-2.88 ó
2.88
Valores críticos de z para
ensayos bilaterales
-1.645 y
1.645
-1.96 y
1.96
-2.58 y
2.58
-2.81 y
2.81
-3.08 y
3.08
Tabla 06
4.1.7. Ensayos relacionados con diferencias de medias y proporciones
La variable tipificada en base a la media muestral ( ̅), la media poblacional
u y la desviación típica de una muestra de tamaño n está dada por:
̅
√
Asimismo, Para ensayar la hipótesis Ho de que una población normal tiene de
media u utilizamos (en muestras pequeñas, n <30)
̅
√
̅
√
La distribución de T sigue una distribución t de Student.
En la diferencia de medias y proporciones muestrales de 2 muestras
grandes de tamaño n1 y n2 extraídas de poblaciones respectivas que tienen de
media y y desviaciones típicas y se puede establecer:
̅ ̅
̅ ̅ √
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
47
E-mail: jhnv1977@hotmail.com
Con la variable tipificada dada por
̅ ̅
̅ ̅
Asimismo
√ ( )
Haciendo:
Con la variable tipificada dada por
Varianzas. Para ensayar la hipótesis H0 de que una población normal tiene
varianza consideramos la variable aleatoria
Que tiene la distribución chi-cuadrado con n-1 grados de libertad.
Ejemplo 35: Se hizo un examen a dos clases formadas por 40 y 50 estudiantes
respectivamente. En la primera clase la puntuación media fue de 74 con una
desviación típica de 8, mientras que en la segunda clase la puntuación media
fue de 78 con una desviación típica de 7. ¿Hay una diferencia significativa
entre el resultado de las dos clases al nivel de significación de 0.05?
Supóngase que las dos clases provienen de dos poblaciones que tienen de
medias respectivas y . Entonces, se tiene que decidir entre las hipótesis:
o H0 : = , y la diferencia se debe simplemente al azar.
o H1 :  , hay una diferencia significativa entre las dos clases.
Bajo la hipótesis H0, ambas clases provienen de la misma población. La media
y la desviación típica de la diferencia de medias están dadas por:
̅ ̅
̅ ̅ √ √
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
48
E-mail: jhnv1977@hotmail.com
Entonces:
̅ ̅
̅ ̅
Por ser un ensayo bilateral, los resultados son significativos al nivel de 0.05 si
Z se encuentra entre -1.96 y 1.96. De aquí se deduce que al nivel de 0.05 hay
una diferencia significativa entre las dos clases y la segunda es probablemente
mejor.
4.1.8. Ensayos relacionados con la Distribución t de Student
Ejemplo 36: En el pasado una máquina ha producido arandelas con un grosor
de 0.050 pulgadas. Para determinar si la máquina sigue en buenas condiciones
de producción, se toma una muestra de 10 arandelas, que resulta tener un
grosor medio de 0.053 pulgadas y una desviación típica de 0.003 pulgadas.
Ensayar la hipótesis de que la máquina está en buenas condiciones de
producción al nivel de significación del 0.05
Se desea decidir entre las hipótesis:
o Ho: u = 0.050, y la máquina se encuentra en buenas condiciones.
o H1: u  0.050, y la máquina no se encuentra en buenas condiciones.
De modo que se requiere un ensayo bilateral.
Bajo la hipótesis H0 se tiene
̅
√ √
Para un ensayo bilateral al nivel de significación del 0.05 se adopta la regla de
decisión:
- Se acepta H0 si t se encuentra en el intervalo –t975 a t975 lo cual para 10-
1=9 grados de libertad es el intervalo -2.26 a 2.26. (Usando Apéndice
C)
- Se rechaza H0 en caso contrario.
Puesto que T=3, se rechaza H0 al nivel de 0.05 de significancia.
4.1.9. Ensayos relacionados con la Distribución chi-Cuadrado
Ejemplo 37: En el pasado la desviación típica de los pesos de ciertos paquetes
de 40.0 onzas, llenados por una máquina era de 0.25 onzas. Una muestra
aleatoria de 20 paquetes dio una desviación típica de 0.32 onzas. ¿Es el
aparente incremento de variabilidad significativa al nivel de significación del
0.05?
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
49
E-mail: jhnv1977@hotmail.com
Hay que decidir entre las dos hipótesis:
o H0:  = 0.25 onzas, y los resultados observados se deben al azar.
o H1:  > 0.25 onzas, y la variabilidad se ha incrementado.
El valor de X2
para la muestra es:
Mediante un ensayo unilateral, se rechaza H0 al nivel de significación del 0.05
si el valor de X2
muestral fuese mayor que .
Utilizando el Apéndice D determinamos para v = 20 -1 = 19 grados de
libertad que es igual a 30.1. Por lo tanto, se rechaza H0 al nivel de significación
del 0.05.
4.2. Curva de ajuste, regresión y correlación
4.2.1. Curva de Ajuste
Muy a menudo en la práctica se encuentra que existe una relación entre dos (o
más) variables, y se desea expresar esta relación en forma matemática
determinando una ecuación que conecte las variables. Un primer paso es la
colección de datos indicando los valores correspondientes de las variables. Por
ejemplo, si x y y denotan la estatura y peso de un adulto; entonces una muestra
de n individuos resultaría en las estaturas x1, x2,.. .,xn y los pesos
correspondientes y1, y2, ... , yn. El paso siguiente es dibujar los puntos (x1,
y1), (x2, y2), …, (xn, yn) en un sistema de coordenadas rectangulares. El
conjunto resultante de puntos se llama a veces diagrama de dispersión.
Del diagrama de dispersión es posible frecuentemente visualizar una curva que
se aproxime a los datos. Dicha curva se llama curva de aproximación. En la
Imagen 10 por ejemplo se observa que los datos se aproximan bien por una
recta y decimos que existe una relación lineal entre las variables.
Sin embargo, en la Imagen 11 aunque existe una relación entre las variables
ésta no es una relación lineal y por esto la llamamos relación no lineal. En la
Imagen 12 parece que no hay ninguna relación entre las variables.
Imagen 10 Imagen 11 Imagen 12
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
50
E-mail: jhnv1977@hotmail.com
El problema general de hallar ecuaciones de curvas de aproximación que se
ajusten a conjuntos de datos dados se denomina curva de ajuste. En la práctica
el tipo de ecuación se sugiere frecuentemente del diagrama de dispersión. Así
para la Imagen 10 podríamos utilizar una recta
Mientras que para la Imagen 11 ensayaríamos una curva cuadrática o
parabólica
Uno de los propósitos principales de la curva de ajuste es estimar una de las
variables (Variable dependiente) de la otra (la variable independiente). El
proceso de estimación se conoce como regresión. Si y se va a estimar a partir
de x por medio de alguna ecuación la llamamos ecuación de regresión de y
sobre x y a la curva correspondiente curva de regresión de y sobre x.
4.2.2. Método de mínimos cuadrados
Definición. De todas las curvas de aproximación de un conjunto de puntos de
datos dados, la curva que tenga la propiedad de que
es la mejor curva de ajuste.
Una curva con esta propiedad se dice que ajusta los datos en el sentido de
mínimos cuadrados y se llama curva de regresión de mínimos cuadrados o
simplemente curva de mínimos cuadrados. Por lo tanto una recta con esta
propiedad se llama recta de mínimos cuadrados, una parábola con esta
propiedad se llama parábola de mínimos cuadrados, etc.
Empleando la definición anterior podemos demostrar que la recta de mínimos
cuadrados de aproximación al conjunto de datos (x1, y1), ..., (xn, yn) tiene la
ecuación
donde las constantes a y b están dadas por
∑ ∑ ∑ ∑
∑ ∑
∑ ∑ ∑
∑ ∑
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
51
E-mail: jhnv1977@hotmail.com
4.2.3. Recta de Mínimos cuadrados en términos de varianzas y covarianzas
muestrales
Las varianzas y covarianzas muestrales de x, y están dadas por
∑ ̅ ∑ ̅ ∑ ̅ ̅
En términos de éstas, las rectas de regresión de mínimos cuadrados de y sobre x
y de x sobre y pueden escribirse respectivamente como
̅ ̅ ̅ ̅
4.2.4. Error típico de la estima
√
∑
Ejemplo 38: Ajustar una recta de mínimos cuadrados a los datos de la Tabla 07
x 1 3 4 6 8 9 11 14
y 1 2 4 4 5 7 8 9
Tabla 07
Se grafican los puntos y se puede observar que la tendencia de los puntos es lineal,
como se puede apreciar en la Imagen 13
Imagen 13: Gráfica de los puntos
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10 12 14 16
Estadística y probabilidad aplicada a la Educación
Docente: Ing. Johan Herbert Narro Vargas
52
E-mail: jhnv1977@hotmail.com
La ecuación de la recta estará dada por
Se reordenan los datos en la siguiente Tabla 08, los mismos que servirán para calcular
los valores de a y b.
x y xy
1 1 1 1 1
3 2 9 6 4
4 4 16 16 16
6 4 36 24 16
8 5 64 40 25
9 7 81 63 49
11 8 121 88 64
14 9 196 126 81
∑ 56 40 524 364 256
Tabla 08
Así
∑ ∑ ∑ ∑
∑ ∑
∑ ∑ ∑
∑ ∑
Por lo tanto la recta de mínimos cuadrados será:
Estadistica 01
Estadistica 01
Estadistica 01
Estadistica 01
Estadistica 01
Estadistica 01

Más contenido relacionado

La actualidad más candente

Ejercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasEjercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasJaviera Huera (Temuco)
 
Modelo de transporte
Modelo de transporteModelo de transporte
Modelo de transporteVero_alex
 
Dist. normal
Dist. normalDist. normal
Dist. normalmaryorysp
 
RENNY MENDOZA Resolucion ejercicios dist normal
 RENNY MENDOZA  Resolucion ejercicios dist normal RENNY MENDOZA  Resolucion ejercicios dist normal
RENNY MENDOZA Resolucion ejercicios dist normalrennyjse
 
Ejercicios programacion lineal
Ejercicios programacion linealEjercicios programacion lineal
Ejercicios programacion linealJose Perez
 
Ejemplo distribucion normal
Ejemplo distribucion normalEjemplo distribucion normal
Ejemplo distribucion normaldavid silva
 
Cinco ejemplos de aplicación de las distribuciones de probabilidad.
Cinco ejemplos de aplicación de las distribuciones de probabilidad.Cinco ejemplos de aplicación de las distribuciones de probabilidad.
Cinco ejemplos de aplicación de las distribuciones de probabilidad.leonardo19940511
 
339020420 estrategia-de-distribucion-de-instalaciones
339020420 estrategia-de-distribucion-de-instalaciones339020420 estrategia-de-distribucion-de-instalaciones
339020420 estrategia-de-distribucion-de-instalacionesCarlosLeverman
 
Modelos matematicos simulacion
Modelos matematicos simulacionModelos matematicos simulacion
Modelos matematicos simulacionAlejő Ibañez
 
Tarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestasTarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestasIPN
 
Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Luz Hernández
 
Ejercicios de distribucion normal estandar
Ejercicios de distribucion normal estandarEjercicios de distribucion normal estandar
Ejercicios de distribucion normal estandarNathywiiz Hernández
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...IPN
 
50 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx150 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx1Juan Zaruma
 
Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Luz Hernández
 

La actualidad más candente (20)

Ejercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasEjercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
 
Modelo de transporte
Modelo de transporteModelo de transporte
Modelo de transporte
 
Dist. normal
Dist. normalDist. normal
Dist. normal
 
Principios de estadística
Principios de estadísticaPrincipios de estadística
Principios de estadística
 
Varianza y covarianza
Varianza y covarianzaVarianza y covarianza
Varianza y covarianza
 
RENNY MENDOZA Resolucion ejercicios dist normal
 RENNY MENDOZA  Resolucion ejercicios dist normal RENNY MENDOZA  Resolucion ejercicios dist normal
RENNY MENDOZA Resolucion ejercicios dist normal
 
Ejercicios programacion lineal
Ejercicios programacion linealEjercicios programacion lineal
Ejercicios programacion lineal
 
Ejemplo distribucion normal
Ejemplo distribucion normalEjemplo distribucion normal
Ejemplo distribucion normal
 
Cinco ejemplos de aplicación de las distribuciones de probabilidad.
Cinco ejemplos de aplicación de las distribuciones de probabilidad.Cinco ejemplos de aplicación de las distribuciones de probabilidad.
Cinco ejemplos de aplicación de las distribuciones de probabilidad.
 
339020420 estrategia-de-distribucion-de-instalaciones
339020420 estrategia-de-distribucion-de-instalaciones339020420 estrategia-de-distribucion-de-instalaciones
339020420 estrategia-de-distribucion-de-instalaciones
 
Modelos matematicos simulacion
Modelos matematicos simulacionModelos matematicos simulacion
Modelos matematicos simulacion
 
Tarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestasTarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestas
 
Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)
 
2 distribución de probabilidad discreta
2 distribución de probabilidad discreta2 distribución de probabilidad discreta
2 distribución de probabilidad discreta
 
Ejercicios de distribucion normal estandar
Ejercicios de distribucion normal estandarEjercicios de distribucion normal estandar
Ejercicios de distribucion normal estandar
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
 
50 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx150 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx1
 
Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02
 
Sesgo
SesgoSesgo
Sesgo
 
Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)
 

Similar a Estadistica 01

Investigación sobre el uso de la tecnologia en los centros educativos
Investigación sobre el uso de la tecnologia en los centros educativosInvestigación sobre el uso de la tecnologia en los centros educativos
Investigación sobre el uso de la tecnologia en los centros educativosMaritza Rodríguez Ureña
 
Proyecto completo
Proyecto completoProyecto completo
Proyecto completomaxximuss2
 
Bosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidadBosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidadTony Galvez
 
Bosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidadBosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidadKaren Cideos
 
Marcogeneral
MarcogeneralMarcogeneral
Marcogeneralbrondovic
 
Marcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los nivelesMarcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los nivelesAna María Zima
 
Marcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los nivelesMarcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los nivelesAna María Zima
 
Diagnóstico nacional de juventudes borrador preliminar 2011
Diagnóstico nacional de juventudes borrador preliminar 2011Diagnóstico nacional de juventudes borrador preliminar 2011
Diagnóstico nacional de juventudes borrador preliminar 2011Marvin Torres
 
Trabajo practico final_Desarrollo de Productos_ByE_2015
Trabajo practico final_Desarrollo de Productos_ByE_2015Trabajo practico final_Desarrollo de Productos_ByE_2015
Trabajo practico final_Desarrollo de Productos_ByE_2015Oswald Sánchez
 
El salvador-informe-final
El salvador-informe-finalEl salvador-informe-final
El salvador-informe-finalAndre Posada
 
Universidad técnica de machala proyecto de bio
Universidad técnica de machala proyecto de bio Universidad técnica de machala proyecto de bio
Universidad técnica de machala proyecto de bio Kevin Noles
 
RELACIONES ECONÓMICAS INTERNACIONALES
RELACIONES ECONÓMICAS INTERNACIONALESRELACIONES ECONÓMICAS INTERNACIONALES
RELACIONES ECONÓMICAS INTERNACIONALESMAGNO CARDENAS
 
Las políticas fiscales y su impacto en el bienestar social
Las políticas fiscales y su impacto en el bienestar socialLas políticas fiscales y su impacto en el bienestar social
Las políticas fiscales y su impacto en el bienestar socialRafael Verde)
 
NUTRICIÓN DEL INDIVIDUO SANO
NUTRICIÓN DEL INDIVIDUO SANONUTRICIÓN DEL INDIVIDUO SANO
NUTRICIÓN DEL INDIVIDUO SANOLuciano Renteria
 

Similar a Estadistica 01 (20)

Tesis vinculación universidad empresa en honduras (octubre 2012)
Tesis vinculación universidad  empresa en honduras (octubre 2012)Tesis vinculación universidad  empresa en honduras (octubre 2012)
Tesis vinculación universidad empresa en honduras (octubre 2012)
 
Investigación sobre el uso de la tecnologia en los centros educativos
Investigación sobre el uso de la tecnologia en los centros educativosInvestigación sobre el uso de la tecnologia en los centros educativos
Investigación sobre el uso de la tecnologia en los centros educativos
 
Proyecto completo
Proyecto completoProyecto completo
Proyecto completo
 
Bosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidadBosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidad
 
Bosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidadBosques tropicales y_biodiversidad
Bosques tropicales y_biodiversidad
 
Marcogeneral
MarcogeneralMarcogeneral
Marcogeneral
 
Marcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los nivelesMarcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los niveles
 
Marcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los nivelesMarcogeneral politica curricular todos los niveles
Marcogeneral politica curricular todos los niveles
 
Diagnóstico nacional de juventudes borrador preliminar 2011
Diagnóstico nacional de juventudes borrador preliminar 2011Diagnóstico nacional de juventudes borrador preliminar 2011
Diagnóstico nacional de juventudes borrador preliminar 2011
 
plan de mercadeo y comunicaciones
plan de mercadeo y comunicacionesplan de mercadeo y comunicaciones
plan de mercadeo y comunicaciones
 
Trabajo practico final_Desarrollo de Productos_ByE_2015
Trabajo practico final_Desarrollo de Productos_ByE_2015Trabajo practico final_Desarrollo de Productos_ByE_2015
Trabajo practico final_Desarrollo de Productos_ByE_2015
 
El salvador-informe-final
El salvador-informe-finalEl salvador-informe-final
El salvador-informe-final
 
Universidad técnica de machala proyecto de bio
Universidad técnica de machala proyecto de bio Universidad técnica de machala proyecto de bio
Universidad técnica de machala proyecto de bio
 
RELACIONES ECONÓMICAS INTERNACIONALES
RELACIONES ECONÓMICAS INTERNACIONALESRELACIONES ECONÓMICAS INTERNACIONALES
RELACIONES ECONÓMICAS INTERNACIONALES
 
Comercialización de sabila el rosario
Comercialización de sabila  el rosarioComercialización de sabila  el rosario
Comercialización de sabila el rosario
 
Las políticas fiscales y su impacto en el bienestar social
Las políticas fiscales y su impacto en el bienestar socialLas políticas fiscales y su impacto en el bienestar social
Las políticas fiscales y su impacto en el bienestar social
 
Infocomunicación en la Gestión Docente
Infocomunicación en la Gestión DocenteInfocomunicación en la Gestión Docente
Infocomunicación en la Gestión Docente
 
En el mundo desde nuestro mundo
En el mundo desde nuestro mundoEn el mundo desde nuestro mundo
En el mundo desde nuestro mundo
 
Jeca pis
Jeca pisJeca pis
Jeca pis
 
NUTRICIÓN DEL INDIVIDUO SANO
NUTRICIÓN DEL INDIVIDUO SANONUTRICIÓN DEL INDIVIDUO SANO
NUTRICIÓN DEL INDIVIDUO SANO
 

Último

Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfedsonzav8
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfAntonioGonzalezIzqui
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones025ca20
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
PPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdfPPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdfalexquispenieto2
 
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptxguillermosantana15
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacajeremiasnifla
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7luisanthonycarrascos
 
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)ssuser563c56
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxbingoscarlet
 
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfReporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfMikkaelNicolae
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTFundación YOD YOD
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfDanielaVelasquez553560
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdfvictoralejandroayala2
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfyoseka196
 
Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxEverardoRuiz8
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdfFernandaGarca788912
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMarceloQuisbert6
 
Seleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSeleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSaulSantiago25
 
Residente de obra y sus funciones que realiza .pdf
Residente de obra y sus funciones que realiza  .pdfResidente de obra y sus funciones que realiza  .pdf
Residente de obra y sus funciones que realiza .pdfevin1703e
 

Último (20)

Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdf
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
PPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdfPPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdf
 
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpaca
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7
 
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptx
 
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfReporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NIST
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdf
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdf
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdf
 
Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptx
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdf
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principios
 
Seleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusiblesSeleccion de Fusibles en media tension fusibles
Seleccion de Fusibles en media tension fusibles
 
Residente de obra y sus funciones que realiza .pdf
Residente de obra y sus funciones que realiza  .pdfResidente de obra y sus funciones que realiza  .pdf
Residente de obra y sus funciones que realiza .pdf
 

Estadistica 01

  • 1. UNIVERSIDAD CATÓLICA DE TRUJILLO BENEDICTO XVI Programa de Complementación Académica Asignatura: ESTADÍSTICA Y PROBABILIDAD APLICADA A LA EDUCACIÓN Ing. JOHAN HERBERT NARRO VARGAS Trujillo, Perú 2013 UNIVERSIDAD CATÓLICA DE TRUJILLO BENEDICTO XVI
  • 2. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas ii E-mail: jhnv1977@hotmail.com AUTORIDADES UNIVERSITARIAS Gran Canciller y Fundador de la UCT: Mons. Dr. Héctor Miguel Cabrejos Vidarte, OFM. Vice Gran Canciller: Rvdo Padre Francisco Castro Lalupú. Rector: Dr. Alcibíades Helí Miranda Chávez. Vicerrector Académico: Mg. José Andrés Cruzado Albarrán. Gerente General: Rvdo Padre César Lázaro Lescano. Delegado de la Asociación Civil ante la UCT: Mons. Ricardo Exequiel Angulo Bazauri Gerente de Administración y Finanzas: Ing. Marco Antonio Dávila Cabrejos. Secretario General: Lic. Jorge Isaac Manrique Catalán FACULTAD DE HUMANIDADES Decano: Dr. José Theódulo Esquivel Grados. PROGRAMA DE COMPLEMENTACIÓN ACADÉMICA Director General: Mg. José Andrés Cruzado Albarrán. .
  • 3. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas iii E-mail: jhnv1977@hotmail.com Contenidos Presentación ............................................................................................................................................ 1 Capítulo I: Conceptos y Generalidades................................................................................................... 2 1.1. Aspectos generales de Estadística ........................................................................................... 2 1.1.1. Definición de Estadística................................................................................................. 2 1.1.2. Áreas del Análisis Estadístico ......................................................................................... 2 1.1.3. Población......................................................................................................................... 4 1.1.4. Muestra............................................................................................................................ 4 1.1.5. Variable ........................................................................................................................... 5 1.2. Obtención de información....................................................................................................... 5 1.2.1. Muestreo.......................................................................................................................... 6 1.2.2. Muestreo No Probabilístico............................................................................................. 6 1.2.3. Muestreo Probabilístico................................................................................................... 7 1.3. Tablas de frecuencia................................................................................................................ 9 1.4. Gráficos estadísticos.............................................................................................................. 11 1.4.1. Barras............................................................................................................................. 12 1.4.2. Histogramas y Polígonos de frecuencias....................................................................... 12 1.4.3. Circulares....................................................................................................................... 13 1.4.4. Barras subliminales ....................................................................................................... 13 1.4.5. Pictogramas ................................................................................................................... 13 Ejercicios del Capítulo I................................................................................................................ 14 Capítulo II: Medidas Resúmenes .......................................................................................................... 16 2.1. Medidas de Posición.............................................................................................................. 16 2.1.1. Media aritmética............................................................................................................ 16 2.1.2. Mediana......................................................................................................................... 17 2.1.3. Moda.............................................................................................................................. 19 2.1.4. Percentiles ..................................................................................................................... 20 2.2. Medidas de Dispersión.......................................................................................................... 20 2.2.1. Desviación Media.......................................................................................................... 20 2.2.2. Varianza y Desviación típica......................................................................................... 22 2.2.3. Coeficiente de variación y asimetría de Pearson........................................................... 24 Ejercicios del Capítulo II............................................................................................................... 25 Capítulo III: Probabilidad...................................................................................................................... 26
  • 4. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas iv E-mail: jhnv1977@hotmail.com 3.1. Conjuntos y Probabilidad ...................................................................................................... 26 3.1.1. Generalidades de Conjuntos.......................................................................................... 26 3.1.2. Operaciones con Conjuntos........................................................................................... 27 3.1.3. Experimentos aleatorios ................................................................................................ 29 3.1.4. Espacio muestral............................................................................................................ 29 3.1.5. Probabilidad, axiomas y teoremas................................................................................. 30 3.1.6. Probabilidad Condicional.............................................................................................. 31 3.1.7. Sucesos Independientes................................................................................................. 32 3.1.8. Teorema de Bayes ......................................................................................................... 32 3.1.9. Análisis Combinatorio................................................................................................... 32 3.2. Variables Aleatorias y distribuciones de probabilidad.......................................................... 34 3.2.1. Variable aleatoria .......................................................................................................... 34 3.2.2. Distribución de Probabilidad discreta ........................................................................... 35 3.2.3. Función de Distribución discreta................................................................................... 35 3.2.4. Distribución de Probabilidad continua .......................................................................... 36 3.2.5. Función de Distribución continua ................................................................................. 37 3.3. Varianza y desviación típica de variables aleatorias ............................................................. 37 3.3.1. Varianza y desviación típica de una VA discreta.......................................................... 37 3.3.2. Varianza y desviación típica de una VA continua......................................................... 37 3.4. Distribuciones de Probabilidad con nombre Propio.............................................................. 38 3.4.1. Distribución Binomial o de Bernoulli ........................................................................... 38 3.4.2. Distribución Normal...................................................................................................... 38 3.4.3. Distribución de Poisson................................................................................................. 39 3.4.4. Distribución Hipergeométrica ....................................................................................... 39 3.4.5. Distribución Chi-Cuadrado ........................................................................................... 39 3.4.6. Distribución t de Student............................................................................................... 39 Ejercicios del Capítulo III ............................................................................................................. 40 Capítulo IV: Estadísticos para la prueba de Hipótesis .......................................................................... 42 4.1. Ensayos de Hipótesis y significación .................................................................................... 42 4.1.1. Decisiones Estadísticas.................................................................................................. 42 4.1.2. Hipótesis estadísticas. Hipótesis nula............................................................................ 42 4.1.3. Errores de Tipo I y Tipo II ............................................................................................ 43 4.1.4. Nivel de significación.................................................................................................... 43 4.1.5. Ensayos referentes a Distribuciones Normales ............................................................. 43
  • 5. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas v E-mail: jhnv1977@hotmail.com 4.1.6. Ensayos de una y dos colas ........................................................................................... 45 4.1.7. Ensayos relacionados con diferencias de medias y proporciones ................................. 46 4.1.8. Ensayos relacionados con la Distribución t de Student................................................. 48 4.1.9. Ensayos relacionados con la Distribución chi-Cuadrado .............................................. 48 4.2. Curva de ajuste, regresión y correlación ............................................................................... 49 4.2.1. Curva de Ajuste............................................................................................................. 49 4.2.2. Método de mínimos cuadrados...................................................................................... 50 4.2.3. Recta de Mínimos cuadrados en términos de varianzas y covarianzas muestrales ....... 51 4.2.4. Error típico de la estima ................................................................................................ 51 Ejercicios del Capítulo IV ............................................................................................................. 53 Apéndice A............................................................................................................................................ 54 Apéndice B............................................................................................................................................ 55 Apéndice C............................................................................................................................................ 56 Apéndice D............................................................................................................................................ 57 Referencias............................................................................................................................................ 58
  • 6. Presentación Permanentemente recibimos información referente al área en que trabajamos y es necesario hacer uso de ella, puesto que será útil para el proyecto en que deseemos embarcarnos. La información es importante para la toma de decisiones en muchos problemas. Para esto necesitamos un procesamiento adecuado de los datos que nos permita obtener conclusiones certeras. En caso contrario, si no se aplica un buen procesamiento, es posible que en base a los resultados tomemos una mala decisión. La estadística es un campo del conocimiento que permite al investigador deducir y evaluar conclusiones acerca de una población a partir de información proporcionada por una muestra. Específicamente, la estadística trata de teoremas, herramientas, métodos y técnicas que se pueden usar en: Recolección, selección y clasificación de datos; Interpretación y análisis de datos; Deducción y evolución de conclusiones y de su confiabilidad, basada en datos muéstrales. Los métodos de la estadística fueron desarrollados para el análisis de datos muestreados, así como para propósitos de inferencia sobre la población de la que se seleccionó la muestra. La estadística como ciencia, cubre un extenso campo donde poder aplicarla. Se divide en: estadística descriptiva y estadística inferencial, que desempeñan funciones distintivas, pero complementarias en el análisis. Es importante que todo profesional que utilice la estadística como herramienta auxiliar de trabajo, posea un mínimo de conocimientos y habilidades prácticas en aquellas técnicas que le facilitarán el buen desarrollo de esta actividad. El presente módulo tiene como objetivo general dar a conocer de forma concisa los teoremas, herramientas, métodos y técnicas necesarios para el correcto análisis de los datos y que nos permita obtener correctos resultados. Para ello se han estructurado los contenidos en cuatro capítulos. El primer capítulo trata sobre definición, historia y tipos de Estadística, así como los conceptos de los términos a ser utilizados, terminando el capítulo con tablas de frecuencia y gráficos estadísticos. El segundo capítulo tratará sobre estadígrafos de posición y dispersión, mientras que el tercer capítulo estará dedicado a las probabilidades. En el cuarto capítulo concluiremos con el estudio de ensayos de hipótesis y significación. El Autor.
  • 7. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 2 E-mail: jhnv1977@hotmail.com Capítulo I: Conceptos y Generalidades La educación es un factor crucial de desarrollo social y económico, así como un factor esencial para la cohesión social, el diseño de políticas educativas exige que los actores involucrados en las mismas tengan acceso a información pertinente, confiable y valida. Es aquí donde la estadística educativa empieza a ser de gran importancia para la educación porque mediante la interpretación de los datos se elaboran los objetivos del sector educativo, se diseñan los proyectos y/o programas y, asignan las responsabilidades de cada componente del sistema educativo del país. Mediante un análisis cuantitativo podemos conocer el sistema escolarizado, las escuelas, alumnos, personal docente y administrativo e indicadores, describir los movimientos y el aprovechamiento de los alumnos por nivel educativo, sostenimiento y modalidad con representaciones gráficas, tanto a nivel país como por regiones; también se registrar los principales indicadores de retención, deserción, aprobación, reprobación y eficiencia terminal, lo que permite conocer la situación de cada una de las regiones en materia educativa, así como también, identificar cuáles presentan indicadores deficientes y qué regiones alcanzaron mejores resultados. 1.1. Aspectos generales de Estadística Resulta importante conocer los fundamentos básicos de la estadística, ya que constituye una excelente herramienta de trabajo que nos permitirá conocer de manera certera datos sobre los cuales tomar decisiones y así seguir progresando. 1.1.1. Definición de Estadística La estadística es una rama de la matemática que se refiere a la recolección, análisis e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales. 1.1.2. Áreas del Análisis Estadístico Describiremos brevemente cada una de las áreas en que puede dividirse el análisis estadístico: a. Diseño: Planeamiento y desarrollo de investigaciones. b. Descripción: Resumen y exploración de datos. c. Inferencia: Hacer predicciones o generalizaciones acerca de características de una población en base a la información de una muestra de la población.
  • 8. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 3 E-mail: jhnv1977@hotmail.com a. Diseño Es una actividad crucial. Consiste en definir como se desarrollará la investigación para dar respuesta a las preguntas que motivaron la misma. La recolección de los datos requiere en general de un gran esfuerzo, por lo que, dedicar especial cuidado a la etapa de planificación de la investigación ahorra trabajo en las siguientes etapas. Un estudio bien diseñado resulta simple de analizar y las conclusiones suelen ser obvias. Un experimento pobremente diseñado o con datos inapropiadamente recolectados o registrados puede ser incapaz de dar respuesta a las preguntas que motivaron la investigación, más allá de lo sofisticado que sea el análisis estadístico. Aún en los casos en que se estudian datos ya registrados, en que estamos restringidos a la información existente, los principios del buen diseño de experimentos, pueden ser útiles para ayudar a seleccionar un conjunto razonable de datos que esté relacionado con el problema de interés. b. Descripción Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos ayudan a presentar los datos de modo tal que sobresalga su estructura. Hay varias formas simples e interesantes de organizar los datos en gráficos que permiten detectar tanto las características sobresalientes como las características inesperadas. El otro modo de describir los datos es resumirlos en uno o dos números que pretenden caracterizar el conjunto con la menor distorsión o pérdida de información posible. Explorar los datos, debe ser la primera etapa de todo análisis de datos. ¿Por qué no analizarlos directamente? En primer lugar porque las computadoras no son demasiado hábiles (sólo son rápidas), hacen aquello para lo que están programadas y actúan sobre los datos que les ofrecemos. Datos erróneos o inesperados serán procesados de modo inapropiado y ni usted, ni la computadora se darán cuenta a menos que realice previamente un análisis exploratorio de los datos. c. Inferencia Inferencia Estadística hace referencia a un conjunto de métodos que permiten hacer predicciones acerca de características de un fenómeno sobre la base de información parcial acerca del mismo. Los métodos de la inferencia nos permiten proponer el valor de una cantidad desconocida (estimación) o decidir entre dos teorías contrapuestas cuál de ellas explica mejor los datos observados (test de hipótesis). El fin último de cualquier estudio es aprender sobre las poblaciones. Pero es usualmente necesario, y más práctico, estudiar solo una muestra de cada una de las poblaciones.
  • 9. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 4 E-mail: jhnv1977@hotmail.com 1.1.3. Población Es el conjunto de todos los elementos (individuos) que presentan una característica común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se puede estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por ejemplo, familias, fábricas, empresas, etc.). Las características de la población se resumen en valores llamados parámetros. 1.1.4. Muestra Muestra es un subconjunto, extraído de la población (mediante técnicas de muestreo), cuyo estudio sirve para inferir características de toda la población. Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente: Donde:  n: es el tamaño de la muestra.  z: es es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de z más utilizados y sus niveles de confianza son: Valor de k 1,15 1,28 1,44 1,65 1,96 2,24 2,58 Nivel de confianza 75% 80% 85% 90% 95% 97,5% 99%  e: es el error muestral deseado. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la población y el que obtendríamos si preguntáramos al total de ella. Ejemplo: si los resultados de una encuesta dicen que 100 personas comprarían un producto y tenemos un error muestral del 5%, entonces comprarán el producto entre 95 y 105 personas.  p: es la proporción de individuos que poseen en la población la característica de estudio. Este dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opción más segura. Si el tamaño de la población es pequeño, entonces el tamaño de la muestra se tendrá que reajustar de acuerdo a la siguiente fórmula:
  • 10. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 5 E-mail: jhnv1977@hotmail.com Donde:  n´: Tamaño de la muestra necesario, reajustado.  n: Tamaño de la muestra según la primera fórmula.  N: Tamaño de la población. 1.1.5. Variable Se llama variable a una característica que se observa en una población o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Una variable se puede clasificar de la siguiente manera: a. Variable cuantitativa: es aquella que toma valores numéricos. Dentro de ella, se subdividen en:  Continua: son valores reales. Pueden tomar cualquier valor dentro de un intervalo. Ej. Peso, estatura, sueldos.  Discreta: toma valores enteros. Ej. N° de hijos de una familia, n° de alumnos de un curso. b. Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen en:  Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por una marca, sexo, lugar de residencia.  Ordinal: son cualidades que representan un orden y jerarquía. Ej. Nivel educacional, días de la semana, calidad de la atención, nivel socioeconómico. 1.2. Obtención de información Los datos son generalmente imperfectos en el sentido que aun cuando posean información útil no nos cuentan la historia completa. Es necesario contar con métodos que nos permitan extraer información a partir de los datos observados para comprender mejor las situaciones que los mismos representan. Algunas técnicas de análisis de datos son sorprendentemente simples de aprender y usar más allá del hecho que la teoría matemática que las sustentan puede ser muy complejo. Todos, aún los estadísticos, tenemos problemas al enfrentarnos con listados de datos. Existen muchos métodos estadísticos cuyo propósito es ayudarnos a poner de manifiesto las características sobresalientes e interesantes de nuestros datos que pueden ser usados en casi todas las áreas del conocimiento. Los métodos estadísticos pueden y deberían ser usados en todas las etapas de una investigación, desde el comienzo hasta el final. Existe el convencimiento de que la estadística trata con el ANÁLISIS DE DATOS (quizás porque esta es la contribución
  • 11. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 6 E-mail: jhnv1977@hotmail.com más visible de la estadística), pero este punto de vista excluye aspectos vitales relacionados con el DISEÑO DE LAS INVESTIGACIONES. Es importante tomar conciencia que la elección del método de análisis para un problema, se basa tanto en el tipo de datos disponibles como en la forma en que fueron recolectados. 1.2.1. Muestreo En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta. Los errores más comunes que se pueden cometer son:  Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error de muestreo.  Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomó la muestra. Error de Inferencia. Recordar: En estadística se usa la palabra población para referirse no sólo a personas sino a todos los elementos que han sido escogidos para su estudio y el término muestra se usa para describir una porción escogida de la población. 1.2.2. Muestreo No Probabilístico A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.
  • 12. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 7 E-mail: jhnv1977@hotmail.com Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos: a. Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. b. Muestreo intencional o de conveniencia: Éste tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad o colegios emplean con mucha frecuencia a sus propios alumnos). c. Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc. d. Muestreo Discrecional: A criterio del investigador los elementos son elegidos sobre los que él cree que pueden aportar al estudio. 1.2.3. Muestreo Probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de
  • 13. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 8 E-mail: jhnv1977@hotmail.com una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: a. Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. b. Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos. c. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra.
  • 14. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 9 E-mail: jhnv1977@hotmail.com Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:  Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.  Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.  Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación. d. Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. 1.3. Tablas de frecuencia La estadística descriptiva o análisis exploratorio de datos ofrece modos de presentar y evaluar las características principales de los datos a través de tablas, gráficos y medidas resúmenes. El modo más simple de presentar datos categóricos es por medio de una tabla de frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una de las clases de la variable cualitativa.
  • 15. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 10 E-mail: jhnv1977@hotmail.com Cuando los datos estadísticos de que se dispone son numerosos, es difícil realizar cálculos sobre ellos. Por esta razón se organizan en tablas de manera de facilitar el trabajo. Una tabla de frecuencia es la ordenación de la información obtenida de una muestra, en el estudio de una sola variable. Cuando se dispone de un gran número de datos, es útil distribuirlos en categorías dentro de una tabla para facilitar el análisis. Se explicara con un ejemplo: Ejemplo 01: en una encuesta de presupuesto familiar, se ha obtenido la siguiente información respecto al número de hijos en 21 familias: 3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3 Variable X: Número de hijos Observamos que la variable X toma valores entre 0 y 4, es decir existen en éste grupo 5 categorías o clases. Contamos el número de familias en cada categoría y construimos la tabla Clase Xi Frecuencia fi Frec. Acumulada Fi=fi-1+fi Frec. Relativa hi=fi/n Frec. Rel. Acum. Hi=hi-1+hi 0 2 0+2=2 2/21=0.095 0+0.095=0.095 1 4 2+4=6 4/21=0.190 0.095+0.190=0.286 2 7 6+7=13 7/21=0.333 0.286+0.333=0.619 3 6 13+6=19 6/21=0.286 0.619+0.286=0.905 4 2 19+2=21 2/21=0.095 0.905+0.095=1 Total n = 21 1 Tabla 01: Distribución de frecuencias de la variable X, número de hijos por familia. Observamos algunos detalles importantes: o n es la suma de la columna fi, es decir, siempre debe dar como resultado el tamaño de la muestra. o En la columna de frecuencia absoluta acumulada se va sumando los valores de la columna fi, por lo tanto el último valor debe ser igual a n. o La columna frecuencia relativa (hi) representa en % de familias en cada categoría. Por ejemplo, en la categorías con 3 hijos a un 28.6% de familias. Esta columna debe sumar 1. o La Hi acumula los valores de la frecuencia relativa, por lo tanto el último valor debe ser 1. Ejemplo H4: el 90.5% de las familias encuestadas tienen a los más 3 hijos.
  • 16. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 11 E-mail: jhnv1977@hotmail.com En el caso de analizar una variable continua, la tabla de frecuencia cambia sólo en el comienzo. También se verá en un ejemplo: Ejemplo 02: Salarios semanales de 40 personas en nuevos soles: 90 62 102 85 92 106 110 95 105 112 108 86 110 68 118 99 98 74 91 80 80 100 79 93 93 104 77 106 98 73 95 85 91 83 67 119 108 115 74 88 Se efectúan los siguientes pasos: a. Se buscan los valores mínimo (Xmin=……) y máximo (Xmax=……) b. Se calcula el rango (R). R = Xmax - Xmin = …… - ……. = …… c. La cantidad de intervalos no debe ser menor de 5 ni mayor de 18. Por lo general tiene el mismo ancho. Una forma de calcular el nº de intervalos para generar la tabla de frecuencias es mediante la siguiente formula: k = 1 + 3.322log(n). Para nuestro ejemplo entonces el número de intervalos “k” será: k = 1 + 3.322log(……) k = ……. d. Se calcula la amplitud de cada intervalo c = R / k. Para nuestro caso será: c = … e. Se construye la tabla: Intervalos [Xinf – Xsup> Marca de Clase fi Fi hi Hi 61 - . . - 121 Total Tabla 02: Distribución de frecuencias de la variable X, salarios semanales 1.4. Gráficos estadísticos En este apartado presentaremos formas simples de resumir y representar gráficamente conjuntos de datos. El objetivo de construir gráficos es poder apreciar los datos como un todo e identificar sus características sobresalientes. El tipo de gráfico a seleccionar depende del tipo de variable que nos interese representar por esa razón distinguiremos en la presentación gráficos para variables categóricas y para variables numéricas.
  • 17. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 12 E-mail: jhnv1977@hotmail.com 1.4.1. Barras Se construye sobre el sistema de ejes cartesianos. Es un procedimiento gráfico para representar los datos nominales u ordinales. Para cada categoría se traza una barra vertical en que la altura es la frecuencia absoluta de la categoría. El ancho de la barra es arbitrario. Imagen 02: Gráfico de barras También se utiliza si la variable en estudio es numérica discreta. 1.4.2. Histogramas y Polígonos de frecuencias Se construyen sobre el sistema de coordenadas cartesianas. Se utiliza cuando la variable en estudio es continua o esta agrupada en una tabla de frecuencia con intervalos en cada categoría. En el eje X se identifica la variable en estudio y en el eje Y sé gráfica la frecuencia absoluta o la frecuencia relativa. Consiste en una serie de rectángulos en donde su altura depende del valor de cada frecuencia. Cada categoría de la variable se representa por una barra. El ancho de cada barra depende de la amplitud del intervalo. Tomando como referencia los datos del ejemplo 02, se tiene el siguiente gráfico: Imagen 02: Polígono de frecuencias 0 20 40 60 80 100 120 140 1 2 3 4 5 6 0 2 4 6 8 10 12 56 66 76 86 96 106 116 126 frecuencia Salario semanal en S/.
  • 18. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 13 E-mail: jhnv1977@hotmail.com El polígono se gráfica uniendo la punta superior de cada barra por segmento de recta. Para que el polígono quede cerrado se considera un punto en la recta horizontal, antes y después de las anotadas. 1.4.3. Circulares Esta es otra forma de representar los datos, en especial cuando se trata de cualidades. En un gráfico dibujado dentro de un círculo. Es necesario en primer lugar calcular el porcentaje de cada categoría respecto del total y luego repartir proporcionalmente estos porcentajes en los 360° del círculo. Imagen 03: Gráfico de torta 1.4.4. Barras subliminales Es un gráfico de barras muy apropiado para comprobar subdivisiones en la variable. Por ejemplo: % de estudiantes en diferentes carreras, separadas por sexo. Cada barra es un 100%. 100% 80% 60% Hombres 40% Mujeres 20% 0% A B C D Imagen 04: Barras subliminales 1.4.5. Pictogramas Un pictograma es la representación de datos estadísticos por medio de símbolos que por su forma sugieren la naturaleza del dato. Así: podemos representar el número de conferencias realizadas por las Universidades A (100 conferencias) y B (40 conferencias). Imagen 05: Pictograma 7% 12% 18% 28% 20% 15% 66 76 86 96 106
  • 19. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 14 E-mail: jhnv1977@hotmail.com Ejercicios del Capítulo I i. Clasificar las siguientes variables: - Número de alumnos por carrera. - Comuna en que viven los alumnos del curso de estadística - Color de ojos de un grupo de niños - Notas de unidad - Monto de pagos por concepto de aranceles en la universidad - Sumas posibles de los números obtenidos al lanzar dos dados - Estatura de los alumnos - Peso del contenido de un paquete de cereal - Monto de la venta de un artículo en $ - Número de acciones vendidas - Nivel de atención en el Banco - Nivel de actitud académica - AFP a que pertenece un individuo - Edad de los alumnos ii. Se desea conocer el tamaño de la muestra de la Población de estudiantes de nivel secundario de la urbanización Primavera de la ciudad de Trujillo con un nivel de confianza de 97.5 % y un error de 5%. n = iii. Con los datos del ejercicio anterior reajustar la muestra sabiendo que el tamaño de la población es de 1500 alumnos. n´ = iv. En la tabla de frecuencia siguiente faltan datos, complételos. Valores fi Fi hi Hi 0 2 1 5 2 9 3 14 0.7 4 0,2 5 Totales
  • 20. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 15 E-mail: jhnv1977@hotmail.com v. En la tabla de frecuencia siguiente faltan datos, complételos. Yi-1 - Yi Yi fi Fi hi Hi - 100 2 150 7 0,2 0,8 30 Total vi. Los datos de la tabla de frecuencia que se presenta a continuación muestran los resultados obtenidos por un grupo de alumnos en una prueba de habilidad de lectura, Xi-1 – Xi+1 Xi fi Fi hi Hi [32 - 35) 33,5 5 5 0,04 0,04 35 – 38 36,5 12 17 0,11 0,15 38 – 41 39,5 18 35 0,16 0,31 41 – 44 42,5 19 54 0,17 0,48 44 – 47 45,5 26 80 0,23 0,71 47 – 50 48,5 19 99 0,17 0,88 50 – 53 51,5 13 112 0,12 1,00 n = 112 1,00 ¿Cómo interpretas los números en negrita? vii. Realizar para cada una de las tablas de frecuencias de los ejercicios iv y vi sus respectivos gráficos.
  • 21. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 16 E-mail: jhnv1977@hotmail.com Capítulo II: Medidas Resúmenes En este capítulo introduciremos distintas formas de resumir la distribución muestral o poblacional de una variable NUMÉRICA. Resumir un conjunto de datos es pasar de una visión detallada a una generalización simple e informativa tratando de preservar las características esenciales. ¿Por qué resumir? Para simplificar la comprensión y la comunicación de los datos. Las medidas resúmenes son útiles para comparar conjuntos de datos cuantitativos y para presentar los resultados de un estudio y se clasifican en dos grupos principales:  Medidas de posición o localización o tendencia central ⇒ describen un valor alrededor del cual se encuentran las observaciones.  Medidas de dispersión o escala ⇒ pretenden expresar cuan variable es un conjunto de datos. 2.1. Medidas de Posición Son estadígrafos de tendencia central que son interpretados como valores que permiten resumir a un conjunto de datos dispersos, podría asumirse que estas medidas equivalen a un centro de gravedad que adoptan un valor representativo para todo un conjunto de datos predeterminados. 2.1.1. Media aritmética La media aritmética de una variable estadística es la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos. a. Para datos no tabulados ̅ Ejemplo 03: Se tienen las notas de una prueba de matemáticas de los alumnos del 5° grado de educación primaria de la I.E. Buena Educación. 15, 12, 08, 18, 13, 11, 09, 16, 20, 19, 17, 15, 14, 16, 18. La media aritmética será: ̅ ̅ ̅ La media de notas de los alumnos del 5° grado de primaria de la I.E. Buena Educación es 14.73.
  • 22. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 17 E-mail: jhnv1977@hotmail.com b. Para datos tabulados ̅ ∑ Ejemplo 04: Con los datos de la Tabla 02, calculamos el promedio de los salarios semanales. ̅ ̅ ̅ ̅ El salario semanal de los 40 trabajadores es en promedio de S/. 93.00 nuevos soles. 2.1.2. Mediana Es otra medida de posición o tendencia central. Se define como aquel valor de la variable que supera la mitad de las observaciones y a su vez es superado por la otra mitad de ellas. Por esta razón, se la considera como el valor central, ya que se divide a los datos en 2 grupos (las observaciones deben estar ordenadas de mayor a menor). a. Para datos no tabulados Se ordenan las observaciones de menor a mayor y se ubica el valor central. Si la constante de datos (n) es par, se promedian los 2 valores centrales. En cambio, si n es impar habrá solo un valor en el centro. Ejemplo 05: Sean los datos 4 5 5 6 8 9 9 10 n=8 (par) Ejemplo 06: Sean los datos 14 15 15 16 17 18 19 19 20 n = 9 (impar)
  • 23. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 18 E-mail: jhnv1977@hotmail.com b. Para datos tabulados Si los datos están tabulados no es posible individualizar el valor de la mediana, pero si es factible determinar el intervalo donde se encuentra. La fórmula para encontrar la mediana es: ( ) Donde:  Xinf : es el valor inferior del intervalo mediano.  c : es la amplitud del intervalo.  Fi-1 : es la frecuencia acumulada anterior al intervalo mediano.  fi : es la frecuencia del intervalo mediano  n : es el número total de datos. Ejemplo 07: Obtener la mediana de la distribución adjunta: Xinf – Xsup fi Xi Fi 0 - 10 60 5 60 10 - 20 80 15 140 20 - 30 30 25 170 30 - 40 20 65 190 40 - 50 10 300 200 n=200 Calculamos n/2 para poder determinar el intervalo mediano n/2= 200/2 = 100. La Fi más próxima que supera al valor calculado n/2=100 es F2=140, por lo tanto el intervalo mediano será 10 – 20>. Entonces: ( ) De lo que se puede afirmar que el 50% de los datos es mayor a 15, mientras que el 50% restante es menor a 15.
  • 24. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 19 E-mail: jhnv1977@hotmail.com 2.1.3. Moda Llamaremos moda a cualquier máximo relativo de la distribución de frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor que su anterior y su posterior. a. Para datos no tabulados Se busca el valor más repetido. Ejemplo 08: Para los datos 2 5 3 4 1 5 3 4 6 4 3 2 1 4 La Moda será, Mo = 4 b. Para datos tabulados Se utiliza la siguiente fórmula: ( ) Donde:  Xinf : es el valor inferior del intervalo con mayor frecuencia.  c : es la amplitud del intervalo.  fi-1 : es la frecuencia anterior al intervalo modal.  fi : es la frecuencia del intervalo modal.  fi+1 : es la frecuencia posterior del intervalo modal.  n : es el número total de datos. Ejemplo 09: Utilizando los datos de la Tabla 02, calculamos la moda ( ) ( ) De lo cual podemos afirmar que el salario semanal más frecuente de los trabajadores es de S/. 98.14 nuevos soles.
  • 25. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 20 E-mail: jhnv1977@hotmail.com 2.1.4. Percentiles Para una variable discreta, se define el percentil de orden k, como la observación, Pk, que deja por debajo de si el k% de la población. Se calcula con la siguiente fórmula: ( ) 2.2. Medidas de Dispersión Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores están próximas entre sí o si por el contrario están o muy dispersas. Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes:  No utiliza todas las observaciones (sólo dos de ellas);  Se puede ver muy afectada por alguna observación extrema;  El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye. En el transcurso de esta sección, veremos medidas de dispersión mejores que la anterior. Estas se determinan en función de la distancia entre las observaciones y algún estadístico de tendencia central. 2.2.1. Desviación Media Se define la desviación media como la media de las diferencias en valor absoluto de los valores de la variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces ∑| ̅| Si los datos están agrupados en una tabla estadística es más sencillo usar la relación ∑| ̅| Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista geométrico, la distancia que induce la desviación media en el espacio de observaciones no es la natural. Esto hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a la población.
  • 26. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 21 E-mail: jhnv1977@hotmail.com Ejemplo 10: Para el siguiente conjunto de datos, calcular su desviación media. 2 5 3 4 6 4 Entonces, primero calculamos la media ̅ ̅ Luego, la desviación media será ∑| ̅| | | | | | | | | | | | | Ejemplo 11: Sea la siguiente tabla de distribución de frecuencias correspondiente a la variable X, estatura de los alumnos de un determinado colegio. Xinf Xsup Xi fi 0.99 1.16 1.075 4 1.16 1.33 1.245 6 1.33 1.50 1.415 8 1.50 1.67 1.585 9 1.67 1.84 1.755 8 1.84 2.01 1.925 5 Total 40 Tabla 03: Distribución de frecuencias de estaturas de alumnos Calculamos la media, y completamos la tabla de distribución Xinf Xsup Xi fi Xi.fi |Xi-Xprom| |Xi-Xprom|*fi 0.99 1.16 1.075 4 4.3 0.4505 1.8020 1.16 1.33 1.245 6 7.47 0.2805 1.6830 1.33 1.50 1.415 8 11.32 0.1105 0.8840 1.50 1.67 1.585 9 14.265 0.0595 0.5355 1.67 1.84 1.755 8 14.04 0.2295 1.8360 1.84 2.01 1.925 5 9.625 0.3995 1.9975 Total 40 61.02 8.7380
  • 27. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 22 E-mail: jhnv1977@hotmail.com ̅ ∑ ̅ ̅ Luego la desviación media será, ∑| ̅| 2.2.2. Varianza y Desviación típica La Desviación estándar, también llamada desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. Específicamente, la desviación estándar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma  según se calcule en una muestra o en la población. Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca de la media. Imagen 06: Nivel de dispersión de datos
  • 28. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 23 E-mail: jhnv1977@hotmail.com La fórmula para calcular la desviación típica en datos no tabulados es: √ ∑ ̅ Mientras que en datos tabulados se calcula con la siguiente fórmula: √∑ (∑ ) Ejemplo 12: Con los datos de la tabla 03, determinar la desviación típica, para ello completamos la tabla Xinf Xsup Xi fi Xi.fi fi. 0.99 1.16 1.075 4 4.3 4.6225 1.16 1.33 1.245 6 7.47 9.3002 1.33 1.50 1.415 8 11.32 16.0178 1.50 1.67 1.585 9 14.265 22.6100 1.67 1.84 1.755 8 14.04 24.6402 1.84 2.01 1.925 5 9.625 18.5281 Total 40 61.02 95.7188 Luego con los datos obtenidos calculamos la desviación típica: √∑ (∑ ) √ √ El valor de la varianza es S2 , entonces para nuestro caso, la varianza será:
  • 29. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 24 E-mail: jhnv1977@hotmail.com 2.2.3. Coeficiente de variación y asimetría de Pearson El coeficiente de variación elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre medias y desviación típica. Se define del siguiente modo: ̅ Las distribuciones pueden tener diferentes formas, y una manera de caracterizar la forma es observar su simetría. Una distribución de frecuencias puede ser simétrica o asimétrica. Para saber si es simétrica tenemos que tomar una referencia, es decir, ver respecto a qué es simétrica. El coeficiente de asimetría de Pearson, mide la desviación de la simetría, expresando la diferencia entre la media y la mediana con respecto a la desviación estándar del grupo de mediciones. Su fórmula es: ̅  Si As = 0 diremos que la distribución es simétrica, en ese caso las desviaciones a la derecha y a la izquierda de la media se compensan.  Si As < 0 diremos que es asimétrica negativa ya que la mayoría de las observaciones están a la derecha de la proyección de la media.  Si As > 0 diremos que es asimétrica positiva ya que la mayoría de las observaciones están a la izquierda de la proyección de la media. Imagen 07: Tipos de asimetría
  • 30. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 25 E-mail: jhnv1977@hotmail.com Ejercicios del Capítulo II i. Una empresa ha realizado un test físico entre sus empleados para comprobar la capacidad de esfuerzo que posee cada uno de ellos. Una de las medidas que componen el mismo es el número de pulsaciones después de una determinada actividad física, que está altamente relacionada con las que se realizan a lo largo de una jornada laboral. Los datos conseguidos han sido distribuidos en una tabla de frecuencias. La tabla resultante es la que se presenta: Número de pulsaciones Número de empleados 70 - 75 3 75 – 80 3 80 – 85 7 85 – 90 10 90 – 95 12 95 - 100 8 Se pide: a) media aritmética, mediana, cuartil inferior, percentil 60 y desviación típica. b) ¿Qué tanto por cien de empleados tuvieron menos de 83 pulsaciones? ii. Sea la siguiente tabla de distribución de frecuencias: Intervalos Xi fi 160 – 162 161 2 163 – 165 164 5 166 – 168 167 7 169 – 171 170 9 172 – 174 173 12 175 – 177 176 13 178 – 180 179 14 181 – 183 182 15 184 – 186 185 20 187 – 189 188 22 TOTAL 119 Determinar: a) Promedio b) Mediana c) Moda d) Percentil 60 e) Desviación media f) Desviación típica g) Coeficiente de variación y coeficiente de asimetría
  • 31. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 26 E-mail: jhnv1977@hotmail.com Capítulo III: Probabilidad Si el único propósito del investigador es describir los resultados de un experimento concreto, los métodos analizados en los capítulos anteriores pueden considerarse suficientes. No obstante, si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los cuales implican el uso inteligente de la teoría de la probabilidad. Comenzamos este bloque interpretando la noción de probabilidad y la terminología subyacente a esta área de las matemáticas, ya que la probabilidad constituye por sí misma un concepto básico que refleja su relación con la faceta del mundo exterior que pretende estudiar: los fenómenos aleatorios, los cuales obedecen unas ciertas reglas de comportamiento. De alguna manera, el concepto de probabilidad, se relaciona o nos recuerda las propiedades de la frecuencia relativa. A partir de ella, y junto con las definiciones de probabilidad condicionada y la de sucesos independientes, se deducen los teoremas fundamentales del Cálculo de Probabilidades. Nos centraremos posteriormente en el eslabón que une la teoría de la probabilidad y la estadística aplicada: la noción de variable aleatoria, mostrando de esta manera, como puede emplearse la teoría de la probabilidad para sacar conclusiones precisas acerca de una población en base a una muestra extraída de ella, y que muchos de los estudios estadísticos son de hecho, estudio de las propiedades de una o más variables aleatorias. Tal como hemos citado anteriormente, en las aplicaciones prácticas es importante poder describir los rasgos principales de una distribución, es decir, caracterizar los resultados del experimento aleatorio mediante unos parámetros. Llegamos así al estudio de las características asociadas a una variable aleatoria introduciendo los conceptos de esperanza y varianza matemática, relacionándolos con los conceptos de media y varianza de una variable estadística. 3.1. Conjuntos y Probabilidad El concepto de conjunto es un pilar fundamental de la probabilidad y la estadística y de la matemática en general. Un conjunto puede considerarse como una colección de objetos, llamados miembros o elementos. 3.1.1. Generalidades de Conjuntos a. Notación de un conjunto En general se denota un conjunto con las letras del alfabeto en mayúsculas (A, B, C, …, Z) y los elementos con las letras en minúsculas.
  • 32. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 27 E-mail: jhnv1977@hotmail.com Si un elemento “a” pertenece a un determinado conjunto “A” se representa así: a  A y si un elemento “x” no pertenece a un conjunto “B” se representa así: x  B. Un conjunto puede estar expresado por extensión, o por comprensión. Ejemplo: sea el conjunto A de las vocales. Por extensión A = {a, e, i, o, u} Por Comprensión A = {x /x es una vocal} b. Subconjunto Si todos los elementos de un conjunto A también pertenecen a B, llamamos a A un subconjunto de B, el cual se denota A  B y se lee “A está contenido en B”. c. Conjunto universal y conjunto vacío El conjunto Universo se denota con U, mientras que el conjunto nulo o vacío se denota con . d. Representación Gráfica de un conjunto Un conjunto puede ser representado gráficamente por cualquier figura geométrica, así: Imagen 08: Representaciones gráficas de un Conjunto 3.1.2. Operaciones con Conjuntos a. Unión Ejemplo 13: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se determinará A  B. A  B = {1,2,3,4,5}  {1,3,5,7} A  B = {1,2,3,4,5,1,3,5,7} se omiten los elementos repetidos, entonces A  B = {1,2,3,4,5,7} A B C D E F G
  • 33. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 28 E-mail: jhnv1977@hotmail.com b. Intersección Ejemplo 13: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se determinará A  B. A  B = {1,2,3,4,5}  {1,3,5,7}, sólo se consideran los elementos comunes a ambos conjuntos. A  B = {1,3,5} c. Diferencia Ejemplo 14: Sean los conjuntos A = {1,2,3,4,5}, B = {1,3,5,7}, se determinará A - B. A - B = {1,2,3,4,5} - {1,3,5,7}, sólo se consideran los elementos del conjunto A que no se repiten en B. A - B = {2,4} d. Complemento Ejemplo 15: Sea el conjunto universal U = {c,a,m,o,t,e} y sea el conjunto A = {m,o,t,e}, el complemento de A respecto al universo U será: A’ = U – A A’ = {c,a,m,o,t,e} - {m,o,t,e} A’ = {c,a}
  • 34. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 29 E-mail: jhnv1977@hotmail.com 3.1.3. Experimentos aleatorios Todos estamos familiarizados con la importancia de los experimentos en la ciencia y en la ingeniería. Sin embargo, hay experimentos en los cuales los resultados no son esencialmente los mismos a pesar de que las condiciones sean aproximadamente idénticas. Tales experimentos se denominan experimentos aleatorios. Los siguientes son algunos ejemplos: Ejemplo 16: Si lanzamos una moneda el resultado del experimento es un sello, simbolizado por S, o una cara, simbolizado por C, es decir uno de los elementos del conjunto {S,C} Ejemplo 17: Si lanzamos un dado, el resultado es un número perteneciente al siguiente conjunto {1,2,3,4,5,6} Ejemplo 18: Se tiene un lector óptico para revisar examenes, el resultado del experimento es que algunos examenes tendrán nota desaprobatoria. Así, cuando se revise un examen el resultado es un elemento del conjunto {0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20} Ejemplo 19: Si lanzamos un dado dos veces, el resultado es un elemento perteneciente al siguiente conjunto {CC,CS,SC,SS} Hasta aquí podemos decir que un experimento es aleatorio si se verifican las siguientes condiciones: 1. Se puede repetir indefinidamente, siempre en las mismas condiciones; 2. Antes de realizarlo, no se puede predecir el resultado que se va a obtener; 3. El resultado que se obtenga, e, pertenece a un conjunto conocido previamente de resultados posibles. 3.1.4. Espacio muestral Al conjunto, de resultados posibles de un experimento, lo denominaremos espacio muestral y lo denotaremos normalmente mediante la letra δ. Los elementos del espacio muestral se denominan sucesos elementales. Cualquier subconjunto de δ será denominado suceso aleatorio, y se denotará normalmente con las letras A, B,... Obsérvese que los sucesos elementales son sucesos aleatorios compuestos por un sólo elemento. Por supuesto los sucesos aleatorios son más generales que los elementales, ya que son conjuntos que pueden contener no a uno sólo, sino a una infinidad de sucesos elementales y también no contener ninguno.
  • 35. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 30 E-mail: jhnv1977@hotmail.com Ejemplo 20: Si se lanza un dado, el espacio muestral será δ = {1,2,3,4,5,6}. Son sucesos aleatorios A = {1,2}, B = {1,3}, C = {1,4}, D = {x /x es un número par menor que 7}, … Suceso Seguro: es el mismo δ Suceso imposible: es aquel que nunca se verifica como resultado del experimento aleatorio. Se representa con . Ejemplo 21: Si se lanza una moneda 2 veces, se puede determinar: El espacio muestral, δ = {CC,CS,SC,SS} Los siguientes sucesos aleatorios: A el suceso “por lo menos se obtenga una cara”. A = {CS,SC,SS} B el suceso “el segundo lanzamiento sea un sello”. B = {CS,SS} Nota a tener en cuenta: A los sucesos se les puede aplicar operaciones con conjuntos. 3.1.5. Probabilidad, axiomas y teoremas En cualquier experimento aleatorio siempre hay incertidumbre sobre si un suceso específico ocurrirá o no. Como medida de la oportunidad o probabilidad con la que podemos esperar que un suceso ocurra es conveniente asignar un número entre 0 y 1. Si estamos seguros de que el suceso ocurrirá decimos que su probabilidad es 100% ó 1, pero si estamos seguros de que el suceso no ocurrirá decimos que su probabilidad es cero. Existen dos procedimientos importantes por medio de los cuales podemos obtener estimativos para la probabilidad de un suceso, a saber: a. Enfoque clásico o a priori Si un suceso A puede ocurrir en h maneras diferentes de un número total de n maneras posibles, todos igualmente factibles, entonces la probabilidad del suceso es: Ejemplo 22: Supóngase que deseamos la probabilidad de que resulte una cara en un solo lanzamiento de una moneda. Puesto que hay dos maneras igualmente factibles del resultado de la moneda (n=2), simplemente "cara" y “sello” (suponiendo que la moneda no se pierda ni caiga verticalmente), y de estas dos maneras una cara puede aparecer en una sola manera (h=1), entonces la probabilidad requerida es:
  • 36. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 31 E-mail: jhnv1977@hotmail.com La probabilidad de que resulte una cara en un lanzamiento es de 50%. b. Enfoque como frecuencia relativa o a posteriori Si después de n repeticiones de un experimento, donde n es muy grande, un suceso ocurre h veces, entonces la probabilidad del suceso es h/n. Esto también se llama la probabilidad empírica del suceso. Ejemplo 23: Si lanzamos una moneda 1000 veces y hallamos que 532 veces resultan caras estimamos que la probabilidad de una cara es: c. Axiomas de la Probabilidad  P(A) ≥ 0  P(δ) = 1  P(AB) = P(A) + P(B), si A y B son mutuamente excluyentes. d. Teoremas importantes sobre Probabilidad - Si A1  A2. P(A1)  P(A2) y P(A2 – A1) = P(A2) - P(A1) - Para cada suceso 0  P(A)  1 - P() = 0 - P(A’) = 1 - P(A) - Si A y B son sucesos cualesquiera, entonces P(AB) = P(A) + P(B) – P(AB) 3.1.6. Probabilidad Condicional Sean A y B dos sucesos tales que P(A)> 0. Denotamos por P(B|A) la probabilidad de B dado que A ha ocurrido. Puesto que se sabe que A ha ocurrido, se convierte en el nuevo espacio muestral remplazando el original δ. De aquí llegamos a la definición |  Ejemplo 24: Hallar la probabilidad de que en un sólo lanzamiento de un dado resulte un número menor que 4, (a) no se da ninguna otra información, (b) se da que el lanzamiento resultó en un número impar,
  • 37. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 32 E-mail: jhnv1977@hotmail.com (a) Si B es el suceso {menor que 4}, entonces (b) Si A es el suceso {número impar} observamos que P(A)=3/6=1/2. También P(AB)=2/6:1/3. Entonces | | 3.1.7. Sucesos Independientes Si P(B|A) = P(B), es decir la probabilidad de que B ocurra no está afectada por la ocurrencia o no ocurrencia de A, entonces decimos que A y B son sucesos independientes. Esto es equivalente a: P(AB) = P(A).P(B) 3.1.8. Teorema de Bayes Supóngase que A1, A2,..., An son sucesos mutuamente excluyentes cuya unión es el espacio muestral δ, es decir uno de los sucesos debe ocurrir. Entonces si A es cualquier suceso tenemos el siguiente teorema importante: | | ∑ | 3.1.9. Análisis Combinatorio En muchos casos el número de puntos muestrales en un espacio muestral no es muy grande y así la enumeración o cuenta directa de los puntos del muestreo necesarios para obtener las probabilidades no es difícil. Sin embargo, surgen problemas cuando la cuenta directa se convierte en una imposibilidad práctica. En tales casos se emplea el análisis combinatorio, que podría llamarse una forma sofisticada de contar. a. Principio fundamental de cuenta Si una cosa puede realizarse en n1 maneras diferentes y después de esto una segunda cosa puede realizarse en n2 maneras diferentes,…, y finalmente una k-ésima cosa puede realizarse en nk maneras diferentes, entonces todas las k cosas pueden realizarse en el orden especificado en n1 n2 … nk maneras diferentes.
  • 38. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 33 E-mail: jhnv1977@hotmail.com Ejemplo 25: Si un hombre tiene 2 camisas y 4 corbatas entonces tiene 2*4=8 maneras de escoger una camisa y luego una corbata. b. Permutaciones Supóngase que se dan n objetos diferentes y deseamos ordenar r de estos objetos en una línea puesto que hay n maneras de escoger el primer objeto, y luego de hacer esto n - 1 maneras de escoger el segundo objeto, … , y finalmente n - r + 1 formas de escoger el r-ésimo objeto, se deduce por el principio fundamental de cuenta que el número de ordenaciones, o permutaciones diferentes como generalmente se les llama está dado por: nPr = n(n - l)(n - 2). . . (n - r + l) Ésta fórmula también puede ser expresada en términos de factoriales, a saber: Ejemplo 26: El número de ordenaciones o permutaciones diferentes que consisten de 3 letras cada una y que pueden formarse de las 7 letras A, B, C, D, E, F, G es Supóngase ahora que un conjunto que consiste de n objetos de los cuales n1 son de un tipo (es decir no pueden distinguirse entre sí), n2 son de un segundo tipo,…, nk son del k-ésimo tipo. Lógicamente n = n1 + n2 +… + nk Así el número de permutaciones diferentes de los objetos es: nPn1, n2, … , nk c. Combinaciones En una permutación estamos interesados en el orden de la distribución de los objetos. Así abc es una permutación diferente a cba. Sin embargo, en muchos problemas estamos interesados solamente en seleccionar o escoger los objetos sin interesar su orden. Dichas selecciones se llaman combinaciones. Así abc y cba son la misma combinación.
  • 39. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 34 E-mail: jhnv1977@hotmail.com El número total de combinaciones de r objetos seleccionados de n, se denota por: ( ) Ejemplo 27: El número de maneras en las cuales 3 cartas pueden escogerse de un total de 8 cartas diferentes es ( ) ( ) ( ) 3.2. Variables Aleatorias y distribuciones de probabilidad 3.2.1. Variable aleatoria Supóngase que a cada punto de un espacio muestral asignamos un número. Así definimos una función en el espacio muestral. Esta función se llama variable aleatoria (o variable estocástica) o más precisamente función aleatoria (función estocástica). Comúnmente se denota por una letra mayúscula como X o Y. En general una variable aleatoria tiene algún significado físico, geométrico u otro. Ejemplo 28: Supóngase que se lanza una moneda dos veces de tal forma que el espacio muestral es δ = {CC,CS,SC,SS}. Represéntese por X el número de caras que pueden resultar. Con cada punto muestral podemos asociar un número para X como se muestra en la Tabla 04. Así en el caso de CC (es decir 2 caras) X = 2 en tanto que para SC (1 cara) X = 1. Se concluye que X es una variable aleatoria. Punto Muestral CC CS SC SS X 2 1 1 0 Tabla 04: Asociación de suceso X con puntos muestrales Debe observare que también podrían definirse otras muchas variables aleatorias en este espacio muestral, por ejemplo el cuadrado del número de caras, el número de caras menos el número de sellos, etc. Una variable aleatoria que tiene un número finito de valores se denomina variable aleatoria discreta, mientras que si una variable aleatoria tiene un número infinito no contable de valores se denomina variable aleatoria continua.
  • 40. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 35 E-mail: jhnv1977@hotmail.com 3.2.2. Distribución de Probabilidad discreta Es conveniente introducir la función de probabilidad, también conocida como la distribución de probabilidad, definida por P(X = x) = En general es una función de probabilidad si - ≥ 0 - ∑ Ejemplo 29: Hallar la función de probabilidad correspondiente a la variable X del ejemplo 28. Supóngase que la moneda es honrada. Entonces tenemos: Luego: Recordar que X es la variable aleatoria que representa el número de caras, así:  Así, la función de probabilidad está dada en la Tabla 05 x 0 1 2 f(x) Tabla 05 3.2.3. Función de Distribución discreta La función de distribución acumulada, o simplemente la función de distribución, para una variable aleatoria X se define por P(X  x) = F(x) Si X únicamente toma un número finito de valores x1, x2, … , xn entonces la función de distribución está dada por {
  • 41. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 36 E-mail: jhnv1977@hotmail.com Ejemplo 30: Hallar la función de Probabilidad para la variable aleatoria X del ejemplo 29. Así, con los datos de la Tabla 05 la función de probabilidad es: { { 3.2.4. Distribución de Probabilidad continua Se define mediante la existencia de una función f(x) tal que: - ≥ 0 - ∫ Entonces definimos la probabilidad de que X se encuentre entre a y b como: ∫ Una función f(x) que satisface los requisitos anteriores se llama función de probabilidad o distribución de probabilidad para una variable aleatoria continua, pero con mayor frecuencia se denomina función de densidad de probabilidad o simplemente función de densidad. Ejemplo 31: Sea la función de densidad f(x) = , 0  x  3. Determinar P(1X2) ∫ |
  • 42. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 37 E-mail: jhnv1977@hotmail.com 3.2.5. Función de Distribución continua Definimos la función de distribución F(x) para una variable aleatoria continua por: F(x) = P(X  x) = P( ) ∫ Ejemplo 32: Halla la función de distribución para la variable aleatoria continua X del ejemplo 31 Tenemos: F(x) = P(X  x) = ∫ Si x < 0, entonces F(x)=0 Si 0  x  3, entonces ∫ ∫ Si x ≥ 3, entonces ∫ ∫ ( ) Por lo tanto la función de distribución será: { 3.3. Varianza y desviación típica de variables aleatorias 3.3.1. Varianza y desviación típica de una VA discreta Si X es una variable aleatoria discreta con función de probabilidad f(x), entonces la varianza es ∑ Y la desviación típica es: √ 3.3.2. Varianza y desviación típica de una VA continua Si X es una variable aleatoria continua con función de probabilidad f(x), entonces la varianza es ∫
  • 43. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 38 E-mail: jhnv1977@hotmail.com 3.4. Distribuciones de Probabilidad con nombre Propio 3.4.1. Distribución Binomial o de Bernoulli Supóngase que tenemos un experimento como lanzar una moneda o un dado repetidamente, extraer una bola de una urna repetidamente, etc. Cada lanzamiento o escogencia se llama una prueba. Con cada prueba hay una probabilidad asociada con un suceso particular como la cara en la moneda, el 4 en el dado o la selección de una bola roja. En algunos casos la probabilidad no cambia de una prueba a la siguiente (como en el lanzamiento de la moneda o del dado). A estas pruebas se les llama independientes y se conocen como las pruebas de Bernoulli en memoria de James Bernoulli quien las investigó a finales del siglo XVII. Sea p la probabilidad de que un suceso ocurra en una sola prueba de Bernoulli (llamada la probabilidad de éxito). Entonces q = 1 – p es la probabilidad de que el suceso no ocurra en una sola prueba (llamada la probabilidad de fracaso). La probabilidad de que el suceso ocurra x veces en n pruebas (es decir que ocurran x éxitos y n – x fracasos) está dada por la función de probabilidad donde la variable aleatoria discreta X denota el número de éxitos en n pruebas. Ejemplo 33: La probabilidad de obtener exactamente 2 caras en 6 lanzamientos de una moneda es ( ) ( ) A tener en cuenta: Propiedades de la distribución binomial: 3.4.2. Distribución Normal Uno de los más importantes ejemplos de una distribución de probabilidad continua es la distribución normal, algunas veces denominada la distribución gaussiana. La función de densidad para la distribución está dada por √
  • 44. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 39 E-mail: jhnv1977@hotmail.com donde y son la media y la desviación típica respectivamente. La función de distribución correspondiente está dada por √ ∫ Los valores de la distribución normal pueden ser encontrados en el Apéndice A. 3.4.3. Distribución de Poisson Sea X una variable aleatoria discreta que puede tomar los valores 0, 1, 2, . . . tal que la función de probabilidad de X esté dada por Donde es una constante positiva dada. Los valores de f(x) pueden obtenerse empleando el Apéndice B. A tener en cuenta: Propiedades de la distribución binomial: 3.4.4. Distribución Hipergeométrica Sea X una variable aleatoria discreta, su función de probabilidad es: ( )( ) ( ) 3.4.5. Distribución Chi-Cuadrado Sean X1, X2, … , Xv, v variables aleatorias independientes distribuidas normalmente con media cero y varianza 1. Considérese la variable aleatoria Donde se llama chi-cuadrado. Se define la distribución chi-cuadrado con v grados de libertad como ∫ ( ) 3.4.6. Distribución t de Student Los valores de la distribución t pueden obtenerse empleando el Apéndice C.
  • 45. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 40 E-mail: jhnv1977@hotmail.com Ejercicios del Capítulo III i. Sea A el conjunto de todos los números reales cuyos cuadrados son iguales a 25. Indique cómo describir en A por (a) el método de comprensión y (b) el método de extensión. ii. Determinar cuáles de las proposiciones siguientes son verdaderas y corregir las que son falsas. {x /x  x} = {} Si A = {x /x2 = 4, x>9} y B = {x /x  l}, entonces A  B. iii. Se extrae una carta aleatoriamente de una baraja de 52 cartas. Describir el espacio muestral si (a) no se tiene en consideración el palo (b) si se tiene en cuenta el palo. iv. Refiriéndose al experimento del Problema iii sea, A el suceso {se extrae un rey} o sencillamente {rey} y B el suceso {se extrae un trébol} o sencillamente {trébol}. Describir los sucesos (a) A  B, (b) A  B, (c) A  B', (d) A’  B’, (e) A - B, (f) A’ – B’, (g) (AB)  (AB’). v. Una carta se extrae aleatoriamente de una baraja de 52 cartas. Encontrar la probabilidad de que sea (a) un as, (b) una jota de corazones, (c) un tres de tréboles o un seis de diamantes, (d) un corazón, (e) cualquier palo excepto corazones, (f) un diez o una pica (g) ni un cuatro ni un trébol. vi. Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4 bolas blancas y 5 bolas azules. Determinar la probabilidad de que sea (a) roja, (b) blanca, (c) azul, (d) no roja, (e) roja o blanca. vii. Encontrar la probabilidad de no obtener un total de 7 u 11 en ninguno de los dos lanzamientos de un par de dados honrados. viii. Se va a conformar un comité de 3 miembros compuesto por un representante de los trabajadores, uno de la administración y uno del gobierno. Si hay 3 candidatos de los trabajadores, 2 de la administración y 4 del gobierno, determinar cuántos comités diferentes pueden conformarse, empleando el principio fundamental de cuenta. ix. ¿De cuántas maneras pueden 10 personas sentarse en una banca si sólo hay 4 puestos disponibles? x. Se quieren sentar 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen los sitios pares. ¿De cuántas formas pueden sentarse? xi. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules: Si las bolas de igual color no se distinguen entre sí ¿de cuántas formas posibles pueden ordenarse?
  • 46. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 41 E-mail: jhnv1977@hotmail.com xii. De un total de 5 matemáticos y 7 físicos, se forma un comité de 2 matemáticos y 3 físicos. ¿De cuántas formas puede formarse, si (a) puede pertenecer a él cualquier matemático y físico, (b) un físico determinado debe pertenecer al comité, (c) dos matemáticos determinados no pueden estar en el comité? xiii. ¿Cuántos números artísticos se pueden preparar con 5 alumnos (Juan, Jorge, Luis, Miguel y Lidia) de mi sección? xiv. Organizo un torneo de ajedrez en el aula. Daniel y María juegan 12 partidas de ajedrez de las cuales Daniel gana 6, María gana 4 y 2 terminan en tablas. María pide la revancha y acuerdan jugar un torneo consistente en 3 partidas. Hallar la probabilidad de que (a) Daniel gane las tres partidas, (b) dos partidas terminen en tablas, (c) Daniel y María ganen alternativamente, (d) María gane al menos una partida. xv. Si el 20 % de los alumnos egresados de una institución educativa emigran al extranjero, determinar la probabilidad de que de 4 alumnos escogidos aleatoriamente (a) 1, (b) 0, (c) menos de 2, emigren. xvi. El peso medio de 500 estudiantes varones de una universidad es de 68.5 kg y la desviación tipificada es de 10 kg. Suponiendo que los pesos están distribuidos normalmente, hallar el número de estudiantes que pesan (a) entre 48 y 71 kg, (b) más. de 91 kg. xvii. Si la probabilidad de que un alumno sufra un desmayo debido a la manifestación de un movimiento telúrico, es 0.001, determinar la probabilidad de que de un total de 2000 alumnos (a) exactamente 3, (b) más de 2 individuos sufran desmayo durante un sismo. xviii. Luego de un incidente de mal comportamiento en una institución educativa se han detenido en un aula a 10 alumnos involucrados, de los cuales 6 si participaron del incidente y 4 de ellos no. Se realiza un experimento en el cual se selecciona un alumno del aula aleatoriamente y se determina su responsabilidad. Hallar la probabilidad de que después de 5 pruebas del experimento se hallan escogido 3 alumnos responsables del mal comportamiento. xix. Hallar para (a) v = 60 y (b) v = 100 grados de libertad.
  • 47. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 42 E-mail: jhnv1977@hotmail.com Capítulo IV: Estadísticos para la prueba de Hipótesis 4.1. Ensayos de Hipótesis y significación 4.1.1. Decisiones Estadísticas Muy a menudo, en la práctica se tienen que tomar decisiones sobre poblaciones, partiendo de la información muestral de las mismas. Tales decisiones se llaman decisiones estadísticas Por ejemplo, se puede querer decidir a partir de los datos del muestreo, si un suero nuevo es realmente efectivo para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda determinada está o no cargada, etc. 4.1.2. Hipótesis estadísticas. Hipótesis nula Para llegar a tomar decisiones, conviene hacer determinados supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se llaman hipótesis estadísticas y, en general, lo son sobre las distribuciones de probabilidad de las poblaciones. En muchos casos se formulan las hipótesis estadísticas con el solo propósito de rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está cargada, se formula la hipótesis de que la moneda está bien, es decir, p : 0.5; donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la hipótesis de que no hay diferencia entre los procedimientos (es decir, cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma población). Tales hipótesis se llaman también hipótesis nulas y se denotan por H0. Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis alternativa. Por ejemplo, si una hipótesis es p=0.5, hipótesis alternativas son p=0.7; p=0.56; p>0.5. Una hipótesis alternativa de la hipótesis nula se denota por H1. Si en el supuesto de que una hipótesis determinada es cierta, se encuentra que los resultados observados en una muestra aleatoria difieren marcadamente de aquellos que cabía esperar con la hipótesis y con la variación propia del muestreo, se diría que las diferencias observadas son significativas y se estaría en condiciones de rechazar la hipótesis (o al menos no aceptarla de acuerdo con la evidencia obtenida). Por ejemplo, si en 20 lanzamientos de una moneda se obtienen 16 caras, se estaría inclinado a rechazar la hipótesis de que la moneda está bien, aunque sería posible que fuese un rechazamiento erróneo. Los procedimientos que facilitan el decidir si una hipótesis se acepta o se rechaza o el determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman ensayos de hipótesis, ensayos de significación o reglas de decisión.
  • 48. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 43 E-mail: jhnv1977@hotmail.com 4.1.3. Errores de Tipo I y Tipo II Si se rechaza una hipótesis cuando debería ser aceptada, se dice que se comete un error del Tipo I. Si por el contrario, se acepta una hipótesis que debería ser rechazada, se dice que se comete un error del Tipo II. En cualquiera de los dos casos se comete un error al tomar una decisión equivocada. Para que cualquier ensayo de hipótesis o reglas de decisión sea bueno, debe diseñarse de forma que minimice los errores de decisión. Esto no es tan sencillo como pueda parecer puesto que para un tamaño de muestra dado, un intento de disminuir un tipo de error, va generalmente acompañado por un incremento en el otro tipo de error. En la práctica, un tipo de error puede tener más importancia que el otro, y así se tiende a conseguir poner una limitación al error de mayor importancia. La única forma de reducir al tiempo ambos tipos de error es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible. 4.1.4. Nivel de significación La probabilidad máxima con la que en el ensayo de una hipótesis se puede cometer un error del Tipo I se llama nivel de significación del ensayo. Esta probabilidad se denota frecuentemente por α; generalmente se fija antes de la extracción de las muestras, de modo que los resultados obtenidos no influyen en la elección. En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo se elige un nivel de significación del 0.05 ó 5%, al diseñar un ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un 95% de confianza de que se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido rechazada al nivel de significación del 0.05, lo que significa que se puede cometer error con una probabilidad de 0.05. 4.1.5. Ensayos referentes a Distribuciones Normales Para aclarar las ideas anteriores, supóngase que con una hipótesis dada, la distribución muestral de un estadístico S es una distribución normal con media y desviación típica . Entonces la distribución de la variable tipificada dada por es una normal tipificada (media 0, varianza 1) y se muestra en la Imagen 09.
  • 49. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 44 E-mail: jhnv1977@hotmail.com Imagen 09 Como se indica en la figura, se puede estar con el 95% de confianza de que, si la hipótesis es cierta, el valor de z obtenido de una muestra real para el estadístico S se encontrará entre - 1.96 y 1.96 (puesto que el área bajo la curva normal entre estos valores es 0.95). Sin embargo, si al elegir una muestra aleatoria se encuentra que z para ese estadístico se halla fuera del recorrido - 1.96 a 1.96, lo que quiere decir que es un suceso con probabilidad de solamente 0.05 (área sombreada de la figura) si la hipótesis fuese verdadera. Entonces puede decirse que esta z difiere significativamente de la que cabía esperar bajo esta hipótesis y se estaría inclinado a rechazar la hipótesis. El área total sombreada 0.05 es el nivel de significación del ensayo. Representa la probabilidad de cometer error al rechazar la hipótesis es decir, la probabilidad de cometer error del Tipo I. Así pues, se dice que la hipótesis se rechaza al nivel de significación del 0.05 o que la z obtenida del estadístico muestral dado es significativa al nivel de significación del 0.05. El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen lo que se llama región crítica o región de rechazo de la hipótesis o región de significación. El conjunto de las z que se encuentran dentro del recorrido - 1.96 a 1.96 puede entonces llamarse región de aceptación de la hipótesis o región de no significación. De acuerdo con lo dicho hasta ahora, se puede formular la siguiente regla de decisión o ensayo de hipótesis o significación: o Se rechaza la hipótesis al nivel de significación del 0.05 si la z obtenida para el estadístico S se encuentra fuera del recorrido - 1.96 a 1.96 (es decir, z > 1.96 ó z  - 1.96). Esto equivale a decir que el estadístico muestral observado es significativo al nivel del 0.05. o Se acepta la hipótesis (o si se desea no se toma decisión alguna) en caso contrario. Debe ponerse de manifiesto que pueden igualmente emplearse otros niveles de significación.
  • 50. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 45 E-mail: jhnv1977@hotmail.com Ejemplo 34: Para ensayar la hipótesis de que una moneda está bien hecha, se toma la siguiente regla de decisión: o Se acepta la hipótesis si el número de caras en una serie de 100 lanzamientos se encuentra entre 40 y 60, ambos inclusive; o De otro modo, se rechaza. (a) Determinar la probabilidad de aceptar la hipótesis y la probabilidad de rechazar la hipótesis, siendo ésta cierta. La probabilidad de obtener entre 40 y 60 caras inclusive en 100 lanzamientos de una moneda, según la distribución binomial, es: ∑ La media y la desviación típica está dado por: ( ) √ ( ) ( ) En una escala discreta, entre 40 y 60 caras inclusive es lo mismo que entre 39.5 y 60.5 caras. Entonces la probabilidad pedida es = área bajo la curva normal entre z=-2.10 y z=2.10 = 2(área entre z=0 y z=2.10), dato que es extraído del Apéndice A. Así: Probabilidad pedida = 2(0.4821) = 0.9642 Entonces la probabilidad de aceptar la hipótesis es de 96.42%, mientras que la probabilidad de rechazar la hipótesis será: 1-0.9642 = 0.0358 = 3.58% 4.1.6. Ensayos de una y dos colas En el ensayo anterior se atendía a los valores extremos del estadístico S o su correspondiente z a ambos lados de la media, es decir, en las dos "colas" de la distribución. Por esta raz6n, tales ensayos se llaman ensayos de dos colas o ensayos bilaterales.
  • 51. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 46 E-mail: jhnv1977@hotmail.com Sin embargo, con frecuencia se puede estar solamente interesado en los valores extremos a un solo lado de la media, es decir, en una "cola" de la distribución, como por ejemplo, cuando se está ensayando la hipótesis de que un proceso es mejor que otro (que es diferente a ensayar si un proceso es mejor o peor que otro). Tales ensayos se llaman ensayos de una cola o ensayos unilaterales. En tales casos, la región crítica es una región a un lado de la distribución, con área igual al nivel de significación. La Tabla 06, que da los valores críticos de z para ensayos de una y dos colas a distintos niveles de significación, será de utilidad para propósitos de referencia. Valores críticos de z para otros niveles de significación, se pueden encontrar utilizando la tabla que da las áreas bajo la curva normal. Nivel de significación α 0.10 0.05 0.01 0.005 0.002 Valores críticos de z para ensayos unilaterales -1.28 ó 1.28 -1.645 ó 1.645 -2.33 ó 2.33 -2.58 ó 2.58 -2.88 ó 2.88 Valores críticos de z para ensayos bilaterales -1.645 y 1.645 -1.96 y 1.96 -2.58 y 2.58 -2.81 y 2.81 -3.08 y 3.08 Tabla 06 4.1.7. Ensayos relacionados con diferencias de medias y proporciones La variable tipificada en base a la media muestral ( ̅), la media poblacional u y la desviación típica de una muestra de tamaño n está dada por: ̅ √ Asimismo, Para ensayar la hipótesis Ho de que una población normal tiene de media u utilizamos (en muestras pequeñas, n <30) ̅ √ ̅ √ La distribución de T sigue una distribución t de Student. En la diferencia de medias y proporciones muestrales de 2 muestras grandes de tamaño n1 y n2 extraídas de poblaciones respectivas que tienen de media y y desviaciones típicas y se puede establecer: ̅ ̅ ̅ ̅ √
  • 52. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 47 E-mail: jhnv1977@hotmail.com Con la variable tipificada dada por ̅ ̅ ̅ ̅ Asimismo √ ( ) Haciendo: Con la variable tipificada dada por Varianzas. Para ensayar la hipótesis H0 de que una población normal tiene varianza consideramos la variable aleatoria Que tiene la distribución chi-cuadrado con n-1 grados de libertad. Ejemplo 35: Se hizo un examen a dos clases formadas por 40 y 50 estudiantes respectivamente. En la primera clase la puntuación media fue de 74 con una desviación típica de 8, mientras que en la segunda clase la puntuación media fue de 78 con una desviación típica de 7. ¿Hay una diferencia significativa entre el resultado de las dos clases al nivel de significación de 0.05? Supóngase que las dos clases provienen de dos poblaciones que tienen de medias respectivas y . Entonces, se tiene que decidir entre las hipótesis: o H0 : = , y la diferencia se debe simplemente al azar. o H1 :  , hay una diferencia significativa entre las dos clases. Bajo la hipótesis H0, ambas clases provienen de la misma población. La media y la desviación típica de la diferencia de medias están dadas por: ̅ ̅ ̅ ̅ √ √
  • 53. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 48 E-mail: jhnv1977@hotmail.com Entonces: ̅ ̅ ̅ ̅ Por ser un ensayo bilateral, los resultados son significativos al nivel de 0.05 si Z se encuentra entre -1.96 y 1.96. De aquí se deduce que al nivel de 0.05 hay una diferencia significativa entre las dos clases y la segunda es probablemente mejor. 4.1.8. Ensayos relacionados con la Distribución t de Student Ejemplo 36: En el pasado una máquina ha producido arandelas con un grosor de 0.050 pulgadas. Para determinar si la máquina sigue en buenas condiciones de producción, se toma una muestra de 10 arandelas, que resulta tener un grosor medio de 0.053 pulgadas y una desviación típica de 0.003 pulgadas. Ensayar la hipótesis de que la máquina está en buenas condiciones de producción al nivel de significación del 0.05 Se desea decidir entre las hipótesis: o Ho: u = 0.050, y la máquina se encuentra en buenas condiciones. o H1: u  0.050, y la máquina no se encuentra en buenas condiciones. De modo que se requiere un ensayo bilateral. Bajo la hipótesis H0 se tiene ̅ √ √ Para un ensayo bilateral al nivel de significación del 0.05 se adopta la regla de decisión: - Se acepta H0 si t se encuentra en el intervalo –t975 a t975 lo cual para 10- 1=9 grados de libertad es el intervalo -2.26 a 2.26. (Usando Apéndice C) - Se rechaza H0 en caso contrario. Puesto que T=3, se rechaza H0 al nivel de 0.05 de significancia. 4.1.9. Ensayos relacionados con la Distribución chi-Cuadrado Ejemplo 37: En el pasado la desviación típica de los pesos de ciertos paquetes de 40.0 onzas, llenados por una máquina era de 0.25 onzas. Una muestra aleatoria de 20 paquetes dio una desviación típica de 0.32 onzas. ¿Es el aparente incremento de variabilidad significativa al nivel de significación del 0.05?
  • 54. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 49 E-mail: jhnv1977@hotmail.com Hay que decidir entre las dos hipótesis: o H0:  = 0.25 onzas, y los resultados observados se deben al azar. o H1:  > 0.25 onzas, y la variabilidad se ha incrementado. El valor de X2 para la muestra es: Mediante un ensayo unilateral, se rechaza H0 al nivel de significación del 0.05 si el valor de X2 muestral fuese mayor que . Utilizando el Apéndice D determinamos para v = 20 -1 = 19 grados de libertad que es igual a 30.1. Por lo tanto, se rechaza H0 al nivel de significación del 0.05. 4.2. Curva de ajuste, regresión y correlación 4.2.1. Curva de Ajuste Muy a menudo en la práctica se encuentra que existe una relación entre dos (o más) variables, y se desea expresar esta relación en forma matemática determinando una ecuación que conecte las variables. Un primer paso es la colección de datos indicando los valores correspondientes de las variables. Por ejemplo, si x y y denotan la estatura y peso de un adulto; entonces una muestra de n individuos resultaría en las estaturas x1, x2,.. .,xn y los pesos correspondientes y1, y2, ... , yn. El paso siguiente es dibujar los puntos (x1, y1), (x2, y2), …, (xn, yn) en un sistema de coordenadas rectangulares. El conjunto resultante de puntos se llama a veces diagrama de dispersión. Del diagrama de dispersión es posible frecuentemente visualizar una curva que se aproxime a los datos. Dicha curva se llama curva de aproximación. En la Imagen 10 por ejemplo se observa que los datos se aproximan bien por una recta y decimos que existe una relación lineal entre las variables. Sin embargo, en la Imagen 11 aunque existe una relación entre las variables ésta no es una relación lineal y por esto la llamamos relación no lineal. En la Imagen 12 parece que no hay ninguna relación entre las variables. Imagen 10 Imagen 11 Imagen 12
  • 55. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 50 E-mail: jhnv1977@hotmail.com El problema general de hallar ecuaciones de curvas de aproximación que se ajusten a conjuntos de datos dados se denomina curva de ajuste. En la práctica el tipo de ecuación se sugiere frecuentemente del diagrama de dispersión. Así para la Imagen 10 podríamos utilizar una recta Mientras que para la Imagen 11 ensayaríamos una curva cuadrática o parabólica Uno de los propósitos principales de la curva de ajuste es estimar una de las variables (Variable dependiente) de la otra (la variable independiente). El proceso de estimación se conoce como regresión. Si y se va a estimar a partir de x por medio de alguna ecuación la llamamos ecuación de regresión de y sobre x y a la curva correspondiente curva de regresión de y sobre x. 4.2.2. Método de mínimos cuadrados Definición. De todas las curvas de aproximación de un conjunto de puntos de datos dados, la curva que tenga la propiedad de que es la mejor curva de ajuste. Una curva con esta propiedad se dice que ajusta los datos en el sentido de mínimos cuadrados y se llama curva de regresión de mínimos cuadrados o simplemente curva de mínimos cuadrados. Por lo tanto una recta con esta propiedad se llama recta de mínimos cuadrados, una parábola con esta propiedad se llama parábola de mínimos cuadrados, etc. Empleando la definición anterior podemos demostrar que la recta de mínimos cuadrados de aproximación al conjunto de datos (x1, y1), ..., (xn, yn) tiene la ecuación donde las constantes a y b están dadas por ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
  • 56. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 51 E-mail: jhnv1977@hotmail.com 4.2.3. Recta de Mínimos cuadrados en términos de varianzas y covarianzas muestrales Las varianzas y covarianzas muestrales de x, y están dadas por ∑ ̅ ∑ ̅ ∑ ̅ ̅ En términos de éstas, las rectas de regresión de mínimos cuadrados de y sobre x y de x sobre y pueden escribirse respectivamente como ̅ ̅ ̅ ̅ 4.2.4. Error típico de la estima √ ∑ Ejemplo 38: Ajustar una recta de mínimos cuadrados a los datos de la Tabla 07 x 1 3 4 6 8 9 11 14 y 1 2 4 4 5 7 8 9 Tabla 07 Se grafican los puntos y se puede observar que la tendencia de los puntos es lineal, como se puede apreciar en la Imagen 13 Imagen 13: Gráfica de los puntos 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 12 14 16
  • 57. Estadística y probabilidad aplicada a la Educación Docente: Ing. Johan Herbert Narro Vargas 52 E-mail: jhnv1977@hotmail.com La ecuación de la recta estará dada por Se reordenan los datos en la siguiente Tabla 08, los mismos que servirán para calcular los valores de a y b. x y xy 1 1 1 1 1 3 2 9 6 4 4 4 16 16 16 6 4 36 24 16 8 5 64 40 25 9 7 81 63 49 11 8 121 88 64 14 9 196 126 81 ∑ 56 40 524 364 256 Tabla 08 Así ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ Por lo tanto la recta de mínimos cuadrados será: