SlideShare una empresa de Scribd logo
1 de 48
Descargar para leer sin conexión
Universidad de la República – Facultad de Agronomía
Departamento de Biometría, Estadística y Computación




            Métodos Cuantitativos II


              Guía de Ejercicios
               (versión preliminar)


                       2010




                                   Estela Priore
                                   Alejandra Borges
Lista de ejercicios 1


Conceptos claves: Población, muestra, experimento, experimento aleatorio, espacio muestral, resultado
elemental, conjunto de partes.



Ejercicio 1 (Actividad)

    1- Salir al parque de Facultad y medir los diámetros de las palmeras y araucarias del
    camino de entrada. Para medir los diámetros se van a tomar las medidas de
    circunferencia. En forestación se mide el DAP (Diámetro a la Altura del Pecho), esto es a
    1.3 metros desde el piso.

    2- Calcular los diámetros.

    3- Con los datos de diámetro de ambas especies, construir el cuadro de distribución de
    frecuencias (utilice intervalos cerrados a la derecha y abiertos a la izquierda) siguiendo las
    siguientes especificaciones:

                             Palmeras       Araucarias
        Rango                0,1 - 0,18     0,20 - 0,55
        Ancho de clase           0,01          0,05

Construir en un mismo par de ejes cartesianos los histogramas de frecuencias relativas de
ambas especies.


Ejercicio 2 (Discusión)

Sobre la actividad realizada en el ejercicio 1, discuta en grupo cual fue la población objetivo, la
muestra, la variable medida, si la actividad consistió en un experimento aleatorio, y el alcance
de las posibles inferencias.


Ejercicio 3

En base a las siguientes situaciones, discuta cuál es la población objetivo, la muestra, las
variables a medir, y si se trata de un experimento aleatorio o no.

    a) Se quiere caracterizar la distribución de ingresos de la población rural uruguaya en la
       década del ’90. Se utiliza para ello la información registrada por el Censo General
       Agropecuario.
    b) Se quiere saber, sobre el total de habilitados para votar a nivel nacional, qué
       porcentaje estaría a favor sobre la legalización de la comercialización de marihuana.
       Para esto se realizará una encuesta telefónica sorteando 300 números de la guía
       telefónica.
c) Se quiere determinar la incidencia de una cierta cepa de ”Pietín” en ovejas de la raza
       Corriedale en Uruguay. Se seleccionan 10 establecimientos rurales y en ellos se cuenta
       el número de animales que presentan la enfermedad.
    d) Se desea estudiar el efecto de cuatro temperaturas de cocción sobre la suavidad de los
       omelets preparados a partir de una mezcla. La mezcla se divide en 20 partes.
       Aleatoriamente se asignan 5 partes de la mezcla a una temperatura, 5 a otra, y así
       sucesivamente. La variable explicativa de interés (factor) está controlada por el
       investigador.
    e) En un experimento a campo se quiere estudiar la efectividad de un nuevo
       antiparasitario para lo cual se toman 325 terneros de la raza Hereford y se les aplica la
       dosis del mismo. Luego de una semana se observa si cada animal presenta o no
       parásitos.
    f) Una empresa forestal quiere determinar qué cultivares de Eucaliptos producen el
       mayor volumen y la mayor altura (atributo de calidad). Se plantaron 3 parcelas por
       cultivar, cada una con 30 árboles.


Ejercicio 4

Para cada una de las situaciones presentadas en los siguientes ítems, verificar si cumplen con
la definición de experimento aleatorio y para las que verifican construir el espacio muestral.

    1- Lanzar una moneda y observar cual es la cara que queda hacia arriba.

    2- Lanzar un dado y observar que cara queda hacia arriba.

    3- Sacar dos billetes sucesivamente, sin elegirlos, de una billetera que contiene uno de
       $U 100, otro de $U 200 y otro de $U 500. Anotar el valor de los billetes.

    4- Tomar tres pollitos bebé en un establecimiento avícola y determinar su sexo.

    5- Lanzar una moneda cuatro veces y ver que cara quedó hacia arriba en cada una.

    6- En un lote de 5 artículos hay 3 defectuosos. Elegir un artículo después de otro (sin
       sustituir el artículo elegido) hasta que se obtenga el último artículo defectuoso.

    7- Medir la resistencia a la tensión de una barra de acero.



Ejercicio 5 (problema)

Defina un experimento para contestar la siguiente pregunta: ¿cuál será la temperatura máxima
diaria el próximo 10 de abril en Paysandú?
Lista de ejercicios 2

Conceptos claves: Histograma de frecuencias relativas, evento, características de los eventos, conjunto
de partes, variable aleatoria (VA), clasificación de VA: discreta y continua, probabilidad.

Ejercicio 1 (Cont. Ej. 1 de lista anterior)

En base a los histogramas de frecuencias relativas construidos con los datos de diámetros de
las palmeras y las araucarias, responder las siguientes preguntas:

1-¿Qué proporción de las palmeras tienen diámetros menores a 0.12 m?

2. ¿Qué proporción de las araucarias tienen diámetros mayores a 0.35 m?

3. ¿Qué proporción de las palmeras tienen diámetros comprendidos entre 0.13 y 0.16 m?

4. ¿Qué proporción de las araucarias tienen diámetros menores a 0.30 m o mayores a 0.45 m?

5. ¿Cuál es la probabilidad de medir una palmera con diámetro entre 0.13 y 0.15 si se mide una
al azar?

6. ¿Con qué probabilidad se tendría una araucaria de diámetro entre 0.30 y 0.40 si se extrae
una al azar?

7. Para ambas especies, calcular: media, mediana, moda, varianza, desvío estándar y
coeficiente de variación.

Ejercicio 2

A continuación se presenta la precipitación acumulada mensual (mm) y el número de días al
mes con precipitación, para las estaciones meteorológicas de Salto y Paysandú ocurridas entre
los años 1960 y 1990 en el mes de Abril.

Para cada variable y cada estación, realice lo siguiente:

1. Construir los histogramas, incluyendo los polígonos de frecuencia.

2. Calcular la media, la mediana, la moda y el coeficiente de variación.

3. Calcule, para Salto y Paysandú, la probabilidad de que en abril del próximo año ocurran los
siguientes fenómenos:

        • Llueva más de 300 mm.
        • Llueva más de 250 mm.
        • Llueva menos de 50 mm.
        • Llueva menos de 100 mm.
        • Llueva entre 100 y 200 mm.
        • Llueva entre 150 y 300 mm.
PAYSANDÚ            SALTO
    AÑO        pp.    n.d.pp   pp.        n.d.pp
    1960       72        3     13            3
    1961       190       6     186           8
    1962       46        5     71            3
    1963       149       6     167           8
    1964       20        1     48            2
    1965       40        4     21            2
    1966       82        5     76            8
    1967       117       7     176           6
    1968       90        8     77            5
    1969       103       7     46            5
    1970       122       8     213           8
    1971       320      13     311          11
    1972       30        5     122           8
    1973       128       9     48            6
    1974       145      11     100           8
    1975       13        3     47            2
    1976       109       9     104           3
    1977       91        8     132           7
    1978       266      10     111           5
    1979        _        _     33            3
    1980       26        5     12            2
    1981       192      11     116           5
    1982        4        3     33            4
    1983       80        4     161           4
    1984       207       8     126           5
    1985       49        7     38            4
    1986       171       6     133           6
    1987       57        4     106           8
    1988       130       5     282           9
    1989       13        3     10            4
    1990        _        _     98            8

• Llueva menos de 5 días.
• Llueva menos de 10 días.
• Llueva menos de 20 días.
• Llueva más de 15 días.
• Llueva más de 10 días.
• Llueva entre 5 y 15 días.
• Llueva entre 10 y 20 días.
Ejercicio 3 (Said Infante Gil)

1) Los siguientes son conteos del número de cromosomas en una herbácea (Claytonia
virginica, L.):

24          28       28          28          27          28          29          29          29          30
29          30       30          29          31          29          31          24          28          29
28          24       28          29          31          31          24          28          29          30
29          28       30          33          28          34          38          28          32          33
28          31       32          34          39          40          31          35          27          28
31          35       30          29          24          28          31          32          28          32
28          29       30          33          41          30          29          42          28          29
32          33       30          28          28          31          32          28          29          30
28          28       31          34          34          28          36          31          36          35
Fuente: Science, 17 de noviembre de 1969

     a) Construya una tabla de dos encabezados mostrando la frecuencia de cada conteo
     b) Construya una tabla de frecuencias que le permita contestar las siguientes
        preguntas:
        1. ¿Qué porcentaje de células tienen 32 cromosomas o menos?
        2. ¿Qué porcentaje de células tienen más e 29 cromosomas?


Ejercicio 4 (Said Infante Gil)

A continuación se presentan 103 determinaciones del contenido de ácido ascórbico en el jugo
de toronja.

 Contenido de ácido ascórbico en 103 muestras de jugo de toronja (miligramos por mililitros)

     0.49        0.56     0.53        0.58        0.53        0.48        0.46        0.41        0.43    0.50
     0.49        0.47     0.46        0.43        0.38        0.39        0.51        0.51        0.50    0.45
     0.42        0.43     0.42        0.40        0.49        0.47        0.48        0.41        0.44    0.39
     0.35        0.33     0.35        0.40        0.43        0.47        0.47        0.46        0.48    0.50
     0.45        0.50     0.42        0.38        0.41        0.35        0.32        0.33        0.33    0.38
     0.40        0.45     0.50        0.41        0.45        0.48        0.43        0.48        0.47    0.37
     0.42        0.36     0.34        0.34        0.36        0.42        0.40        0.44        0.47    0.46
     0.50        0.44     0.43        0.41        0.40        0.38        0.41        0.36        0.36    0.34
     0.36        0.40     0.43        0.47        0.48        0.46        0.34        0.37        0.34    0.35
     0.37        0.39     0.38        0.41        0.46        0.43        0.42        0.44        0.38    0.36
     0.36        0.33     0.33
Fuente: Science, 4 de febrero de 1944, pág.103

     a) ¿Qué inconveniente tendría en este caso una tabla de dos encabezados?
     b) Elija límites de clases adecuados para estos datos y construya una tabla de frecuencias
        con límites y valor medio de clase, frecuencias absolutas y relativas, frecuencias
        absolutas acumuladas y frecuencias relativas acumuladas.
Ejercicio 5 (Said Infante Gil)

Con los conteos de cromosomas del ejercicio anterior elaboramos la siguiente tabla de
frecuencias:
               Número de cromosomas por
                                                  Frecuencia (fi)
                        planta
                       (23 , 26]                        5
                       (26 , 29]                       40
                       (29 , 32]                       27
                       (32 , 35]                       11
                       (35 , 38]                        3
                       (38 , 41]                        3
                       (41 , 44]                        1
              Σ                                        90

Calcule media, mediana, varianza, desviación estándar y coeficiente de variación del
número de cromosomas por planta usando la tabla. Calcule estas medias en los datos
individuales y compárelas.

Ejercicio 6 (Repaso de conjuntos)

Para cada ítem definir el conjunto A1 unión A2 y el conjunto A1 intersección A2, y realice un
diagrama de Venn.

1. A1 = {x : x = 0, 1, 2} A2 = {x : x = 2, 3, 4}
2. A1 = {x : 0 < x < 2} A2 = {x : 1 < x < 3}
3. A1 = {x : x = 1, 2, 3, 4} A2 = {x : x = 3, 4, 5, 6}
4. A1 = {x : 2 x 6} A2 = {x : x > 10}
5. A1 = {x : 0 x 40 o 50 x 100} A2 = {x : 0 < x < 50}

Ejercicio 7 (Repaso de conjuntos)

Encuentre el complemento de A siendo A* el conjunto universal:

1. A* = {x : 0 < x < 1} A = {x : 5/8 ≤ x < 1}
2. A* = {x : 0 < x ≤ 10} A = {x : 2 ≤ x < 10}
3. A* = {x : 0 ≤ x < ∞} A = {x : 15 ≤ x, 0 ≤ x ≤ 8}
4. A* = {♣,◊,♥,♠} A = {◊,♠}


Ejercicio 8 (Repaso de conjuntos)

Dados los siguientes conjuntos:

A = {x : 10 < x < 20}
B = {x : 15 ≤ x ≤ 50}
C = {x : 12 < x < 30}

Compare los siguientes conjuntos:

1. A U B y B ∩ A
2. A ∩ B y B ∩ A
3. A U (B U C) y (A U B) U C
4. A ∩ (B ∩ C) y (A ∩ B) ∩ C
5. A U (B ∩ C) y (A U B) ∩ (A U C)
6. A ∩ (B U C) y (A ∩ B) U (A ∩ C)

Para los mismos conjuntos anteriores siendo el conjunto A* = {x : 0 ≤ x < ∞} escribir los
siguientes conjuntos complementarios:

1. (A U B) c
2. (A ∩ B) c


Ejercicio 9 (Variables aleatorias)

Para cada uno de los casos del Ejercicio 4 de la lista de ejercicios anterior, defina una variable
aleatoria de interés y clasifíquela como continua o discreta.


Ejercicio 10 (Variables aleatorias)

Defina 4 experimentos aleatorios distintos y construya sus respectivos espacios muestrales,
defina 2 variables aleatorias de interés para los experimentos y clasifíquelas.


Ejercicio 11 (Probabilidad)

La siguiente tabla de frecuencias se construyó con datos obtenidos de 100 parcelas de 10
metros cuadrados cada una, en las que se observó el rendimiento obtenido en kg. de tomate
por parcela.
                                  Xi          Frec. Relat.
                                  7,5            0.045
                                 12,5            0.120
                                 17,5            0.170
                                 22,5            0.110
                                 27,5            0.060
                                 32,5            0.070
                                 37,5            0.150
                                 42,5            0.170
                                 47,5            0.075
                                 52,5            0.030

Asumiendo que el número de repeticiones es suficientemente grande como para considerar a
las frecuencias relativas aproximadas a los valores de probabilidad. Considere los siguientes
eventos siendo “Y” la variable aleatoria rendimiento de tomate en Kg por parcela: A = {Y ≤ 15} ;
B = {Y ≤ 45} ; C = {Y ≤ 20}.
Calcule las siguientes probabilidades:

1. P[BcUA]
2. P[B∩Ac]
3. P[Ac U [C∩Bc]]
Ejercicio 12 (Probabilidad)
Los datos de la siguiente tabla de frecuencias corresponden a rendimientos (gr.) de plantas de
soja.

 Intervalo     Frec. absoluta
   [ 0 - 5]           7
  ( 5 - 10]           5
  (10 - 15]           7
  (15 - 20]          18
  (20 - 25]          32
  (25 - 30]          41
  (30 - 35]          37
  (35 - 40]          25
  (40 - 45]          22
  (45 - 50]          19
  (50 - 55]           6
  (55 - 60]           6
  (60 - 65]           3
  (65 - 70]           1

1. ¿Cuántas plantas se observaron?
2. Si se asume que el número r hallado en el punto ”a” es suficientemente grande, calcule (a
   partir de la tabla) las siguientes probabilidades al seleccionar una planta al azar de la
   población:

• P[{20 < Y ≤ 60}]
• P[{30 < Y ≤ 60}]
• P[{Y ≤ 10} U {Y > 60}]
• P[{Y ≤ 50} ∩ {Y > 10}]
• P[{20 < Y ≤ 50} U {30 < Y ≤ 60}]
• P[{20 < Y ≤ 50} ∩ {30 < Y ≤ 60}]
• P[{Y ≤ 30}]
• P[{Y > 50}]


Ejercicio 13 (Reto)

En una cosecha de manzanas se sabe que el 15 % están picadas. Si el productor toma 4
manzanas, ¿cuál es la probabilidad de que encuentre:

1. Exactamente dos manzanas picadas?
2. Por lo menos una manzana picada?
3. No más de tres manzanas picadas?
4. Hasta 3 manzanas picadas?

(Sugerencia: Plantear primero el experimento aleatorio básico y en cada caso tener claro qué
resultados sirven y cuáles no)
Lista de ejercicios 3


Conceptos claves: Característica de eventos. Dos leyes del cálculo de probabilidades. Función de
distribución y de densidad de probabilidad. Modelos de probabilidad Bernoulli y Binomial.

Ejercicio 1 (Said Infante Gil)

Considere el experimento en elegir cédulas del censo mexicano de 1970 y determinar si el
individuo censado únicamente habla alguna lengua indígena, si sólo habla español, o si habla
alguna lengua indígena y además español. En el primer caso denote el resultado del
experimento por I (sólo lengua indígena), en el segundo por E (sólo español) y en el tercero por
B (bilingüe).

    a) Escriba el espacio muestral si se eligen dos cédulas (notar que hay 9 resultados
       posibles).
    b) Sobre el espacio muestral obtenido defina la variable aleatoria X como el número de
       individuos bilingües. Determine el valor de X para cada uno de los 9 resultados
       posibles.
    c) De acuerdo con el censo de 1970, P(I) = 0.02, P(E) = 0.92 y P(B) = 0.06 (esas son las
       frecuencias relativas obtenidas). ¿Cuál es la función de probabilidades para la variable
       aleatoria X definida en b)? Suponga independencia entre las dos repeticiones del
       experimento; es decir , que la probabilidad del evento { I I } es 0.0004

Ejercicio 2 (Said Infante Gil)

En seguida se presentan 4 funciones. Determine cuáles son funciones de probabilidades.
Establezca la razón o razones para su decisión.

                      x −1
        a) f X ( x) =      ; x = 0,1,2
                        2
        b) f X ( x) = x − x 2 + 0.01; x = 0.1;0.2;0.3;0.4;0.5
        c) f X ( x) = + x ; x = 0.01;0.04;0.09;0.16
                        x
        d) f X ( x) =     ; x = 1,2,3
                        5

Ejercicio 3 (Said Infante Gil)

Considere la siguiente función de probabilidades:
X             -4            -3           -2               -1         0             1
fX(x)         0.2           0.3          0.2              0.1        0.1           0.1

    a) Calcule P(X≤ -3); P(X> -1); P(X< -4); P(X≥ -3); P(X> -3)
    b) Dibuje el diagrama de puntos e histograma de probabilidades para fX(x).


Ejercicio 4

En una fábrica que se dedica a la producción de bolsas plásticas se sabe que el 8% están
pinchadas. A su vez una empresa productora de lácteos -cliente de la anterior- desea saber
cuál es la calidad de las mismas ya que el empaque es fundamental para la correcta
conservación de los productos que ella distribuye. Para esto se realiza un experimento que
consiste en tomar 4 bolsas al azar y se observa si están pinchadas o no.

1. Escriba el espacio muestral.
2. Defina la variable aleatoria de interés y su correspondiente distribución.
3. Calcule las siguientes probabilidades:

        • Sacar al menos 2 bolsas dañadas.
        • Sacar 3 bolsas dañadas.
        • Sacar hasta 3 bolsas dañadas

4. ¿Que supuestos fueron necesarios para el calculo de probabilidad que usted realizó?

Ejercicio 5

Un productor decide cultivar dos tipos de tomate: americano y perita. Del tipo americano
planta 230 semillas y del tipo perita planta 358. Luego de tres semanas de cultivadas el
productor recorre el campo y registra la cantidad de semillas que emergieron para cada tipo.
Los resultados son los siguientes:

Variedad         Cultivadas       Emergieron       % emergencia
 Americano             230            126              0,55
    Perita             358            293              0,81

1. ¿Qué modelo teórico de probabilidad considera apropiado si se define una variable aleatoria
X:”número de plantas que emergieron de una variedad en el total que se cultivó de la misma”?
¿Cuáles son los parámetros para cada una de las variedades?

2. Suponga que se toman 6 semillas al azar. Calcule las siguientes probabilidades:
   (a) Que germinen 4 semillas.
   (b) Que germinen a lo sumo 2 semillas.
   (c) Que germinen al menos 3 semillas.

3. ¿Cuál será el número esperado de semillas germinadas, si se plantaran en el próximo ciclo
500 semillas para cada tipo?

Ejercicio 6

Se quiere estudiar la incidencia de mancha negra, causada por Phillosticta citricarpa en frutos
cítricos. Para esto se observaron 10 frutas por árbol en 20 árboles y en cada caso se registró
presencia de síntoma o no.

1. ¿Cuál es la variable de interés y cómo se distribuye?

2. Dado que la probabilidad de encontrar un fruto infectado es de 0.2, ¿cuál es el número
esperado de frutos con síntoma?

3. Si se tomaran 6 frutos al azar, calcule las siguientes probabilidades:

        (a) Encontrar más de 4 frutos infectados.
        (b) Encontrar al menos un fruto infectado.
Ejercicio 7

Un comité asesor está compuesto por 15 miembros, 9 a favor, 4 en contra y 2 indiferentes
acerca de la modificación de un reglamento. Tres periodistas de distintos programas radiales
(en distintos momentos) eligen al azar una persona del comité para entrevistar, ¿cuál es la
probabilidad de que al menos dos de las personas seleccionadas estén a favor de la
modificación?


Ejercicio 8

Un barco posee 3 luces de emergencia, cada una de las cuales se pone en funcionamiento
automáticamente con una probabilidad de 0,99 ante una emergencia. Si las tres luces
funcionan de forma INDEPENDIENTE, calcule:

        1. la probabilidad de que al menos una de las luces funcione en una emergencia.
        2. la probabilidad de que todas fallen (no funcione ninguna) en una emergencia.


Ejercicio 9

Según las Leyes de Mendel, la proporción de semillas de color amarillo en arvejas en la F2
luego de un cruzamiento de una homocigota dominante y una recesiva es de 0.75.

1. Si se obtienen 600 semillas de un cruzamiento, cuántas de estas se espera que sean
amarillas?.
2. Si se toman 6 semillas al azar, siendo Y: ”número de semillas amarillas en 6 semillas”, calcule
la probabilidad de los siguientes eventos:

        (a) P[{Y < 3}]
        (b) P[{Y > 2} ∩ {Y < 5}]
        (c) P[{Y > 3}]
        (d) P[{Y > 2}]
        (e) P[{Y = 3}]
        (f) P[{Y ≥ 3}]


Ejercicio 10 (Aplicación: Inspección por muestreo1)

Una compañía farmacéutica es la encargada para proveer lotes de vacuna para ganado a un
distribuidor, algunas de las cuales resultan estériles. Testear cada vacuna es impracticable ya
que el test es destructivo. Para el seguimiento de la calidad de las vacuna el distribuidor realiza
en el siguiente proceso de inspección. De cada lote se eligen al azar 10 vacunas y se registra el
número de vacunas estériles, X. Si X = 0 el lote es aceptado, y si 1 _ X es rechazado2. Asuma
que el tamaño de lote es lo suficientemente grande y que X es aproximadamente binomial con
n = 10 y p la fracción desconocida de vacunas estériles (parámetro) por lote.

1. Si p = 0.2, ¿cuál es la probabilidad de que un lote sea aceptado utilizando el plan de
inspección por muestreo del distribuidor?

2. Calcule la probabilidad de aceptar el lote, P(A), para p = 0.05, 0.1, 0.2, 0.3, 0.4. Grafique P(A)
en función de p uniendo los puntos3.
Ejercicio 11 (Variable aleatoria Poisson)

Sea X = ”número de animales afectados con Pietín en una hectárea”. Se sabe que X presenta la
siguiente función de masa de probabilidad:

                                                                        e − λ λ xi
                                                     P( X = xi ) =
                                                                           xi !

para x1 = 0, 1, 2 . . . n, con λ el número promedio (esperado) de animales con Pietín por
hectárea.
Para λ = 0.02, calcule las siguiente probabilidades.

              1. Exactamente un animal afectado.
              2. Ningún animal afectado.
              3. Al menos un animal afectado.

Ejercicio 12

Se está pensando el parcial de Métodos Cuantitativos II en un formato de múltiple opción. Una
propuesta es hacer 10 preguntas, cada una con cuatro opciones. Calcule la probabilidad de
responder 8 o más preguntas correctamente, si se contesta al azar.


Ejercicio 13 (Variable aleatoria uniforme)

Sea X una variable aleatoria con función de densidad f(x) = k para 0 ≤ X ≤ 2 y 0 en otro caso.

1. Grafique f(x).
2. Calcule el valor de k para que la función f sea una función de densidad de probabilidades.
3. Calcule P(X ≤ 0, 05), P(X ≤ 0, 25), P (0, 8 ≤ X)


Ejercicio 14 (Variable aleatoria triangular)

Dibuje en un plano cartesiano un triángulo de vértices (0,0), (1,1) y (2,0).

1. Calcule el área de dicho triángulo.
2. El triángulo dibujado por usted puede representar la distribución de probabilidades de una
variable aleatoria, digamos X. Dicha variable se llama triangular. Calcule P(X ≤ 0.5); P(X ≤ 0.25);
P(X ≤ 1); P(0.75 ≤ X)


Ejercicio 15
Encuentre en el capítulo 4 (Nociones de probabilidad) de Said Infante Gil, en la página 103,
¿cuál es el error en el espacio muestral planteado en el ejemplo c?


1Ej.   Tomado de Atacaría et al, Cap. 5, Ej. 12
2Esto es un plan de muestreo con tamaño de muestra n       = 10 y número de aceptación c = 0.
3Esta curva es   llamada ”Curva operativa característica para el plan del muestreo
Lista de ejercicios 4

Conceptos claves: Valor esperado, varianza, propiedades. Distribución normal, distribución normal
estándar.

Ejercicio 1

Para los siguientes modelos de probabilidad calcule la E(X) y V (X)

1. X ~ Bernoulli (0:8)
2. X ~ Bernoulli (p)
3. X ~ Binomial (3; 0:8)

Ejercicio 2 (Continuación Ej. 9 de la lista anterior)

Calcule la esperanza y la varianza de las variables P1 y P2, siendo P1 = 4X y P2 = 4X - 2(10 - X).

Ejercicio 3

Sea X una variable aleatoria con función de densidad f(x) = 1, si 0 ≤ X ≤ 1 y 0 en otro caso.
1. Grafique f(x) y verifique que es una función de densidad.
2. Calcule la E(X) y V (X).
3. Sean Y = X + 3 y W = 2X, calcule la esperanza y la varianza de Y y W.

Ejercicio 4

Una compañía de seguros sabe que la probabilidad de que roben un auto en un año es 0.15 (nº
robos/ nº autos) y que hay solicitudes para 1.500 seguros contra robo. El precio promedio de
un auto es U$ 3.000. ¿Cuánto debe cobrar por seguro para que en un año no tenga pérdidas?

Ejercicio 5

La función de distribución de probabilidades de venta de 2 productos es:

marca A             xi        0      1      2      3      4      5
                  P(X=xi)    0,1    0,1    0,2    0,3    0,2    0,1


Marca B             yi        0    1    2
                  P(Y=yi)    0,23 0,48 0,29

Sea X = número de unidades de la marca A vendidas en 1 semana, y Y = número de unidades
de la marca B vendidas en 1 semana. Hallar la esperanza y la varianza de ambas marcas.


Ejercicio 6

Sea X: nº de unidades vendidas de la marca A en una semana, cuya función de distribución de
probabilidad fue dada en el ejercicio anterior. Suponga que se obtiene una ganancia de 50
dólares por cada unidad vendida y que el costo fijo semanal es de 20 dólares. ¿Cuál es la
esperanza de ganancia neta? (Ganancia neta = ingresos - costos)
Ejercicio 7

En vacas holando en posparto, la probabilidad de presencia de folículos ovulatorios (NFOL:X),
donde de cada folículo sale un ovulo, tiene asociada la siguiente función de distribución.

     NFOL:X        0       1       2   3    4
 f(X) = P(X = xi) 0.3     0.5     0.1 0.06 0.04

Determine la esperanza y la varianza de esta variable aleatoria.

Ejercicio 8

En un trabajo sobre preferencia de alfajores de chocolate, se usa una escala de preferencia de
5 puntos, donde 1 significa el más aceptado, y 5 el menos aceptado. Se sabe la función de
probabilidad asociada con la variable X (escala de preferencia) para una determinada marca de
alfajores de chocolate, es:

       X               1   2    3   4   5
f(X) = P(X = xi)      0,1 0,25 0,5 0,1 0,05

Determine la esperanza de dicha variable aleatoria.

Ejercicio 9 (Said Infante Gil)

Suponga que le número de interrupciones (por mes) de la corriente eléctrica (X) en un sector
de una ciudad tiene la siguiente función de probabilidades:

X              0           1           2          3            4           5               6
fX(x)          0.12        0.32        0.28       0.17         0.06        0.03            0.02

    a) Calcule E(X) y E(X2)
    b) Calcule σ X y obtenga σ X
                 2




Ejercicio 10 (Said Infante Gil)

Calcule µ X , σ X y σ X para la función de probabilidades del ejercicio 3 de la lista 3.
                2



Ejercicio 11

1. Dada la variable aleatoria Z con distribución normal, media cero y varianza 1, calcular las
siguientes probabilidades:

        (a) P (Z > 0,75)
        (b) P (Z < 1,30)
        (c) P (Z > 1,96 ó Z < -1,96)
        (d) P (Z < 1,64)
        (e) P (Z > -0,57)
        (f) P (Z > 1,64 ó Z < -1,64)
2. Dada la variable aleatoria Z con distribución normal, media cero y varianza 1, calcular los
valores simétricos z1 y z2 que cumplen,

        (a) P (z1 < Z < z2) = 0,95
        (b) P (z1 < Z < z2) = 0,80
        (c) P (Z > z1 ó Z < z2) = 0,10 siendo z1 > z2
        (d) P (Z > z1 ó Z < z2) = 0,20 siendo z1 > z2
        (e) P (z1 < Z < z2) = 0,6826
        (f) P (z1 < Z < z2) = 0,9974

Ejercicio 12

Dada la variable aleatoria Y, con distribución normal, media 6 y varianza 4, calcular las
siguientes probabilidades,

        1. P (Y > 3)
        2. P (Y > 1,6)
        3. P (Y > 8)
        4. P (Y > 10 ó Y < 2)
        5. P (2 < Y < 10)
        6. P (Y > 3 y Y < 2)
        7. P (0 < Y < 12)
        8. P (Y > 6)


Ejercicio 13

Utilizando el modelo teórico normal, determine para una variedad de maíz, cuya media es
10.23 y su varianza 4.25, las siguientes probabilidades,

        1. P (X > 10,23)
        2. P (X = 10,23)
        3. P (X < 10,23)
        4. P (10, 23 < X < 14,35)
        5. P (X > 14,35)
        6. P (9 < X < 10,23)
        7. P (X < 9)
        8. P (8,17 < X < 12,29)


Ejercicio 14

Se sabe que la distribución del rendimiento en gramos de las plantas de Soja se distribuye
normal (31.4; 16.3), calcule,

        1. La probabilidad de encontrar plantas entre 20 y 43 gr.
        2. La probabilidad de encontrar plantas que pesen más de 40 gr.
        3. La probabilidad de encontrar plantas que pesen menos de 20 gr.
        4. La probabilidad de encontrar plantas entre 30 y 33 gr.
Ejercicio 15 (Said Infante Gil)

Si X ∼ N(60 ; 81) calcule:
        a) P(X ≤ 80)
        b) P(X ≤ 50)
        c) P(50 < X < 70)
        d) P(62 < X < 69)
        e) P(41 < X < 49)


Ejercicio 16 (Said Infante Gil)

Suponga ahora que X ∼ N(60 ; 16). Calcule las mismas probabilidades que en el ejercicio
anterior. Compárelas e interprete los cambios en relación con la disminución de σ2.
Lista de ejercicios 5


Conceptos claves: Muestra aleatoria, estimador y estimación. Distribución de la media muestral.
Distribución t

Ejercicio 1

Una muestra aleatoria de plantas de soja (de la Lista de Ejercicio 4, ejercicio 12), resultó en los
siguientes valores:

  Xi     29.2   32.4    28.4     21.5   40.6    35.2   33.4     35.3   29.4

1. Estime la media y la varianza de la población.
2. Calcule la esperanza y la varianza de
3. ¿Cómo se distribuye X?
4. Calcule la probabilidad de obtener una media muestral como la que obtuvo o mayor.

Ejercicio 2 (Said Infante Gil)

El porcentaje de proteína (X) en una variedad de soja tiene una media de 23, con una
desviación estándar de 2.0. Se realizan 10 determinaciones independientes del contenido de
proteína en dicha variedad. Suponga que X tiene distribución Normal.

    a) ¿Cuál es la distribución de X , la media aritmética de las determinaciones?
    b) ¿Cuál es la probabilidad de que la X que se obtenga sea mayor de 24? ¿De qué esté
       entre 22.5 y 23.5?
    c) Suponga ahora que se hacen 50 determinaciones. Calcule las mismas probabilidades
       que en el inciso b).

Ejercicio 3 (Said Infante Gil)

Refiriéndonos al ejercicio anterior, suponga que la desviación estándar del porcentaje de
proteína es 3.0. Repita los cálculos de los incisos b) y c).


Ejercicio 4 (Said Infante Gil)

Interprete los cambios en P ( X > 24) y P (22.5 < X < 23.5) en los ejercicios 7.8 y 7.9, con
respecto al aumento de tamaño de muestra y al aumento en la varianza de la distribución.

Ejercicio 5 (Said Infante Gil)

Suponga que el peso neto por lata en una marca de sopa tiene una media de 565 gramos, con
una desviación estándar de 15 gramos. Suponga distribución Normal de los pesos.
   a) Si se toma una muestra aleatoria de 9 latas y se registra el peso, ¿cuál es la
       probabilidad de que la media muestral esté entre 555 y 575 gramos?
   b) ¿De qué tamaño tendría que ser la muestra para que la probabilidad calculada en el
       inciso a) fuese 0.9906?
Ejercicio 6

Calcule para una variable aleatoria con distribución t de Student (con los grados de libertad
señalados), las siguientes probabilidades:

        P(T9 < 1.83)
        P(T4 < 1.53)
        P(T6 > −3.14 )
        P(T15 > 2.13)
        P(− 1.36 < T12 < 1.36)

Ejercicio 7

En una variable aleatoria con distribución t de Student con 12 grados de libertad, encuentre:

1. El valor de la variable que es superado por el 5 % de las observaciones.
2. El valor de la variable que supera al 10% de las observaciones.
3. Los valores entre los que se encuentra el 95% central de las observaciones.

(Sugerencia: Plantear lo que se está pidiendo en un bosquejo de la distribución t)

Ejercicio 8

¿Cuántos grados de libertad debe tener una variable aleatoria con distribución T de Student
para que se cumplan las siguientes igualdades:

P(T   > 1.67 ) = 0.05
P(T   < 6.31) = 0.95
P(T   > 2.53) = 0.01
P(T   > −1.74) = 0.95


Ejercicio 9

Para el ejercicio 1 realice los ítems 3 y 4 suponiendo desconocida la varianza poblacional.


Ejercicio 10

Una muestra aleatoria de plantas de maíz dio como resultado los siguientes valores:

                            xi 1.5 2.3 1.8 1.6 2.0 1.3 2.4 1.9

1. Estime la media y la varianza del peso de las plantas de maíz.

2. Calcule la probabilidad de obtener una media muestral como la obtenida o menor si se
supone que la verdadera media de la población es 2.5.
3. Calcule la probabilidad de obtener una media muestral como la obtenida o menor si se
supone que la verdadera media de la población es 1.8.

4. ¿Que le sugieren los resultados respecto al verdadero valor de la media de la población?
Lista de ejercicios 6

Conceptos claves: Estimación por intervalos de confianza para la media y varianza. Distribución
χ2.Teorema del límite central.

Ejercicio 1

Si la variable aleatoria Y tiene una distribución Chi-cuadrado con 10 grados de libertad, calcule
las siguientes probabilidades:

         P(Y > 3.25)
         P(Y > 18.3)
         P(Y > 2.56)

Ejercicio 2

En cada ítem, encuentre el valor de k para que se cumplan las siguientes condiciones:

           (             )
         P χ 6 > k = 0.975
             2


         P (χ   2
                9    < k ) = 0.025
         P (χ   6
                16   > k ) = 0.95
         P (χ   2
                15   < k ) = 0.995


Ejercicio 3

Encuentre los valores k1 y k2 que cumplen las siguientes condiciones, dejando probabilidades
iguales en cada cola de la distribución.

           (
         P k1 < χ 82 < k 2 = 0.90 )
         P (k   1   <χ    2
                         17   < k ) = 0.80
                                 2

         P (k   1   <χ   2
                         20   < k ) = 0.80
                                 2


Ejercicio 4

En una investigación sobre toxinas producidas por un hongo que afecta el cultivo de maíz, un
bioquímico prepara extractos de un cultivo del hongo con solventes orgánicos y mide la
cantidad de la sustancia tóxica (mg) por gramo de solución, obteniendo los siguientes
resultados a partir de 9 preparados:

                                 1,2 0,8 0,6 1,1 1,2 0,9 1,5 0,9 1,0

1. Calcule la media muestral.

2. Sabiendo que σ = 0.3 construya un intervalo de confianza del 98% para el peso promedio
de la sustancia tóxica por gramo de cultivo del hongo.

3. Interprete el intervalo.
Ejercicio 5

Un investigador, estudiando la posibilidad de extraer proteína de un alga marina para usarla en
la alimentación de animales, hizo 18 determinaciones de la proteína extraída en muestras de
50 Kg. de alga. La media muestral y la desviación estándar fueron de 3.6 kg y 0.8 kg
respectivamente. Estime a través de un intervalo de 95% de confianza la producción media de
proteína extraída por 50 kg de alga. Interprete el intervalo. Un colega afirma que el contenido
de proteína en 50 kg de alga es igual a 4,5 kg ¿Qué puede decir usted en base al intervalo que
construyó?

Ejercicio 6

Para el ejercicio anterior obtenga un intervalo de confianza al 95% para σ2.

Ejercicio 7

Una muestra aleatoria de cebollas, proporcionó la siguiente información con respecto al peso
en gramos/bulbo:

       100 122 125 98 95 106 189 125 160 145 138 165 172 154 166 140

Estime el peso medio de los bulbos de toda la cosecha de donde proviene la muestra,
utilizando un intervalo de confianza del 90%. Estima con un intervalo de confianza al 90% la
varianza poblacional.

Ejercicio 8

Encuentre los límites del 95% de confianza para la media de la población de la cual se obtuvo
una muestra que dio los siguientes valores:

                               18,5 20,6 12,9 14,6 19,8 15,0

Ejercicio 9

Se obtuvieron los siguientes rendimientos (en ton/ha) de una variedad de uva para vino fino,
en 9 parcelas experimentales:

                         3,2 3,9 4,3 3,4 3,7 4,2 3,4 4,4 4,5

Calcule el intervalo de 90% de confianza para la varianza poblacional.

Ejercicio 10

Un modelo físico sugiere que el aumento de la temperatura promedio en el agua usada como
refrigerante en una cámara de compresión no debe ser más de 5 oC. Los aumentos de
temperatura en el refrigerante medidos en 8 oportunidades en el compresor dieron los
siguientes resultados:

                            6,4 4,3 5,7 4,9 6,5 5,9 6,4 5,1
1. Obtenga un intervalo de confianza al 95% para la media de la variable de interés.
2. Permiten estos datos concluir que el cambio de temperatura es diferente a 5 ºC.
3. Si el laboratorio observara valores promedio de cambio de temperatura en el refrigerante
de 6 ºC los seguiría utilizando o no? Fundamente su respuesta.


Ejercicio 11

Los paquetes de un determinado fungicida, poseen una especificación acerca del contenido de
cobre del mismo: 0.60 miligramos de cobre cada 100 gramos de producto. Una dependencia
del MGAP analiza una muestra al azar compuesta por 100 paquetes de 100 gramos de
producto y encuentra que la media muestral es de 0.63 miligramos y el desvío de 0.11
miligramos.

1. Construya un intervalo de confianza para el valor promedio de cobre del fungicida de 98%
de confianza.

2. Considerando la información que posee ¿como haría la especificación del producto en
cuanto a su contenido en cobre?

Ejercicio 12

Una muestra aleatoria de frascos de cereza, dio los siguientes pesos (g) de contenido por
frasco:

                          343 337 352 349 337 343 352 343

1. Estime la media de peso de contenido y el desvío estándar de la población.
2. Estima con un intervalo de confianza de 80% el contenido medio de la población.
3. ¿Se puede afirmar con 95% de confianza que U es de 350 g, a partir de lo calculado en el
punto anterior?

Ejercicio 13

Una muestra aleatoria de 25 pollos arrojó un peso medio de 2350 gr. con una desviación
estándar de 150 gr.

1. Estime el peso medio de todos los pollos del criadero de donde proviene la muestra con un
intervalo de confianza del 90%.

2. Efectúe lo mismo pero suponiendo que la media muestral fue obtenida en una muestra de
tamaño:

        n=9
        n=16
        n=144

3. ¿Como influye el tamaño de muestra sobre la amplitud del intervalo?

4. Estime el peso medio de todos los pollos del criadero de donde proviene la muestra con un
intervalo de confianza de 80%, 95% y %99.
5. ¿Cómo influye el nivel de confianza sobre la amplitud del intervalo?

6. Calcule el intervalo de 90% para la varianza poblacional.

Ejercicio 14

Una muestra aleatoria de botellas de Chardonnay (de 375 cc de contenido) fue medida para
controlar su contenido. Los resultados fueron:

                           373 377 372 379 377 378 372 373

1. estime la media y el desvío estándar del lote.

2. estime con un intervalo de confianza de 0.90 los parámetros

Ejercicio 15

La Reproductive Biology Research Foundation de St. Louis, Missouri realizó un experimento con
el objetivo de determinar el efecto de la marihuana en la sexualidad (Newsweek, 27 de abril
1974). Para el mismo se eligieron 20 muchachos en buen estado de salud que habían fumado
marihuana al menos 4 días por semana por un período de 6 semanas, sin ingerir otras drogas
en ese lapso, junto con un grupo de control de otros 20 muchachos que nunca habían fumado
marihuana. La medida de la sexualidad que se midió fue el nivel sanguíneo de testosterona
(hormona sexual masculina). El grupo que consumió marihuana tuvo una media de
testosterona de 416 y un desvío estándar de 152, mientras que el otro grupo tuvo una media
de 742 y un desvío estándar de 130. Sabiendo que cuanto mayor sea el nivel sanguíneo de
testosterona mayor es el impulso sexual, realice un intervalo de confianza para cada uno de los
grupos al 95%. ¿Qué puede decir usted en términos del problema?

Ejercicio 16

Se somete a prueba 2 variedades, para determinar las diferencias de rendimientos. Las 32
parcelas sembradas con la variedad A tienen rendimiento medio de 60 con una desviación
estándar de 19 mientras que las 36 sembradas con la variedad B, una media de 66 con una
desviación estándar de 16. Determine los límites de confianza del 95% para cada la media de
cada variedad.

Ejercicio 17

La ganancia de peso de dos lotes de animales alimentados con dos raciones diferentes fueron
las siguientes:

                                      Ración A      Ración B
                                         15            25
                                         25            30
                                         35            30
                                         25            40
                                                       35
                                                       20
Determine un intervalo de confianza al 90% para ganancia de peso media cada lote alimentado
con las diferentes raciones. Determine además un intervalo de confianza para cada una de las
varianzas poblacionales al 90%.


Ejercicio 18

Se analizan dos variedades de tabaco, para determinar el contenido de nicotina, y se obtienen
los resultados siguientes en miligramos:

                                  Tabaco A 24 26 25 22 23
                                  Tabaco B 27 28 25 29 26 32

1. Determine un intervalo de confianza del 90% para el contenido de nicotina de cada variedad
de tabaco.

2. Ídem para el 95% de confianza.

3. Ídem para el 99% de confianza.

4. Determine un intervalo de confianza al 90% para la varianza del contenido de nicotina de
cada variedad de tabaco.


Ejercicio 19 (Said Infante Gil)

En un estudio sobre le contenido de caroteno en un tubérculo (Science, Vol.103, núm. 2668,
pág. 194, 15 de febrero de 1946) se obtuvieron los siguientes resultados (en mg/100 g):

6.39    5.52     5.05    4.75     4.60   4.13   3.90   3.99   3.90    3.85   3.76    3.65
3.43    3.49     3.51    3.34     3.41   3.26   3.31   3.13   3.11    3.03   2.89    2.56
2.25    2.01     1.46

    a) Construya un intervalo de confianza para la media del contenido de caroteno (α =
       0.05)
    b) Construya un intervalo de confianza para la varianza del contenido de caroteno en la
       especie en cuestión (α = 0.05)
Lista de ejercicios 7

Conceptos claves: Teorema del límite central. Estimación por intervalos de confianza para una
proporción.

Ejercicio 1

Un productor de lámparas de bajo consumo asegura que en promedio sus lámparas tienen un
duración media de 1000 horas. Usted que no confía mucho en el comerciante compra 64
lámparas, registra la duración de cada una de ellas, y obtiene que x = 1156 y s 2 = 463 .

1. ¿Puede considerarse las 64 lámparas una muestra aleatoria?

2. Asumiendo que las 64 lámparas son una muestra aleatoria, calcule la probabilidad de que la
duración media de la muestra resulte igual o mayor a la que se obtuvo.

3. ¿Cambian los cálculos que usted realizó si se conoce la verdadera varianza poblacional?

Ejercicio 2

Considere una muestra aleatoria de tamaño n de una población Bernoulli(p).

                 ( )
1. Muestre que E X = p
                         p (1 − p )
                V (X ) =
                             n

2. ¿Como se distribuye X si n es suficientemente grande? ¿Es una distribución exacta o
aproximada?

3. ¿Por qué es X un buen estimador puntual de p ?


4. Si anotamos p a un estimador de p , un intervalo de confianza al (1 − α ) * 100% es
               ˆ


                                           p(1 − p )
                                           ˆ     ˆ                p(1 − p )
                                                                  ˆ     ˆ
                            p − zα
                            ˆ                        ; p + zα
                                                       ˆ
                                      2       n               2      n

¿Qué supuesto realizamos para obtener este intervalo?

Ejercicio 3

Un productor decide cultivar dos variedades de tomate, valencia y perita. De la variedad
valencia planta 230 semillas y de la variedad perita planta 358. Luego de tres semanas de
cultivadas ambas variedades el productor recorre el campo y registra que cantidad de semillas
emergieron para cada variedad. Los resultados son los siguientes:

                             Variedad   Cultivadas Emergieron
                             Valenciano    230        126
                             Perita        358        293
1. ¿Qué modelo teórico de probabilidad considera apropiado si la variable aleatoria es
"número de plantas que emergieron de una variedad en el total que se cultivó de la misma"?
¿Cuáles son los parámetros para cada una de las variedades?

2. Estime para cada variable la probabilidad de emergencia.

3. Construya un intervalo de confianza al 95 % para la probabilidad de emergencia de las
plantas de cada variedad e interprete en términos del problema

4. ¿Que supuesto fue necesario para que el intervalo anterior sea válido?

5. Si comparamos ambas variedades con el tomate americano que tiene una probabilidad de
emergencia de 0.65, ¿que puede decir viendo los intervalos de confianza?

6. Si el productor quiere saber si el tomate valenciano tiene la misma probabilidad de
emergencia que el tomate americano. ¿Cuál es el procedimiento a seguir?. Explíquelo y
concluya con el mismo.


Ejercicio 4 (Said Infante Gil)

En un experimento para determinar la toxicidad de una sustancia se administra una dosis de
ésta a cada uno de 300 conejos, y se registra el número de muertos, que resulta ser de 192.
Calcule el estimador de p, la probabilidad de que un conejo elegido al azar muera a causa de
una dosis de la sustancia. Calcule la desviación estándar. Construya un intervalo de confianza
al 98%.


Ejercicio 5 (Said Infante Gil)

Usando aproximación Normal calcule, con los datos del ejercicio anterior, la probabilidad de
                  ˆ
que el estimador p difiera del valor paramétrico p por menos de 0.05; es decir calcule
P( p − p ≤ 0.05) = P(−0.05 ≤ p − p ≤ 0.05) . Recuerde que el estimador
   ˆ                         ˆ
  .
       p (1 − p )                                          p (1 − p )
                                                             ˆ
p ∼ N  p,
ˆ                   . Para este tamaño de muestra use S p =
                                                         2
                                                         ˆ              en vez de σ 2 al
                                                                                    ˆ
                                                                                    p
           n                                                   n
estandarizar.


Ejercicio 6 (Said Infante Gil) – Tamaño de muestra

Suponga que quiere estimarse el porcentaje de analfabetismo en el país de Nuncafué. Se
desea estimarlo con un margen de error menor del 4% con una probabilidad de 0.98. ¿De qué
tamaño debe tomarse la muestra si nunca se ha realizado una investigación al respecto?
Ejercicio 7

Una empresa agroindustrial hace control de calidad en la línea de producción de latas de
duraznos en almíbar. El resumen de la información obtenida en las últimas 15 inspecciones se
presenta en la tabla siguiente.

              Nº de inspección   Nº de latas inspeccionadas   Nº de latas con defectos
                      1                       48                          5
                      2                       36                          5
                      3                       50                          0
                      4                       47                          5
                      5                       48                          0
                      6                       54                          3
                      7                       50                          0

Estime a través de un intervalo de 95% de confianza la proporción de latas de duraznos en
almíbar con defectos producidas por esta empresa.
Lista de ejercicios 8

Conceptos claves: Prueba de hipótesis. Error de tipo I, error de tipo II. Hipótesis estadística. Juego de
hipótesis: hipótesis nula, hipótesis alternativa. Estadístico de la prueba. Distribución del estadístico de la
prueba bajo la hipótesis nula. Criterio de decisión. Nivel de significancia. Decisión. Valor p, p-valor o alfa-
gorro ( α ).
         ˆ

“En todos los terrenos se hacen preguntas, se escudriña, se investiga, se husmea y se
experimenta. Ya no basta decir que una cosa existe y describirla: ahora todo tiene que
probarse, y mejor si se hace con testigos, datos y algunos experimentos ridículos."
                                                               Patrick Suskind. “ El Perfume”
Ejercicio 1

Un cruzamiento de 2 tipos de plantas de maíz da como resultado 3 genotipos diferentes A, B y
C. Un modelo genético sugiere que la proporción de los tres genotipos es 1:2:1. Para la
verificación experimental se tomaron 90 plantas resultado del cruzamiento anterior y se
observó la frecuencia de los tres genotipos:

                                    GENOTIPOS          Nº DE PLANTAS
                                        A                    18
                                        B                    44
                                        C                    28

¿Permiten estos datos corroborar el modelo genético?

Ejercicio 2

Se dice que la administración de una hormona acorta el intervalo interparto de vacas Hereford
mayores de 2 años. Tradicionalmente el intervalo es en promedio de 390 días. Se administró a
80 vacas de más de 2 años y se registró la duración del intervalo interparto de las mismas. El
experimento dio como resultado un intervalo interparto promedio de 366 días con un desvío
estándar de 11 días. ¿Permiten estos datos avalar la afirmación tradicional?

Ejercicio 3

Los paquetes de un determinado fungicida, poseen una especificación acerca del contenido de
cobre del mismo: 0.60 miligramos de cobre cada 100 gramos de producto. Una dependencia
del MGAP analiza una muestra al azar compuesta por 100 paquetes de 100 gramos de
producto y encuentra que la media muestral es de 0.63 miligramos y el desvío de 0.11
miligramos.

    1. Con un nivel de significancia de 5%, ¿permiten estos resultados afirmar que el
       contenido promedio de cobre en 100 gramos de producto es mayor que el valor
       especificado?
    2. Construya un intervalo de confianza para el valor promedio de cobre del fungicida de
       98% de confianza.
Ejercicio 4

Los registros de los últimos años de los estudiantes que ingresan a primer año en un colegio,
indican que su calificación media en una prueba de aptitud era de 115 con una desviación
estándar de 20. El director, interesado en saber si los que ingresan este año pertenecen a una
clase típica con respecto a aptitud, pretende probar la hipótesis de que la nueva generación
tiene una media igual a la de clases anteriores. Para probar su hipótesis, obtiene la calificación
de la prueba de aptitud de este año, de un estudiante en cada diez, de la oficina de admisión.
Esta selección dio una muestra de tamaño 50 con una media de 118. Que puede concluir sobre
la hipótesis planteada por el director?


Ejercicio 5

El investigador del ejercicio 5 de la Lista de Ejercicios 6 armaba que el contenido de proteína
en 50kg de algas marinas es superior a 4.5kg. Con los resultados que encontró, puede seguir
sosteniendo su afirmación?


Ejercicio 6

Una casa comercial asegura que los motores que vende pueden ser usados durante 10.000
horas sin necesidad de hacer un ajuste, la variabilidad de la vida útil está dada por un desvío
estándar de 1.500 horas. Una cooperativa que le compra estos motores a esta casa ha
registrado las horas de trabajo hasta el momento de efectuar el primer ajuste de 25 motores
siendo el promedio de 9.400 horas. Utilice esta información para juzgar la afirmación de la
casa vendedora.


Ejercicio 7

Durante varios años se ha puesto un examen tipo en muchas escuelas. El puntaje medio del
examen es 70 y la varianza 9. Una escuela que utiliza este examen por primera vez, examinó
un grupo de 25 estudiantes que obtuvieron una calificación media de 71 y una varianza de 12.
¿Hay alguna razón para dudar de que las calificaciones de todos los estudiantes de la escuela
tuviera una varianza de 9?


Ejercicio 8

Se quiere estudiar la variabilidad en la vida útil de un nuevo tipo de bombillas. Se considera
como nivel de comparación otro tipo de bombillas cuya duración (medida en horas) presenta
una varianza de 10.000 horas2. Una muestra de 20 bombillas del nuevo tipo presenta una
varianza de 12.000 horas2. Realice el estudio que considere conveniente al 1% de significancía.

Ejercicio 9

De larga experiencia se sabe que el 20% de las semillas de cierta variedad germinan. En un
experimento, 60 de 400 semillas germinaron, ¿puede considerarse una germinación
significativamente pobre sobre la base de un 1% como nivel de significación?
Lista de ejercicios 9


Conceptos claves: Diseño de experimentos: unidad experimental, tratamiento, nivel, variable de
respuesta, fuentes de variabilidad. Principios básicos de la experimentación

Bibliografía recomendada: Steel y Torrie, Bioestadística (Capítulo VI)

Ejercicio 1

En cada uno de los siguientes enunciados referentes a estudios experimentales indicar: la
unidad experimental, la variable de respuesta, las fuentes de variabilidad, los tratamientos y
sus niveles.

1. Un investigador desea estudiar los efectos de los medicamentos A y B sobre el recuento de
linfocitos en ratones (expresados en miles por ml de sangre) comparando A, B y el placebo P.
Al diseñar el experimento se piensa que los ratones de una misma camada darán respuestas
mas homogéneas que ratones de camadas diferentes. Por tal motivo se utilizan en el
experimento 7 camadas de 3 ratones cada una.

2. Se pretende estudiar si el azufre produce una disminución del número de cierto tipo de
parásitos de la papa. Para ello se divide el campo en 24 parcelas de igual tamaño. Interesa
comparar 3 cantidades distintas de azufre en 2 estaciones del año (primavera y otoño). En
cada estación del año y con cada cantidad de azufre se repite el experimento en 4 parcelas que
son asignadas al azar entre las 24 parcelas preparadas para el experimento. En cada parcela se
mide el número de parásitos de la papa.

3. Un investigador realizó un estudio sobre las técnicas de dosificación del ácido ribonucleico.
En una determinada etapa el proceso comprende una extracción por una solución de ácido
tricloroacético, donde se efectúa una medición del total de ácido ribonucleico extraído. El
investigador estaba interesado en saber si el reemplazo del ácido tricloroacético por ácido
perclórico asegura una extracción más completa y decidió ensayar el ácido perclórico a dos
concentraciones diferentes, 5% y 10%, con respecto al procedimiento que se realizaba
anteriormente. A tal fin se trataron 15 partes alícuotas de un mismo homogenato de páncreas
(5 con cada tratamiento).


Ejercicio 2

La única manera satisfactoria de conocer la duración de una cubierta de automóvil es hacerla
rodar en un coche de prueba bajo condiciones normales del camino. Se desea comparar 4
tratamientos, cada uno corresponde a gomas preparadas con diferentes procesos. Evalué los
siguientes planes:

    1. Utilizar 4 autos y en cada auto colocar las 4 cubiertas con el mismo tratamiento. Es
       decir, un tratamiento por auto.

    2. Utilizar 4 autos y en cada uno de ellos asignar a la cubierta delantera derecha el
       tratamiento 1, a la delantera izquierda el tratamiento 2, a la trasera derecha el
       tratamiento 3 y a la trasera izquierda el tratamiento 4.

    3. Utilizar 4 autos y en cada uno asignar aleatoriamente un tratamiento a una cubierta.
4. Utilizar 4 autos y en cada uno asignar un tratamiento a una cubierta de modo que
       todos los tratamientos estén una vez en cada posición (usando los 4 autos) y los 4
       tratamientos estén presentes en cada auto.


Ejercicio 3

Los tres principios básicos del diseño de experimentos son: replicación, aleatorización y control
de los efectos de variables externas. Considere cada uno de los siguientes escenarios. ¿Se
adhiere cada uno de ellos a todos los principios? En casa de respuesta afirmativa, describa de
qué manera. En caso de respuesta negativa indique como cambiaría el diseño para incorporar
el o los principios faltantes.

1. Un químico desea comparar un nuevo método de ensayo más simple con un método
estándar. Prepara una cierta solución y la divide en 40 tubos de ensayo. Aleatoriamente
selecciona 20 tubos y le pide a su ayudante técnico que los analice usando el método estándar.
Ella por su parte analiza los restantes 20 usando el método nuevo. Al final los dos grupos de
resultados de estos ensayos serán comparados.

2. Un grupo de estudiantes universitarios cree que un cierto té de hierbas posee un
remarcable poder para levantar el ánimo. Para probar lo que creían realizaron visitas
semanales a un hogar de ancianos, visitando a los residentes y sirviéndoles de este té. El
personal del hogar reporto que luego de varios meses muchos de los residentes estaban más
alegres y saludables.


Ejercicio 4

El tamaño final del fruto es un factor determinante de la calidad de los duraznos. Algunas de
las nuevas variedades de duraznero se caracterizan por su abundante fructificación lo que
origina una gran cantidad de frutos de pequeño tamaño con escasa calidad comercial. Una
práctica que puede mejorar el tamaño del fruto es el raleo (eliminación de frutos) químico o
manual. Con el objetivo de evaluar el impacto del raleo sobre el tamaño final de los frutos
(peso medio de fruto en gramos), se realizó el siguiente ensayo:

    •   Material experimental: plantas homogéneas en desarrollo y estado sanitario

    •   Repeticiones: 5 por tratamiento, cada repetición era una planta y se muestrearon 100
        frutos por planta.

    •   Tratamientos: un testigo sin ralear (Trat 1); raleo manual (Trat 2); y raleo químico (Trat
        3).

Los calibres promedio por planta (mm) en cosecha se resumen en el siguiente cuadro:

                       Tratamiento    Rep 1   Rep 2   Rep 3   Rep 4   Rep 5
                          Trat 1      52.3    53.8    57.3    60.2    61.3
                          Trat 2      70.2    71.8    68.7    67.5    66.2
                          Trat 3      57.8    67.2    63.5    58.4    68.8
1. Indique:

        (a) Objetivo del estudio
        (b) Factor en estudio
        (c) Unidad experimental
        (d) Variable de respuesta

2. Escriba el modelo estadístico adecuado para este estudio y explique sus componentes.

3. Estime la media general.

4. Estime los efectos.¿Cuánto suman los efectos? ¿Es siempre así? ¿Por qué?

5. Obtenga las predicciones para las unidades (1,4) y (3,4). ¿Cuál es el error en estas
predicciones?¿A qué se debe?

6.¿Cuánto suman los errores de todas las unidades? ¿Es siempre así? ¿Por qué?
Lista de ejercicios 10

Conceptos claves: Diseño de experimentos: unidad experimental, tratamiento, nivel, variable de
respuesta, fuentes de variabilidad. Suma de cuadrados. Grados de libertad. Cuadrados Medios. Fórmula
de trabajo.

Ejercicio 1

Para cada uno de los experimentos responda las siguientes preguntas:

1. Explicite cuáles son los tratamientos, cuáles y cuántas las unidades experimentales y cuántas
repeticiones hay por tratamiento.

2. Escriba el modelo estadístico correspondiente al diseño utilizado en cada experimento y
describa, en términos estadísticos y agronómicos, cada componente en él.

3. Cuál es la hipótesis nula y cuál la alterna, en términos estadísticos y agronómicos.

4. Estime los parámetros del modelo utilizado.

5. Indique dos fuentes posibles de error experimental para este caso concreto.

Experimento A

Los siguientes datos corresponden a un experimento en el que se quería evaluar la respuesta
de un cereal al agregado de 3 dosis de nitrógeno. El experimento se realizó en un terreno
bastante homogéneo y se midió la respuesta en kilogramos de cereal por parcela.

                                  Dosis N1 Dosis N2 Dosis N3
                                    20       25       36
                                    25       29       37
                                    23       31       29
                                    27       30       40
                                    19       27       33

Experimento B

A continuación se muestran los resultados de un experimento en el que se probó el efecto de
dos dosis de azufre (en Kg/ha) para reducir la roña de la papa, que se midió a través de un
Índice de roña. Se trabajó Como el terreno era bastante homogéneo se utilizó un diseño
experimental completamente aleatorizado con 4 repeticiones.


                                Dosis 300 kg/ha Dosis 600 kg/ha
                                       9              10
                                       7               4
                                       4               4
                                       1               5
Experimento C

Con el fin de evaluar la capacidad nutritiva de 4 variedades de avena se realizó un experimento
con diseño de bloques completos al azar. Los resultados (porcentaje de proteína en base a
materia seca) fueron:

                                                         Bloque
 Variedad          1                2              3                4               5        6
     1           16.28            17.88          16.88            15.57           16.72    17.32
     2           16.31            18.17          17.38            17.53           16.34    17.88
     3           16.25            16.92          15.88            14.78           15.97    16.66
     4           21.09            21.37          21.38            20.52           21.09    21.58


Experimento D

A.Bing en un trabajo realizado en 1953 comparo el efecto de varios herbicidas sobre el peso de
las flores de gladiolos. El peso promedio por inflorescencia en onzas se da a continuación para
los cuatro tratamientos.

                                                            Bloque
  Tratamiento                1                      2                       3               4
    Control                1.25                   1.73                    1.82            1.31
   2.4-DTCA                2.05                   1.56                    1.68            1.69
     DN/Cr                 1.95                   2.00                    1.83            1.81
     Sesin                 1.75                   1.93                    1.70            1.59


Ejercicio 2

Sobre los datos del ejercicio 4 de la lista de ejercicios anterior, calcule las siguientes
cantidades:
                                                         i =3   j =5
    •   Suma de cuadrados totales:        SCtotal = ∑i =1 ∑ j =1 ( yij − y.. ) 2

                                                                  i =3
    •   Suma de cuadrados tratamientos:         SCtrat = 5∑i =1 ( yi. − y.. ) 2

                                                         i =3     j =5
    •   Suma de cuadrados errores:        SCerror = ∑i =1 ∑ j =1 ( yij − yi. ) 2

1. ¿Qué porcentaje de la   SCtotal representa la SCtrat ?

2. En el cuadro de calibres promedio por planta (mm) en cosecha calcule los totales por
repetición, por tratamiento y el total general.

3. Si usted cuenta con el dato del total general, ¿hasta cuántos datos del interior del cuadro se
pueden omitir sin perder información alguna?

4. Si usted cuenta con los datos de los totales por tratamientos, ¿hasta cuántos datos del
interior del cuadro se pueden omitir sin perder información alguna?
5. Complete el siguiente cuadro:

Fuente                    Grados de libertad     Suma de Cuadrados        Cuadrados medios
Tratamientos
Error
Total


Ejercicio 3 (Said Infante Gil)

En un experimento realizado en el cultivo de soja se ensayaron varios niveles de humedad
aprovechable y varios niveles de fósforo. En este ejercicio sólo usaremos parte de los datos.
Los tratamientos son:

             1.   (H1P1): 20% de humedad y 30 kg/ha de fósforo
             2.   (H2P1): 40% de humedad y 30 kg/ha de fósforo
             3.   (H1P2): 20% de humedad y 60 kg/ha de fósforo
             4.   (H2P2): 40% de humedad y 60 kg/ha de fósforo

El experimento se realizó en un DBAC con 6 repeticiones. Los bloques fueron franjas de
terreno relativamente uniformes. Las unidades experimentales (4 por bloque) fueron
rectángulos de 28 m2 y la variable medida fue el rendimiento de grano (en kg) por unidad
experimental.
                                               Tratamiento
Bloque
                          1                2                 3                 4
I                        7.3              6.8               6.7               5.7
II                       7.2              5.5               7.3               6.9
III                      7.6              6.8               6.8               6.4
IV                       7.2              6.5               7.4               6.1
V                        7.5              6.8               7.5               6.4
VI                       7.6              7.1               6.3               6.3

Presente la tabla del Análisis de la Varianza y pruebe la hipótesis de igualdad de tratamientos
(Use α = 0.05).


Ejercicio 4 (Said Infante Gil)

Una cadena de supermercados está considerando 3 posibles tipos de obsequio por volumen de
compra para incrementar sus ventas. El primero estaría dirigido a los niños (N), el segundo a
las madres (M) y el tercero a los padres (P). Antes de decidir cuál de los tres tipos le conviene,
el gerente de publicidad decide realizar un experimento. De las ciudades donde la compañía
tiene negocios, elige 5 que considera representativas y en las cuales tiene 3 o más
supermercados. En cada ciudad elige 3 supermercados al azar y también aleatoriamente,
decide cuál negocio va a ofrecer cada uno de los tipos de obsequio. Lleva a cabo las diferentes
promociones durante una semana y en cada uno de los 15 casos, registra el incremento
semanal en ventas con respecto a la semana anterior en el mismo negocio. Los resultados se
resumen enseguida.
Incremento semanal en ventas (Decenas de miles de pesos)
                                                Tratamiento
Bloque (ciudad)
                               N                     M                            P
1                            10.1                    9.2                         4.9
2                             8.9                    9.3                         5.2
3                             2.6                    3.1                         1.9
4                             7.4                    6.0                         5.4
5                             0.8                    1.2                         0.1

Presente la tabla de ANAVA y pruebe la hipótesis de igualdad de tratamientos (Use α = 0.05).
Lista de ejercicios 11

Conceptos claves: Covarianza, correlación lineal. Coeficiente de correlación lineal de Pearson. Regresión
lineal simple.

Ejercicio 1

Se cuenta con los registros de diámetro a la altura del pecho (en cms) y la altura (en mts) de 10
Eucalyptus Grandis plantados en un rodal de Rivera.

                                            Dap            H
                                           22,85         22,45
                                           22,59         20,54
                                           17,42         15,65
                                           19,81         17,97
                                           19,91         17,74
                                           18,69         18,61
                                           21,86         21,21
                                           21,23         22,44
                                           19,17         18,89
                                           19,39         19,85

1. Realice un diagrama de dispersión.

2. Calcule la covarianza muestral.

3. Calcule el coeficiente de correlación lineal de Pearson en la muestra.

4. Realice una prueba de hipótesis para probar que el coeficiente de correlación lineal
poblacional es distinto de cero a un nivel de significancia del 5%.


Ejercicio 2

El objetivo de un ensayo es evaluar el comportamiento productivo de una variedad de
duraznero en la zona de Melilla en relación a la dosis de nitrógeno aplicada.

Para eso se hizo un experimento con las siguientes características:

    •    Diseño: Bloques completos al Azar

    •    Tratamientos: 4 dosis de Nitrógeno (50, 100, 150 y 200 unidades de N/planta/año
         fraccionado en 3 momentos )

    •    Repeticiones: 3

    •    Variable medida: Peso total del fruto por planta
Cuadro: Promedio de kilogramos por planta según dosis de nitrógeno.


                                 Dosis de N         Medias
                                    50              31.53
                                    100             24.94
                                    150             21.79
                                    200             10.85


1. Proponga una hipótesis orientadora para el estudio.

2. Proponga un instrumento de análisis adecuado para el estudio de estos datos en función de
su hipótesis orientadora.

3. Estime el modelo propuesto usando mínimos cuadrados.

4. Pruebe la significación del modelo al 5%.
ANEXOS


I. LEYES IMPORTANTES DE PROBABILIDAD


I.1. LEY DE SUMA DE LAS PROBABILIDADES

Si A y B son dos sucesos cualesquiera, entonces
P(A∪B) = P(A) + P(B) – P(A∩B)

Nota: si P(A∪B) = P(A) + P(B), entonces los sucesos son mutuamente excluyentes.



I.2. LEY DE MULTIPLICACIÓN DE PROBABILIDADES

Si A y B son dos sucesos cualesquiera, la probabilidad de que A ocurra si sabemos que
B ocurrió, se llama probabilidad condicional de A y es
            P( A ∩ B)
P( A / B) =           , ⇒ P( A ∩ B) = P( B) * P( A / B)
               P( B)

Nota: si dos sucesos A y B son tales que

P ( A ∩ B) = P ( B ) * P ( A) ,

entonces los sucesos A y B son probabilísticamente independientes.
II. Algunas Funciones de Distribución de Probabilidad o de Densidad de
Probabilidad



II.1. Una v.a. X tiene distribución Bernoulli si su función de masa o distribución de
probabilidades está dada por

 f ( x ) = P ( X = xi ) = p xi (1 − p )1− xi                xi = 0,1   0 ≤ p ≤1


II.2. Una v.a. X tiene distribución Binomial si su función de masa o distribución de
probabilidades está dada por


 f ( x ) = P ( X = xi ) =        ( )p
                                  n
                                  xi
                                           xi
                                                (1 − p) n− xi

Nota: cualquier función de distribución de probabilidades debe cumplir que

       1) f ( xi ) ≥ 0
       2)   ∑ f (x ) = 1
            ∀i
                     i



II.3. Una v.a. X tiene distribución Normal si su función de densidad de probabilidad
está dada por

                              1  X −µ 
                                           2

                 1           −        
                              2 σ 
 f ( x) =                e
             σ 2π
Nota: Nota: cualquier función de densidad de probabilidades debe cumplir que

            ∞

       1)   ∫ f ( x)dx = 1
            −∞


       2)   f ( x) ≥ 0            ∀x
III. ESPERANZA Y VARIANZA


III.1. ESPERANZA MATEMÁTICA


1. Variables discretas

        E ( X ) = ∑ xi f ( x i ) = ∑ x i P ( X = xi )
                     ∀xi                ∀xi


Nota: Si la V.A. tiene distribución Binomial se puede demostrar que

        E ( X ) = np

2. Variables continuas

                     ∞
        E( X ) =     ∫ xf ( x)dx
                     −∞



III.2. VARIANZA


V ( X ) = E{X − E ( X )} = E ( X 2 ) − [E ( X ) ]
                                 2                             2



1. Variables discretas


        V ( X ) = ∑ [xi − E ( X )] f ( xi )
                                              2

                         ∀xi

Nota: Si la V.A. tiene distribución Binomial se puede demostrar que

        V ( X ) = np (1 − p )

2. Variables continuas

                         ∞
        V (X ) =         ∫ [x − E ( X )]2 f ( x)dx
                         −∞
IV. PROPIEDADES DE LA ESPERANZA Y LA VARIANZA



IV.1. PROPIEDADES DE LA ESPERANZA


Sea X una V.A. y a y b dos constantes, entonces

           1) E(a) = a
           2) E(bX) = b E(X)
           3) E(a + bX) = a + b E(X)



IV.2. PROPIEDADES DE LA VARIANZA


Sea X una V.A. y a y b dos constantes, entonces,

   1)   V(X) > 0
   2)   V(a) = 0
   3)   V(bX) = b2 V(X)
   4)   V(a + bX) = b2 V(X)
V. DISEÑO EXPERIMENTAL – ANÁLISIS DE LA VARIANZA

V.1. DISEÑO COMPLETAMENTE AL AZAR (DCA) – FÓRMULAS DE CÁLCULO

TABLA DE ANAVA




i = 1,2, ……., t t=número de tratamientos
j = 1,2, ……., r r=número de repeticiones por tratamientos


V.1. DISEÑO DE BLOQUES COMPLETOS AL AZAR (DBCA) – FÓRMULAS DE CÁLCULO

TABLA DE ANAVA




i = 1,2, ……., t t=número de tratamientos
j = 1,2, ……., r r=número de bloques
VI. PRUEBAS DE COMPARACIONES MÚLTIPLES DE MEDIAS – PRUEBA DE
TUKEY


Hipótesis a probar


H 0: : µ i = µ i '    ⇔        H 0: : τ i = τ i '    ∀i ≠ i '


Valor crítico o diferencia mínima significativa de Tukey entre dos medias en el
experimento para rechazar la hipótesis nula está dado por


                             CME
       W = q(t ; gle;α )
                              r

por lo tanto el criterio de decisión para rechazar o no la hipótesis nula es




CD : Si Yi. − Yi '. ≥ W ⇒ Rechazo H0 con (1-α)*100 de confianza
VII. MEDIDAS DE ASOCIACIÓN ENTRE DOS VARIABLES ALEATORIAS


VII.1. COVARIANZA




VII.2. COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON




                                  n

                       n
                               (∑ xi ) 2
             SCx = ∑ xi2 −       i =1

                      i =1              n
VIII. REGRESIÓN LINEAL


VIII.1. Estimación de los parámetros de regresión lineal simple de primer orden



β1 =
ˆ       ∑ ( X − X )(Y − Y ) = SP
                   i            i           xy

          ∑(X − X )         i SC    2
                                             x



β 0 = Y − β1 X
ˆ         ˆ

VIII.2.Propiedades de los estimadores

       1) E ( β 1 ) = β 1
              ˆ
                        σ2
       2) V ( β 1 ) =
              ˆ
                  SCx
       3) E ( β 0
              ˆ )=β
                    0

                          1 X2 
       4) V ( β 0 ) = σ 2  +
              ˆ
                           n SCx 
                                  
                                 
                          σ 
                             2
       5) β1 ~ N  β 1 ,
           ˆ
                              
                         SCx 


                 SCE SCy ) − β 1SPxy ( SCy ) − β 12 SCx
                              ˆ                ˆ
       σ = CME =
        ˆ 2
                     =              =
                 n−2      n−2              n−2

VIII.3. Estimación de los parámetros de regresión lineal en forma matricial



β = ( X ' X ) −1 X ' Y
ˆ
VIII.4. ANÁLISIS DE VARIANZA PARA LA REGRESIÓN


Fuentes de              Grados de          Sumas de                                Cuadrados             Fo
Variación                libertad        Cuadrados (SC)                           Medios (CM)
                                                          n

Regresión                   P*                       ∑(y )            i
                                                                              2
                                                                                   SCreg/glreg      CMreg/CMerror
                                        β 'X ' Y −
                                        ˆ                i =1

                                                     n
Error o Residual          n-(p+1)         Y 'Y − β
                                                 ˆ 'X ' Y                         SCerror/glerror
                                                     n

Total                       n-1                   ∑(y )           i
                                                                          2


                                         Y 'Y −   i =1

                                                              n
*
    número de parámetros de regresión

Más contenido relacionado

La actualidad más candente

Trabajo probabilidad
Trabajo probabilidadTrabajo probabilidad
Trabajo probabilidadFreddy Adrian
 
Ejemplos de diseño Bloques al azar
Ejemplos de diseño Bloques al azarEjemplos de diseño Bloques al azar
Ejemplos de diseño Bloques al azarug-dipa
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...IPN
 
Presentación probabilidad
Presentación probabilidadPresentación probabilidad
Presentación probabilidadojitos55
 
ESTADISTICA.Tabla tstudent
ESTADISTICA.Tabla tstudentESTADISTICA.Tabla tstudent
ESTADISTICA.Tabla tstudentAna Ingrid
 
Tarea 9 de probabilidad y estadistica con respuestas
Tarea 9 de probabilidad y estadistica con respuestasTarea 9 de probabilidad y estadistica con respuestas
Tarea 9 de probabilidad y estadistica con respuestasIPN
 
Ejercicios de distribucion normal estandar
Ejercicios de distribucion normal estandarEjercicios de distribucion normal estandar
Ejercicios de distribucion normal estandarNathywiiz Hernández
 
Tarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaTarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaIPN
 
Cuadrados latinos y grecolatinos
Cuadrados latinos y grecolatinosCuadrados latinos y grecolatinos
Cuadrados latinos y grecolatinosHero Valrey
 
6 diseños completamente aleatorizado y bloques al azar
6   diseños completamente aleatorizado y bloques al azar6   diseños completamente aleatorizado y bloques al azar
6 diseños completamente aleatorizado y bloques al azarrbarriosm
 
Diseño factorial de 3 factores
Diseño factorial de 3 factores Diseño factorial de 3 factores
Diseño factorial de 3 factores Oscar Saenz
 
Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8) Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8) Luz Hernández
 
Problemas calor trabajo primera ley
Problemas calor trabajo primera leyProblemas calor trabajo primera ley
Problemas calor trabajo primera leycharliebm7512
 
Probabilidad aplicada a la ingeniería industrial
Probabilidad aplicada a la ingeniería industrialProbabilidad aplicada a la ingeniería industrial
Probabilidad aplicada a la ingeniería industrialDiana Salinas
 

La actualidad más candente (20)

Trabajo probabilidad
Trabajo probabilidadTrabajo probabilidad
Trabajo probabilidad
 
Tabla z
Tabla zTabla z
Tabla z
 
Hipotesis2
Hipotesis2Hipotesis2
Hipotesis2
 
Ejemplos de diseño Bloques al azar
Ejemplos de diseño Bloques al azarEjemplos de diseño Bloques al azar
Ejemplos de diseño Bloques al azar
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
 
Presentación probabilidad
Presentación probabilidadPresentación probabilidad
Presentación probabilidad
 
ESTADISTICA.Tabla tstudent
ESTADISTICA.Tabla tstudentESTADISTICA.Tabla tstudent
ESTADISTICA.Tabla tstudent
 
Tarea 9 de probabilidad y estadistica con respuestas
Tarea 9 de probabilidad y estadistica con respuestasTarea 9 de probabilidad y estadistica con respuestas
Tarea 9 de probabilidad y estadistica con respuestas
 
Ejercicios de distribucion normal estandar
Ejercicios de distribucion normal estandarEjercicios de distribucion normal estandar
Ejercicios de distribucion normal estandar
 
Tablas de distribución normal.
Tablas de distribución normal.Tablas de distribución normal.
Tablas de distribución normal.
 
Tarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuestaTarea 10 de probabilidad y estadistica con respuesta
Tarea 10 de probabilidad y estadistica con respuesta
 
Tabla t student.pdf analitica
Tabla t student.pdf analiticaTabla t student.pdf analitica
Tabla t student.pdf analitica
 
Cuadrados latinos y grecolatinos
Cuadrados latinos y grecolatinosCuadrados latinos y grecolatinos
Cuadrados latinos y grecolatinos
 
6 diseños completamente aleatorizado y bloques al azar
6   diseños completamente aleatorizado y bloques al azar6   diseños completamente aleatorizado y bloques al azar
6 diseños completamente aleatorizado y bloques al azar
 
Diseño factorial de 3 factores
Diseño factorial de 3 factores Diseño factorial de 3 factores
Diseño factorial de 3 factores
 
ANOVA Prueba de tukey
ANOVA  Prueba de tukeyANOVA  Prueba de tukey
ANOVA Prueba de tukey
 
Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8) Ejercicios de estimación de intervalo o intervalos de confianza (8)
Ejercicios de estimación de intervalo o intervalos de confianza (8)
 
Problemas calor trabajo primera ley
Problemas calor trabajo primera leyProblemas calor trabajo primera ley
Problemas calor trabajo primera ley
 
Probabilidad aplicada a la ingeniería industrial
Probabilidad aplicada a la ingeniería industrialProbabilidad aplicada a la ingeniería industrial
Probabilidad aplicada a la ingeniería industrial
 
Tabla z
Tabla zTabla z
Tabla z
 

Similar a Guia de ejercicios

Interaprendizaje holístico de álgebra y geometría
Interaprendizaje holístico de álgebra y geometríaInteraprendizaje holístico de álgebra y geometría
Interaprendizaje holístico de álgebra y geometríaMario Suárez
 
1º practica medidas de frecuencia y tendencia central
1º practica medidas de frecuencia y tendencia central1º practica medidas de frecuencia y tendencia central
1º practica medidas de frecuencia y tendencia centralPia Hurtado Burgos
 
Actividad 15
Actividad 15Actividad 15
Actividad 15Isa Adams
 
Guía 1 segundo periodo grado 9°
Guía 1 segundo periodo grado 9°Guía 1 segundo periodo grado 9°
Guía 1 segundo periodo grado 9°Edwin Rivera Cantor
 
Algebra 1ºbach cctt
Algebra 1ºbach ccttAlgebra 1ºbach cctt
Algebra 1ºbach ccttmarvargas1981
 
1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.com
1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.com1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.com
1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.comAzucena Gracia
 
Encuestas Monitoria
Encuestas MonitoriaEncuestas Monitoria
Encuestas MonitoriaDiego Rendon
 
Blog. 2011 2012 global 3ªevaluación 2º eso
Blog. 2011 2012 global 3ªevaluación 2º esoBlog. 2011 2012 global 3ªevaluación 2º eso
Blog. 2011 2012 global 3ªevaluación 2º esoChemagutierrez73
 
Articles 80888 documento-adjunto_3
Articles 80888 documento-adjunto_3Articles 80888 documento-adjunto_3
Articles 80888 documento-adjunto_3Coke Katu S
 
Matrices - Metodo Gauss-Jordan
Matrices - Metodo Gauss-Jordan Matrices - Metodo Gauss-Jordan
Matrices - Metodo Gauss-Jordan Crhis
 
Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010
Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010
Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010Mercedes Ortega Labajos
 

Similar a Guia de ejercicios (20)

Interaprendizaje holístico de álgebra y geometría
Interaprendizaje holístico de álgebra y geometríaInteraprendizaje holístico de álgebra y geometría
Interaprendizaje holístico de álgebra y geometría
 
1º practica medidas de frecuencia y tendencia central
1º practica medidas de frecuencia y tendencia central1º practica medidas de frecuencia y tendencia central
1º practica medidas de frecuencia y tendencia central
 
Actividad 15
Actividad 15Actividad 15
Actividad 15
 
Necesidades de agua de los cultivos paisajismo
Necesidades de agua de los cultivos paisajismoNecesidades de agua de los cultivos paisajismo
Necesidades de agua de los cultivos paisajismo
 
Probabilidad
ProbabilidadProbabilidad
Probabilidad
 
Guía 1 segundo periodo grado 9°
Guía 1 segundo periodo grado 9°Guía 1 segundo periodo grado 9°
Guía 1 segundo periodo grado 9°
 
2 4 proporcionalidad
2 4 proporcionalidad2 4 proporcionalidad
2 4 proporcionalidad
 
Algebra 1ºbach cctt
Algebra 1ºbach ccttAlgebra 1ºbach cctt
Algebra 1ºbach cctt
 
Mapa sonoro ies m carbonell
Mapa sonoro  ies m carbonellMapa sonoro  ies m carbonell
Mapa sonoro ies m carbonell
 
1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.com
1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.com1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.com
1⺠desafiosmatematicos.szeretlek.denkenesh jromo05.com
 
Encuestas Monitoria
Encuestas MonitoriaEncuestas Monitoria
Encuestas Monitoria
 
Blog. 2011 2012 global 3ªevaluación 2º eso
Blog. 2011 2012 global 3ªevaluación 2º esoBlog. 2011 2012 global 3ªevaluación 2º eso
Blog. 2011 2012 global 3ªevaluación 2º eso
 
Articles 80888 documento-adjunto_3
Articles 80888 documento-adjunto_3Articles 80888 documento-adjunto_3
Articles 80888 documento-adjunto_3
 
Matrices - Metodo Gauss-Jordan
Matrices - Metodo Gauss-Jordan Matrices - Metodo Gauss-Jordan
Matrices - Metodo Gauss-Jordan
 
2.1 Los datos y gráficas.pdf
2.1 Los datos y gráficas.pdf2.1 Los datos y gráficas.pdf
2.1 Los datos y gráficas.pdf
 
Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010
Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010
Cuaderno de ejercicios de refuerzo de 1º de eso.verano 2010
 
Guia ed mativ_jonathan landaverde
Guia ed mativ_jonathan landaverdeGuia ed mativ_jonathan landaverde
Guia ed mativ_jonathan landaverde
 
Pruebas de diagnóstico
Pruebas de diagnósticoPruebas de diagnóstico
Pruebas de diagnóstico
 
Matematicas
MatematicasMatematicas
Matematicas
 
Talleres para nivelar matematicas periodo 3
Talleres para nivelar matematicas periodo 3Talleres para nivelar matematicas periodo 3
Talleres para nivelar matematicas periodo 3
 

Más de Elsa Castillo Lucio (6)

Tesis paras encuestas
Tesis paras encuestasTesis paras encuestas
Tesis paras encuestas
 
Trabajo de computo2
Trabajo de computo2Trabajo de computo2
Trabajo de computo2
 
negocio
negocionegocio
negocio
 
Mavel
MavelMavel
Mavel
 
Establo ganadero chimbote
Establo ganadero chimboteEstablo ganadero chimbote
Establo ganadero chimbote
 
Tu zona chimbote
Tu zona chimboteTu zona chimbote
Tu zona chimbote
 

Guia de ejercicios

  • 1. Universidad de la República – Facultad de Agronomía Departamento de Biometría, Estadística y Computación Métodos Cuantitativos II Guía de Ejercicios (versión preliminar) 2010 Estela Priore Alejandra Borges
  • 2. Lista de ejercicios 1 Conceptos claves: Población, muestra, experimento, experimento aleatorio, espacio muestral, resultado elemental, conjunto de partes. Ejercicio 1 (Actividad) 1- Salir al parque de Facultad y medir los diámetros de las palmeras y araucarias del camino de entrada. Para medir los diámetros se van a tomar las medidas de circunferencia. En forestación se mide el DAP (Diámetro a la Altura del Pecho), esto es a 1.3 metros desde el piso. 2- Calcular los diámetros. 3- Con los datos de diámetro de ambas especies, construir el cuadro de distribución de frecuencias (utilice intervalos cerrados a la derecha y abiertos a la izquierda) siguiendo las siguientes especificaciones: Palmeras Araucarias Rango 0,1 - 0,18 0,20 - 0,55 Ancho de clase 0,01 0,05 Construir en un mismo par de ejes cartesianos los histogramas de frecuencias relativas de ambas especies. Ejercicio 2 (Discusión) Sobre la actividad realizada en el ejercicio 1, discuta en grupo cual fue la población objetivo, la muestra, la variable medida, si la actividad consistió en un experimento aleatorio, y el alcance de las posibles inferencias. Ejercicio 3 En base a las siguientes situaciones, discuta cuál es la población objetivo, la muestra, las variables a medir, y si se trata de un experimento aleatorio o no. a) Se quiere caracterizar la distribución de ingresos de la población rural uruguaya en la década del ’90. Se utiliza para ello la información registrada por el Censo General Agropecuario. b) Se quiere saber, sobre el total de habilitados para votar a nivel nacional, qué porcentaje estaría a favor sobre la legalización de la comercialización de marihuana. Para esto se realizará una encuesta telefónica sorteando 300 números de la guía telefónica.
  • 3. c) Se quiere determinar la incidencia de una cierta cepa de ”Pietín” en ovejas de la raza Corriedale en Uruguay. Se seleccionan 10 establecimientos rurales y en ellos se cuenta el número de animales que presentan la enfermedad. d) Se desea estudiar el efecto de cuatro temperaturas de cocción sobre la suavidad de los omelets preparados a partir de una mezcla. La mezcla se divide en 20 partes. Aleatoriamente se asignan 5 partes de la mezcla a una temperatura, 5 a otra, y así sucesivamente. La variable explicativa de interés (factor) está controlada por el investigador. e) En un experimento a campo se quiere estudiar la efectividad de un nuevo antiparasitario para lo cual se toman 325 terneros de la raza Hereford y se les aplica la dosis del mismo. Luego de una semana se observa si cada animal presenta o no parásitos. f) Una empresa forestal quiere determinar qué cultivares de Eucaliptos producen el mayor volumen y la mayor altura (atributo de calidad). Se plantaron 3 parcelas por cultivar, cada una con 30 árboles. Ejercicio 4 Para cada una de las situaciones presentadas en los siguientes ítems, verificar si cumplen con la definición de experimento aleatorio y para las que verifican construir el espacio muestral. 1- Lanzar una moneda y observar cual es la cara que queda hacia arriba. 2- Lanzar un dado y observar que cara queda hacia arriba. 3- Sacar dos billetes sucesivamente, sin elegirlos, de una billetera que contiene uno de $U 100, otro de $U 200 y otro de $U 500. Anotar el valor de los billetes. 4- Tomar tres pollitos bebé en un establecimiento avícola y determinar su sexo. 5- Lanzar una moneda cuatro veces y ver que cara quedó hacia arriba en cada una. 6- En un lote de 5 artículos hay 3 defectuosos. Elegir un artículo después de otro (sin sustituir el artículo elegido) hasta que se obtenga el último artículo defectuoso. 7- Medir la resistencia a la tensión de una barra de acero. Ejercicio 5 (problema) Defina un experimento para contestar la siguiente pregunta: ¿cuál será la temperatura máxima diaria el próximo 10 de abril en Paysandú?
  • 4. Lista de ejercicios 2 Conceptos claves: Histograma de frecuencias relativas, evento, características de los eventos, conjunto de partes, variable aleatoria (VA), clasificación de VA: discreta y continua, probabilidad. Ejercicio 1 (Cont. Ej. 1 de lista anterior) En base a los histogramas de frecuencias relativas construidos con los datos de diámetros de las palmeras y las araucarias, responder las siguientes preguntas: 1-¿Qué proporción de las palmeras tienen diámetros menores a 0.12 m? 2. ¿Qué proporción de las araucarias tienen diámetros mayores a 0.35 m? 3. ¿Qué proporción de las palmeras tienen diámetros comprendidos entre 0.13 y 0.16 m? 4. ¿Qué proporción de las araucarias tienen diámetros menores a 0.30 m o mayores a 0.45 m? 5. ¿Cuál es la probabilidad de medir una palmera con diámetro entre 0.13 y 0.15 si se mide una al azar? 6. ¿Con qué probabilidad se tendría una araucaria de diámetro entre 0.30 y 0.40 si se extrae una al azar? 7. Para ambas especies, calcular: media, mediana, moda, varianza, desvío estándar y coeficiente de variación. Ejercicio 2 A continuación se presenta la precipitación acumulada mensual (mm) y el número de días al mes con precipitación, para las estaciones meteorológicas de Salto y Paysandú ocurridas entre los años 1960 y 1990 en el mes de Abril. Para cada variable y cada estación, realice lo siguiente: 1. Construir los histogramas, incluyendo los polígonos de frecuencia. 2. Calcular la media, la mediana, la moda y el coeficiente de variación. 3. Calcule, para Salto y Paysandú, la probabilidad de que en abril del próximo año ocurran los siguientes fenómenos: • Llueva más de 300 mm. • Llueva más de 250 mm. • Llueva menos de 50 mm. • Llueva menos de 100 mm. • Llueva entre 100 y 200 mm. • Llueva entre 150 y 300 mm.
  • 5. PAYSANDÚ SALTO AÑO pp. n.d.pp pp. n.d.pp 1960 72 3 13 3 1961 190 6 186 8 1962 46 5 71 3 1963 149 6 167 8 1964 20 1 48 2 1965 40 4 21 2 1966 82 5 76 8 1967 117 7 176 6 1968 90 8 77 5 1969 103 7 46 5 1970 122 8 213 8 1971 320 13 311 11 1972 30 5 122 8 1973 128 9 48 6 1974 145 11 100 8 1975 13 3 47 2 1976 109 9 104 3 1977 91 8 132 7 1978 266 10 111 5 1979 _ _ 33 3 1980 26 5 12 2 1981 192 11 116 5 1982 4 3 33 4 1983 80 4 161 4 1984 207 8 126 5 1985 49 7 38 4 1986 171 6 133 6 1987 57 4 106 8 1988 130 5 282 9 1989 13 3 10 4 1990 _ _ 98 8 • Llueva menos de 5 días. • Llueva menos de 10 días. • Llueva menos de 20 días. • Llueva más de 15 días. • Llueva más de 10 días. • Llueva entre 5 y 15 días. • Llueva entre 10 y 20 días.
  • 6. Ejercicio 3 (Said Infante Gil) 1) Los siguientes son conteos del número de cromosomas en una herbácea (Claytonia virginica, L.): 24 28 28 28 27 28 29 29 29 30 29 30 30 29 31 29 31 24 28 29 28 24 28 29 31 31 24 28 29 30 29 28 30 33 28 34 38 28 32 33 28 31 32 34 39 40 31 35 27 28 31 35 30 29 24 28 31 32 28 32 28 29 30 33 41 30 29 42 28 29 32 33 30 28 28 31 32 28 29 30 28 28 31 34 34 28 36 31 36 35 Fuente: Science, 17 de noviembre de 1969 a) Construya una tabla de dos encabezados mostrando la frecuencia de cada conteo b) Construya una tabla de frecuencias que le permita contestar las siguientes preguntas: 1. ¿Qué porcentaje de células tienen 32 cromosomas o menos? 2. ¿Qué porcentaje de células tienen más e 29 cromosomas? Ejercicio 4 (Said Infante Gil) A continuación se presentan 103 determinaciones del contenido de ácido ascórbico en el jugo de toronja. Contenido de ácido ascórbico en 103 muestras de jugo de toronja (miligramos por mililitros) 0.49 0.56 0.53 0.58 0.53 0.48 0.46 0.41 0.43 0.50 0.49 0.47 0.46 0.43 0.38 0.39 0.51 0.51 0.50 0.45 0.42 0.43 0.42 0.40 0.49 0.47 0.48 0.41 0.44 0.39 0.35 0.33 0.35 0.40 0.43 0.47 0.47 0.46 0.48 0.50 0.45 0.50 0.42 0.38 0.41 0.35 0.32 0.33 0.33 0.38 0.40 0.45 0.50 0.41 0.45 0.48 0.43 0.48 0.47 0.37 0.42 0.36 0.34 0.34 0.36 0.42 0.40 0.44 0.47 0.46 0.50 0.44 0.43 0.41 0.40 0.38 0.41 0.36 0.36 0.34 0.36 0.40 0.43 0.47 0.48 0.46 0.34 0.37 0.34 0.35 0.37 0.39 0.38 0.41 0.46 0.43 0.42 0.44 0.38 0.36 0.36 0.33 0.33 Fuente: Science, 4 de febrero de 1944, pág.103 a) ¿Qué inconveniente tendría en este caso una tabla de dos encabezados? b) Elija límites de clases adecuados para estos datos y construya una tabla de frecuencias con límites y valor medio de clase, frecuencias absolutas y relativas, frecuencias absolutas acumuladas y frecuencias relativas acumuladas.
  • 7. Ejercicio 5 (Said Infante Gil) Con los conteos de cromosomas del ejercicio anterior elaboramos la siguiente tabla de frecuencias: Número de cromosomas por Frecuencia (fi) planta (23 , 26] 5 (26 , 29] 40 (29 , 32] 27 (32 , 35] 11 (35 , 38] 3 (38 , 41] 3 (41 , 44] 1 Σ 90 Calcule media, mediana, varianza, desviación estándar y coeficiente de variación del número de cromosomas por planta usando la tabla. Calcule estas medias en los datos individuales y compárelas. Ejercicio 6 (Repaso de conjuntos) Para cada ítem definir el conjunto A1 unión A2 y el conjunto A1 intersección A2, y realice un diagrama de Venn. 1. A1 = {x : x = 0, 1, 2} A2 = {x : x = 2, 3, 4} 2. A1 = {x : 0 < x < 2} A2 = {x : 1 < x < 3} 3. A1 = {x : x = 1, 2, 3, 4} A2 = {x : x = 3, 4, 5, 6} 4. A1 = {x : 2 x 6} A2 = {x : x > 10} 5. A1 = {x : 0 x 40 o 50 x 100} A2 = {x : 0 < x < 50} Ejercicio 7 (Repaso de conjuntos) Encuentre el complemento de A siendo A* el conjunto universal: 1. A* = {x : 0 < x < 1} A = {x : 5/8 ≤ x < 1} 2. A* = {x : 0 < x ≤ 10} A = {x : 2 ≤ x < 10} 3. A* = {x : 0 ≤ x < ∞} A = {x : 15 ≤ x, 0 ≤ x ≤ 8} 4. A* = {♣,◊,♥,♠} A = {◊,♠} Ejercicio 8 (Repaso de conjuntos) Dados los siguientes conjuntos: A = {x : 10 < x < 20} B = {x : 15 ≤ x ≤ 50} C = {x : 12 < x < 30} Compare los siguientes conjuntos: 1. A U B y B ∩ A
  • 8. 2. A ∩ B y B ∩ A 3. A U (B U C) y (A U B) U C 4. A ∩ (B ∩ C) y (A ∩ B) ∩ C 5. A U (B ∩ C) y (A U B) ∩ (A U C) 6. A ∩ (B U C) y (A ∩ B) U (A ∩ C) Para los mismos conjuntos anteriores siendo el conjunto A* = {x : 0 ≤ x < ∞} escribir los siguientes conjuntos complementarios: 1. (A U B) c 2. (A ∩ B) c Ejercicio 9 (Variables aleatorias) Para cada uno de los casos del Ejercicio 4 de la lista de ejercicios anterior, defina una variable aleatoria de interés y clasifíquela como continua o discreta. Ejercicio 10 (Variables aleatorias) Defina 4 experimentos aleatorios distintos y construya sus respectivos espacios muestrales, defina 2 variables aleatorias de interés para los experimentos y clasifíquelas. Ejercicio 11 (Probabilidad) La siguiente tabla de frecuencias se construyó con datos obtenidos de 100 parcelas de 10 metros cuadrados cada una, en las que se observó el rendimiento obtenido en kg. de tomate por parcela. Xi Frec. Relat. 7,5 0.045 12,5 0.120 17,5 0.170 22,5 0.110 27,5 0.060 32,5 0.070 37,5 0.150 42,5 0.170 47,5 0.075 52,5 0.030 Asumiendo que el número de repeticiones es suficientemente grande como para considerar a las frecuencias relativas aproximadas a los valores de probabilidad. Considere los siguientes eventos siendo “Y” la variable aleatoria rendimiento de tomate en Kg por parcela: A = {Y ≤ 15} ; B = {Y ≤ 45} ; C = {Y ≤ 20}. Calcule las siguientes probabilidades: 1. P[BcUA] 2. P[B∩Ac] 3. P[Ac U [C∩Bc]]
  • 9. Ejercicio 12 (Probabilidad) Los datos de la siguiente tabla de frecuencias corresponden a rendimientos (gr.) de plantas de soja. Intervalo Frec. absoluta [ 0 - 5] 7 ( 5 - 10] 5 (10 - 15] 7 (15 - 20] 18 (20 - 25] 32 (25 - 30] 41 (30 - 35] 37 (35 - 40] 25 (40 - 45] 22 (45 - 50] 19 (50 - 55] 6 (55 - 60] 6 (60 - 65] 3 (65 - 70] 1 1. ¿Cuántas plantas se observaron? 2. Si se asume que el número r hallado en el punto ”a” es suficientemente grande, calcule (a partir de la tabla) las siguientes probabilidades al seleccionar una planta al azar de la población: • P[{20 < Y ≤ 60}] • P[{30 < Y ≤ 60}] • P[{Y ≤ 10} U {Y > 60}] • P[{Y ≤ 50} ∩ {Y > 10}] • P[{20 < Y ≤ 50} U {30 < Y ≤ 60}] • P[{20 < Y ≤ 50} ∩ {30 < Y ≤ 60}] • P[{Y ≤ 30}] • P[{Y > 50}] Ejercicio 13 (Reto) En una cosecha de manzanas se sabe que el 15 % están picadas. Si el productor toma 4 manzanas, ¿cuál es la probabilidad de que encuentre: 1. Exactamente dos manzanas picadas? 2. Por lo menos una manzana picada? 3. No más de tres manzanas picadas? 4. Hasta 3 manzanas picadas? (Sugerencia: Plantear primero el experimento aleatorio básico y en cada caso tener claro qué resultados sirven y cuáles no)
  • 10. Lista de ejercicios 3 Conceptos claves: Característica de eventos. Dos leyes del cálculo de probabilidades. Función de distribución y de densidad de probabilidad. Modelos de probabilidad Bernoulli y Binomial. Ejercicio 1 (Said Infante Gil) Considere el experimento en elegir cédulas del censo mexicano de 1970 y determinar si el individuo censado únicamente habla alguna lengua indígena, si sólo habla español, o si habla alguna lengua indígena y además español. En el primer caso denote el resultado del experimento por I (sólo lengua indígena), en el segundo por E (sólo español) y en el tercero por B (bilingüe). a) Escriba el espacio muestral si se eligen dos cédulas (notar que hay 9 resultados posibles). b) Sobre el espacio muestral obtenido defina la variable aleatoria X como el número de individuos bilingües. Determine el valor de X para cada uno de los 9 resultados posibles. c) De acuerdo con el censo de 1970, P(I) = 0.02, P(E) = 0.92 y P(B) = 0.06 (esas son las frecuencias relativas obtenidas). ¿Cuál es la función de probabilidades para la variable aleatoria X definida en b)? Suponga independencia entre las dos repeticiones del experimento; es decir , que la probabilidad del evento { I I } es 0.0004 Ejercicio 2 (Said Infante Gil) En seguida se presentan 4 funciones. Determine cuáles son funciones de probabilidades. Establezca la razón o razones para su decisión. x −1 a) f X ( x) = ; x = 0,1,2 2 b) f X ( x) = x − x 2 + 0.01; x = 0.1;0.2;0.3;0.4;0.5 c) f X ( x) = + x ; x = 0.01;0.04;0.09;0.16 x d) f X ( x) = ; x = 1,2,3 5 Ejercicio 3 (Said Infante Gil) Considere la siguiente función de probabilidades: X -4 -3 -2 -1 0 1 fX(x) 0.2 0.3 0.2 0.1 0.1 0.1 a) Calcule P(X≤ -3); P(X> -1); P(X< -4); P(X≥ -3); P(X> -3) b) Dibuje el diagrama de puntos e histograma de probabilidades para fX(x). Ejercicio 4 En una fábrica que se dedica a la producción de bolsas plásticas se sabe que el 8% están pinchadas. A su vez una empresa productora de lácteos -cliente de la anterior- desea saber cuál es la calidad de las mismas ya que el empaque es fundamental para la correcta
  • 11. conservación de los productos que ella distribuye. Para esto se realiza un experimento que consiste en tomar 4 bolsas al azar y se observa si están pinchadas o no. 1. Escriba el espacio muestral. 2. Defina la variable aleatoria de interés y su correspondiente distribución. 3. Calcule las siguientes probabilidades: • Sacar al menos 2 bolsas dañadas. • Sacar 3 bolsas dañadas. • Sacar hasta 3 bolsas dañadas 4. ¿Que supuestos fueron necesarios para el calculo de probabilidad que usted realizó? Ejercicio 5 Un productor decide cultivar dos tipos de tomate: americano y perita. Del tipo americano planta 230 semillas y del tipo perita planta 358. Luego de tres semanas de cultivadas el productor recorre el campo y registra la cantidad de semillas que emergieron para cada tipo. Los resultados son los siguientes: Variedad Cultivadas Emergieron % emergencia Americano 230 126 0,55 Perita 358 293 0,81 1. ¿Qué modelo teórico de probabilidad considera apropiado si se define una variable aleatoria X:”número de plantas que emergieron de una variedad en el total que se cultivó de la misma”? ¿Cuáles son los parámetros para cada una de las variedades? 2. Suponga que se toman 6 semillas al azar. Calcule las siguientes probabilidades: (a) Que germinen 4 semillas. (b) Que germinen a lo sumo 2 semillas. (c) Que germinen al menos 3 semillas. 3. ¿Cuál será el número esperado de semillas germinadas, si se plantaran en el próximo ciclo 500 semillas para cada tipo? Ejercicio 6 Se quiere estudiar la incidencia de mancha negra, causada por Phillosticta citricarpa en frutos cítricos. Para esto se observaron 10 frutas por árbol en 20 árboles y en cada caso se registró presencia de síntoma o no. 1. ¿Cuál es la variable de interés y cómo se distribuye? 2. Dado que la probabilidad de encontrar un fruto infectado es de 0.2, ¿cuál es el número esperado de frutos con síntoma? 3. Si se tomaran 6 frutos al azar, calcule las siguientes probabilidades: (a) Encontrar más de 4 frutos infectados. (b) Encontrar al menos un fruto infectado.
  • 12. Ejercicio 7 Un comité asesor está compuesto por 15 miembros, 9 a favor, 4 en contra y 2 indiferentes acerca de la modificación de un reglamento. Tres periodistas de distintos programas radiales (en distintos momentos) eligen al azar una persona del comité para entrevistar, ¿cuál es la probabilidad de que al menos dos de las personas seleccionadas estén a favor de la modificación? Ejercicio 8 Un barco posee 3 luces de emergencia, cada una de las cuales se pone en funcionamiento automáticamente con una probabilidad de 0,99 ante una emergencia. Si las tres luces funcionan de forma INDEPENDIENTE, calcule: 1. la probabilidad de que al menos una de las luces funcione en una emergencia. 2. la probabilidad de que todas fallen (no funcione ninguna) en una emergencia. Ejercicio 9 Según las Leyes de Mendel, la proporción de semillas de color amarillo en arvejas en la F2 luego de un cruzamiento de una homocigota dominante y una recesiva es de 0.75. 1. Si se obtienen 600 semillas de un cruzamiento, cuántas de estas se espera que sean amarillas?. 2. Si se toman 6 semillas al azar, siendo Y: ”número de semillas amarillas en 6 semillas”, calcule la probabilidad de los siguientes eventos: (a) P[{Y < 3}] (b) P[{Y > 2} ∩ {Y < 5}] (c) P[{Y > 3}] (d) P[{Y > 2}] (e) P[{Y = 3}] (f) P[{Y ≥ 3}] Ejercicio 10 (Aplicación: Inspección por muestreo1) Una compañía farmacéutica es la encargada para proveer lotes de vacuna para ganado a un distribuidor, algunas de las cuales resultan estériles. Testear cada vacuna es impracticable ya que el test es destructivo. Para el seguimiento de la calidad de las vacuna el distribuidor realiza en el siguiente proceso de inspección. De cada lote se eligen al azar 10 vacunas y se registra el número de vacunas estériles, X. Si X = 0 el lote es aceptado, y si 1 _ X es rechazado2. Asuma que el tamaño de lote es lo suficientemente grande y que X es aproximadamente binomial con n = 10 y p la fracción desconocida de vacunas estériles (parámetro) por lote. 1. Si p = 0.2, ¿cuál es la probabilidad de que un lote sea aceptado utilizando el plan de inspección por muestreo del distribuidor? 2. Calcule la probabilidad de aceptar el lote, P(A), para p = 0.05, 0.1, 0.2, 0.3, 0.4. Grafique P(A) en función de p uniendo los puntos3.
  • 13. Ejercicio 11 (Variable aleatoria Poisson) Sea X = ”número de animales afectados con Pietín en una hectárea”. Se sabe que X presenta la siguiente función de masa de probabilidad: e − λ λ xi P( X = xi ) = xi ! para x1 = 0, 1, 2 . . . n, con λ el número promedio (esperado) de animales con Pietín por hectárea. Para λ = 0.02, calcule las siguiente probabilidades. 1. Exactamente un animal afectado. 2. Ningún animal afectado. 3. Al menos un animal afectado. Ejercicio 12 Se está pensando el parcial de Métodos Cuantitativos II en un formato de múltiple opción. Una propuesta es hacer 10 preguntas, cada una con cuatro opciones. Calcule la probabilidad de responder 8 o más preguntas correctamente, si se contesta al azar. Ejercicio 13 (Variable aleatoria uniforme) Sea X una variable aleatoria con función de densidad f(x) = k para 0 ≤ X ≤ 2 y 0 en otro caso. 1. Grafique f(x). 2. Calcule el valor de k para que la función f sea una función de densidad de probabilidades. 3. Calcule P(X ≤ 0, 05), P(X ≤ 0, 25), P (0, 8 ≤ X) Ejercicio 14 (Variable aleatoria triangular) Dibuje en un plano cartesiano un triángulo de vértices (0,0), (1,1) y (2,0). 1. Calcule el área de dicho triángulo. 2. El triángulo dibujado por usted puede representar la distribución de probabilidades de una variable aleatoria, digamos X. Dicha variable se llama triangular. Calcule P(X ≤ 0.5); P(X ≤ 0.25); P(X ≤ 1); P(0.75 ≤ X) Ejercicio 15 Encuentre en el capítulo 4 (Nociones de probabilidad) de Said Infante Gil, en la página 103, ¿cuál es el error en el espacio muestral planteado en el ejemplo c? 1Ej. Tomado de Atacaría et al, Cap. 5, Ej. 12 2Esto es un plan de muestreo con tamaño de muestra n = 10 y número de aceptación c = 0. 3Esta curva es llamada ”Curva operativa característica para el plan del muestreo
  • 14. Lista de ejercicios 4 Conceptos claves: Valor esperado, varianza, propiedades. Distribución normal, distribución normal estándar. Ejercicio 1 Para los siguientes modelos de probabilidad calcule la E(X) y V (X) 1. X ~ Bernoulli (0:8) 2. X ~ Bernoulli (p) 3. X ~ Binomial (3; 0:8) Ejercicio 2 (Continuación Ej. 9 de la lista anterior) Calcule la esperanza y la varianza de las variables P1 y P2, siendo P1 = 4X y P2 = 4X - 2(10 - X). Ejercicio 3 Sea X una variable aleatoria con función de densidad f(x) = 1, si 0 ≤ X ≤ 1 y 0 en otro caso. 1. Grafique f(x) y verifique que es una función de densidad. 2. Calcule la E(X) y V (X). 3. Sean Y = X + 3 y W = 2X, calcule la esperanza y la varianza de Y y W. Ejercicio 4 Una compañía de seguros sabe que la probabilidad de que roben un auto en un año es 0.15 (nº robos/ nº autos) y que hay solicitudes para 1.500 seguros contra robo. El precio promedio de un auto es U$ 3.000. ¿Cuánto debe cobrar por seguro para que en un año no tenga pérdidas? Ejercicio 5 La función de distribución de probabilidades de venta de 2 productos es: marca A xi 0 1 2 3 4 5 P(X=xi) 0,1 0,1 0,2 0,3 0,2 0,1 Marca B yi 0 1 2 P(Y=yi) 0,23 0,48 0,29 Sea X = número de unidades de la marca A vendidas en 1 semana, y Y = número de unidades de la marca B vendidas en 1 semana. Hallar la esperanza y la varianza de ambas marcas. Ejercicio 6 Sea X: nº de unidades vendidas de la marca A en una semana, cuya función de distribución de probabilidad fue dada en el ejercicio anterior. Suponga que se obtiene una ganancia de 50 dólares por cada unidad vendida y que el costo fijo semanal es de 20 dólares. ¿Cuál es la esperanza de ganancia neta? (Ganancia neta = ingresos - costos)
  • 15. Ejercicio 7 En vacas holando en posparto, la probabilidad de presencia de folículos ovulatorios (NFOL:X), donde de cada folículo sale un ovulo, tiene asociada la siguiente función de distribución. NFOL:X 0 1 2 3 4 f(X) = P(X = xi) 0.3 0.5 0.1 0.06 0.04 Determine la esperanza y la varianza de esta variable aleatoria. Ejercicio 8 En un trabajo sobre preferencia de alfajores de chocolate, se usa una escala de preferencia de 5 puntos, donde 1 significa el más aceptado, y 5 el menos aceptado. Se sabe la función de probabilidad asociada con la variable X (escala de preferencia) para una determinada marca de alfajores de chocolate, es: X 1 2 3 4 5 f(X) = P(X = xi) 0,1 0,25 0,5 0,1 0,05 Determine la esperanza de dicha variable aleatoria. Ejercicio 9 (Said Infante Gil) Suponga que le número de interrupciones (por mes) de la corriente eléctrica (X) en un sector de una ciudad tiene la siguiente función de probabilidades: X 0 1 2 3 4 5 6 fX(x) 0.12 0.32 0.28 0.17 0.06 0.03 0.02 a) Calcule E(X) y E(X2) b) Calcule σ X y obtenga σ X 2 Ejercicio 10 (Said Infante Gil) Calcule µ X , σ X y σ X para la función de probabilidades del ejercicio 3 de la lista 3. 2 Ejercicio 11 1. Dada la variable aleatoria Z con distribución normal, media cero y varianza 1, calcular las siguientes probabilidades: (a) P (Z > 0,75) (b) P (Z < 1,30) (c) P (Z > 1,96 ó Z < -1,96) (d) P (Z < 1,64) (e) P (Z > -0,57) (f) P (Z > 1,64 ó Z < -1,64)
  • 16. 2. Dada la variable aleatoria Z con distribución normal, media cero y varianza 1, calcular los valores simétricos z1 y z2 que cumplen, (a) P (z1 < Z < z2) = 0,95 (b) P (z1 < Z < z2) = 0,80 (c) P (Z > z1 ó Z < z2) = 0,10 siendo z1 > z2 (d) P (Z > z1 ó Z < z2) = 0,20 siendo z1 > z2 (e) P (z1 < Z < z2) = 0,6826 (f) P (z1 < Z < z2) = 0,9974 Ejercicio 12 Dada la variable aleatoria Y, con distribución normal, media 6 y varianza 4, calcular las siguientes probabilidades, 1. P (Y > 3) 2. P (Y > 1,6) 3. P (Y > 8) 4. P (Y > 10 ó Y < 2) 5. P (2 < Y < 10) 6. P (Y > 3 y Y < 2) 7. P (0 < Y < 12) 8. P (Y > 6) Ejercicio 13 Utilizando el modelo teórico normal, determine para una variedad de maíz, cuya media es 10.23 y su varianza 4.25, las siguientes probabilidades, 1. P (X > 10,23) 2. P (X = 10,23) 3. P (X < 10,23) 4. P (10, 23 < X < 14,35) 5. P (X > 14,35) 6. P (9 < X < 10,23) 7. P (X < 9) 8. P (8,17 < X < 12,29) Ejercicio 14 Se sabe que la distribución del rendimiento en gramos de las plantas de Soja se distribuye normal (31.4; 16.3), calcule, 1. La probabilidad de encontrar plantas entre 20 y 43 gr. 2. La probabilidad de encontrar plantas que pesen más de 40 gr. 3. La probabilidad de encontrar plantas que pesen menos de 20 gr. 4. La probabilidad de encontrar plantas entre 30 y 33 gr.
  • 17. Ejercicio 15 (Said Infante Gil) Si X ∼ N(60 ; 81) calcule: a) P(X ≤ 80) b) P(X ≤ 50) c) P(50 < X < 70) d) P(62 < X < 69) e) P(41 < X < 49) Ejercicio 16 (Said Infante Gil) Suponga ahora que X ∼ N(60 ; 16). Calcule las mismas probabilidades que en el ejercicio anterior. Compárelas e interprete los cambios en relación con la disminución de σ2.
  • 18. Lista de ejercicios 5 Conceptos claves: Muestra aleatoria, estimador y estimación. Distribución de la media muestral. Distribución t Ejercicio 1 Una muestra aleatoria de plantas de soja (de la Lista de Ejercicio 4, ejercicio 12), resultó en los siguientes valores: Xi 29.2 32.4 28.4 21.5 40.6 35.2 33.4 35.3 29.4 1. Estime la media y la varianza de la población. 2. Calcule la esperanza y la varianza de 3. ¿Cómo se distribuye X? 4. Calcule la probabilidad de obtener una media muestral como la que obtuvo o mayor. Ejercicio 2 (Said Infante Gil) El porcentaje de proteína (X) en una variedad de soja tiene una media de 23, con una desviación estándar de 2.0. Se realizan 10 determinaciones independientes del contenido de proteína en dicha variedad. Suponga que X tiene distribución Normal. a) ¿Cuál es la distribución de X , la media aritmética de las determinaciones? b) ¿Cuál es la probabilidad de que la X que se obtenga sea mayor de 24? ¿De qué esté entre 22.5 y 23.5? c) Suponga ahora que se hacen 50 determinaciones. Calcule las mismas probabilidades que en el inciso b). Ejercicio 3 (Said Infante Gil) Refiriéndonos al ejercicio anterior, suponga que la desviación estándar del porcentaje de proteína es 3.0. Repita los cálculos de los incisos b) y c). Ejercicio 4 (Said Infante Gil) Interprete los cambios en P ( X > 24) y P (22.5 < X < 23.5) en los ejercicios 7.8 y 7.9, con respecto al aumento de tamaño de muestra y al aumento en la varianza de la distribución. Ejercicio 5 (Said Infante Gil) Suponga que el peso neto por lata en una marca de sopa tiene una media de 565 gramos, con una desviación estándar de 15 gramos. Suponga distribución Normal de los pesos. a) Si se toma una muestra aleatoria de 9 latas y se registra el peso, ¿cuál es la probabilidad de que la media muestral esté entre 555 y 575 gramos? b) ¿De qué tamaño tendría que ser la muestra para que la probabilidad calculada en el inciso a) fuese 0.9906?
  • 19. Ejercicio 6 Calcule para una variable aleatoria con distribución t de Student (con los grados de libertad señalados), las siguientes probabilidades: P(T9 < 1.83) P(T4 < 1.53) P(T6 > −3.14 ) P(T15 > 2.13) P(− 1.36 < T12 < 1.36) Ejercicio 7 En una variable aleatoria con distribución t de Student con 12 grados de libertad, encuentre: 1. El valor de la variable que es superado por el 5 % de las observaciones. 2. El valor de la variable que supera al 10% de las observaciones. 3. Los valores entre los que se encuentra el 95% central de las observaciones. (Sugerencia: Plantear lo que se está pidiendo en un bosquejo de la distribución t) Ejercicio 8 ¿Cuántos grados de libertad debe tener una variable aleatoria con distribución T de Student para que se cumplan las siguientes igualdades: P(T > 1.67 ) = 0.05 P(T < 6.31) = 0.95 P(T > 2.53) = 0.01 P(T > −1.74) = 0.95 Ejercicio 9 Para el ejercicio 1 realice los ítems 3 y 4 suponiendo desconocida la varianza poblacional. Ejercicio 10 Una muestra aleatoria de plantas de maíz dio como resultado los siguientes valores: xi 1.5 2.3 1.8 1.6 2.0 1.3 2.4 1.9 1. Estime la media y la varianza del peso de las plantas de maíz. 2. Calcule la probabilidad de obtener una media muestral como la obtenida o menor si se supone que la verdadera media de la población es 2.5.
  • 20. 3. Calcule la probabilidad de obtener una media muestral como la obtenida o menor si se supone que la verdadera media de la población es 1.8. 4. ¿Que le sugieren los resultados respecto al verdadero valor de la media de la población?
  • 21. Lista de ejercicios 6 Conceptos claves: Estimación por intervalos de confianza para la media y varianza. Distribución χ2.Teorema del límite central. Ejercicio 1 Si la variable aleatoria Y tiene una distribución Chi-cuadrado con 10 grados de libertad, calcule las siguientes probabilidades: P(Y > 3.25) P(Y > 18.3) P(Y > 2.56) Ejercicio 2 En cada ítem, encuentre el valor de k para que se cumplan las siguientes condiciones: ( ) P χ 6 > k = 0.975 2 P (χ 2 9 < k ) = 0.025 P (χ 6 16 > k ) = 0.95 P (χ 2 15 < k ) = 0.995 Ejercicio 3 Encuentre los valores k1 y k2 que cumplen las siguientes condiciones, dejando probabilidades iguales en cada cola de la distribución. ( P k1 < χ 82 < k 2 = 0.90 ) P (k 1 <χ 2 17 < k ) = 0.80 2 P (k 1 <χ 2 20 < k ) = 0.80 2 Ejercicio 4 En una investigación sobre toxinas producidas por un hongo que afecta el cultivo de maíz, un bioquímico prepara extractos de un cultivo del hongo con solventes orgánicos y mide la cantidad de la sustancia tóxica (mg) por gramo de solución, obteniendo los siguientes resultados a partir de 9 preparados: 1,2 0,8 0,6 1,1 1,2 0,9 1,5 0,9 1,0 1. Calcule la media muestral. 2. Sabiendo que σ = 0.3 construya un intervalo de confianza del 98% para el peso promedio de la sustancia tóxica por gramo de cultivo del hongo. 3. Interprete el intervalo.
  • 22. Ejercicio 5 Un investigador, estudiando la posibilidad de extraer proteína de un alga marina para usarla en la alimentación de animales, hizo 18 determinaciones de la proteína extraída en muestras de 50 Kg. de alga. La media muestral y la desviación estándar fueron de 3.6 kg y 0.8 kg respectivamente. Estime a través de un intervalo de 95% de confianza la producción media de proteína extraída por 50 kg de alga. Interprete el intervalo. Un colega afirma que el contenido de proteína en 50 kg de alga es igual a 4,5 kg ¿Qué puede decir usted en base al intervalo que construyó? Ejercicio 6 Para el ejercicio anterior obtenga un intervalo de confianza al 95% para σ2. Ejercicio 7 Una muestra aleatoria de cebollas, proporcionó la siguiente información con respecto al peso en gramos/bulbo: 100 122 125 98 95 106 189 125 160 145 138 165 172 154 166 140 Estime el peso medio de los bulbos de toda la cosecha de donde proviene la muestra, utilizando un intervalo de confianza del 90%. Estima con un intervalo de confianza al 90% la varianza poblacional. Ejercicio 8 Encuentre los límites del 95% de confianza para la media de la población de la cual se obtuvo una muestra que dio los siguientes valores: 18,5 20,6 12,9 14,6 19,8 15,0 Ejercicio 9 Se obtuvieron los siguientes rendimientos (en ton/ha) de una variedad de uva para vino fino, en 9 parcelas experimentales: 3,2 3,9 4,3 3,4 3,7 4,2 3,4 4,4 4,5 Calcule el intervalo de 90% de confianza para la varianza poblacional. Ejercicio 10 Un modelo físico sugiere que el aumento de la temperatura promedio en el agua usada como refrigerante en una cámara de compresión no debe ser más de 5 oC. Los aumentos de temperatura en el refrigerante medidos en 8 oportunidades en el compresor dieron los siguientes resultados: 6,4 4,3 5,7 4,9 6,5 5,9 6,4 5,1
  • 23. 1. Obtenga un intervalo de confianza al 95% para la media de la variable de interés. 2. Permiten estos datos concluir que el cambio de temperatura es diferente a 5 ºC. 3. Si el laboratorio observara valores promedio de cambio de temperatura en el refrigerante de 6 ºC los seguiría utilizando o no? Fundamente su respuesta. Ejercicio 11 Los paquetes de un determinado fungicida, poseen una especificación acerca del contenido de cobre del mismo: 0.60 miligramos de cobre cada 100 gramos de producto. Una dependencia del MGAP analiza una muestra al azar compuesta por 100 paquetes de 100 gramos de producto y encuentra que la media muestral es de 0.63 miligramos y el desvío de 0.11 miligramos. 1. Construya un intervalo de confianza para el valor promedio de cobre del fungicida de 98% de confianza. 2. Considerando la información que posee ¿como haría la especificación del producto en cuanto a su contenido en cobre? Ejercicio 12 Una muestra aleatoria de frascos de cereza, dio los siguientes pesos (g) de contenido por frasco: 343 337 352 349 337 343 352 343 1. Estime la media de peso de contenido y el desvío estándar de la población. 2. Estima con un intervalo de confianza de 80% el contenido medio de la población. 3. ¿Se puede afirmar con 95% de confianza que U es de 350 g, a partir de lo calculado en el punto anterior? Ejercicio 13 Una muestra aleatoria de 25 pollos arrojó un peso medio de 2350 gr. con una desviación estándar de 150 gr. 1. Estime el peso medio de todos los pollos del criadero de donde proviene la muestra con un intervalo de confianza del 90%. 2. Efectúe lo mismo pero suponiendo que la media muestral fue obtenida en una muestra de tamaño: n=9 n=16 n=144 3. ¿Como influye el tamaño de muestra sobre la amplitud del intervalo? 4. Estime el peso medio de todos los pollos del criadero de donde proviene la muestra con un intervalo de confianza de 80%, 95% y %99.
  • 24. 5. ¿Cómo influye el nivel de confianza sobre la amplitud del intervalo? 6. Calcule el intervalo de 90% para la varianza poblacional. Ejercicio 14 Una muestra aleatoria de botellas de Chardonnay (de 375 cc de contenido) fue medida para controlar su contenido. Los resultados fueron: 373 377 372 379 377 378 372 373 1. estime la media y el desvío estándar del lote. 2. estime con un intervalo de confianza de 0.90 los parámetros Ejercicio 15 La Reproductive Biology Research Foundation de St. Louis, Missouri realizó un experimento con el objetivo de determinar el efecto de la marihuana en la sexualidad (Newsweek, 27 de abril 1974). Para el mismo se eligieron 20 muchachos en buen estado de salud que habían fumado marihuana al menos 4 días por semana por un período de 6 semanas, sin ingerir otras drogas en ese lapso, junto con un grupo de control de otros 20 muchachos que nunca habían fumado marihuana. La medida de la sexualidad que se midió fue el nivel sanguíneo de testosterona (hormona sexual masculina). El grupo que consumió marihuana tuvo una media de testosterona de 416 y un desvío estándar de 152, mientras que el otro grupo tuvo una media de 742 y un desvío estándar de 130. Sabiendo que cuanto mayor sea el nivel sanguíneo de testosterona mayor es el impulso sexual, realice un intervalo de confianza para cada uno de los grupos al 95%. ¿Qué puede decir usted en términos del problema? Ejercicio 16 Se somete a prueba 2 variedades, para determinar las diferencias de rendimientos. Las 32 parcelas sembradas con la variedad A tienen rendimiento medio de 60 con una desviación estándar de 19 mientras que las 36 sembradas con la variedad B, una media de 66 con una desviación estándar de 16. Determine los límites de confianza del 95% para cada la media de cada variedad. Ejercicio 17 La ganancia de peso de dos lotes de animales alimentados con dos raciones diferentes fueron las siguientes: Ración A Ración B 15 25 25 30 35 30 25 40 35 20
  • 25. Determine un intervalo de confianza al 90% para ganancia de peso media cada lote alimentado con las diferentes raciones. Determine además un intervalo de confianza para cada una de las varianzas poblacionales al 90%. Ejercicio 18 Se analizan dos variedades de tabaco, para determinar el contenido de nicotina, y se obtienen los resultados siguientes en miligramos: Tabaco A 24 26 25 22 23 Tabaco B 27 28 25 29 26 32 1. Determine un intervalo de confianza del 90% para el contenido de nicotina de cada variedad de tabaco. 2. Ídem para el 95% de confianza. 3. Ídem para el 99% de confianza. 4. Determine un intervalo de confianza al 90% para la varianza del contenido de nicotina de cada variedad de tabaco. Ejercicio 19 (Said Infante Gil) En un estudio sobre le contenido de caroteno en un tubérculo (Science, Vol.103, núm. 2668, pág. 194, 15 de febrero de 1946) se obtuvieron los siguientes resultados (en mg/100 g): 6.39 5.52 5.05 4.75 4.60 4.13 3.90 3.99 3.90 3.85 3.76 3.65 3.43 3.49 3.51 3.34 3.41 3.26 3.31 3.13 3.11 3.03 2.89 2.56 2.25 2.01 1.46 a) Construya un intervalo de confianza para la media del contenido de caroteno (α = 0.05) b) Construya un intervalo de confianza para la varianza del contenido de caroteno en la especie en cuestión (α = 0.05)
  • 26. Lista de ejercicios 7 Conceptos claves: Teorema del límite central. Estimación por intervalos de confianza para una proporción. Ejercicio 1 Un productor de lámparas de bajo consumo asegura que en promedio sus lámparas tienen un duración media de 1000 horas. Usted que no confía mucho en el comerciante compra 64 lámparas, registra la duración de cada una de ellas, y obtiene que x = 1156 y s 2 = 463 . 1. ¿Puede considerarse las 64 lámparas una muestra aleatoria? 2. Asumiendo que las 64 lámparas son una muestra aleatoria, calcule la probabilidad de que la duración media de la muestra resulte igual o mayor a la que se obtuvo. 3. ¿Cambian los cálculos que usted realizó si se conoce la verdadera varianza poblacional? Ejercicio 2 Considere una muestra aleatoria de tamaño n de una población Bernoulli(p). ( ) 1. Muestre que E X = p p (1 − p ) V (X ) = n 2. ¿Como se distribuye X si n es suficientemente grande? ¿Es una distribución exacta o aproximada? 3. ¿Por qué es X un buen estimador puntual de p ? 4. Si anotamos p a un estimador de p , un intervalo de confianza al (1 − α ) * 100% es ˆ p(1 − p ) ˆ ˆ p(1 − p ) ˆ ˆ p − zα ˆ ; p + zα ˆ 2 n 2 n ¿Qué supuesto realizamos para obtener este intervalo? Ejercicio 3 Un productor decide cultivar dos variedades de tomate, valencia y perita. De la variedad valencia planta 230 semillas y de la variedad perita planta 358. Luego de tres semanas de cultivadas ambas variedades el productor recorre el campo y registra que cantidad de semillas emergieron para cada variedad. Los resultados son los siguientes: Variedad Cultivadas Emergieron Valenciano 230 126 Perita 358 293
  • 27. 1. ¿Qué modelo teórico de probabilidad considera apropiado si la variable aleatoria es "número de plantas que emergieron de una variedad en el total que se cultivó de la misma"? ¿Cuáles son los parámetros para cada una de las variedades? 2. Estime para cada variable la probabilidad de emergencia. 3. Construya un intervalo de confianza al 95 % para la probabilidad de emergencia de las plantas de cada variedad e interprete en términos del problema 4. ¿Que supuesto fue necesario para que el intervalo anterior sea válido? 5. Si comparamos ambas variedades con el tomate americano que tiene una probabilidad de emergencia de 0.65, ¿que puede decir viendo los intervalos de confianza? 6. Si el productor quiere saber si el tomate valenciano tiene la misma probabilidad de emergencia que el tomate americano. ¿Cuál es el procedimiento a seguir?. Explíquelo y concluya con el mismo. Ejercicio 4 (Said Infante Gil) En un experimento para determinar la toxicidad de una sustancia se administra una dosis de ésta a cada uno de 300 conejos, y se registra el número de muertos, que resulta ser de 192. Calcule el estimador de p, la probabilidad de que un conejo elegido al azar muera a causa de una dosis de la sustancia. Calcule la desviación estándar. Construya un intervalo de confianza al 98%. Ejercicio 5 (Said Infante Gil) Usando aproximación Normal calcule, con los datos del ejercicio anterior, la probabilidad de ˆ que el estimador p difiera del valor paramétrico p por menos de 0.05; es decir calcule P( p − p ≤ 0.05) = P(−0.05 ≤ p − p ≤ 0.05) . Recuerde que el estimador ˆ ˆ .  p (1 − p )  p (1 − p ) ˆ p ∼ N  p, ˆ  . Para este tamaño de muestra use S p = 2 ˆ en vez de σ 2 al ˆ p  n  n estandarizar. Ejercicio 6 (Said Infante Gil) – Tamaño de muestra Suponga que quiere estimarse el porcentaje de analfabetismo en el país de Nuncafué. Se desea estimarlo con un margen de error menor del 4% con una probabilidad de 0.98. ¿De qué tamaño debe tomarse la muestra si nunca se ha realizado una investigación al respecto?
  • 28. Ejercicio 7 Una empresa agroindustrial hace control de calidad en la línea de producción de latas de duraznos en almíbar. El resumen de la información obtenida en las últimas 15 inspecciones se presenta en la tabla siguiente. Nº de inspección Nº de latas inspeccionadas Nº de latas con defectos 1 48 5 2 36 5 3 50 0 4 47 5 5 48 0 6 54 3 7 50 0 Estime a través de un intervalo de 95% de confianza la proporción de latas de duraznos en almíbar con defectos producidas por esta empresa.
  • 29. Lista de ejercicios 8 Conceptos claves: Prueba de hipótesis. Error de tipo I, error de tipo II. Hipótesis estadística. Juego de hipótesis: hipótesis nula, hipótesis alternativa. Estadístico de la prueba. Distribución del estadístico de la prueba bajo la hipótesis nula. Criterio de decisión. Nivel de significancia. Decisión. Valor p, p-valor o alfa- gorro ( α ). ˆ “En todos los terrenos se hacen preguntas, se escudriña, se investiga, se husmea y se experimenta. Ya no basta decir que una cosa existe y describirla: ahora todo tiene que probarse, y mejor si se hace con testigos, datos y algunos experimentos ridículos." Patrick Suskind. “ El Perfume” Ejercicio 1 Un cruzamiento de 2 tipos de plantas de maíz da como resultado 3 genotipos diferentes A, B y C. Un modelo genético sugiere que la proporción de los tres genotipos es 1:2:1. Para la verificación experimental se tomaron 90 plantas resultado del cruzamiento anterior y se observó la frecuencia de los tres genotipos: GENOTIPOS Nº DE PLANTAS A 18 B 44 C 28 ¿Permiten estos datos corroborar el modelo genético? Ejercicio 2 Se dice que la administración de una hormona acorta el intervalo interparto de vacas Hereford mayores de 2 años. Tradicionalmente el intervalo es en promedio de 390 días. Se administró a 80 vacas de más de 2 años y se registró la duración del intervalo interparto de las mismas. El experimento dio como resultado un intervalo interparto promedio de 366 días con un desvío estándar de 11 días. ¿Permiten estos datos avalar la afirmación tradicional? Ejercicio 3 Los paquetes de un determinado fungicida, poseen una especificación acerca del contenido de cobre del mismo: 0.60 miligramos de cobre cada 100 gramos de producto. Una dependencia del MGAP analiza una muestra al azar compuesta por 100 paquetes de 100 gramos de producto y encuentra que la media muestral es de 0.63 miligramos y el desvío de 0.11 miligramos. 1. Con un nivel de significancia de 5%, ¿permiten estos resultados afirmar que el contenido promedio de cobre en 100 gramos de producto es mayor que el valor especificado? 2. Construya un intervalo de confianza para el valor promedio de cobre del fungicida de 98% de confianza.
  • 30. Ejercicio 4 Los registros de los últimos años de los estudiantes que ingresan a primer año en un colegio, indican que su calificación media en una prueba de aptitud era de 115 con una desviación estándar de 20. El director, interesado en saber si los que ingresan este año pertenecen a una clase típica con respecto a aptitud, pretende probar la hipótesis de que la nueva generación tiene una media igual a la de clases anteriores. Para probar su hipótesis, obtiene la calificación de la prueba de aptitud de este año, de un estudiante en cada diez, de la oficina de admisión. Esta selección dio una muestra de tamaño 50 con una media de 118. Que puede concluir sobre la hipótesis planteada por el director? Ejercicio 5 El investigador del ejercicio 5 de la Lista de Ejercicios 6 armaba que el contenido de proteína en 50kg de algas marinas es superior a 4.5kg. Con los resultados que encontró, puede seguir sosteniendo su afirmación? Ejercicio 6 Una casa comercial asegura que los motores que vende pueden ser usados durante 10.000 horas sin necesidad de hacer un ajuste, la variabilidad de la vida útil está dada por un desvío estándar de 1.500 horas. Una cooperativa que le compra estos motores a esta casa ha registrado las horas de trabajo hasta el momento de efectuar el primer ajuste de 25 motores siendo el promedio de 9.400 horas. Utilice esta información para juzgar la afirmación de la casa vendedora. Ejercicio 7 Durante varios años se ha puesto un examen tipo en muchas escuelas. El puntaje medio del examen es 70 y la varianza 9. Una escuela que utiliza este examen por primera vez, examinó un grupo de 25 estudiantes que obtuvieron una calificación media de 71 y una varianza de 12. ¿Hay alguna razón para dudar de que las calificaciones de todos los estudiantes de la escuela tuviera una varianza de 9? Ejercicio 8 Se quiere estudiar la variabilidad en la vida útil de un nuevo tipo de bombillas. Se considera como nivel de comparación otro tipo de bombillas cuya duración (medida en horas) presenta una varianza de 10.000 horas2. Una muestra de 20 bombillas del nuevo tipo presenta una varianza de 12.000 horas2. Realice el estudio que considere conveniente al 1% de significancía. Ejercicio 9 De larga experiencia se sabe que el 20% de las semillas de cierta variedad germinan. En un experimento, 60 de 400 semillas germinaron, ¿puede considerarse una germinación significativamente pobre sobre la base de un 1% como nivel de significación?
  • 31. Lista de ejercicios 9 Conceptos claves: Diseño de experimentos: unidad experimental, tratamiento, nivel, variable de respuesta, fuentes de variabilidad. Principios básicos de la experimentación Bibliografía recomendada: Steel y Torrie, Bioestadística (Capítulo VI) Ejercicio 1 En cada uno de los siguientes enunciados referentes a estudios experimentales indicar: la unidad experimental, la variable de respuesta, las fuentes de variabilidad, los tratamientos y sus niveles. 1. Un investigador desea estudiar los efectos de los medicamentos A y B sobre el recuento de linfocitos en ratones (expresados en miles por ml de sangre) comparando A, B y el placebo P. Al diseñar el experimento se piensa que los ratones de una misma camada darán respuestas mas homogéneas que ratones de camadas diferentes. Por tal motivo se utilizan en el experimento 7 camadas de 3 ratones cada una. 2. Se pretende estudiar si el azufre produce una disminución del número de cierto tipo de parásitos de la papa. Para ello se divide el campo en 24 parcelas de igual tamaño. Interesa comparar 3 cantidades distintas de azufre en 2 estaciones del año (primavera y otoño). En cada estación del año y con cada cantidad de azufre se repite el experimento en 4 parcelas que son asignadas al azar entre las 24 parcelas preparadas para el experimento. En cada parcela se mide el número de parásitos de la papa. 3. Un investigador realizó un estudio sobre las técnicas de dosificación del ácido ribonucleico. En una determinada etapa el proceso comprende una extracción por una solución de ácido tricloroacético, donde se efectúa una medición del total de ácido ribonucleico extraído. El investigador estaba interesado en saber si el reemplazo del ácido tricloroacético por ácido perclórico asegura una extracción más completa y decidió ensayar el ácido perclórico a dos concentraciones diferentes, 5% y 10%, con respecto al procedimiento que se realizaba anteriormente. A tal fin se trataron 15 partes alícuotas de un mismo homogenato de páncreas (5 con cada tratamiento). Ejercicio 2 La única manera satisfactoria de conocer la duración de una cubierta de automóvil es hacerla rodar en un coche de prueba bajo condiciones normales del camino. Se desea comparar 4 tratamientos, cada uno corresponde a gomas preparadas con diferentes procesos. Evalué los siguientes planes: 1. Utilizar 4 autos y en cada auto colocar las 4 cubiertas con el mismo tratamiento. Es decir, un tratamiento por auto. 2. Utilizar 4 autos y en cada uno de ellos asignar a la cubierta delantera derecha el tratamiento 1, a la delantera izquierda el tratamiento 2, a la trasera derecha el tratamiento 3 y a la trasera izquierda el tratamiento 4. 3. Utilizar 4 autos y en cada uno asignar aleatoriamente un tratamiento a una cubierta.
  • 32. 4. Utilizar 4 autos y en cada uno asignar un tratamiento a una cubierta de modo que todos los tratamientos estén una vez en cada posición (usando los 4 autos) y los 4 tratamientos estén presentes en cada auto. Ejercicio 3 Los tres principios básicos del diseño de experimentos son: replicación, aleatorización y control de los efectos de variables externas. Considere cada uno de los siguientes escenarios. ¿Se adhiere cada uno de ellos a todos los principios? En casa de respuesta afirmativa, describa de qué manera. En caso de respuesta negativa indique como cambiaría el diseño para incorporar el o los principios faltantes. 1. Un químico desea comparar un nuevo método de ensayo más simple con un método estándar. Prepara una cierta solución y la divide en 40 tubos de ensayo. Aleatoriamente selecciona 20 tubos y le pide a su ayudante técnico que los analice usando el método estándar. Ella por su parte analiza los restantes 20 usando el método nuevo. Al final los dos grupos de resultados de estos ensayos serán comparados. 2. Un grupo de estudiantes universitarios cree que un cierto té de hierbas posee un remarcable poder para levantar el ánimo. Para probar lo que creían realizaron visitas semanales a un hogar de ancianos, visitando a los residentes y sirviéndoles de este té. El personal del hogar reporto que luego de varios meses muchos de los residentes estaban más alegres y saludables. Ejercicio 4 El tamaño final del fruto es un factor determinante de la calidad de los duraznos. Algunas de las nuevas variedades de duraznero se caracterizan por su abundante fructificación lo que origina una gran cantidad de frutos de pequeño tamaño con escasa calidad comercial. Una práctica que puede mejorar el tamaño del fruto es el raleo (eliminación de frutos) químico o manual. Con el objetivo de evaluar el impacto del raleo sobre el tamaño final de los frutos (peso medio de fruto en gramos), se realizó el siguiente ensayo: • Material experimental: plantas homogéneas en desarrollo y estado sanitario • Repeticiones: 5 por tratamiento, cada repetición era una planta y se muestrearon 100 frutos por planta. • Tratamientos: un testigo sin ralear (Trat 1); raleo manual (Trat 2); y raleo químico (Trat 3). Los calibres promedio por planta (mm) en cosecha se resumen en el siguiente cuadro: Tratamiento Rep 1 Rep 2 Rep 3 Rep 4 Rep 5 Trat 1 52.3 53.8 57.3 60.2 61.3 Trat 2 70.2 71.8 68.7 67.5 66.2 Trat 3 57.8 67.2 63.5 58.4 68.8
  • 33. 1. Indique: (a) Objetivo del estudio (b) Factor en estudio (c) Unidad experimental (d) Variable de respuesta 2. Escriba el modelo estadístico adecuado para este estudio y explique sus componentes. 3. Estime la media general. 4. Estime los efectos.¿Cuánto suman los efectos? ¿Es siempre así? ¿Por qué? 5. Obtenga las predicciones para las unidades (1,4) y (3,4). ¿Cuál es el error en estas predicciones?¿A qué se debe? 6.¿Cuánto suman los errores de todas las unidades? ¿Es siempre así? ¿Por qué?
  • 34. Lista de ejercicios 10 Conceptos claves: Diseño de experimentos: unidad experimental, tratamiento, nivel, variable de respuesta, fuentes de variabilidad. Suma de cuadrados. Grados de libertad. Cuadrados Medios. Fórmula de trabajo. Ejercicio 1 Para cada uno de los experimentos responda las siguientes preguntas: 1. Explicite cuáles son los tratamientos, cuáles y cuántas las unidades experimentales y cuántas repeticiones hay por tratamiento. 2. Escriba el modelo estadístico correspondiente al diseño utilizado en cada experimento y describa, en términos estadísticos y agronómicos, cada componente en él. 3. Cuál es la hipótesis nula y cuál la alterna, en términos estadísticos y agronómicos. 4. Estime los parámetros del modelo utilizado. 5. Indique dos fuentes posibles de error experimental para este caso concreto. Experimento A Los siguientes datos corresponden a un experimento en el que se quería evaluar la respuesta de un cereal al agregado de 3 dosis de nitrógeno. El experimento se realizó en un terreno bastante homogéneo y se midió la respuesta en kilogramos de cereal por parcela. Dosis N1 Dosis N2 Dosis N3 20 25 36 25 29 37 23 31 29 27 30 40 19 27 33 Experimento B A continuación se muestran los resultados de un experimento en el que se probó el efecto de dos dosis de azufre (en Kg/ha) para reducir la roña de la papa, que se midió a través de un Índice de roña. Se trabajó Como el terreno era bastante homogéneo se utilizó un diseño experimental completamente aleatorizado con 4 repeticiones. Dosis 300 kg/ha Dosis 600 kg/ha 9 10 7 4 4 4 1 5
  • 35. Experimento C Con el fin de evaluar la capacidad nutritiva de 4 variedades de avena se realizó un experimento con diseño de bloques completos al azar. Los resultados (porcentaje de proteína en base a materia seca) fueron: Bloque Variedad 1 2 3 4 5 6 1 16.28 17.88 16.88 15.57 16.72 17.32 2 16.31 18.17 17.38 17.53 16.34 17.88 3 16.25 16.92 15.88 14.78 15.97 16.66 4 21.09 21.37 21.38 20.52 21.09 21.58 Experimento D A.Bing en un trabajo realizado en 1953 comparo el efecto de varios herbicidas sobre el peso de las flores de gladiolos. El peso promedio por inflorescencia en onzas se da a continuación para los cuatro tratamientos. Bloque Tratamiento 1 2 3 4 Control 1.25 1.73 1.82 1.31 2.4-DTCA 2.05 1.56 1.68 1.69 DN/Cr 1.95 2.00 1.83 1.81 Sesin 1.75 1.93 1.70 1.59 Ejercicio 2 Sobre los datos del ejercicio 4 de la lista de ejercicios anterior, calcule las siguientes cantidades: i =3 j =5 • Suma de cuadrados totales: SCtotal = ∑i =1 ∑ j =1 ( yij − y.. ) 2 i =3 • Suma de cuadrados tratamientos: SCtrat = 5∑i =1 ( yi. − y.. ) 2 i =3 j =5 • Suma de cuadrados errores: SCerror = ∑i =1 ∑ j =1 ( yij − yi. ) 2 1. ¿Qué porcentaje de la SCtotal representa la SCtrat ? 2. En el cuadro de calibres promedio por planta (mm) en cosecha calcule los totales por repetición, por tratamiento y el total general. 3. Si usted cuenta con el dato del total general, ¿hasta cuántos datos del interior del cuadro se pueden omitir sin perder información alguna? 4. Si usted cuenta con los datos de los totales por tratamientos, ¿hasta cuántos datos del interior del cuadro se pueden omitir sin perder información alguna?
  • 36. 5. Complete el siguiente cuadro: Fuente Grados de libertad Suma de Cuadrados Cuadrados medios Tratamientos Error Total Ejercicio 3 (Said Infante Gil) En un experimento realizado en el cultivo de soja se ensayaron varios niveles de humedad aprovechable y varios niveles de fósforo. En este ejercicio sólo usaremos parte de los datos. Los tratamientos son: 1. (H1P1): 20% de humedad y 30 kg/ha de fósforo 2. (H2P1): 40% de humedad y 30 kg/ha de fósforo 3. (H1P2): 20% de humedad y 60 kg/ha de fósforo 4. (H2P2): 40% de humedad y 60 kg/ha de fósforo El experimento se realizó en un DBAC con 6 repeticiones. Los bloques fueron franjas de terreno relativamente uniformes. Las unidades experimentales (4 por bloque) fueron rectángulos de 28 m2 y la variable medida fue el rendimiento de grano (en kg) por unidad experimental. Tratamiento Bloque 1 2 3 4 I 7.3 6.8 6.7 5.7 II 7.2 5.5 7.3 6.9 III 7.6 6.8 6.8 6.4 IV 7.2 6.5 7.4 6.1 V 7.5 6.8 7.5 6.4 VI 7.6 7.1 6.3 6.3 Presente la tabla del Análisis de la Varianza y pruebe la hipótesis de igualdad de tratamientos (Use α = 0.05). Ejercicio 4 (Said Infante Gil) Una cadena de supermercados está considerando 3 posibles tipos de obsequio por volumen de compra para incrementar sus ventas. El primero estaría dirigido a los niños (N), el segundo a las madres (M) y el tercero a los padres (P). Antes de decidir cuál de los tres tipos le conviene, el gerente de publicidad decide realizar un experimento. De las ciudades donde la compañía tiene negocios, elige 5 que considera representativas y en las cuales tiene 3 o más supermercados. En cada ciudad elige 3 supermercados al azar y también aleatoriamente, decide cuál negocio va a ofrecer cada uno de los tipos de obsequio. Lleva a cabo las diferentes promociones durante una semana y en cada uno de los 15 casos, registra el incremento semanal en ventas con respecto a la semana anterior en el mismo negocio. Los resultados se resumen enseguida.
  • 37. Incremento semanal en ventas (Decenas de miles de pesos) Tratamiento Bloque (ciudad) N M P 1 10.1 9.2 4.9 2 8.9 9.3 5.2 3 2.6 3.1 1.9 4 7.4 6.0 5.4 5 0.8 1.2 0.1 Presente la tabla de ANAVA y pruebe la hipótesis de igualdad de tratamientos (Use α = 0.05).
  • 38. Lista de ejercicios 11 Conceptos claves: Covarianza, correlación lineal. Coeficiente de correlación lineal de Pearson. Regresión lineal simple. Ejercicio 1 Se cuenta con los registros de diámetro a la altura del pecho (en cms) y la altura (en mts) de 10 Eucalyptus Grandis plantados en un rodal de Rivera. Dap H 22,85 22,45 22,59 20,54 17,42 15,65 19,81 17,97 19,91 17,74 18,69 18,61 21,86 21,21 21,23 22,44 19,17 18,89 19,39 19,85 1. Realice un diagrama de dispersión. 2. Calcule la covarianza muestral. 3. Calcule el coeficiente de correlación lineal de Pearson en la muestra. 4. Realice una prueba de hipótesis para probar que el coeficiente de correlación lineal poblacional es distinto de cero a un nivel de significancia del 5%. Ejercicio 2 El objetivo de un ensayo es evaluar el comportamiento productivo de una variedad de duraznero en la zona de Melilla en relación a la dosis de nitrógeno aplicada. Para eso se hizo un experimento con las siguientes características: • Diseño: Bloques completos al Azar • Tratamientos: 4 dosis de Nitrógeno (50, 100, 150 y 200 unidades de N/planta/año fraccionado en 3 momentos ) • Repeticiones: 3 • Variable medida: Peso total del fruto por planta
  • 39. Cuadro: Promedio de kilogramos por planta según dosis de nitrógeno. Dosis de N Medias 50 31.53 100 24.94 150 21.79 200 10.85 1. Proponga una hipótesis orientadora para el estudio. 2. Proponga un instrumento de análisis adecuado para el estudio de estos datos en función de su hipótesis orientadora. 3. Estime el modelo propuesto usando mínimos cuadrados. 4. Pruebe la significación del modelo al 5%.
  • 40. ANEXOS I. LEYES IMPORTANTES DE PROBABILIDAD I.1. LEY DE SUMA DE LAS PROBABILIDADES Si A y B son dos sucesos cualesquiera, entonces P(A∪B) = P(A) + P(B) – P(A∩B) Nota: si P(A∪B) = P(A) + P(B), entonces los sucesos son mutuamente excluyentes. I.2. LEY DE MULTIPLICACIÓN DE PROBABILIDADES Si A y B son dos sucesos cualesquiera, la probabilidad de que A ocurra si sabemos que B ocurrió, se llama probabilidad condicional de A y es P( A ∩ B) P( A / B) = , ⇒ P( A ∩ B) = P( B) * P( A / B) P( B) Nota: si dos sucesos A y B son tales que P ( A ∩ B) = P ( B ) * P ( A) , entonces los sucesos A y B son probabilísticamente independientes.
  • 41. II. Algunas Funciones de Distribución de Probabilidad o de Densidad de Probabilidad II.1. Una v.a. X tiene distribución Bernoulli si su función de masa o distribución de probabilidades está dada por f ( x ) = P ( X = xi ) = p xi (1 − p )1− xi xi = 0,1 0 ≤ p ≤1 II.2. Una v.a. X tiene distribución Binomial si su función de masa o distribución de probabilidades está dada por f ( x ) = P ( X = xi ) = ( )p n xi xi (1 − p) n− xi Nota: cualquier función de distribución de probabilidades debe cumplir que 1) f ( xi ) ≥ 0 2) ∑ f (x ) = 1 ∀i i II.3. Una v.a. X tiene distribución Normal si su función de densidad de probabilidad está dada por 1  X −µ  2 1 −   2 σ  f ( x) = e σ 2π Nota: Nota: cualquier función de densidad de probabilidades debe cumplir que ∞ 1) ∫ f ( x)dx = 1 −∞ 2) f ( x) ≥ 0 ∀x
  • 42. III. ESPERANZA Y VARIANZA III.1. ESPERANZA MATEMÁTICA 1. Variables discretas E ( X ) = ∑ xi f ( x i ) = ∑ x i P ( X = xi ) ∀xi ∀xi Nota: Si la V.A. tiene distribución Binomial se puede demostrar que E ( X ) = np 2. Variables continuas ∞ E( X ) = ∫ xf ( x)dx −∞ III.2. VARIANZA V ( X ) = E{X − E ( X )} = E ( X 2 ) − [E ( X ) ] 2 2 1. Variables discretas V ( X ) = ∑ [xi − E ( X )] f ( xi ) 2 ∀xi Nota: Si la V.A. tiene distribución Binomial se puede demostrar que V ( X ) = np (1 − p ) 2. Variables continuas ∞ V (X ) = ∫ [x − E ( X )]2 f ( x)dx −∞
  • 43. IV. PROPIEDADES DE LA ESPERANZA Y LA VARIANZA IV.1. PROPIEDADES DE LA ESPERANZA Sea X una V.A. y a y b dos constantes, entonces 1) E(a) = a 2) E(bX) = b E(X) 3) E(a + bX) = a + b E(X) IV.2. PROPIEDADES DE LA VARIANZA Sea X una V.A. y a y b dos constantes, entonces, 1) V(X) > 0 2) V(a) = 0 3) V(bX) = b2 V(X) 4) V(a + bX) = b2 V(X)
  • 44. V. DISEÑO EXPERIMENTAL – ANÁLISIS DE LA VARIANZA V.1. DISEÑO COMPLETAMENTE AL AZAR (DCA) – FÓRMULAS DE CÁLCULO TABLA DE ANAVA i = 1,2, ……., t t=número de tratamientos j = 1,2, ……., r r=número de repeticiones por tratamientos V.1. DISEÑO DE BLOQUES COMPLETOS AL AZAR (DBCA) – FÓRMULAS DE CÁLCULO TABLA DE ANAVA i = 1,2, ……., t t=número de tratamientos j = 1,2, ……., r r=número de bloques
  • 45. VI. PRUEBAS DE COMPARACIONES MÚLTIPLES DE MEDIAS – PRUEBA DE TUKEY Hipótesis a probar H 0: : µ i = µ i ' ⇔ H 0: : τ i = τ i ' ∀i ≠ i ' Valor crítico o diferencia mínima significativa de Tukey entre dos medias en el experimento para rechazar la hipótesis nula está dado por CME W = q(t ; gle;α ) r por lo tanto el criterio de decisión para rechazar o no la hipótesis nula es CD : Si Yi. − Yi '. ≥ W ⇒ Rechazo H0 con (1-α)*100 de confianza
  • 46. VII. MEDIDAS DE ASOCIACIÓN ENTRE DOS VARIABLES ALEATORIAS VII.1. COVARIANZA VII.2. COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON n n (∑ xi ) 2 SCx = ∑ xi2 − i =1 i =1 n
  • 47. VIII. REGRESIÓN LINEAL VIII.1. Estimación de los parámetros de regresión lineal simple de primer orden β1 = ˆ ∑ ( X − X )(Y − Y ) = SP i i xy ∑(X − X ) i SC 2 x β 0 = Y − β1 X ˆ ˆ VIII.2.Propiedades de los estimadores 1) E ( β 1 ) = β 1 ˆ σ2 2) V ( β 1 ) = ˆ SCx 3) E ( β 0 ˆ )=β 0 1 X2  4) V ( β 0 ) = σ 2  + ˆ  n SCx      σ  2 5) β1 ~ N  β 1 , ˆ    SCx  SCE SCy ) − β 1SPxy ( SCy ) − β 12 SCx ˆ ˆ σ = CME = ˆ 2 = = n−2 n−2 n−2 VIII.3. Estimación de los parámetros de regresión lineal en forma matricial β = ( X ' X ) −1 X ' Y ˆ
  • 48. VIII.4. ANÁLISIS DE VARIANZA PARA LA REGRESIÓN Fuentes de Grados de Sumas de Cuadrados Fo Variación libertad Cuadrados (SC) Medios (CM) n Regresión P* ∑(y ) i 2 SCreg/glreg CMreg/CMerror β 'X ' Y − ˆ i =1 n Error o Residual n-(p+1) Y 'Y − β ˆ 'X ' Y SCerror/glerror n Total n-1 ∑(y ) i 2 Y 'Y − i =1 n * número de parámetros de regresión