1. Centro de Ciencias de la Salud
Departamento de Optometría
Maestría en Rehabilitación Visual
Métodos estadísticos
“Biostatistics with R”
Ejercicios
Profesor:
Dr. Rogelio Salinas Gutiérrez
Alumna:
Opt. Melissa P. García Félix
28 de Febrero del 2014
3. INTRODUCCION
La probabilidad es un método por el cual se obtiene la frecuencia de un suceso determinado
mediante la realización de un experimento aleatorio, del que se conocen todos los resultados
posibles, bajo condiciones suficientemente estables.
La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la
matemática, las ciencias y la filosofía para sacar conclusiones sobre la probabilidad discreta de
sucesos potenciales y la mecánica subyacente discreta de sistemas complejos, por lo tanto es la
rama de las matemáticas que estudia, mide o determina a los experimentos o fenómenos
aleatorios.
La probabilidad constituye un importante parámetro en la determinación de las diversas
casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico.
Existen diversas formas como método abstracto, como la teoría Dempster-Shafer y la teoría de la
relatividad numérica, esta última con un alto grado de aceptación si se toma en cuenta que
disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las
antiguas reglas a una simple ley de relatividad.[cita requerida]
La probabilidad de un evento se denota con la letra p y se expresa en términos de una fracción y
no en porcentajes, por lo que el valor de p cae entre 0 y 1. Por otra parte, la probabilidad de que
un evento "no ocurra" equivale a 1 menos el valor de p y se denota con la letra q
Los tres métodos para calcular las probabilidades son la regla de la adición, la regla de la
multiplicación y la distribución binomial.
Regla de la adición
La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier
evento en particular es igual a la suma de las probabilidades individuales, si es que los eventos son
mutuamente excluyentes, es decir, que dos no pueden ocurrir al mismo tiempo.
P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente. P(A o B) = P(A) + P(B) −
P(A y B) si A y B son no excluyentes.
Siendo: P(A) = probabilidad de ocurrencia del evento A. P(B) = probabilidad de ocurrencia del
evento B. P(A y B) = probabilidad de ocurrencia simultánea de los eventos A y B.
2
4.
Regla de la multiplicación
La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más eventos
estadísticamente independientes es igual al producto de sus probabilidades individuales.
P(A y B) = P(A B) = P(A)P(B) si A y B son independientes. P(A y B) = P(A B) = P(A)P(B|A) si A y B son
dependientes
Regla de Laplace
La regla de Laplace establece que:
a) La probabilidad de ocurrencia de un suceso imposible es 0.
b) La probabilidad de ocurrencia de un suceso seguro es 1, es decir, P(A) = 1.
Para aplicar la regla de Laplace es necesario que los experimentos den lugar a sucesos
equiprobables, es decir, que todos tengan o posean la misma probabilidad.
La probabilidad de que ocurra un suceso se calcula así:
P(A) = Nº de casos favorables / Nº de resultados posibles
Esto significa que: la probabilidad del evento A es igual al cociente del número de casos favorables
(los casos dónde sucede A) sobre el total de casos posibles.
* La mayoría de las investigaciones biomédicas utilizan muestras de probabilidad, es decir,
aquellas que el investigador pueda especificar la probabilidad de cualquier elemento en la
población que investiga. Las muestras de probabilidad permiten usar estadísticas inferenciales,
aquellas que permiten hacer inferencias a partir de datos. Por otra parte, las muestras no
probabilísticas solo permiten usarse estadísticas descriptivas, aquellas que solo permiten describir,
organizar y resumir datos. Se utilizan cuatro tipos de muestras probabilísticas: muestras aleatorias
simples, muestras aleatorias estratificadas, muestra por conglomerados y muestras sistemáticas.
OBJETIVO
Conocer conceptos básicos de la Teoría de Probabilidad y vincularlos con ejercicios prácticos.
3
5. CONTENIDO
1. Espacio muestral
El espacio muestral o espacio de muestreo (denotado E, S, Ω o U) consiste en el conjunto de todos
los posibles resultados individuales de un experimento aleatorio.
Un evento o suceso es cualquier subconjunto del espacio muestral, llamándose a los sucesos que
contengan un único elemento sucesos elementales.
Los espacios de muestreo aparecen de forma natural en una aproximación elemental a la
probabilidad, pero son también importantes en espacios de probabilidad. Un espacio de
probabilidad (Ω, F, P) incorpora un espacio de muestreo de resultados, Ω, pero define un conjunto
de sucesos de interés, la σ-álgebra F, por la cual se define la medida de probabilidad P
Tipos de espacio muestral
Podemos diferenciar entre dos tipos de espacios muestrales: discretos y continuos.
A. Discretos
Son aquellos espacios donde el número de sucesos elementales es finito o infinito numerable.
B. Espacio probabilístico discreto
Es aquel cuyo espacio muestral es discreto. Podemos diferenciar varios tipos de espacio
probabilístico discreto:
a) Espacio Probabilístico Discreto Equiprobable.
Su espacio muestral es finito de tamaño n.
La probabilidad de cualquier suceso elemental E es
, de aquí se deduce que para todo suceso A la probabilidad es
b) Espacio Probabilístico Finito.
Su espacio muestral es discreto finito.
Hay al menos 2 sucesos elementales que cumplen.
c) Procesos Estocásticos Finitos Y Diagramas de Árbol
Un proceso estocástico es una sucesión finita de experimentos aleatorios, cada uno de ellos con
un nº finito de resultados posibles. Se representan con diagrama de árbol.
4
6. Por ejemplo, imaginemos que se lanza una moneda y un dado de seis caras. La probabilidad de
obtener un resultado particular corresponde a la multiplicación de sus probabilidades. Es decir, la
probabilidad de obtener «cara» y un tres será:
Ahora bien, la probabilidad de un suceso cualquiera es la suma de las probabilidades de los
distintos resultados aislados posibles. Así, la probabilidad de sacar siempre un resultado impar en
los dados, independientemente del resultado de la moneda, será:
d) Espacio Probabilístico Infinito Contable
Aquel cuyo espacio muestral es discreto infinito contable. Por ejemplo
La probabilidad de que salga cara en la primera tirada ---->
La probabilidad de que salga nuevamente cara en la segunda tirada ---->
La probabilidad de que salga nuevamente cara en la tercera tirada ---->
e) Continuos
Son aquellos espacios donde el número de sucesos elementales es infinito incontable.
f)
Espacio probabilístico continuo
Espacio muestral infinito no numerable. -No es posible observar puntos concretos del espacio.
Tiene sentido hablar de intervalos observados. - No es posible asignar probabilidad a un punto
concreto, se asigna a intervalos.
Por tanto la función P está definida sobre intervalos ----->
-Habitualmente cuando trabajamos con magnitudes físicas.
5
7. g) Particiones
Es posible definir particiones sobre el espacio muestral. Formalmente hablando, una partición
sobre Ω se define como un conjunto numerable:
tal que:
2. ¿Cuál es el rango de valores que puede tomar una probabilidad?
Todos los eventos pueden ser medibles a través de una escala de 0 a 1 (o la expresamos en tanto
por ciento, entre 0% y 100%), donde el evento que no pueda ocurrir tiene una probabilidad de 0 y
uno que ocurra con certeza es de 1, y el resto de sucesos tendrá probabilidades entre “cero y uno”
que será tanto mayor cuanto más probable sea que dicho suceso tenga lugar.
6
8. 3. Dibujar y presentar un diagrama de árbol
Un diagrama de árbol es una herramienta que se utiliza para determinar todos los posibles
resultados de un experimento aleatorio. En el cálculo de la probabilidad se requiere conocer el
número de objetos que forman parte del espacio muestral. Se utiliza en los problemas de conteo y
probabilidad. Para la construcción se inicia con una rama para cada una de las posibilidades,
acompañada de su probabilidad. Cada una de estas ramas se conoce como rama de primera
generación. En el final de cada rama de primera generación se constituye a su vez, un nudo del
cual parten nuevas ramas conocidas como ramas de segunda generación, según las posibilidades
del siguiente paso, salvo si el nudo representa un posible final del experimento (nudo final).
Ejemplo: (Para los posibles tipos de paciente de optometrista considerando sexo (hombre, mujer),
si utiliza o no utiliza anteojos al momento de la consulta y grupo de edad (niño, adulto, adulto
mayor.
7
9. En base al diagrama de árbol definir cuál es el conjunto complemento de un paciente hombre que
no utiliza anteojos y que es adulto mayor proporcionando argumentación que justifique la
respuesta.
El complemento o el conjunto complementario de un conjunto dado es otro conjunto que
contiene todos los elementos que no están en el conjunto original. Para poder definirlo es
necesario especificar qué tipo de elementos se están utilizando, o de otro modo, cuál es el
conjunto universal; por lo tanto:
“Si tomamos como universo todo el diagrama de árbol, el conjunto complemento de un H-AM-SRX
es: H-N-SRX, H-N-CRX, H-A-SRX, H-A-CRX, H-AM-SRX, M-N-SRX, M-N-CRX, M-A-SRX, M-A-CRX,
M-AM-SRX, M-AM-CRX; o bien podríamos abstraer el conjunto como M, H-N, H-A, H-AM-CRX”
(Todas las mujeres más todos los hombres niños y adultos con y sin graduación, más los hombres
adultos mayores con graduación.)
Ahora si tomamos el universo de “SOLO HOMBRES ADULTOS MAYORES”, el complemento de un
hombre adulto mayor sin graduación sería un hombre adulto mayor con graduación.
8
10. EJERCICIOS
(Chapter 4 Probability página 107)
A. EJERCICIO 1
Consider two events E1 and E2, where P(E1) = 0.3 and P(E2) = 0.5. Calculate the following
probabilities:
(a) P(E1 ∪ E2) if the events are disjoint. In this case, are these two events partitioning the
sample space?
For disjoint events we have : P(E1 U E2) = P(E1) + P(E2) = 0.3 + 0.5 = 0.8
The response is 0.8 and actually these events are not partitioning the sample space.
(b) P(E3), where E3 = (E1 ∪ E2)c, and E1 and E2 are disjoint.
The P(E1 U E2) = 0.8, and P(0.8) c = 0.2, so the respose is P(E3) = 0.2.
(c) P(E1 ∩ E2) if the events are independent.
For independent events we have that P(E1 n E2) = P(E1) x P(E2), so we have that
P(E1 n E2) = 0.3 x 0.5 = 0.15.
(d) P(E1 ∪ E2) if the events are independent.
For independent events we have that P(E1 U E2) = P(E1) + P(E2) – P(E1) x P(E2) so we have that
P(E1 U E2) = 0.3 + 0.5 – 0.3 x 0.5 = 0.8 x 0.15 = 0.12
(e) P(E2|E1) if P(E1|E2) = 0.35. In this case, are these two events independent?
P(E2|E1) iF P(E1|E2) = 0.35
P(E1) = 0.3
P(E2) = 0.5
P(E2|E1) = P(E2 n E1)= 0.3 X 0.5 = 0.15 = 0.5
P(E1)
0.3
0.3
Nota: Tengo mucha duda en este ejercicio, no podría contestar si son dependientes o
independientes.
9
11. B. EJERCICIO 2
In a population that is in Hardy–Weinberg equilibrium, P(a) = 0.1 and P(A) = 0.9. Find the
probability of each possible genotype.
C. EJERCICIO 3
Assume that the probability of having the disease is 0.4 and that the disease is not genetic (i.e., it
is independent from the genotype of individuals). Also assume that the gene A has two alleles A
and a such that P(A) = 0.3 and P(a) = 0.7. If the population is in Hardy–Weinberg equilibrium, write
down the sample space for the combination of the disease status (D for diseased and H for
healthy) and different genotypes along with the probability of each possible combination
10
12. D. EJERCICIO 4
For the above question, find the probabilities for all possible combinations of genotypes and the
disease status assuming that the disease is related to the gene A such that P(D|aa) = 0.5 and
P(D|Aa) = P(D|AA) = 0.3.
E. EJERCICIO 5
Suppose that a pregnant woman is going to give birth to a girl or a boy with equal probabilities.
However, if the baby is a boy, the probability that he has black (Bk) hair is 0.7, whereas this
probability is 0.4 if the baby is a girl. Alternatively, the baby could have blond (Bd) hair. Using a
tree diagram, find the sample space and the corresponding probabilities for all possible
combinations of gender and hair color for the baby.
11
13. F. EJERCICIO 6
Suppose that the probability of being affected by H1N1 flu is 0.02.We found that among people
who are affected by H1N1, the probability that a person washes her hands regularly is 0.3. If the
probability of washing hands regularly in general (regardless of whether the person has the H1N1
flu or not) is 0.6. What is the probability of getting the H1N1 flu if a person washes her hands
regularly?
P (H1N1) = 0.02
P(WH) =0.6 (WH = Was hand)
P(WH |H1N1) = 0.3
P(H1N1| WH) = ?
Formulas
P(E1nE2) = P(E1|E2) P(E2)
P(E1|E2) = P(E1nE2)
P(E2)
Por lo tanto sustituyo:
P(H1N1|WH) = P (WHnH1N1) = P(WH|H1N1) P(H1N1) = 0.3 X 0.02 = 0.01
P(WH)
P(WH)
0.6
G. EJERCICIO 7
A person has received the result of his medical test and realized that his diagnosis was positive
(affected by the disease). However, the lab report stated that this kind of test has false positive
probability of 0.06 (i.e., diagnosing a healthy person, H, as affected, D) and that the probability of
false negative is 0.038 (i.e.,diagnosing an affected person as healthy). Therefore, while this news
was devastating, there is a chance that he was misdiagnosed. After some research, he found out
that the probability of this disease in the population is P(D) = 0.02. Find the probability that he is
actually affected by the disease given the positive lab result.
P(D) = 0.02
P(FP) = P(T + |H) = 0.06 (False positive)
P(FN) = P(T - |D) = 0.038 (False negative)
P(D|T+) =
______P(T + |D) P (D)_______
P(T + |D) P (D) + (P(T + |H) P(H)
P(T + |D) = 1 - P(T - |D) = 1 – 0.038 = 0.962
P(T - |H) = 1 - P(T + |H) = 1 – 0.06 = 0.94
P(D|T +) = _____0.962 X 0.02______ = ____0.01924__ = 0.1924 = 0.2465
0.962 X 0.02 + 0.06 X 0.98 0.01924 + 0.0588 0.07804
12
14. REFERENCIAS
Material Didáctico Maestría en Rehabilitación Visual
Materia Métodos Estadísticos
Biostatistics whit R.
An introduction to statistics.
Through Biological Data
Biblioteca Virtual UAA.
Google académico
http://cran.r-project.org/doc/contrib/Seefeld_StatsRBio.pdf
http://www.ics.uci.edu/~babaks/BWR/Home.html
http://www.stats.gla.ac.uk/steps/glossary/probability.html#probability
Asesoría Personalizada con Maestro de Centro de Ciencias Básicas. UAA
13