1. La estadística tiene por objeto el desarrollo de técnicas para analizar datos empíricos recogidos mediante experimentos o encuestas.
2. Los datos pueden ser cualitativos o cuantitativos. Los cuantitativos se dividen en discretos o continuos.
3. La correlación mide la relación entre dos variables estadísticas y puede ser positiva, negativa o nula. Cuanto más cercana a 1 o -1 es más fuerte la correlación.
1. RESUMEN ESTADÍSTICA
La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto de
datos empíricos ( recogidos mediante experimentos o encuestas).
Los datos obtenidos pueden tener varios caracteres.
Carácter cualitativo: la característica observada no se puede contar ni medir ( color de pelo, sexo,...)
Carácter cuantitativo: La característica observada se puede contar o medir, se indica mediante números.
A esta característica también se la conoce como variable estadística pudiendo ser:
-Variable discreta: Solo toma valores puntuales. (sin decimales) Edad , número de hijos,...
-Variable continua: Pueden tomar todos los valores de un intervalo. Altura, peso, ...
La Población es el conjunto de todos los elementos cuyo conocimiento nos interesa y que serán sujetos
de nuestro estudio. (Alumnos de bachillerato)
La Muestra es un subconjunto, extraído de la población representativo de esta.
Tamaño es el número de individuos que componen la muestra.
Una distribución se denomina bidimensional o de dos variables cuando para cada elemento de una
población se consideran los valores correspondientes a dos caracteres cuantitativos distintos. Cada
uno de esos caracteres estudiados vienen representados por el par (x , y). Por ejemplo las notas de 12
estudiantes en Física y Matemáticas, “x” indicaría la nota de Física e “y” la de Matemáticas.
Si interpretamos cada par de valores como las coordenadas de un punto, la representación gráfica del
conjunto de todos ellos se llama nube de puntos o diagrama de dispersión.
Si agrupamos cada variable unidimensional en intervalos de igual amplitud podemos establecer una nueva
tabla de distribución bidimensional denominada de doble entrada.
La frecuencia absoluta bidimensional fij es el número de veces que aparece cada par (xi, yj) de las
variables. La suma de las frecuencias absolutas bidimensionales es igual al número total de elementos
considerados, N.
Las frecuencias relativas bidimensionales se obtienen dividiendo cada frecuencia absoluta
bidimensional por el número total de elementos N.
La correlación viene a representar la relación que existe entre esas dos variables para los N individuos.
Puede ser más o menos fuerte según lo apretados que estén los puntos en la nube en torno a una recta que
marca la tendencia y se llama recta de regresión.
Si al aumentar el valor de una variable aumenta el valor de la otra, la pendiente de la recta de regresión es
positiva y la correlación será positiva o directa.
Si al aumentar el valor de una variable disminuye el valor de la otra, la pendiente es negativa y la
correlación será negativa o inversa.
Cuando no existe ningún grado de dependencia entre las dos variables, se dice que la correlación es nula.
Por ejemplo estudiemos las notas de 12 estudiantes en Física , Matemáticas y Filosofía:
Alumno a b c d e f g h i j k l
Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10
Filosofía 2 5 2 7 5 4 6 6 7 5 5 9
Física Filosofía
Matemáticas Matemáticas
Se aprecia una relación fuerte entre las notas de Física y Matemáticas, a mejor nota en Matemáticas
mejor nota en Física. Se dice que existe correlación entre estas dos variables. Si nos fijamos en la
relación entre las notas de Filosofía y Matemáticas aunque también existe correlación, esta es más débil
que en el caso anterior. Cuanto más próximos estén los puntos a la recta, más fuerte es la correlación.
DDD
2. MEDIDA DE LA CORRELACIÓN MEDIA
Media de la variable x x
x i
Media de la variable y y
y i
n n
El punto ( x, y) se llama centro de gravedad de la distribución.
DESVIACIÓN TÍPICA
La desviación típica es la raíz cuadrada de la varianza V:
x Vx
(x i x)2
x i
2
x2
n n
y Vy
(y i y) 2
y i
2
y2
n n
COVARIANZA
xy
(x i x ).( yi y )
x y i i
xy
n n
Ambas expresiones son iguales, aunque la segunda es más cómoda para obtener numéricamente la
covarianza.
La covarianza positiva nos indica una correlación directa y la negativa una inversa.
COEFICIENTE DE CORRELACIÓN LINEAL
El valor de la correlación entre las dos variables viene dado por la expresión:
xy
r El coeficiente de correlación, r , varía entre –1 y 1 y tiene las siguientes propiedades:
x y
- No tiene dimensiones.
- Cuando está próximo a 0 la correlación es débil.
- Cuando está próximo a 1 o –1 la correlación es fuerte.
- Cuando es igual a 1 todos los puntos de la nube están situados sobre una recta de pendiente
positiva y la correlación es perfecta. Entre las dos variables existe una dependencia
funcional.
- Cuando es igual a -1 todos los puntos de la nube están situados sobre una recta de pendiente
negativa y la correlación es perfecta. Entre las dos variables existe una dependencia
funcional.
- Cuando r >0 la correlación es positiva o directa.
- Cuando r < 0 la correlación es negativa o inversa.
RECTA DE REGRESIÓN
Vamos a hallar la recta que mejor se ajuste a la nube de puntos. Esta se obtiene mediante las ecuaciones.
xy
Recta de regresión de y sobre x: y y (x x)
x2
xy
Recta de regresión de x sobre y: xx ( y y)
y2
La recta de regresión sirva para hacer estimaciones, es decir se puede obtener de forma aproximada el
valor esperado de y para un cierto valor de x o viceversa.
Las estimaciones se realizan aproximadamente y en términos de probabilidad.
La estimación es tanto mejor cuanto mayor sea r, es decir cuanto más próximo sea a 1 o –1.
Las estimaciones solo deben hacerse dentro del intervalo de valores utilizados o muy cerca de ellos.
Cuanto mayor sea el número de datos tomados más fiable será la estimación.
DDD
3. RESUMEN DE PROBABILIDAD
CONCEPTOS TEÓRICOS
-ESPACIO MUESTRAL: Es el conjunto formado por todos los resultados que pueden obtenerse cuando
se realiza un experimento aleatorio.
-SUCESO ELEMENTAL: Es cada uno de los resultados posibles obtenidos al realizarse un
experimento.
-SUCESO SEGURO E: Es aquel que siempre ocurre y contiene a todos los sucesos elementales..
-SUCESO IMPOSIBLE : Es aquel que nunca ocurre y no contiene ningún suceso elemental.
-SUCESO CONTRARIO a uno dado A es el que ocurre cuando no sucede A y se representa por A .
-SUCESOS COMPATIBLES: Dos sucesos A y B que tienen algún suceso elemental común y pueden
ocurrir simultáneamente.
-SUCESOS INCOMPATIBLES: Cuando ambos sucesos no tienen sucesos elementales comunes.
OPERACIONES CON SUCESOS
-UNIÓN DE SUCESOS: Suceso unión de A y B es el suceso formado por todos los sucesos elementales
de A y B. Se expresa por AUB. Es la suma de los sucesos elementales de A y de B.
-INTERSECCIÓN DE SUCESOS: Suceso intersección de A y B es el suceso formado por todos los
sucesos elementales comunes de A y B. Se expresa por AB. Y es el conjunto de sucesos elementales
que aparecen tanto en A como en B.
Cuando AB = los sucesos son incompatibles.
-DIFERENCIA DE SUCESOS: Suceso diferencia de A y B es el suceso formado por los sucesos
elementales de A que no lo son de B. Se expresa por A-B.
PROBABILIDAD
Cuando en un experimento aleatorio todos los sucesos elementales tienen la misma probabilidad de
ocurrir, se denominan equiprobales. Y en este caso se puede aplicar la Regla de Laplace.
Nº de casos favorables al suceso S
Probabilid ad (S)
Nº de casos posibles
- Para cada suceso A : 0 P(A) 1.
- La probabilidad del suceso seguro E es P(E) =1.
- Si A y B son incompatibles P(AUB) = P(A) + P(B).
- La probabilidad del suceso contrario es : P( A) 1 P( A)
-La probabilidad del suceso imposible es: P() =0.
-Si A y B son dos sucesos cualesquiera: P(AUB) = P(A) + P(B) – P(AB).
-La suma de las probabilidades de todos los sucesos elementales de un espacio muestral E es
siempre 1.
Ejemplo: En una baraja de 40 cartas hallar la probabilidad de hallar un As. P(As) = 4/40 = 1/10
PROBABILIDAD COMPUESTA
Se representa por P(AB) o P(AB) y es P ( A B) P( A).P( B / A)
Se multiplican las dos probabilidades que aparecen en el diagrama de árbol y cumplen lo requerido.
EjemploUna caja contiene 10 bolas blancas, 5 negras y 5 rojas. Se extraen dos bolas de forma
consecutiva y sin reemplazamiento. Calcular la probabilidad de que:
a) Las dos bolas sean blancas: P(BB) = 10/20. 9/19
b) La primera sea roja y la segunda blanca: P(RB)= 5/20. 10/19
c) La primera sea negra y la segunda roja: P(NR)= 5/20.5/19
PROBABILIDAD TOTAL P(S) = P(A1).P(S/A1) + P(A2).P(S/A2) + ... + P(An).P(S/An)
La probabilidad de que se cumpla un determinado suceso, que aparece en más de una rama del
diagrama, es la suma de las probabilidades de cada uno de los casos en que aparece.
Ejemplo En el ejemplo anterior calcular la probabilidad de que la segunda bola sea roja:
P(2ªR)= P(RR) + P(NR) + P(BR)=5/20.4/19 + 5/20.5/19 + 10/20. 5/19 = 19/76
DDD
4. P(A B)
PROBABILIDAD CONDICIONADA P (B/A)
P(A)
Sabiendo que el suceso A (primero del diagrama de árbol) ha sucedido, la probabilidad de que ocurra el
suceso B es la que aparece en la segunda parte del diagrama y cumple el suceso B.
Ejemplo: En el ejemplo anterior calcular la probabilidad de que:
a) La segunda bola sea blanca si la primera bola es roja: P(2ªB/1ªR)= 10/19
b) La segunda bola sea blanca si la primera también lo es: P(2ªB/1ªB)= 9/19
PROBABILIDAD “A POSTERIORI”. FORMULA DE BAYES
Probabilidad de que se cumpla un suceso A ( de la primera parte del diagrama de árbol) sabiendo que
seguro que se cumple un suceso B ( de la segunda parte del diagrama).
P(AB)
P (A/B)
P( B)
Se calcula mediante un cociente en el que en el numerador aparece el producto de las dos probabilidades
que deben cumplirse P(AB) y en el denominador la suma de todas las probabilidades que cumplan la
condición B P(B).
Ejemplo En el ejemplo anterior calcular la probabilidad de que la primera bola sea negra sabiendo que
la segunda bola es roja:
P(1ºN/2ªR)= (5/20.5/19) / 19/76
Ejercicios:
1.- De una baraja de 40 cartas ¿Cuál es la probabilidad de sacar un oro?
a) 1/40 b) ¼ c) 3/10 d) 1/2
2.- En el ejercicio anterior ¿Cuál es la probabilidad de que sea figura y oro?
a) 3/40 b) 1/4 c) ½ d) 3/10
3.- Un estuche contiene 15 lápices de color rojo y 10 de color azul. Si elegimos uno al azar, ¡cuál es la
probabilidad de que sea rojo? a) 0,1 b) 0,25 c) 0,15 d) 0,6
4.- Si extraemos dos ¿cuál es la probabilidad de que ambos sean azules?
a) 0,1 b) 0,25 c) 0,15 d) 0,6
5.- Si elegimos dos, calcular la probabilidad de que el primero sea azul y el segundo rojo.
a) 0,1 b) 0,25 c) 0,15 d) 0,6
6.- La probabilidad de que un estudiante de economía obtenga el título de economista es 0,6. Calcular la
probabilidad de que de un grupo de tres estudiantes matriculados en economía:
Los tres obtengan el título. a) 0,288 b) 0,064 c) 0,936 d) 0,216
7.- Ninguno obtenga el Título. a) 0,288 b) 0,064 c) 0,936 d) 0,216
8.- Al menos uno obtenga el título. a) 0,288 b) 0,064 c) 0,936 d) 0,216
9.-Solo uno obtenga el título. a) 0,288 b) 0,064 c) 0,936 d) 0,216
10.- Una encuesta revela que el 30% de la población tiene estudios, de los cuales el 12% no tiene trabajo.
Del 70% que no tiene estudios un 25% no tiene trabajo. Calcula el tanto por ciento de la población que no
tiene trabajo. a) 0,211 b) 0,1342 c) 0,1706 d) 0,3346
11.- La probabilidad de que tenga estudios una persona elegida al azar entre los que tienen trabajo.
a) 0,211 b) 0,1342 c) 0,1706 d) 0,3346
12.-La probabilidad de que tenga estudios una persona elegida al azar entre las que no tienen trabajo.
a) 0,211 b) 0,1342 c) 0,1706 d) 0,3346
13.- Un vendedor de ordenadores visita a 4 presuntos clientes. se sabe que la probabilidad de que un
cliente haga una compra es 0,3. Calcular la probabilidad de que haga alguna venta.
a) 0,4532 b) 0,2401 c) 0,7599 d) 0,99
14.-Una caja contiene dos monedas normales (con una cara y una cruz) y una moneda trucada (con dos
caras). Se elija de forma aleatoria una moneda y se lanza al aire. Si sale cara ¿cuál es la probabilidad de
que sea la moneda trucada? a) 2/3 b) 1/3 c) 1/4 d) 1/2
15.- La media de edad de los alumnos que se presentan a las pruebas de acceso a la universidad es de 18,1
años y la desviación típica es 0,06 años. ¿cuál es la probabilidad de que la edad de los alumnos esté
comprendida entre 17,9 y 18,2 años? Datos: P(x<3,33 ) = 0,9996; P(x< 1,67)= 0,9525
a) 0,9525 b) 0,9778 c) 0,9521 d) 0,8992
DDD