ESTADÍSTICA1-Definición de estadística.......................................................................................
ESTADÍSTICA1- Definición de estadística.Estadística es la ciencia que se encarga de recoger y ordenar datos referidos a di...
El número total de datos se representa por N y es el tamaño de la muestra. Un determinado datose representa por ix donde i...
Tabla de frecuencias:Datos (alturaen cm.)Marca declase ixFrecuenciaabsoluta ifFrecuenciarelativa ihFrecuenciaacumulada iF ...
4.2 Media ponderada.Sólo para datos cuantitativos (edad, notas, etc.). Se representa por px y es el cociente dedividir la ...
152148 <≤ x 150 3156152 <≤ x 154 7160156 <≤ x 158 6164160 <≤ x 162 2168164 <≤ x 166 1172168 <≤ x 170 1Clase modal = 156152...
6.1 Rango o recorrido.Sólo para datos cuantitativos (edad, notas, etc.). Se representa por Rg y es la diferenciaentre el m...
( )∑∑∑∑====⋅−=−⋅== niiniiiniiniiiffxxxffxVars11221122Demostración:( ) ( ) ( )=−⋅=−+⋅=⋅⋅−⋅+⋅==⋅⋅−⋅+⋅=⋅⋅−⋅+⋅==⋅⋅−⋅+⋅=⋅⋅−+=⋅−...
vertical representamos las frecuencias absolutas. Para cada valor de la variable trazamos unabarra vertical cuya altura co...
164160 <≤ x 162 2168164 <≤ x 166 1172168 <≤ x 170 1Suma = 2010
Próxima SlideShare
Cargando en…5
×

01 estadística unidimensional

390 visualizaciones

Publicado el

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
390
En SlideShare
0
De insertados
0
Número de insertados
205
Acciones
Compartido
0
Descargas
0
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

01 estadística unidimensional

  1. 1. ESTADÍSTICA1-Definición de estadística...................................................................................................................22-Diferentes formas de recogida de información.................................................................................23-Recuento de datos. Frecuencias y porcentajes..................................................................................23.1 Datos sin agrupar....................................................................................................................33.2 Datos agrupados.....................................................................................................................34-Medidas de centralización.................................................................................................................44.1 Media......................................................................................................................................44.2 Media ponderada....................................................................................................................54.3 Moda.......................................................................................................................................54.4 Mediana..................................................................................................................................65-Medidas de posición..........................................................................................................................65.1 Cuartiles..................................................................................................................................65.2 Deciles....................................................................................................................................65.3 Percentiles..............................................................................................................................66-Medidas de dispersión.......................................................................................................................66.1 Rango o recorrido...................................................................................................................76.2 Desviación media...................................................................................................................76.3 Varianza..................................................................................................................................76.4 Desviación típica....................................................................................................................86.5 Intervalo típico.......................................................................................................................86.6 Coeficiente de variación.........................................................................................................87-Gráficos estadísticos.........................................................................................................................87.1 Diagrama de barras.................................................................................................................87.2 Diagrama de sectores..............................................................................................................97.3 Histograma.............................................................................................................................91
  2. 2. ESTADÍSTICA1- Definición de estadística.Estadística es la ciencia que se encarga de recoger y ordenar datos referidos a diversosfenómenos para después analizarlos e interpretarlos.Algunos términos utilizados frecuentemente son:• Población: conjunto de todos los elementos que son objeto de estudio.• Muestra: parte de la población que se estudia y que permite deducir características de lapoblación. Puede ser:– Aleatoria: los elementos se escogen al azar (por ejemplo mediante algún sorteo).– Proporcional: cada parte de la población está representada de acuerdo con suimportancia en ella.• Individuo: es cada uno de los elementos que forman la muestra. Al número deindividuos se le llama tamaño de la muestra.• Variable estadística: propiedad o característica que se quiere estudiar. Hay dos tipos:– Cualitativas: los valores son cualidades, no números, por ejemplo, sexo,nacionalidad, etc.– Cuantitativas: los valores son números, por ejemplo, notas de clase, número decalzado, altura, peso, etc. Hay dos tipos:∗ Discreta: sólo pueden tomar valores aislados. Ejemplo: número de hermanos.∗ Continua: puede tomar todos los valores de un intervalo. Ejemplo: altura.2- Diferentes formas de recogida de información.Los pasos para realizar un estudio estadístico son:• Elaboración de la encuesta: las preguntas y posibles respuestas deben ser claras.• Recogida de datos: se realiza la encuesta y se anotan los resultados. En lugar de unaencuesta, los datos pueden conseguirse de otras formas como:– Búsqueda en anuarios, archivos, etc. Ejemplo: nº de nacimientos en unapoblación.– Por observación. Ejemplo: nº de personas que cogen un medio de transportedurante un intervalo de tiempo, a veces se les ve en el metro.– Por experimentación. Ejemplo: lanzamiento de dados, monedas, etc. un númerodeterminado de veces.• Organización, clasificación y recuento de las respuestas.• Elaboración de tablas con los resultados.• Elaboración de gráficos con los resultados.• Conclusiones del estudio realizado.3- Recuento de datos. Frecuencias y porcentajes.Una vez se han recogido los datos correspondientes a una experiencia estadística, hay queelaborar tablas donde aparezcan los datos ordenados. Esto es determinar los valores que toma lavariable que se está estudiando y contar las veces que aparece cada valor.2
  3. 3. El número total de datos se representa por N y es el tamaño de la muestra. Un determinado datose representa por ix donde i indica el número de orden, así 1x hace referencia al dato 1º.El recuento de datos nos da la siguiente información:• Frecuencia absoluta de un dato: número de veces que se repite. Se representa por if ,donde i indica el número de orden. La suma es el total del número de datos. Es decir:Nfff n =+++ ...21• Frecuencia relativa de un dato: cociente entre la frecuencia absoluta y el número totalde datos. Se representa por ih , donde i indica el número de orden y la suma es 1.Nfh ii = .• Frecuencia absoluta acumulada de un dato: suma de la frecuencia absoluta y de las delos datos menores que él: ii Ffff =+++ ...21• Porcentaje: si se multiplica la frecuencia relativa por 100 obtenemos el porcentaje, y lasuma total es 100.3.1 Datos sin agrupar.Ejemplo: nº de hermanos (contándote a ti).Encuesta: 1, 1, 2, 3, 2, 3, 2, 1, 2, 2, 2, 4, 3, 2, 2, 1, 3, 4, 2, 2.Recuento:Nº Hermanos 1 2 3 4Recuento 4 10 4 2Tabla de frecuencias:Datos (nº dehermanos) ixFrecuenciaabsoluta ifFrecuenciarelativa ihFrecuenciaacumulada iFPorcentaje %1 4 2,051204== 4 20%2 10 5,0212010== 4+10=14 50%3 4 2,051204== 4+10+4=18 40%4 2 1,0101202== 4+10+4+2=20 10%Suma = 20 Suma = 1 Suma = 100%3.2 Datos agrupados.Si la variable estadística es continua o los datos muy numerosos, conviene agruparlos enintervalos o clases que tengan la misma amplitud. El valor que representa a todo el intervalo esel punto medio de cada uno y se llama marca de clase.Ejemplo: altura en cm. De un grupo de alumnos.Encuesta: 149, 154, 153, 155, 154, 156, 152, 152, 160, 165, 170, 160, 158, 159, 150, 151,152, 157, 158, 159.Recuento:Altura149150151152153154155156157158159160161162163164165166167168169170Recuento1 1 1 3 1 2 1 1 1 2 2 2 1 13
  4. 4. Tabla de frecuencias:Datos (alturaen cm.)Marca declase ixFrecuenciaabsoluta ifFrecuenciarelativa ihFrecuenciaacumulada iF Porcentaje %152148 <≤ x 150 3 15,0203= 3 15%156152 <≤ x 154 7 35,0207= 3+7=10 35%160156 <≤ x 158 6 3,0206= 3+7+6=16 30%164160 <≤ x 162 2 1,0202= 3+7+6+2=18 10%168164 <≤ x 166 1 05,0201= 3+7+6+2+1=19 5 %172168 <≤ x 170 1 05,0201= 3+7+6+2+1+1=20 5 %Suma = 20 Suma = 1 Suma = 100%Cálculo de la marca:Amplitud: 152-148 = 4; Marca de clase: 1502148152148 =−+4- Medidas de centralización.Resumen la información.4.1 Media.Sólo para datos cuantitativos (edad, notas, etc.). Se representa por x y es el cociente dedividir la suma total de los datos por su frecuencia, entre el número total de datos. Cada datohay que contarlo tantas veces como aparezca, esas veces que aparece, es la frecuencia.∑∑==⋅=⋅++⋅+⋅= niiniiinnffxNfxfxfxx112211 ...Ejemplo:Datos (nºde hermanos)ixFrecuenciaabsoluta if ii fx ⋅1 4 42 10 203 4 124 2 8Suma = 20 Suma = 442,220442081220420244310241==+++=⋅+⋅+⋅+⋅=x4
  5. 5. 4.2 Media ponderada.Sólo para datos cuantitativos (edad, notas, etc.). Se representa por px y es el cociente dedividir la suma total de los datos por su peso, entre la suma de los pesos.∑∑==⋅=++⋅++⋅+⋅= niiniiinnnpppxpppxpxpxx1112211......Ejemplo: en la asignatura de Matemáticas se valoran los siguientes aspectos con lossiguientes pesos:– Contenidos con peso 5.– Expresión con peso 3.– Trabajo en casa, esfuerzo y comportamiento con peso 2.Un alumno ha obtenido las siguientes notas, calcula la media final:– Contenidos: 7– Expresión con peso: 9– Trabajo en casa, esfuerzo y comportamiento: 21,71022445235213859=++=++⋅+⋅+⋅=pxEjemplo: en la asignatura de Matemáticas se valoran los siguientes aspectos con lossiguientes pesos:– Examen con peso 80%.– Trabajo en casa, esfuerzo y comportamiento con peso 20%.Un alumno ha obtenido las siguientes notas, calcula la media final:– Examen: 4– Trabajo en casa, esfuerzo y comportamiento: 102,522,320,01080,0410020101008041002010804=+=⋅+⋅=⋅+⋅=⋅+⋅=px4.3 Moda.Es el valor que más se repite, es decir el de mayor frecuencia, y se representa por Mo. Silos datos son agrupados, la clase modal es la clase de mayor frecuencia.Ejemplo:Datos (nº de hermanos)ix Frecuencia absoluta if1 42 103 44 2Suma = 20Mo = 2 hermanos.Ejemplo:Datos (altura en cm.) Marca de clase ix Frecuencia absoluta if5
  6. 6. 152148 <≤ x 150 3156152 <≤ x 154 7160156 <≤ x 158 6164160 <≤ x 162 2168164 <≤ x 166 1172168 <≤ x 170 1Clase modal = 156152 <≤ x cm de altura.4.4 Mediana.Sólo para datos cuantitativos (edad, notas, etc.). Se representa por Me y es el valor centralde los datos, ordenados de menor a mayor:– Si el número de datos es par hacemos la media de los dos valores centrales.– Si el número de datos es impar, la mediana es el valor central.Ejemplo:Datos: 7, 12, 3, 9, 15, 6, 8.Ordenados: 3, 6, 7, 8, 9, 12, 15.8=MeEjemplo:Datos: 3,5; 8; 4; 7,5; 4,5; 6,5;Ordenados: 3,5; 4; 4,5; 6,5; 7,5; 8.5,521125,65,4==+=MeEjemplo: nº de hermanos (contándote a ti).Encuesta: 1, 1, 2, 3, 2, 3, 2, 1, 2, 2, 2, 4, 3, 2, 2, 1, 3, 4, 2, 2.Ordenados: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4.2222=+=Me5- Medidas de posición.Indican la situación de los elementos de la distribución. Para calcular estas medidas esnecesario que los datos estén ordenados de menor a mayor.5.1 Cuartiles.Los cuartiles determinan los valores de las posiciones correspondientes al 25 %, 50% y 75%. Se denotan 1C , 2C que coincide con la Me y 3C .5.2 Deciles.Los deciles determinan los valores de las posiciones correspondientes al 10 %, 20%, … y90 %. Se denotan 1D , 2D , …, 9D .5.3 Percentiles.Los percenties determinan los valores de las posiciones correspondientes al 1 %, 2%, …,99 %. Se denotan 1P , 2P , …, 99P .6- Medidas de dispersión.Dan una idea del alejamiento de los datos respecto de las medidas de centralización.6
  7. 7. 6.1 Rango o recorrido.Sólo para datos cuantitativos (edad, notas, etc.). Se representa por Rg y es la diferenciaentre el mayor y el menor valor de la variable.Ejemplo:Datos: 7, 12, 3, 9, 15, 6, 8.Ordenados: 3, 6, 7, 8, 9, 12, 15.12315 =−=RgEjemplo:Datos: 3,5; 8; 4; 7,5; 4,5; 6,5;Ordenados: 3,5; 4; 4,5; 6,5; 7,5; 8.5,45,38 =−=Rg6.2 Desviación media.Sólo para datos cuantitativos (edad, notas, etc.).Desviación de cada dato con respecto a la media es la diferencia: xxi −La desviación media es la media aritmética pero del valor absoluto de la desviación decada dato. Se representa por DM:∑∑==⋅−=⋅−++⋅−+⋅−= niiniiinnffxxNfxxfxxfxxDM112211 ...Ejemplo:Datos (nºde hermanos)ixFrecuenciaabsoluta if ii fx ⋅ xxi − xxi − ii fxx ⋅−1 4 4 2,12,21 −=− 1,2 8,442,1 =⋅2 10 20 2,02,22 −=− 0,2 2102,0 =⋅3 4 12 8,02,23 =− 0,8 2,348,0 =⋅4 2 8 8,12,24 =− 1,8 6,328,1 =⋅Suma = 20 Suma = 44 Suma = 13,668,0206,132022,2442,23102,2242,21==⋅−+⋅−+⋅−+⋅−=DM6.3 Varianza.Sólo para datos cuantitativos (edad, notas, etc.).Es el promedio de los cuadrados de las distancias de los datos a la media. Se representa porVar o por s2.2112222221212xffxxNfx...fxfxVars niiniiinn−⋅=−⋅++⋅+⋅==∑∑==Otra expresión muy utilizada es:7
  8. 8. ( )∑∑∑∑====⋅−=−⋅== niiniiiniiniiiffxxxffxVars11221122Demostración:( ) ( ) ( )=−⋅=−+⋅=⋅⋅−⋅+⋅==⋅⋅−⋅+⋅=⋅⋅−⋅+⋅==⋅⋅−⋅+⋅=⋅⋅−+=⋅−==∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑ ∑∑∑∑∑∑∑∑================== ========211222112111121121111211211 1122112211221122222222xffxxxffxffxxffxffxfxfxffxffxfxfxfxfxfxfxfxfxffxxxxffxxVarsniiniiiniiniiiniiniiiniiniiniiniiiniiniiiniiniiniiniiiniininiiiniiiiniiniiiiiiniiniiiiniiniii6.4 Desviación típica.Sólo para datos cuantitativos (edad, notas, etc.).Es la raíz cuadrada de la varianza. Se representa por σ o s.( )∑∑∑∑====⋅−=−⋅=−⋅++⋅+⋅=== niiniiiniiniiinnffxxxffxxNfxfxfxVars112211222222121 ...σ6.5 Intervalo típico.Sólo para datos cuantitativos (edad, notas, etc.).[ ]σσ +− xx ,6.6 Coeficiente de variación.xsxCV ==σque en forma de porcentaje es 100⋅=xCVσDados dos conjuntos de datos aquel que tenga un CV mayor es el más disperso oheterogéneo. Un CV mayor del 30 % indica que la media es poco representativa como medidade promedio, debiéndose optar por la mediana o la moda.7- Gráficos estadísticos.7.1 Diagrama de barras.Es una representación en ejes coordenados. En el eje horizontal representamos los valoresde la variable estadística (por ejemplo: mujer, hombre, edad, número de hermanos). En el eje8
  9. 9. vertical representamos las frecuencias absolutas. Para cada valor de la variable trazamos unabarra vertical cuya altura coincida con su frecuencia.Ejemplo:Datos (nºde hermanos)ixFrecuenciaabsoluta if1 42 103 44 2 0246810121 2 3 4Nº de hermanosFrecuencia7.2 Diagrama de sectores.Es una representación de la información en un círculo dividido en tantos sectores comovalores y proporcionales a la frecuencia. El ángulo de un sector circular se obtiene con unasimple regla de tres:º360º360ºº360ºº360º⋅=⋅=⇒=⇒→→iiiihNfxNxfxNfDatos (nº dehermanos)ixFrecuenciaabsoluta ifGrados1 4 º72º360204=⋅2 10 º180º3602010=⋅3 4 º72º360204=⋅4 2 º36º360202=⋅7.3 Histograma.Es una representación para datos agrupados. En el eje horizontal se dibujan los extremosde las clases. Las bases de los rectángulos se corresponden con la amplitud de los intervalos. Sila amplitud de todos los intervalos es la misma, las alturas coinciden con las frecuenciasabsolutas.El polígono de frecuencias se dibuja uniendo los puntos medios de las bases superiores delos rectángulos (frecuencias correspondientes a cada valor). El polígono de frecuenciasacumuladas se dibuja de la misma manera pero utilizando la frecuencia acumulada de cadavalor.Ejemplo:Datos (alturaen cm.)Marca declase ixFrecuenciaabsoluta if152148 <≤ x 150 3156152 <≤ x 154 7160156 <≤ x 158 69
  10. 10. 164160 <≤ x 162 2168164 <≤ x 166 1172168 <≤ x 170 1Suma = 2010

×