UNIVERSIDAD FERMIN TOROVICERECTORADO ACADEMICOFACULTAD DE CIENCIAS SOCIALESESCUELA DE COMUNICACIÓN SOCIALConceptos Básicos...
Introducción:El propósito de este trabajo es dar a conocer y enseñar un conocimiento básico de:Medidas de Posición,Medidas...
Medidas de Posición:Las medidas de posición dividen un conjunto de datos en grupos con el mismo número deindividuos.Para c...
Li es el límite inferior de la clase donde se encuentra la mediana.N es la suma de las frecuencias absolutas.Fi-1 es la fr...
Paciente 1: 73 77 74Paciente 2: 64 90 73¿Cuál es la Amplitud en pulsaciones para cada paciente?Para calcular la amplitud d...
Desviación media para datos agrupados: Veamos ahora cómo se calcula la desviaciónmedia en el caso de datos agrupados en in...
Varianza: La varianza es una medida de dispersión relativa a algún punto de referencia.Ese punto de referencia es la media...
Medidas de Centralización:Al describir grupos de observaciones, con frecuencia es conveniente resumir lainformación con un...
Medidas de Forma: Las medidas de forma caracterizan la forma de la gráfica de unadistribución de datos estadísticos. La ma...
Medidas de Curtosis o Apuntamiento: La curtosis mide el grado de agudeza oachatamiento de una distribución con relación a ...
o valor esperado, se obtiene a partir de la suma de todos sus valores divididaentre el número de sumandos. Cuando el conju...
a) De la forma más ortodoxa, es decir:099869493.1330526316.178.432.6*23.578.4*75.423.5Y**Y*YG 33nn21  Lo que acabamos...
Datos Agrupados:Se localiza la clase modal buscando la frecuencia más alta y después se aplica lasiguiente fórmula:Nota: L...
Rango Intercuartilico:Es una medida de variabilidad adecuada cuando la medida de posición centralempleada ha sido la media...
Conclusión:.Las medidas estadísticas son técnicas que permiten resumir la información de algunapoblación. Dividen un conju...
Próxima SlideShare
Cargando en…5
×

Universidad fermin toro

302 visualizaciones

Publicado el

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
302
En SlideShare
0
De insertados
0
Número de insertados
3
Acciones
Compartido
0
Descargas
0
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Universidad fermin toro

  1. 1. UNIVERSIDAD FERMIN TOROVICERECTORADO ACADEMICOFACULTAD DE CIENCIAS SOCIALESESCUELA DE COMUNICACIÓN SOCIALConceptos BásicosEstadísticosAlumna: María PérezC.I:24712508Sección: M-742Barquisimeto, Junio de 2013
  2. 2. Introducción:El propósito de este trabajo es dar a conocer y enseñar un conocimiento básico de:Medidas de Posición,Medidas de DispersiónMedidas de Centralización,Medidas de FormaEntre otrasEs importante tener un conocimiento respecto cada uno de ellos ya que la estadística lavemos cada día en nuestra vida
  3. 3. Medidas de Posición:Las medidas de posición dividen un conjunto de datos en grupos con el mismo número deindividuos.Para calcular las medidas de posición es necesario que los datos estén ordenados demenor a mayorCuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales:primero, segundo y tercer cuartil.Ejemplo: Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75%de los datos. Q2 coincide con la mediana.Cálculo de los cuartiles1 Ordenamos los datos de menor a mayor.2 Buscamos el lugar que ocupa cada cuartil mediante la expresión .Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).Ejemplo: Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de losdatos.D5 coincide con la mediana.Cálculo de los decilesEn primer lugar buscamos la clase donde se encuentra , en la tablade las frecuencias acumuladas
  4. 4. Li es el límite inferior de la clase donde se encuentra la mediana.N es la suma de las frecuencias absolutas.Fi-1 es la frecuencia acumulada anterior a la clase mediana.ai es la amplitud de la clasePercentiles: Los percentiles son los 99 valores que dividen la serie de datos en 100partes iguales.Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.P50 coincide con la mediana.Cálculo de los percentilesEn primer lugar buscamos la clase donde se encuentra , en latabla de las frecuencias acumuladas.Li es el límite inferior de la clase donde se encuentra la mediana.N es la suma de las frecuencias absolutas.Fi-1 es la frecuencia acumulada anterior a la clase mediana.ai es la amplitud de la clase.Medidas de Dispersión:También llamadas medidas de variabilidad, muestran la variabilidad de una distribución,indicando por medio de un número, si las diferentes puntuaciones de una variable estánmuy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será lavariabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe sitodos los casos son parecidos o varían mucho entre ellos.Rango o Recorrido: Se llama recorrido de una distribución a la diferencia entre el mayor y elmenor valor de la variable estadística.Ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide tres veces aldía y que cierto día los registros de dos pacientes muestran:
  5. 5. Paciente 1: 73 77 74Paciente 2: 64 90 73¿Cuál es la Amplitud en pulsaciones para cada paciente?Para calcular la amplitud de los datos necesario identificar el valor más grande y el valormás pequeño del conjunto de datos de cada uno de los pacientes.Para el Paciente 1:A = 77 - 73 = 4Para el Paciente 2:A = 90 - 64 = 26Desviación Media: En teoría, la desviación puede referirse a cada una de las medidasde tendencia central: media, mediana o moda; pero el interés se suele centrar en lamedida de la desviación con respecto a la media, que llamaremos desviación media.Puede definirse como la media aritmética de las desviaciones de cada uno de los valorescon respecto a la media aritmética de la distribución, y de indica así:NxxDM Ejemplo: Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviación media deestos valores.x xx  x2 -3 32 3 34 -1 14 -1 14 -1 15 0 06 1 17 2 28 3 38 3 3DM = 1,8
  6. 6. Desviación media para datos agrupados: Veamos ahora cómo se calcula la desviaciónmedia en el caso de datos agrupados en intervalos.NxnDMi Donde observamos que ahora las desviaciones van multiplicadas por las frecuencias delos intervalos correspondientes.Además, las desviaciones son de cada centro, o marca de clase, a la media aritmética. Esdecir,NxxnDMmi )(Ejemplo: Para hallar la desviación media de la siguiente tabla referida a las edades de los100 empleados de una cierta empresa:Clase ni16-20 220-24 824-28 828-32 1832-36 2036-40 1840-44 1544-48 848-52 3Veamos cómo se procede:Clase ni xm ni  xm xx  ni  xx 16-20 2 18 36 16,72 33,4420-24 8 22 17624-28 828-32 1832-36 2036-40 1840-44 1844-48 848-52 3100DM = 6,09
  7. 7. Varianza: La varianza es una medida de dispersión relativa a algún punto de referencia.Ese punto de referencia es la media aritmética de la distribución. Más específicamente, lavarianza es una medida de que tan cerca, o que tan lejos están los diferentes valores desu propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética,mayor es la varianza; cuando más cerca estén las Xi a su medida menos es la varianza.Varianza para datos no agrupados: Dado un conjunto de observaciones, tales como X1,X2, … , Xn, la varianza denotada usualmente por la letra minúscula griega δ (sigma)elevada al cuadrado (δ2)y en otros casos S2 según otros analistas, se define como: elcuadrado medio de las desviaciones con respecto a su media aritmética"Matemáticamente, se expresa como:Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber:18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las edades, se obtuvo25.4 años, encontrar la varianza de las edades de estos estudiantes:Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:Xi ( Xi -( Xi -18 (18 – 25.5)=-7.4 (-7.4)2=54.7623 (23 – 25.5)=-2.4 (-2.4)2= 5.7625 (25 – 25.5)=-0.4 (-0.4)2= 0.1627 (27 – 25.5)= 1.6 ( 1.64)2= 2.1634 (34 – 25.5)= 8.6 ( 8.6)2 =73.96Total Xxxx 137.20Respuesta: la varianza de las edades es de 27.4 años
  8. 8. Medidas de Centralización:Al describir grupos de observaciones, con frecuencia es conveniente resumir lainformación con un solo número. Este número que, para tal fin, suele situarse hacia elcentro de la distribución de datos se denomina medida o parámetro de tendencia central ode centralización. Cuando se hace referencia únicamente a la posición de estosparámetros dentro de la distribución, independientemente de que ésta esté más o menoscentrada, se habla de estas medidas como medidas de posición.1En este caso seincluyen también los cuantiles entre estas medidas.Entre las medidas de tendencia central tenemos: Media . Media ponderada. Media geométrica. Media armónica. Mediana. Moda.Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por loque las medidas de posición o medidas de tendencia se usan de acuerdo al tipo devariable que se está observando, en este caso se observan variables cuantitativas
  9. 9. Medidas de Forma: Las medidas de forma caracterizan la forma de la gráfica de unadistribución de datos estadísticos. La mayoría de estos parámetros tiene un valor quesuele compararse con la campana de Gauss, esto es, la gráfica de la distribución normal,una de las que con más frecuencia se ajusta a fenómenos realesMedidas de Asimetría: Se dice que una distribución de datos estadísticos es simétricacuando la línea vertical que pasa por su media, divide a su representación gráfica en dospartes simétricas. Ello equivale a decir que los valores equidistantes de la media, a uno uotro lado, presentan la misma frecuencia.En las distribuciones simétricas los parámetros media, mediana y moda coinciden,mientras que si una distribución presenta cierta asimetría, de un tipo o de otro, losparámetros se sitúan como muestra el siguiente gráfico:Ello puede demostrarse fácilmente si se tiene en cuenta la atracción que la mediaaritmética siente por los valores extremos, que ya se ha comentado más arriba y lasdefiniciones de mediana (justo en el centro de la distribución, tomando el eje de abscisascomo referencia) y moda (valor que presenta una ordenada más alta).Por consiguiente, la posición relativa de los parámetros de centralización puede servircomo una primera medida de la simetría de una distribución. Otras medidas más precisasson el coeficiente de asimetría de Fisher, el coeficiente de asimetría de Bowley y elcoeficiente de asimetría de Pearson.
  10. 10. Medidas de Curtosis o Apuntamiento: La curtosis mide el grado de agudeza oachatamiento de una distribución con relación a la distribución normal, es decir, mide cuánpuntiaguda es una distribuciónTipos de Curtosis: La curtosis determina el grado de concentración que presentan losvalores en la región central de la distribución. Así puede ser:Leptocúrtica.- Existe una gran concentración.Mesocúrtica.- Existe una concentración normal.Platicúrtica.- Existe una baja concentración.Mediana:Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un50% de valores son inferiores y otro 50% son superiores).No presentan el problema de estar influido por los valores extremos, pero en cambio noutiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por elnúmero de veces que se ha repetido).Media:La media aritmética (también llamada promedio o simplemente media) de unconjunto finito de números es el valor característico de una serie de datoscuantitativos objeto de estudio que parte del principio de la esperanza matemática
  11. 11. o valor esperado, se obtiene a partir de la suma de todos sus valores divididaentre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibeel nombre de media muestral siendo uno de los principales estadísticosmuestrales.Expresada de forma más intuitiva, podemos decir que la media (aritmética) es lacantidad total de la variable distribuida a partes iguales entre cada observación. Lamedia aritmética es el valor obtenido al sumar todos los datos y dividir el resultadoentre el número total de datos.Media Aritmética  x : Es el promedio de los datos, y su objetivo principal es encontrar elvalor que debería de estar en el centro. Su ventaja principal es que es la única medida enla que   0 xx , su inconveniente es que se ve influida por valores extremos.Datos No Agrupados:X =Xnii 1nEjemplo: Calcular la media aritmética de los números 10,12,36,25,582.24512155825361210xMedia Geométrica: Con cierto tipo de datos, la media aritmética no da el valor promediocorrecto. La media geométrica sirve para promediar los crecimientos geométricos de unavariable.Si suponemos que Y representa el factor de crecimiento geométrico de la variable X, esdecir: YXXiii 1,entonces el factor de crecimiento geométrico promedio de la variable Xserá:Datos No Agrupados:nn21 Y**Y*YG Ejemplo:Si los precios de la acción “Anáhuac” en los últimos cuatro días fueron; 4.75, 5.23, 4.78 y6.32 calcula el factor de crecimiento promedio y el crecimiento porcentual promedioExisten dos formas de resolverlo:X= cualquier datoNúmero total de datos
  12. 12. a) De la forma más ortodoxa, es decir:099869493.1330526316.178.432.6*23.578.4*75.423.5Y**Y*YG 33nn21  Lo que acabamos de obtener es factor de crecimiento promedio y para obtener elcrecimiento se aplica la siguiente formula:%9869.9100*)099869493.11(100*)1(  Gocrecimientb) Otra forma es 099869493.1330526316.175.432.6primeroúltimo 331-datosdenúmero GDatos Agrupados:n fkf2f1k21Y**Y*YG Dónde: k = última claseNota: Se puede demostrar que X G .También puede calcularse la media geométrica ponderada.Moda:Es el valor que más se repite en la muestra.La medida modal nos indica el valor que más veces se repite dentro de los datos; esdecir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es elnúmero 2 quien sería la moda de los datos. Es posible que en algunas ocasiones sepresente dos valores con la mayor frecuencia, lo cual se denominaBimodal o en otros casos más de dos valores, lo que se conoce como multimodal.En conclusión las Medidas de tendencia central, nos permiten identificar los valores másrepresentativos de los datos, de acuerdo a la manera como se tienden a concentrar. LaMedia nos indica el promedio de los datos; es decir, nos informa el valor que obtendríacada uno de los individuos si se distribuyeran los valores en partes iguales. La Medianapor el contrario nos informa el valor que separa los datos en dos partes iguales, cada unade las cuales cuenta con el cincuenta porciento de los datos. Por último la Moda nosindica el valor que más se repite dentro de los datos.Moda  Xˆ : Es el valor más frecuente, el que se observa mayor número de veces.Datos No Agrupados: Después de ordenar los datos buscamos el valor que más serepite.Ejemplo: Encontrar la moda de; 47, 48, 49, 49, 49, 51, 51, 52. Podemos observar que elnúmero que más se repite es el 49. Si ningún valor se repite, no existe moda
  13. 13. Datos Agrupados:Se localiza la clase modal buscando la frecuencia más alta y después se aplica lasiguiente fórmula:Nota: La distribución puede ser: amodal, unimodal, bimodal, trimodal,...., polimodal.Ejemplo: Calcular el salario que más se repite en:Fronteras($) Salario(X)No. De emp.(F)12,500-17,500$15,0001817,500-22,500$20,0003522,500-27,500$25,00029Observamos las frecuencias (No. de empleados) y decimos que la clase modal es lasegunda, porque 35 es la frecuencia más grande y aplicamos:62935ff171835ff:donde65.195,21$5000*6171717500i*+FI=Xˆposterior2anterior1211Amplitud:Se obtiene restando el valor más bajo del más alto en un conjunto de observaciones. Laamplitud tiene la ventaja de que es fácil de calcular y sus unidades son las mismas quelas de la variable que se mide. La amplitud no toma en consideración el número deobservaciones de la muestra estadística, sino solamente la observación del valor máximoy la del valor mínimo. Sería deseable utilizar también los valores intermedios del conjuntode observaciones.posterior2anterior1211ffff:dondei*+FI=Xˆ
  14. 14. Rango Intercuartilico:Es una medida de variabilidad adecuada cuando la medida de posición centralempleada ha sido la mediana. Se define como la diferencia entre el tercercuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3-Q1. A la mitad del rangointercuartil se le conoce como desviación cuartil (DQ): DQ = RQ/2= (Q3-Q1)/2.Seusa para construir los diagramas de caja y bigote (boxplots) que sirven paravisualizar la variabilidad de una variable y comparar distribuciones de la mismavariable; además de ubicar valores extremos
  15. 15. Conclusión:.Las medidas estadísticas son técnicas que permiten resumir la información de algunapoblación. Dividen un conjunto de datos en grupos con el mismo número de individuos(medidas de posición), determinan los valores centrales o medios de la distribución de losdatos (medidas de centralización), analizan la distribución de los valores de la serie(medidas de distribución) y muestran la forma que presentan esos datos ( medidas deforma)Por eso en el trabajo ya culminado se pudo dar una pequeña explicación conceptualizaday práctica de cada término estadístico de gran importancia tanto en la vida cotidiana comoen problemas matemáticos aún más grandes

×