Ing. Edgar Morales
La estadística tiene que ver con la recopilación,presentación, análisis y uso de datos paratomar decisiones y resolver pro...
Cualquier persona recibe información en formade datos a través de los periódicos, la televisión uotros medios; y a menudo ...
Los métodos empleados para resumir y organizardatos se denominan estadística descriptiva;mientras que los métodos para tom...
1) MÉTODOS NUMÉRICOS• Las descripciones numéricas de datos  suelen ser importantes. Dado un conjunto   de n observaciones ...
• Las medidas descriptivas más comunes de  tendencia central o localización son: la media  aritmética y la mediana (existe...
La media aritmética o simplemente promedio(también llamada media muestral ya quegeneralmente se calcula en relación a unam...
Característica de la Media • Es intuitiva y fácil de calcular. • Su valor puede que no coincida con   ninguno de los valor...
La mediana se suele definir como el valor “más  intermedio” una vez que los datos han sido  ordenados en forma creciente. ...
• La mediana es aquel valor que deja el cincuenta  por ciento de los datos por debajo y otro  cincuenta por encima.• Cabe ...
Moda:Es una medida de tendencia central que sepuede utilizar sea cual sea el tipo de variable aestudiar. La moda de un con...
Media Geométrica:  Se define como la raíz n-ésima del producto  de todos los valores numéricos, es decir,                 ...
La media armónica:                  Se define como el número de observaciones                  de la muestra dividido por ...
La localización o tendencia central de unconjunto      de    datos    no     necesariamenteproporciona      información   ...
Se puede decir que un conjunto de datos tiene una dispersión reducida si los mismos se aglomeran estrechamente en torno a ...
Las medidas descriptivas más comunes dedispersión son: el rango, la varianza, la desviaciónestándar y el rango intercuartí...
El rango de la muestra es la medida de variabilidad más sencilla entre todas las mencionadas; y se define como la diferenc...
Aunque es una medida muy fácil de calcular,ignora toda la información de la muestra entre lasobservaciones más grande y má...
En general, se desea una medida de variabilidadque dependa de todas las observaciones y no sólode unas pocas; así que pare...
Para el conjunto de datos x1,x2,….,xnLas diferencias                        ( x1 − x ), ( x2 − x ),....., ( xn − x )determ...
n      ∑ (x − x)              i                    2S = 2    i =1             n −1
Esta medida de variabilidad se denominavarianza. Como S2 no tiene las mismas unidadesque los datos.Desviación estándar com...
Cuartiles y percentilesCuartiles Los cuartiles dividen a un conjunto de datos en cuatro partes iguales, y se notan con Q1,...
El primer cuartil, al que se le llama Q1, es elvalor por debajo del cual se encuentra el 25%de los datos, y el tercer cuar...
Los valores Q1, Q2 y Q3 dividen alconjunto de datos ordenados en cuatropartes iguales. Q1 se puede entendercomo la mediana...
Procedimiento para el calculo de los percentiles   Sea Lp la posición del percentil deseado.          p   EntoncesL p = ( ...
Calculo del p-ésimo percentil• Paso 1: Ordenar los datos de manera ascendente.• Paso 2: Calculamos el Lp (            )• P...
Por Ejemplo:• Si tenemos 15 datos ordenados y queremos localizar el  primer cuartil (percentil 25) según la formula este  ...
Coeficientes de Asimetría y             Curtosis  Asimetría  Si los valores de la serie de datos presentala misma forma a ...
Los resultados pueden ser los siguientes:• g1 = 0 (distribución simétrica; existe la  misma concentración de valores a la ...
Curtosis• El Coeficiente de Curtosis analiza el grado de  concentración que presentan los valores alrededor  de la zona ce...
• Distribución mesocúrtica: presenta un grado de  concentración medio alrededor de los valores  centrales de la variable (...
El Coeficiente de Curtosis viene definido por la  siguiente fórmula:               n       (1 / n)(∑ ( xi − x )   4g2 =   ...
Los resultados pueden ser los siguientes:• g2 = 0 (distribución mesocúrtica).• g2 > 0 (distribución leptocúrtica).• g2 < 0...
2) MÉTODOS GRÁFICOSHistogramasSe utiliza con variables agrupadas en intervalos, representandoen el eje X los intervalos de...
Grafico de Áreas En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de ...
Cartogramas  Estos tipos de gráficos se utilizan para mostrar  datos sobre una base geográfica. La densidad  de datos se p...
Diagrama Pastel  Se divide un círculo en tantas porciones como  clases tenga la variable, de modo que a cada  clase le cor...
Dispersograma  Es un gráficos que se construye sobre dos ejes  ortogonales     de    coordenadas,     llamados  cartesiano...
Diagrama de Tallo y Hojas    Un diagrama de tallo y hoja permite  analizar la probabilidad de que un  suceso ocurra sin ut...
Diagrama de Caja y BigoteEl diagrama de cajas también llamado boxplotes la presentación visual que describe al mismotiempo...
Presenta los tres cuartiles, (y los valoresmínimos y máximos) alineados sobre unacaja vertical u horizontalmente, la media...
Construcción de los límites y los valores atípicos•Límite interior inferior = Límite del bigote inferior                  ...
Diagrama de frecuencia acumulada u OJIVAEs un diagrama en donde se representan los intervalosde una clase versus la frecue...
Diagrama de Series de tiempoEste diagrama permite graficar una relación en función deltiempo, así por ejemplo se puede gra...
Diagrama de puntos   Los diagramas de puntos sirven para presentar gráficamente tablas en las cuales se consideran únicame...
Diagrama de dígitos    Es una combinación entre el diagrama de   tallo y hojas y el diagrama de series de   tiempo. Su obj...
Estadistica
Próxima SlideShare
Cargando en…5
×

Estadistica

644 visualizaciones

Publicado el

Introducción a las estadística

Publicado en: Educación
0 comentarios
1 recomendación
Estadísticas
Notas
  • Sé el primero en comentar

Sin descargas
Visualizaciones
Visualizaciones totales
644
En SlideShare
0
De insertados
0
Número de insertados
4
Acciones
Compartido
0
Descargas
21
Comentarios
0
Recomendaciones
1
Insertados 0
No insertados

No hay notas en la diapositiva.
  • Proyecto Integrador II
  • Proyecto Integrador II
  • Proyecto Integrador II
  • Proyecto Integrador II
  • Proyecto Integrador II
  • Proyecto Integrador II
  • Estadistica

    1. 1. Ing. Edgar Morales
    2. 2. La estadística tiene que ver con la recopilación,presentación, análisis y uso de datos paratomar decisiones y resolver problemas.
    3. 3. Cualquier persona recibe información en formade datos a través de los periódicos, la televisión uotros medios; y a menudo es necesario obteneralguna conclusión a partir de la informacióncontenida en los datos.
    4. 4. Los métodos empleados para resumir y organizardatos se denominan estadística descriptiva;mientras que los métodos para tomar decisionesse denominan inferencia estadística.
    5. 5. 1) MÉTODOS NUMÉRICOS• Las descripciones numéricas de datos suelen ser importantes. Dado un conjunto de n observaciones x1 , x2 ,..., xn• La estadística descriptiva nos puede ayudar mediante resúmenes numéricos, que son medidas de tendencia central, o también llamadas de posición y medidas de dispersión
    6. 6. • Las medidas descriptivas más comunes de tendencia central o localización son: la media aritmética y la mediana (existen otras medidas de tendencia central que en ocasiones pueden resultar de interés: la moda, los cuartiles, los deciles, los percentiles, la media armónica, la media geométrica y la media ponderada.)
    7. 7. La media aritmética o simplemente promedio(también llamada media muestral ya quegeneralmente se calcula en relación a unamuestra) se calcula de la siguiente forma: si lasobservaciones de una muestra de tamaño n son x1,x2,…,xn entonces n ∑x x 1 + x 2 + ... + x n i = 1 i X= = n n
    8. 8. Característica de la Media • Es intuitiva y fácil de calcular. • Su valor puede que no coincida con ninguno de los valores de la muestra • La suma de las diferencias de cada valor de la muestra con la media su resultado es cero, es decir, n∑ (x − x) = 0i =1 i
    9. 9. La mediana se suele definir como el valor “más intermedio” una vez que los datos han sido ordenados en forma creciente. Se suele denotar por Me. La forma más general de calcular la mediana es la siguiente:  x ( ( n + 1) 2) si n es impar Me =  x + x ( ( n 2) +1) ( n 2)  si n es par  2
    10. 10. • La mediana es aquel valor que deja el cincuenta por ciento de los datos por debajo y otro cincuenta por encima.• Cabe destacar que es preferible el uso de la mediana como medida descriptiva del centro cuando se quiere reducir o eliminar el efecto de valores extremos en un conjunto de datos (muy grandes o muy pequeños).
    11. 11. Moda:Es una medida de tendencia central que sepuede utilizar sea cual sea el tipo de variable aestudiar. La moda de un conjunto deobservaciones es el valor que más se repite, aquelcuya frecuencia absoluta es máxima. Puede serúnica, que haya más de una, o que no exista.
    12. 12. Media Geométrica: Se define como la raíz n-ésima del producto de todos los valores numéricos, es decir, nX G = n x1.x2 ....xn = n ∏ ( xi ) i =1
    13. 13. La media armónica: Se define como el número de observaciones de la muestra dividido por la suma del inverso de cada una de las observaciones, es decir, nXA = n ∑(1 / x ) i =1 i
    14. 14. La localización o tendencia central de unconjunto de datos no necesariamenteproporciona información suficiente paradescribirlos adecuadamente. Debido a que notodos los valores son semejantes, la variación entreellos se considera importante.
    15. 15. Se puede decir que un conjunto de datos tiene una dispersión reducida si los mismos se aglomeran estrechamente en torno a alguna medida de localización de interés y se dice que tiene una dispersión grande si se esparcen ampliamente alrededor de alguna medida de localización de interés.
    16. 16. Las medidas descriptivas más comunes dedispersión son: el rango, la varianza, la desviaciónestándar y el rango intercuartílico.
    17. 17. El rango de la muestra es la medida de variabilidad más sencilla entre todas las mencionadas; y se define como la diferencia entre la observación más grande y la más pequeña :r = xmax − xmin
    18. 18. Aunque es una medida muy fácil de calcular,ignora toda la información de la muestra entre lasobservaciones más grande y más pequeña. Sinembargo, vale la pena resaltar que el rango seutiliza mucho en aplicaciones estadísticas alcontrol de calidad, donde lo común es emplearmuestras con tamaños n = 4 o n = 5 ya que en estos casos la pérdida deinformación no se considera relevante.
    19. 19. En general, se desea una medida de variabilidadque dependa de todas las observaciones y no sólode unas pocas; así que parece razonable medir lavariación en términos de las desviaciones relativasa alguna medida de localización (generalmenteesta medida es la media)
    20. 20. Para el conjunto de datos x1,x2,….,xnLas diferencias ( x1 − x ), ( x2 − x ),....., ( xn − x )determinan las desviaciones de la media.Dado que la suma de estas desviaciones escero, se utiliza como medida de variabilidad elpromedio de los cuadrados de talesdesviaciones.
    21. 21. n ∑ (x − x) i 2S = 2 i =1 n −1
    22. 22. Esta medida de variabilidad se denominavarianza. Como S2 no tiene las mismas unidadesque los datos.Desviación estándar como la raíz cuadrada(positiva) de la varianza a fin de tener una medidaen las mismas unidades de los datos; Ladesviación estándar es útil para comparardispersión entre dos poblaciones.
    23. 23. Cuartiles y percentilesCuartiles Los cuartiles dividen a un conjunto de datos en cuatro partes iguales, y se notan con Q1, Q2 y Q3
    24. 24. El primer cuartil, al que se le llama Q1, es elvalor por debajo del cual se encuentra el 25%de los datos, y el tercer cuartil usualmentellamado Q3, es el valor por debajo de el seencuentra el 75% de los datos. Q2 es lamediana.
    25. 25. Los valores Q1, Q2 y Q3 dividen alconjunto de datos ordenados en cuatropartes iguales. Q1 se puede entendercomo la mediana de la mitad inferior delos datos ordenados y Q3 como lamediana de la mitad superior de los datosordenado.
    26. 26. Procedimiento para el calculo de los percentiles Sea Lp la posición del percentil deseado. p EntoncesL p = ( n) 100 donde n es el numero de datos y p el percentil Ejemplo: el percentil 33 P33, el percentil 50 es el P50, que es también la mediana ó el Q2. El percentil 25 es el P25=Q1 y el percentil 75 es el P75=Q3
    27. 27. Calculo del p-ésimo percentil• Paso 1: Ordenar los datos de manera ascendente.• Paso 2: Calculamos el Lp ( )• Paso 3: a) Si Lp no es entero, se redondea. El valor p L = ( n) entero inmediato mayor que Lp indica lapposición % del p-ésimo percentil. 100 b) Si Lp es entero, el p-ésimo persentil es el promedio de los valores de los datos ubicados en los lugares i e i+1
    28. 28. Por Ejemplo:• Si tenemos 15 datos ordenados y queremos localizar el primer cuartil (percentil 25) según la formula este estará ubicado en la posición 4 (por redondeo) y el tercer cuartil (percentil 75) estará ubicado en la posición 12 (por redondeo)• Si tenemos 20 datos ordenados el primer cuartil estará en la posición intermedia entre el 5° y el 6° dato es decir si el 5° dato fuese 36 y el 6° 41 el P25=Q1=38,5
    29. 29. Coeficientes de Asimetría y Curtosis Asimetría Si los valores de la serie de datos presentala misma forma a izquierda y derecha de unvalor central (media aritmética) se dice quees simétrica de lo contrario será asimétrica. Para medir el nivel de asimetría se utiliza elllamado Coeficiente de Asimetría de Fisher,que viene definido: n (1 / n)(∑ ( xi − x ) 3 g1 = i =1 3 s
    30. 30. Los resultados pueden ser los siguientes:• g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media)• g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda)• g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su
    31. 31. Curtosis• El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.• Se definen 3 tipos de distribuciones según su grado de curtosis:
    32. 32. • Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).• Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.• Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
    33. 33. El Coeficiente de Curtosis viene definido por la siguiente fórmula: n (1 / n)(∑ ( xi − x ) 4g2 = i =1 4 −3 s
    34. 34. Los resultados pueden ser los siguientes:• g2 = 0 (distribución mesocúrtica).• g2 > 0 (distribución leptocúrtica).• g2 < 0 (distribución platicúrtica).
    35. 35. 2) MÉTODOS GRÁFICOSHistogramasSe utiliza con variables agrupadas en intervalos, representandoen el eje X los intervalos de clase y levantando rectánguloscontiguos de base la longitud de los distintos intervalos y dealtura tal que el área sea proporcional a las frecuenciasrepresentadas. Si son frecuencias acumuladas, seránproporcionales a las alturas aunque los intervalos sean dedistinta amplitud.
    36. 36. Grafico de Áreas En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo.
    37. 37. Cartogramas Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color.
    38. 38. Diagrama Pastel Se divide un círculo en tantas porciones como clases tenga la variable, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa.
    39. 39. Dispersograma Es un gráficos que se construye sobre dos ejes ortogonales de coordenadas, llamados cartesianos, a cada punto corresponde a un par de valores de datos x e y de un mismo elemento o suceso.
    40. 40. Diagrama de Tallo y Hojas Un diagrama de tallo y hoja permite analizar la probabilidad de que un suceso ocurra sin utilizar probabilidad y estadística concretamente. Proporciona una información rápida, visual y relativamente nueva sobre datos no agrupados.Tallo Hojas T1 a , b, c,… T2 a , b, c,… T3 a , b, c,… T4 a , b, c,…
    41. 41. Diagrama de Caja y BigoteEl diagrama de cajas también llamado boxplotes la presentación visual que describe al mismotiempo varias características importantes de unconjunto de datos, tales como el centro, ladispersión, el alejamiento de la simetría, y laidentificación de valores extremos (puntosatípicos), es decir, de valores que se alejan deuna manera poco usual del resto de los datos.
    42. 42. Presenta los tres cuartiles, (y los valoresmínimos y máximos) alineados sobre unacaja vertical u horizontalmente, la mediana,el valor máximo y valor mínimo.
    43. 43. Construcción de los límites y los valores atípicos•Límite interior inferior = Límite del bigote inferior = Q1 - 1,5RI•Límite interior superior = Límite del bigote superior = Q3 + 1,5RI•Límite exterior inferior = Q1 - 3RI (Rango intercuartílico)•Límite exterior superior = Q3 + 3RI (Rango intercuartílico)
    44. 44. Diagrama de frecuencia acumulada u OJIVAEs un diagrama en donde se representan los intervalosde una clase versus la frecuencia relativa acumulada. Suprincipal ventaja radica en la fácil ubicación de loscuartiles y percentiles ( calculados a partir del eje y paraobtener su imagen en x). Su gráfica es siempre unafunción creciente hasta 1.
    45. 45. Diagrama de Series de tiempoEste diagrama permite graficar una relación en función deltiempo, así por ejemplo se puede graficar la línea deproducción de un determinado artículo durante el día, ademáspermite realizar comparaciones entre dos curvas de tiempocon la finalidad de estimar fluctuaciones, alzas o bajorendimiento en un proceso.
    46. 46. Diagrama de puntos Los diagramas de puntos sirven para presentar gráficamente tablas en las cuales se consideran únicamente una variable y una cantidad asociada a cada valor de la misma.
    47. 47. Diagrama de dígitos Es una combinación entre el diagrama de tallo y hojas y el diagrama de series de tiempo. Su objetivo es dar una ampliación a la información del gráfico pudiendo hacer notorias ciertas características de similitud en la curva.

    ×