2. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, que denominaremos DISTRIBUCIÓN DE FRECUENCIAS, en la que cada valor de la variable o clase se le asocian el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. En caso de que las variables estén al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas y acumuladas porcentuales. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS,
3. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo. Siendo N la suma de las respectivas frecuencias de cada dato (N=ΣXi). Este N será denominado como frecuencia total. A efectos prácticos, asumiremos las siguientes definiciones de frecuencias: frecuencias Absolutas : es el número de veces que aparece dicho valor de la variable y se representa por F. frecuencias Relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por Fr% frecuencias Absoluta Acumulada: es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable, se puede acumular, en la tabla estadística en orden ascendente (Fa↑) o descendente (Fa↓) d) frecuencia Relativa Acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N).(Far%)
4. 23/01/2011 ESTADÍSTICA DESCRIPTIVA REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS El Gráfico es la representación en el plano, de la información estadística, con el fin de obtener una impresión visual global del material presentado, que facilite su rápida comprensión. Los gráficos son una alternativa a las tablas. Se emplean símbolos, barras, polígonos y sectores, de los datos contenidos en tablas de frecuencias. Algunos requisitos recomendables al construir un gráfico son: Evitar distorsiones por escalas exageradas. Elección adecuada del tipo de gráfico, según los objetivos y tamaño de recorrido de las variables. Sencillez y autoexplicación. Al igual que las tablas estadísticas, los gráficos estadísticos deben tener un título y una explicación de QUE, DONDE y CUANDO se obtuvo la información.
5. 23/01/2011 ESTADÍSTICA DESCRIPTIVA REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS Trataremos Cuatro tipos de gráficos estadísticos: Gráfico de sectores o tortas Gráficos de Barras Gráfico de sectores o tortas Este tipo de diagramas consideran una figura geométrica en que la distribución de frecuencias se reparte dentro de la figura como puede ser una dona, pastel, círculo o anillo, en el que cada porción dentro de la figura representa la información porcentual del total de datos. Características de los gráficos de sectores No muestran frecuencias acumuladas. Se prefiere para el tratamiento de datos cualitativos La mayor área (o porción de la figura) representa la mayor frecuencia. Son muy fáciles de elaborar. La figura completa equivale al 100% de los datos (360º).
6. 23/01/2011 ESTADÍSTICA DESCRIPTIVA REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS Ejemplo de Gráfico de sectores o tortas Realizar un diagrama de sectores a partir de la siguiente tabla de frecuencia que resume las preferencias de un grupo de encuestados hacia cinco candidatos a elecciones locales: Pasos para su construcción 1.-Determinar las frecuencias relativas para cada clase. 2.- Determinar los ángulos que representan las porciones dentro de la figura para cada clase.
7. 23/01/2011 ESTADÍSTICA DESCRIPTIVA REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS Un círculo está formado por un ángulo de 360º. La porción correspondiente al Candidato 1 equivale a un 17.85% de esos 360º, es decir, 64,296º (0.1785*360 = 64,296º.) Gráficamente tendríamos (se parte desde el eje vertical superior, y se comienza a graficar cada clase en sentido de las manecillas del reloj): La tabla final con los ángulos repartidos para cada clase quedaría:
8. 23/01/2011 ESTADÍSTICA DESCRIPTIVA REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS Diagramas de Barras. Se utiliza para representar datos cualitativos y cuantitativos, con datos de tipo discreto. En el eje x se representan los datos ordenados en clases mientras que en el eje y se pueden representar frecuencias absolutas o relativas. Todas las barras deben ser de igual ancho y estar igualmente espaciadas . El ejemplo para este tipo de representación se realizara con los datos del ejemplo anterior
9. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad.
10. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE 1.- Rango o Amplitud total (recorrido).- Es el límite dentro del cual están comprendidos todos los valores de la serie de datos, en otras palabras, es el número de diferentes valores que toma la variable en un estudio o investigación dada. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango es el tamaño del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribución de frecuencia se designa con la letra R. R= Valor Mayor – Valor Menor
11. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE 2.-Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites. Una regla práctica para determinar cuántos intervalos van a incluirse es el uso de una fórmula dada por Sturges. Esta fórmula es donde: k: número de intervalos de clase, n: número de valores en el conjunto de datos bajo consideración La respuesta obtenida bajo la fórmula de Sturges no debe considerarse como definitiva, sino solo como una guía.( este valor tiene que ser un numero entero) k = 1 + 3,322 (log n)
12. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE 3.-Amplitud de Clase, Longitud o Ancho de una Clase : La amplitud o longitud de una clase es el número de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras c. Esta amplitud puede determinarse dividiendo el recorrido entre el valor de k, el numero de intervalos de clase. Simbólicamente, la amplitud del intervalo de clase está dada por
13. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE 4.-Punto medio o Marca de Clase: El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos los demás valores de esa clase. Este valor se utiliza para el calculo de la media aritmética. Intervalo de clase Ancho de clase= Ic Limite superior (Ls) Limite Inferior (Li) Marca de Clase
14. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS METODOD PARA DETERMINAR LA FRECUENCIA DE CADA CLASE Diagrama de tallo y hoja (Stem-and-Leaf) Es dentro de las técnicas de análisis exploratorio de datos una de más usadas ya que permite mostrar el orden de rangos así como la forma de un conjunto de datos en forma simultanea Se caracteriza por ser fácil de construir y dar más información que un histograma, debido a que muestra los valores reales No hay cantidad única de tallos ni hojas aún cuando se recomienda seleccionar entre 5 a 20 tallos
15. 23/01/2011 Hoja Tallo ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS METODOD PARA DETERMINAR LA FRECUENCIA DE CADA CLASE Diagrama de tallo y hoja (Stem-and-Leaf) Ejemplo: Trace un diagrama de tallo y hoja para los siguientes datos. 70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 72 1.Ordenar en forma ascendente 2.Seleccionar rangos (ancho de clases) define tallos 3.Incorporar hojas 5 7 8 6 4 5 8 7 0 2 2 5 5 6 8 8 0 2 3 5
16. 23/01/2011 ESTADÍSTICA DESCRIPTIVA REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS Histogramas y Polígonos de Frecuencia Histograma de Frecuencia Este gráfico se puede preparar con datos que han sido resumido en una distribución de frecuencia Se coloca la variable de interés en el eje horizontal y la distribución de frecuencia el vertical A diferencia del gráfico de barras no hay separación entre los rectángulos formados por las clases adyacentes, se completa con la línea vertical que separa a cada uno de ellos Cuando se traza un línea recta entre cada punto medio de clase se construye un polígono de frecuencia
17. 23/01/2011 ESTADÍSTICA DESCRIPTIVA REPRESENTACIÓN GRAFICAS DE VARIABLES CUALITATIVAS Polígono de Frecuencias Alternativo al histograma de frecuencias podemos representar la información a través de los llamados polígonos de frecuencias. Estos se construyen a partir de los puntos medios de cada clase. La utilización de los puntos medios o marcas de clase son llevados al escenario gráfico mediante la utilización de los polígonos de frecuencias. Se construye uniendo los puntos medios de cada clase localizados en las tapas superiores de los rectángulos utilizados en los histogramas de las gráficas. Su utilidad se hace necesaria cuando desean destacarse las variables de tendencia central, como son media, modas y medianas
18. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS EJEMPLO Una tienda realizo un trabajo para determinar el precio de determinado articulo en las tiendas de la competencia La siguiente tabla muestra los precios en Bsf de este artículo. Realizar la distribución de frecuencia
19. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE 1.- Rango o Amplitud total (recorrido) R= Valor Mayor – Valor Menor = 0.81- 0.7 = 0.11 2.-Clase o Intervalo de clase.- k = 1 + 3,322 (log n) ; K = 1+3.322 ( Log 90) = 7.5 = 8 3.-Amplitud de Clase, Longitud o Ancho de una Clase
20. 23/01/2011 ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS AGRUPADOS COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIA DE CLASE Stem-and-Leaf unit = 0,001 1|2 Representa 0,012 Hoja Tallo 70 0 72 24557778889999 73 000011122222223333444455555555666666666778888999 74 0001111222356 75 0001455689 78 9 80 0 81 00