UNIVERSIDAD TECNICA DEL NORTE
FACULTAD DE CIENCIAS ADMINISTRATIVAS
Y ECONOMICAS
INGENIERIA EN CONTABILIDAD Y
AUDITORIA
COM...
2
INDICE
INDICE......................................................................................................3
INDIC...
Tabla 6.............................................................................................17
Tabla 7...............
1) La Estadística en la Educación Básica y Media
A) OBJETIVOS:
Presentar una visión general de la Estadística y sus aplica...
datos en tablas y diagramas, llamados fuente secundaria.
En nuestro país, el Banco Central y el Instituto Nacional de
Esta...
C) DEFINICIONES BASICAS
a) Población (o universo): es el conjunto de todos los
elementos considerados como objetivo del es...
nominales u ordinales.
Variable Nominal, si los datos observados se clasifican en diversas
categorías que no implican ning...
seleccionar el diseño de muestreo y el método de entrevista, elaborar
el cuestionario, capacitar a los encuestadores y sup...
(numerada) de todas las unidades de muestreo. Se denomina marco
de lista de la población si cada unidad de muestreo contie...
examinar las respuestas buscando su integridad y posibles errores
para corregirlos.
Para valorar una investigación por mue...
CNA del año 2000)
Tabla 1
Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba
UPAs 99 39 32 13 68 82 22 16 1 65 34...
405 650 1186 115 79 86 62 2389 129 441 77 73
La mejor manera de examinar datos es presentarlos en forma de
resumen constru...
presentan a continuación:
Diagrama de puntos: cada observación se representa mediante un
punto sobre la recta numérica.
GR...
Gráfico de pastel: es una forma de resumir un conjunto de datos
categóricos. Es un círculo dividido en segmentos, donde el...
de los siguientes datos del Censo de Población (2001):
(a) Población nacional (número de habitantes) por (categorías
corre...
La longitud (y por lo tanto el área) de cada rectángulo es proporcional
al número de casos en la categoría que representa....
Uso del suelo (en miles de hectáreas)
Categ. Cultiv.
Perma.
Cultiv.
Trans.
Descan. Pastos Pasto
s
Páramo Montes Otro
y
Bar...
50 a 100 observaciones se escogen 6 clases, de 100 a 200
observaciones se suele elegir 7 clases, de 200 a 500 observacione...
m = ( Σ xi ) / n
Mediana (Q2): es el valor que se encuentra en el punto medio, cuando
se ordenan los valores de menor a ma...
hijos vivos mas
Número de
madres
9 60
0
63
7
53
4
34
6
23
7
17
3
12
2
90 60 74
Asumiendo que en la última categoría las 74...
a) Sobre una línea horizontal se localizan la mediana, los
cuartiles inferior y superior y los datos mínimos y
máximo.
b) ...
1 2
Total 6.018.35
3
6.138.25
5
12.156.608
La clasificación de datos categóricos de acuerdo con dos variables
(X,Y) se den...
El valor de ni. es la frecuencia absoluta de la primera variable, para la
categoría i, y las frecuencias relativas margina...
Freund J. y Simon G., Estadística elemental, Prentice Hall,
México, 1994.
Galindo E., Estadística para la Administración y...
Próxima SlideShare
Cargando en…5
×

TIPOS DE ESTILOS

81 visualizaciones

Publicado el

TABLAS, LISTAS, PARRAFOS

Publicado en: Educación
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
81
En SlideShare
0
De insertados
0
Número de insertados
2
Acciones
Compartido
0
Descargas
0
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

TIPOS DE ESTILOS

  1. 1. UNIVERSIDAD TECNICA DEL NORTE FACULTAD DE CIENCIAS ADMINISTRATIVAS Y ECONOMICAS INGENIERIA EN CONTABILIDAD Y AUDITORIA COMPUTACION I TIPOS DE ESTILOS DE TABLAS, GRAFICOS Y CONTENIDOS NOMBRE: DANIEL VILAÑEZ CURSO: TERCERO C1 FECHA: 25-11-2015
  2. 2. 2
  3. 3. INDICE INDICE......................................................................................................3 INDICE DE GRAFICOS.........................................................................3 INDICE DE TABLAS ............................................................................3 1) La Estadística en la Educación Básica y Media...............................5 A)OBJETIVOS: ........................................................................................5 B)INTRODUCCION..................................................................................5 C)DEFINICIONES BASICAS..................................................................7 D)TIPOS DE DATOS................................................................................7 E)ENCUESTAS POR MUESTREO..........................................................8 F)MUESTREO ALEATORIO SIMPLE....................................................9 G)EVALUACION DE UNA ENCUESTA POR MUESTREO..............10 H)CLASIFICACION ORDENADA DE LOS DATOS...........................11 I)CARACTERÍSTICAS DE LOS DATOS.............................................13 J)DIAGRAMAS Y GRÁFICOS..............................................................13 K)DISTRIBUCIÓN DE FRECUENCIAS E HISTOGRAMAS..............18 L)MEDIDAS DE LOCALIZACIÓN O TENDENCIA CENTRAL.......19 M)MEDIDAS DE DISPERSIÓN............................................................21 N)DIAGRAMA DE CAJA......................................................................21 O)TABLA DE CONTINGENCIA...........................................................22 P)REGRESIÓN LINEAL SIMPLE.........................................................24 2) Bibliografía:..................................................................................24 3) LINCOGRAFIA...............................................................................25 INDICE DE GRAFICOS INDICE DE TABLAS Tabla 1.............................................................................................12 Tabla 2.............................................................................................12 Tabla 3.............................................................................................12 Tabla 4.............................................................................................15 Tabla 5.............................................................................................17 3
  4. 4. Tabla 6.............................................................................................17 Tabla 7.............................................................................................18 Tabla 8.............................................................................................20 Tabla 9.............................................................................................22 Tabla 10...........................................................................................23 4
  5. 5. 1) La Estadística en la Educación Básica y Media A) OBJETIVOS: Presentar una visión general de la Estadística y sus aplicaciones, los procedimientos para recolección de datos, su clasificación y organización, los requerimientos de una buena investigación por muestreo y los errores que se pueden cometer en una encuesta. Mostrar cómo grandes conjuntos de datos numéricos pueden organizarse y presentarse de manera eficaz, con el propósito de favorecer el análisis y la interpretación de los datos, aspectos claves del proceso de planificación y toma de decisiones. Describir de manera conveniente las características de los datos mediante tablas, diagramas y representaciones gráficas; es decir presentar las técnicas básicas para realizar el análisis de los datos. Motivar a directivos y profesores de colegios para que la estadística sea considerada importante en la formación y el curriculum académico del estudiante, con la finalidad de que forme parte de la cultura general en nuestro país. B) INTRODUCCION La estadística se origina en los propósitos de los gobiernos (naciones o estados) de tener información sobre su población y recabar datos sobre sus ciudadanos, su desarrollo se favorece con el florecimiento en las matemáticas de la teoría de las probabilidades. Cada día es más importante el contar con información para las actividades de planificación y toma de decisiones en cualquier ámbito institucional, por ello las empresas públicas y privadas requieren tener información relevante y confiable sobre su campo de acción con los menores costos posibles. El gobierno es un importante recolector y compilador de datos con propósitos tanto públicos como privados. Hay que distinguir entre el recolector original de los datos, denominado fuente primaria, y el organizador que compila estos 5
  6. 6. datos en tablas y diagramas, llamados fuente secundaria. En nuestro país, el Banco Central y el Instituto Nacional de Estadística y Censos, INEC, son entidades responsables de recolectar datos sobre variables económicas, financieras, sociales y demográficas. Sin embargo en muchas ocasiones no existe la información que requerimos, y para obtenerla debemos diseñar un experimento, o realizar un estudio basado en la observación del comportamiento de interés, o hacer una investigación por medio de una encuesta dirigida a una muestra de la población objeto del estudio. En la actualidad se recogen datos con la finalidad de utilizarlos en diversos propósitos relacionados con estudios de investigación científica, planificación para el desarrollo de un proyecto, para contribuir en un proceso de toma de decisiones, medir el desempeño de un proceso de producción o de un servicio, realizar un estudio de mercado, o simplemente para satisfacer nuestra curiosidad. La estadística comprende dos partes fundamentales: a) La estadística descriptiva: que son los métodos que involucran la recolección, presentación y análisis de un conjunto de datos con el fin de describir apropiadamente sus diversas características. Su desarrollo se ha dado por la necesidad de información relevante de amplias poblaciones. b) La estadística inferencial: que puede definirse como aquellos métodos que hacen posible la estimación de una característica de una población basándose solamente en los resultados de una muestra. Su desarrollo se ha dado a principios del siglo XX y tienen amplia aplicación en todos los campos de la investigación en la actualidad. Para aclarar estos términos, en el siguiente tema, se introducen algunas definiciones fundamentales. 6
  7. 7. C) DEFINICIONES BASICAS a) Población (o universo): es el conjunto de todos los elementos considerados como objetivo del estudio y del cual queremos obtener sus características. b) Muestra: es la porción de la población que se selecciona para su análisis, es el objetivo de la encuesta o del experimento, que será de utilidad para poder obtener las conclusiones sobre la población. c) Parámetro: es una medida de resumen para describir una característica de toda una población. d) Estadístico(a): es una medida de resumen para describir una característica de una muestra de la población. Para que un análisis estadístico sea útil los datos de entrada no deben contener errores, puesto que si entra basura saldrá basura. D) TIPOS DE DATOS Los datos son los resultados observados de diversas características, de los elementos de una población de estudio, llamadas variables aleatorias. Existen básicamente dos tipos de datos o de variables aleatorias: Datos categóricos (variables cualitativas) y datos numéricos (variables cuantitativas). Las variables categóricas se clasifican en dos grupos, pueden ser 7
  8. 8. nominales u ordinales. Variable Nominal, si los datos observados se clasifican en diversas categorías que no implican ningún orden, por ejemplo el estado civil, el sexo, el partido político, o si tiene o no hijos. Variable Ordinal, si los datos se clasifican en categorías que implican algún orden, por ejemplo la medida de satisfacción en el trabajo que desempeña (poco en menos que medianamente y este es menor a mucho). La variable es numérica si sus valores observados son números, es decir representan una cantidad o una medida. Por ejemplo, las respuestas a las preguntas: ¿Cuántos vehículos posee? ¿A cuántas revistas está suscrito actualmente?, ¿Cuántos hijos tiene?, ¿Cuál es su estatura?, ¿Cuánto pesa? son claramente numéricas. Las variables numéricas se clasifican en dos grupos, pueden ser discretas o continuas. Variable discreta si los datos corresponden a respuestas numéricas que provienen de un proceso de conteo. Variable continua si los datos corresponden a respuestas numéricas que surgen de un proceso de medición. E) ENCUESTAS POR MUESTREO Para realizar una encuesta por muestreo previamente se debe determinar con precisión que información se necesita obtener, es decir establecer claramente los objetivos de la investigación, y posteriormente se requiere planificar y ejecutar una serie de actividades para lograr el éxito deseado. Las principales tareas son: definir cuidadosamente la población, establecer el o los marcos de muestreo de manera que la lista de unidades muestrales y la población concuerden lo mejor posible, 8
  9. 9. seleccionar el diseño de muestreo y el método de entrevista, elaborar el cuestionario, capacitar a los encuestadores y supervisores, realizar una prueba piloto, organizar el trabajo de campo, sistematizar el manejo, validación y análisis de los datos y finalmente calcular las estimaciones para obtener la información requerida. El cuestionario es un instrumento que contiene varias preguntas que trata sobre una diversidad de fenómenos o características de una población, denominadas variables aleatorias. Una muestra de probabilidad o aleatoria, es aquella en la que los elementos de la muestra se eligen sobre la base de probabilidades conocidas. La única forma de que hagamos inferencias estadísticas correctas de una muestra a una población, es mediante el uso de una muestra de probabilidad. Los cuatro diseños o tipos de muestras probabilísticas de uso común son: la muestra aleatoria simple, la muestra sistemática, la muestra estratificada y la muestra de agrupación o conglomerados; un análisis detallado de estos procedimientos de muestreo pueden encontrarse en libros sobre investigación por muestreo (en inglés: Sample Survey). F) MUESTREO ALEATORIO SIMPLE En una muestra aleatoria simple cada individuo o elemento tiene la misma oportunidad de selección que cualquier otro, y la selección de un elemento en particular no afecta la probabilidad de que se elija cualquier otro. Una muestra aleatoria simple también puede interpretarse como aquella en la que cada posible muestra extraída (de determinado tamaño) tiene la misma probabilidad de selección que cualquier otra muestra que se pueda extraer (de ese mismo tamaño). Por tanto el marco de población es sencillamente una lista 9
  10. 10. (numerada) de todas las unidades de muestreo. Se denomina marco de lista de la población si cada unidad de muestreo contiene un solo elemento de la población, en este caso la numeración va desde uno (1) hasta el tamaño de la población (N). Numerados los elementos del marco de lista de la población, se obtiene la muestra aleatoria seleccionando aquellos miembros cuyos códigos concuerden con los dígitos extraídos de la urna. Por ejemplo, si deseamos una muestra, de n=50 elementos distintos, seleccionada de una población de N=782 elementos, se formarán por lo menos cincuenta números de tres dígitos (pues se eliminan los números repetidos y no se toman en cuenta los mayores a 782 y el 000) hasta completar los cincuenta requeridos. G) EVALUACION DE UNA ENCUESTA POR MUESTREO Una buena investigación por muestreo requiere tener los objetivos claros, una apropiada planificación y una buena ejecución de todas las actividades programadas. Es de fundamental importancia realizar una encuesta piloto, con una muestra muy reducida, con la finalidad de probar el cuestionario y todos los instrumentos que se utilizarán en los diversas etapas, de modo que se corrijan los errores y se puedan evaluar los procesos y sus costos. Para una buena recolección de datos se debe adiestrar a los encuestadores sobre las definiciones operacionales de la encuesta, es decir sobre el significado de cada variable, de modo que no existan ambigüedades en las preguntas correspondientes; se requiere además organizar detalladamente el trabajo de campo, estableciendo claramente las obligaciones del personal y las líneas de autoridad. Son extremadamente importantes también las actividades de codificación, validación y análisis de datos, puesto que se deben 10
  11. 11. examinar las respuestas buscando su integridad y posibles errores para corregirlos. Para valorar una investigación por muestreo hay que verificar si se han considerado estas recomendaciones y realizado eficientemente todas las actividades antes mencionadas. Es claro que hay una proliferación de investigaciones de encuestas de opinión, pero no toda investigación es buena, significativa o importante. Es esencial que aprendamos a evaluar críticamente lo que leemos o escuchamos y que descartemos las encuestas que carezcan de objetividad y credibilidad. El primer paso para evaluar una encuesta es determinar si se basó en una muestra de probabilidad o en una no probabilística; puesto que la única forma de que hagamos inferencias estadísticas correctas es a través del uso de una muestra aleatoria. H) CLASIFICACION ORDENADA DE LOS DATOS. Cuando se elabora un conjunto de datos, las observaciones numéricas no tienen ningún orden o secuencia particular ni tampoco se encuentran agrupados por similares cualidades o características. Al crecer el número de observaciones, se hace más difícil observar las principales características del conjunto de datos, se requiere entonces organizar las observaciones, de tal manera que entendamos mejor la información que contienen los datos, para lograrlo se han desarrollado diversos métodos, algunos fundamentados en gráficos y diagramas, otros en ciertas medidas numéricas, y varias técnicas fundamentadas en diferentes tipos de análisis matemáticos. Ejemplo 1: los siguientes datos corresponden al número (aproximado y en miles) de Unidades de Producción Agropecuarias (UPAs) de cada provincia del país (resultados del Censo Nacional Agropecuario 11
  12. 12. CNA del año 2000) Tabla 1 Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba UPAs 99 39 32 13 68 82 22 16 1 65 34 Loja LoRi Mana Mo Sa Napo Orel Past Pich Sucu Tung ZaCh ZNAs 66 42 75 17 5 6 5 64 8 71 9 4 La clasificación ordenada de estos datos es la siguiente: Tabla 2 Prov Gala ZNAs Napo Past Orel Sucu ZaCh Carc Esme Mo Sa ElOr UPAs 1 4 5 5 6 8 9 13 16 17 22 Caña Imba Boli LoRi Pich Guay Loja Coto Tung Mana Chim Azua 32 34 39 42 64 65 66 68 71 75 82 99 De esta tabla se puede determinar inmediatamente algunas características, como por ejemplo: la provincia que menos UPAs tiene es Galápagos (aproximadamente un mil), la que tiene mayor cantidad es Azuay (con alrededor de 99 mil); la provincia que corresponde a la mediana es Cañar con 32 mil UPAs. Ejercicio 1: Realizar la clasificación ordenada de los datos correspondientes al número (aproximado y en miles) de habitantes de cada provincia del país (resultados del Censo Nacional de Población y Vivienda del año 2001) Tabla 3 Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba UPAs 600 169 207 153 350 404 526 385 19 3309 344 Loja LoRi Mana Mo Sa Napo Orel Past Pich Sucu Tung ZaCh ZNAs 12
  13. 13. 405 650 1186 115 79 86 62 2389 129 441 77 73 La mejor manera de examinar datos es presentarlos en forma de resumen construyendo tablas y diagramas apropiados, de manera que podamos extraer las características más importantes de los datos. I) CARACTERÍSTICAS DE LOS DATOS Las tres principales características que dan la posición relativa del conjunto de datos son: la localización o tendencia central, la dispersión y la simetría. Tendencia central o localización: es una cantidad cerca de la cual se encuentran los valores del conjunto de datos, se la mide mediante un valor junto al cual se agrupa la mayoría de las observaciones. Una medida de tendencia central es, por ejemplo, la media o promedio de los datos. J) DIAGRAMAS Y GRÁFICOS Puesto que la tabla o matriz de los datos no muestra las cualidades de los datos, se usan representaciones gráficas que ayudan a captar tendencias, apreciar características y establecer modelos probabilísticos de comportamiento global. En general un diagrama o un gráfico, en donde están representados los datos, sirve para resumir el conjunto de las observaciones y advertir sus carácterísticas de localización, de dispersión , de simetría y la presencia de valores atípicos. Los diagramas y gráficos que comúnmente son utilizados, para organizar las observaciones de modo que entendamos mejor la información que contienen y apreciemos sus características, se 13
  14. 14. presentan a continuación: Diagrama de puntos: cada observación se representa mediante un punto sobre la recta numérica. GRAFICO 1 Ejercicio 4: hacer el diagrama de puntos de los datos del ejercicio 1. Diagrama de tallo y hojas: a los datos se los clasifica considerando, por ejemplo, las unidades, o las decenas, o las centenas, etc., estas forman el tallo y se las coloca verticalmente, a continuación se coloca los siguientes dígitos para cada observación a la derecha de la barra vertical, estos valores vienen a constituir las hojas, y así se van añadiendo todas las observaciones; pueden realizarse variantes (por ejemplo distinguiendo las cifras altas y las bajas). Un diagrama de tallo y hojas con los datos correspondientes al número de UPAs (ejemplo 1) sería el siguiente: 9 9 8 2 7 1 / 5 6 4 / 5 / 6 / 8 4 2 3 2 / 4 / 9 2 2 1 3 / 6 / 7 0 1 / 4 / 5 / 5 / 6 / 8 / 9 Ejercicio 5: Hacer al menos un diagrama (adicional) de tallo y hojas con los datos del ejemplo 1, y dos diagramas con los datos del ejercicio 1. 14 Representación de puntos del ejemplo 1 0 20 40 60 80 100
  15. 15. Gráfico de pastel: es una forma de resumir un conjunto de datos categóricos. Es un círculo dividido en segmentos, donde el área de cada uno de los segmentos es proporcional al número de casos en la categoría correspondiente. Tabla 4 Población Nacional Categorías Total Urbana Rural Número de habitantes 12156 7431 4725 GRAFICO 2 Ejercicio 6: Hacer el gráfico de pastel con los respectivos porcentajes 15 Población Nacional Por Categorías de Area Urbana 61.1% Rural 38.9% Urbana Rural
  16. 16. de los siguientes datos del Censo de Población (2001): (a) Población nacional (número de habitantes) por (categorías correspondientes al) sexo (hombre/mujer). (b) Población de la provincia de Pichincha por sexo. (c) Población de la provincia de Guayas por área. (d) Unidades de Producción Agropecuarias (UPAs) por categorías de tenencia de la tierra (referirse a los resultados del CNA 2000) (e) Población (nacional mayor a diez años) de analfabetos por categorías quinquenales de edad. (f) Población de analfabetos por categorías provinciales. (g) Población (nacional masculina mayor a diez años) de analfabetos por categorías quinquenales de edad (respectivamente femenina) (h) Población de hombres analfabetos por categorías provinciales (respectivamente de mujeres). (i) Población nacional mayor a doce años por categorías de estado civil. La representación de pastel se suele usar también con cantidades si se han agregado las mismas en las correspondientes categorías (ver ejercicio 9). Se puede también usar el gráfico de pastel con datos numéricos si previamente se ha creado una tabla de frecuencias (es decir se han clasificado las observaciones en grupos o clases dados por una partición en subintervalos) pero en este caso se usa generalmente el gráfico de barras denominado histograma. Gráfico de barras: los datos categóricos se exhiben mediante un número de rectángulos, del mismo ancho, cada uno de los cuales representa una categoría particular. 16
  17. 17. La longitud (y por lo tanto el área) de cada rectángulo es proporcional al número de casos en la categoría que representa. Ejemplo 3: considerar los datos, de la población nacional por grupos de edad quinquenales, que se presentan a continuación: Tabla 5 Grupos Edad 0 a 4 5 a 9 10 a 14 15 a 19 20 a 24 25 a 29 N° habitantes 1337 1362 1341 1241 1169 947 30 a 34 35 a 39 40 a 44 45 a 49 50 a 54 55 a 59 60 a 64 863 775 674 539 463 339 294 65 a 69 70 a 74 75 a 79 80 a 84 85 a 89 90 a 94 95 y más 244 195 143 97 63 39 32 GRAFICO 3 Ejercicio 8: realizar el gráfico de barras con los datos del ejemplo 2. Ejercicio 9: hacer el gráfico de pastel, y el de barras, de los siguientes datos, que corresponden a la superficie (área) nacional según el uso del suelo (resultados del CNA 2000) Tabla 6 17 Número de habitantes por grupos de edad 0 200 400 600 800 1000 1200 1400 1600 0 a 4 años 10 a 14 años 20 a 24 años 30 a 34 años 40 a 44 años 50 a 54 años 60 a 64 años 70 a 74 años 80 a 84 años 90 a 94 años N° habitantes
  18. 18. Uso del suelo (en miles de hectáreas) Categ. Cultiv. Perma. Cultiv. Trans. Descan. Pastos Pasto s Páramo Montes Otro y Barbe. Cultiv. Natur . y Bosques Usos Super . 1363 1232 381 3357 1130 600 3881 411 Ejemplo 4: los siguientes datos corresponden al número (aproximado y en miles) de Unidades de Producción Agropecuarias (UPAs) según su condición jurídica (de acuerdo al CNA 2000) Tabla 7 CONDICION JURIDICA Cate- Persona Soc.Hecho sin Soc. Institución Otras goría Individual Contrato Legal Legal Pública Condiciones UPAs 577 56 10 9 13 K) DISTRIBUCIÓN DE FRECUENCIAS E HISTOGRAMAS Para crear la tabla de frecuencias con datos categóricos se cuenta el número de veces en la que aparece cada dato, es decir se calcula el número de elementos de cada una de las categorías. Si los datos son numéricos se tiene que crear una partición del intervalo que contiene a todos los valores, es decir dividirlo en grupos de subintervalos, y se cuentan cuantos elementos están en cada clase. Se determina el número de grupos dependiendo del número de observaciones, por ejemplo: si tenemos menos de 20 observaciones se seleccionar 4 clases, de 20 a 50 observaciones se toman 5 clases, de 18
  19. 19. 50 a 100 observaciones se escogen 6 clases, de 100 a 200 observaciones se suele elegir 7 clases, de 200 a 500 observaciones usualmente se seleccionan 8 clases, y más de 500 observaciones se eligen 9 clases o más (en función del número de datos). En el caso de datos numéricos, la longitud de cada clase (subintervalo) es igual a la extensión o rango de los datos dividido para el número de clases. Para cada observación se determina a que clase pertenece para calcular la frecuencia absoluta de cada clase. GRAFICO 4 L) MEDIDAS DE LOCALIZACIÓN O TENDENCIA CENTRAL Una medida de localización es un valor en torno al cual se agrupan la mayoría de datos, es una característica de tendencia central de las observaciones, las más empleadas son: el promedio o media muestral, la mediana, la moda y la media simétricamente segada. Promedio o media muestral (m): es igual a la suma de los valores de las observaciones dividida para el número total de datos (n). Se le denomina m o también x− (x techo). 19 Histograma del ejemplo 1: Provincias por cantidad de UPAs 11 4 5 3 0 5 10 15 De 1 a < 25.5 De 25.5 a <50 De 50 a <74.5 De 74.5 a 99 UPAs (en miles) Provincias
  20. 20. m = ( Σ xi ) / n Mediana (Q2): es el valor que se encuentra en el punto medio, cuando se ordenan los valores de menor a mayor, se la denota Q2. Si n=2p+1 (impar) entonces Q2=xp+1; y si n=2p (par) entonces Q2=(xp+xp+1)/2 Moda (Mo): es aquel valor que tiene la mayor frecuencia absoluta, se la representa por Mo. Si los datos están dispuestos en una tabla de frecuencias agrupados en clases (subintervalos) aquella que tiene la mayor frecuencia se denominará clase modal y puede asumirse que, de manera aproximada, la moda es su punto medio. Media simétricamente segada al 10%: es igual al promedio de las observaciones que quedan luego de eliminar el 5% de las que tienen los valores más bajos y el 5% de las que tienen los valores más altos. Observemos que si cada dato xi está con su respectiva frecuencia ni ; la media (el promedio) se puede calcular evidentemente mediante la expresión: m = ( Σ ni xi ) / n Cuando los datos están dispuestos en una tabla de frecuencias agrupados en clases, se puede calcular el valor aproximado de la media o la media segada considerando la suma de los productos de los valores medios de las clases por su frecuencia y dividiendo como siempre para el número de observaciones, es decir usando la expresión anterior con xi igual al punto medio de clase i (o sea: xi = (li+si)/2 donde li y si son respectivamente los límites inferior y superior de la clase i). Ejemplo 5: Usando los datos del censo de población, determinar el promedio del número de hijos vivos que tienen las madres ecuatorianas. De acuerdo con el cuadro N. 53, se tiene la siguiente tabla de frecuencias por número de hijos: Tabla 8 Número de 0 1 2 3 4 5 6 7 8 9 10 y 20
  21. 21. hijos vivos mas Número de madres 9 60 0 63 7 53 4 34 6 23 7 17 3 12 2 90 60 74 Asumiendo que en la última categoría las 74 madres tienen en promedio 11 hijos, se puede obtener que el valor aproximado de la media es: (0x9+1x600+. . .+9x60+11x74)/(9+600+. . .+60+74)=3,4736 (hijos/madre) El promedio exacto de acuerdo al censo es de 3,2753 . Ejercicio 10: Revisar los ejemplos del texto de Galindo relacionados con las medidas de localización (tendencia central). M) MEDIDAS DE DISPERSIÓN La desviación estándar o típica (denominada s): es igual a la raíz cuadrada de la suma de los cuadrados de las diferencias entre cada valor de los datos y su media, dividida para el número de datos menos uno; se la denomina s, es siempre un valor positivo, y su unidad de medida es la misma que corresponde a los datos originales. s = ( ( Σ (xi - m)2 /(n-1) )½ N) DIAGRAMA DE CAJA El diagrama de caja es una herramienta que describe en un mismo gráfico algunas características de localización, de dispersión, y los valores atípicos, al representar la mediana, los cuartiles, el rango intercuartil y el rango de las observaciones; para su construcción se procede de la siguiente manera: 21
  22. 22. a) Sobre una línea horizontal se localizan la mediana, los cuartiles inferior y superior y los datos mínimos y máximo. b) Se hace una caja angosta que una a Q1 y Q3, a continuación se divide esta caja en dos mediante una línea que pase por Q2. c) Finalmente se trazan dos rectas, una para cada extremo de la caja, en los valores: Q1 – 1,5 RIQ ; y , Q3 + 1,5 RIQ. Q1-1,5RIQ Q1 Q2 Q3 Q3+1,5RIQ Los datos que caen fuera de estas dos vallas (dadas por las dos rectas trazadas) se consideran como valores atípicos. O) TABLA DE CONTINGENCIA Consideremos ahora un esquema de doble clasificación, por ejemplo las personas o habitantes del país se pueden agrupar entre los que viven en el área urbana y los que viven en el área rural, y dentro de estos dos grupos se los puede clasificar respecto al sexo (es decir en hombres y mujeres). Ejemplo 6: de acuerdo a los resultados del censo de población del año 2001 tenemos la siguiente clasificación doble: Tabla 9 POBLACION Hombres Mujeres Total Urbana 3.625.96 2 3.805.39 3 7.431.355 Rural 2.392.39 2.332.86 4.725.253 22
  23. 23. 1 2 Total 6.018.35 3 6.138.25 5 12.156.608 La clasificación de datos categóricos de acuerdo con dos variables (X,Y) se denomina cuadro de contingencia, es en definitiva una tabla de frecuencias (absolutas o relativas) donde una variable se representa en las filas y la otra en las columnas; se cuentan los individuos que tienen los valores indicados en las filas y en las columnas. Se puede encontrar también la frecuencia relativa de la clase (i,j) que es igual al cociente: fi,j = ni,j / n (donde n es el numero total de individuos) y proporcionan la distribución empírica conjunta de las dos variables, y dan una estimación de las probabilidades pij de que un individuo pertenezca a la categoría conjunta (i,j), es decir a la categoría i en la variable X y a la categoría j en Y. En el ejemplo que estamos tratando, la tabla de frecuencias relativas es: Tabla 10 POBLACION Hombres Mujeres Total Urbana 29,8% 31.3% 61,1% Rural 19,7% 19,2% 38.9% Total 49,5% 50,5% 100,0% Propiedades: La sumatoria de todos los valores ni,j (para i desde 1 hasta p, y j desde 1 hasta q) es igual al total de individuos n. La sumatoria de todos los valores fi,j (para i desde 1 hasta p, y j desde 1 hasta q) es igual a 1. Distribuciones marginales: En la tabla de contingencia se suelen incluir los totales de las filas y los totales de las columnas, es decir se calcula: ni. = sumatorio en j de los ni,j (para cada categoría i=1,2,...,p) 23
  24. 24. El valor de ni. es la frecuencia absoluta de la primera variable, para la categoría i, y las frecuencias relativas marginales fi. = ni./n dan la distribución empírica de la primera variable (X). De manera similar, para la segunda variable (Y), se incluye una fila con los valores: n.j que representan sus frecuencias absolutas. Análogamente las frecuencias relativas f.j = n.j/n proporcionan la distribución empírica de la segunda variable Y, y da una estimación de la probabilidad pj de que un individuo pertenezca a la categoría j. P) REGRESIÓN LINEAL SIMPLE En algunas aplicaciones se requiere establecer relaciones entre dos variables; la regresión lineal simple sirve para determinar una relación lineal entre dos variables: X=(x1,x2,...,xn) y Y=(y1,y2,...,yn). El modelo determinista plantea: Y = b0 + b1 X El modelo probabilista (o aleatorio) considera: Y = b0 + b1 X + e ; donde e es una componente aleatoria del error. Como sabemos b0 es la ordenada al origen; y, b1 es la pendiente de la recta; los mismos que se obtienen, usando el método de los mínimos cuadrados, mediante las siguientes fórmulas: b1 = SCXY / SCXX ; Donde: SCXX = Σi (xi – mx)2; y , SCXY = Σi (xi – mx)(yi-my) . b0 = my – b1 mx 2) Bibliografía: Berenson M., Levine D., Estadística Básica en Administración, Prentice Hall Hispanoamericana S. A., México, 1996. 24
  25. 25. Freund J. y Simon G., Estadística elemental, Prentice Hall, México, 1994. Galindo E., Estadística para la Administración y la Ingeniería, Gráficas Mediavilla Hnos., Quito, 1999. 3) LINCOGRAFIA www.math.epn.edu.ec/IX_memorias/docs/Araujo/Araujo.doc 25

×