SlideShare una empresa de Scribd logo
1 de 31
Estadística Descriptiva                             _____________ _____________ __________MC Raúl Adalberto_Morelos




                                 APUNTES DE
                            ESTADÍSTICA DESCRIPTIVA
                                          MC Raúl Adalberto Morelos
                              Centro de Estudios Superiores del Estado de Sonora
                          Unidad Académica de San Luis Río Colorado, Sonora México.




                                                                           Revisión Noviembre 2011

                                                                                                                      1
Estadística Descriptiva                           _____________ _____________ __________MC Raúl Adalberto_Morelos




                                                Índice
Tema                                                                                          Página

Unidad 1
Conceptos Básicos ¿Qué es la estadística? -------------------------                              3
Datos estadísticos -----------------------------------------------------------                   4
Importancia Actual de la estadística ------------------------------------                        4
Clases de estadística -------------------------------------------------------                    5
Estadística Descriptiva ------------------------------------------------------                   6
Estadística Inferencial -------------------------------------------------------                  6
Definición del concepto de estadística ----------------------------------                        7
Ejercicio 1.1 --------------------------------------------------------------------               9
Ejercicio 1.2 --------------------------------------------------------------------               9

Unidad 2
Métodos estadísticos -------------------------------------------------------                    10
Recopilación de datos ------------------------------------------------------                    11
Organización de datos -----------------------------------------------------                     12
Organización de datos usando arreglos -------------------------------                           15
Organización de datos usando una distribución de
frecuencias --------------------------------------------------------------------                15
Número de clases o intervalos -------------------------------------------                       16
Amplitud de clases ----------------------------------------------------------                   17
Tabla de frecuencias --------------------------------------------------------                   18
Datos fundamentales de una tabla de frecuencia -------------------                              18
Otros métodos de presentación de datos -----------------------------                            19
Partes principales de una tabla ------------------------------------------                      20
Gráficas estadísticas -------------- ---------------------------------------- 21
Representación gráfica de una tabla de frecuencia ----------------                              22
Ejercicio 2.1 -------------------------------------------------------------------               24
Medidas de tendencia central para datos NO agrupados ---------                                  26
Medidas de tendencia central para datos agrupados --------------                                27
Medidas de dispersión para datos No agrupados ------------------                                28
Medidas de dispersión para datos agrupados -----------------------                              29
Bibliografía ---------------------------------------------------------------------              29




                                                                                                                    2
Estadística Descriptiva                          _____________ _____________ __________MC Raúl Adalberto_Morelos




                                  ESTADÍSTICA GENERAL.
CONCEPTOS BÁSICOS

¿QUE ES LA ESTADÍSTICA?

Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer lugar, comprender
lo que él termino significa en la actualidad así como conocer algo de su origen.

Como en la mayoría de los vocablos, la palabra “estadística” tiene diversos significados para diferentes
personas. Cuando la mayoría de la gente escucha el término lo relaciona con cuadros o tablas llenas de
cifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automóviles, etc., que ofrecen,
por ejemplo, en los almanaques anuales, y que indudablemente usan el término con toda corrección. A
decir verdad, el término en cuestión fue inicialmente usado para tabular las funciones del Estado en lo
que respecta a los datos necesarios para una planeación idónea, reglamentaciones y recaudación de
impuestos. Los cobradores de impuestos y los encargados de hacer este tipo de análisis eran llamados
“estadísticos” por su dedicación a compaginar datos e informes requeridos por el Estado.

En la actualidad, desde luego, la palabra “estadística” se aplica en este primer sentido para casi todo
relacionado con los informes basados en hechos y consignados en base a números, lo que
comúnmente se denomina: “Hechos y cifras”. Los anunciadores de radio y televisión nos informan que
“en unos cuantos minutos darán la estadística del juego ...”y los periódicos con frecuencia publican
artículos a cerca de concursos de belleza en los cuales brindan las “estadísticas” de las concursantes.

Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con la materia los
desconoce. La estadística es una rama del conocimiento el campo de las matemáticas aplicadas, que
utiliza sus propios símbolos, términos, contenido, teoremas y técnicas. Cuando se estudia la
“estadística” normalmente se pretende dominar algunas de estas técnicas.

Para todos aquellos ya iniciados en los misterios de campo de las estadísticas, el vocablo tiene una
segunda aceptación; las estadísticas son cantidades que han sido calculadas con datos de muestreo:
una sola cantidad así calculada se denomina “estadística”. Por ejemplo, la media de la muestra es una
estadística, así como también lo son la mediana de la muestra y el modo. La varianza de la muestra es
una estadística, como también lo es la gama de la muestra. El coeficiente de correlación de la muestra
es asimismo una estadística.

La estadística está desarrollada para tratar con datos numéricos o información cuantitativa. La palabra
"estadística", por lo tanto ha sido ampliamente referida ya sea a la información cuantitativa misma como
a los métodos que tratan con la información. Los estadísticos prefieren llamar a la información
cuantitativa Datos Estadísticos y a los métodos que tratan con la información los Métodos
Estadísticos.

 Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales podemos
recolectar, organizar, presentar y analizar datos numéricos de un conjunto de individuos permitiéndonos
extraer conclusiones válidas y efectuar decisiones lógicas basadas en dicho análisis.

Los DATOS son agrupaciones de cualquier número de observaciones relacionadas. Para que los datos
sean útiles, las observaciones deben estar organizadas en tal forma que se puedan identificar
tendencias y llegar a conclusiones lógicas.




                                                                                                                   3
Estadística Descriptiva                            _____________ _____________ __________MC Raúl Adalberto_Morelos



DATOS ESTADÍSTICOS

La información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o conjuntos) de
números que muestren relaciones significativas. En otras palabras, los datos Estadísticos son números
que pueden ser comparados, analizados e interpretados.

Un número aislado que no se compara o que no muestra relación significativa con otro número no es
dato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos estadísticos, puesto que las
edades pueden ser comparadas y analizadas, y los resultados de los análisis pueden ser interpretados.

El área de la cual los datos estadísticos son recopilados, se le conoce como población o universo.

Si deseamos tener las edades de 25 estudiantes en la clase de Biometría, podemos simplemente
preguntar a cada estudiante su edad: así tenemos un conjunto completo de datos. Sin embargo
recopilar tales datos de una población finita pero grande es algunas veces imposible o impráctico. A fin
de evitar la tarea imposible o impráctica, usualmente se extrae una muestra de elementos
representativos de la población. La muestra entonces, utilizada para el estudio estadístico y los
resultados de la muestra son usados como las bases para describir, estimar o predecir las
características de la población.

Podemos resumir los significados del término “Estadística” como sigue:
     1. La acepción publica de cifras y hechos, gráficas y mapas. El término en este sentido se usa en
        plural.
     2. La materia propiamente dicha, con su terminología, metodología y conocimientos particulares.
        Bajo este concepto el término se usa en singular.
     3.   Cantidades calculadas sobre datos de muestreo, en cuyo caso el término se usa en plural.




IMPORTANCIA ACTUAL DE LA ESTADÍSTICA

La aplicación de las técnicas estadísticas se ha extendido tanto, y la influencia de la estadística en
nuestra vida es tan grande, que difícilmente podemos ponderarla lo bastante.

Nuestra abundancia agrícola actual se puede explicar parcialmente gracias a la aplicación de la
estadística a los planos y a los análisis de los experimentos agrícolas. Este es un campo en el cual la
técnica estadística se utilizó relativamente al principio. Algunas de las preguntas que los métodos de la
estadística ayudan a contestar son: ¿Qué clase de maíz da los mejores rendimientos? ¿Qué clase de
mezcla alimenticia se debe dar a las gallinas para que obtengan el mayor peso? ¿Qué clase de mezcla
de semillas de pasto da mayor número de toneladas de forraje por hectárea? Todas estas preguntas y
cientos mas nos afectan a todos en forma directa a través del mercado domestico.

La metodología de la estadística también se usa constantemente en la investigación médica y
farmacéutica. La eficacia de nuevos medicamentos se determina por medio de experimentos realizados
primero en animales y, posteriormente, en seres humanos. Los adelantos de la investigación médicas y
las nuevas drogas nos afectan casi a todos.

La estadística también es empleada por los gobiernos. La información económica es objeto de estudio
y afecta la política del gobierno en lo que respecta a los impuestos y a partidas asignables a obras
públicas (tales como caminos, presas, etc.), a fondos para la asistencia pública, y otros. La estadística

                                                                                                                     4
Estadística Descriptiva                             _____________ _____________ __________MC Raúl Adalberto_Morelos



del desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Los
métodos estadísticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar,
desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teoría de las probabilidades y
la estadística (especialmente un nuevo campo llamado teoría estadística de la toma de decisiones) se
usan como ayuda para tomar decisiones sumamente importantes en los altos niveles.

En cuanto a la industria privada, el empleo de las estadísticas es casi tan importante en sus efectos
como en el sector gubernamental. Se usa las técnicas estadísticas para el control de calidad de los
productos en proceso y para evaluar la aceptación de los nuevos productos que se van a lanzar al
mercado. La estadística se emplea en el mercado, en las decisiones para la ampliación de los negocios,
en el análisis de la eficacia de la publicidad, etc. Las compañías de seguros se basan en las
estadísticas para fijar sus tarifas a un nivel realista. La lista sería interminable. La estadística se emplea
en la geología, biología, psicología, sociología; en todo sector en el que las decisiones deben de
hacerse a base de los datos o informes incompletos. Se usan también en pruebas educacionales, para
medidas de seguridad en la ingeniería. La meteorología, la ciencia de la predicción del tiempo, también
esta usando la estadística actualmente.

Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría supuesto que las
estadísticas ayudaran a un erudito o a un investigador histórico a determinar quien es el autor de obras
en disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de las
estadísticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literarios
en los “Federalist Papers”.

En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena tiene la pesca
de las truchas; sobre cual sería el tipo más adecuado del vaso para el agua de los restaurantes; así
como la estrategia óptima para juegos de destreza y azar, tales como el bridge, los solitarios, el
veintiuno, el béisbol, etc.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todo y en cada
uno de nosotros. Los resultados de los estudios estadísticos se pueden ver, aunque quizás no se
comprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios de
las primas de seguros, en nuestra satisfacción al consumir diversos productos y en nuestra propia
salud.


CLASES DE ESTADÍSTICA

La estadística normalmente se divide en dos grandes categorías: La estadística DESCRIPTIVA y la
estadística INFERENCIAL.

Como complemento a las breves consideraciones de los elementos básicos de la probabilidad, hay dos
clases de estadísticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo de
estadística es el de estadística descriptiva. La clasificación de datos; el trazo de los histogramas que
corresponden a las distribuciones a una población; la representación de los datos por medio de otras
clases de gráficas, tales como las lineales, las gráficas en barras, los pictogramas; él cómputo de
medidas muestrales, medianas y modos; él cómputo de varianzas, las medidas de las desviaciones
absolutas y de la gama; todas estas operaciones se refieren a la estadística descriptiva. La labor
estadística ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadística
descriptiva.




                                                                                                                      5
Estadística Descriptiva                           _____________ _____________ __________MC Raúl Adalberto_Morelos



ESTADÍSTICA DESCRIPTIVA
Significado de Estadística

La palabra “Estadística” ha sido frecuentemente referida a la información cuantitativa o numérica.
También ha sido referida ampliamente a los métodos que se tratan con la información. Sin embargo
esto debería aclararse y llamar a la información, datos estadísticos y a los métodos, métodos
estadísticos.

La estadística descriptiva es la parte de la estadística que agrupa las técnicas apropiadas para la
organización, representación y descripción de un conjunto de datos con el propósito de resaltar sus
rasgos más importantes y extraer la información esencial que contiene. En nuestros términos, diremos
que la estadística descriptiva permite tener una visión “a vuelo de pájaro” de la variable que miden los
datos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para la
toma de alguna decisión.

En pocas palabras, la Estadística Descriptiva permite tener una visión “a vuelo de pájaro”, de la variable
que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio más fino de la
misma, para la toma de alguna decisión.

Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de Historia. Como él
              está usando estadística para describir el comportamiento de esa clase y no para
              hacer una generalización acerca de varias clases, se puede decir que él está usando
              estadística descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal forma
              que sean más fáciles de entender son ejemplos de estadística descriptiva.


ESTADÍSTICA INFERENCIAL
Y su significado

La segunda parte importante de la estadística se refiere a la Estadística Inferencial. Antes definimos a
la estadística como la ciencia para tomar decisiones ante alguna incertidumbre; esto es, llegar a la
mejor resolución sobre bases de una información incompleta. Con el fin de llegar a una decisión sobre
una población, se toma una muestra (generalmente de unos cuantos de los miembros) de esa
población. Dicha selección se hace, generalmente, al azar, a pesar de que existen varios medios de
muestreo. En este libro nos circunscribimos al uso del muestreo al azar. Por lo que dicho término
implica, se puede apreciar que se trata de un método de muestreo en los que los elementos que lo
integran son seleccionados bajo un proceso que no esta bajo el control del investigador. Se conocen
varias definiciones de matemáticas del muestreo del azar, pero nosotros lo aceptaremos como un
muestreo en el que cada elemento escogido de la población tiene la misma oportunidad de ser
seleccionado, y en el que la selección de cualquier elemento no afecta que se pueda seleccionar
cualquier otro.

Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la población. La inferencia que
hacemos acerca de la población sobre bases de este tipo de muestreo se conoce como inferencia
estadística. En otras palabras, la inferencia estadística es el empleo de la técnica de muestreo para
llegar a determinadas conclusiones acerca de la población de la cual se han obtenido las muestras.

De manera general, la Estadística Inferencial es: la Estadística mediante la cual se obtienen
generalizaciones o se toman decisiones en base a una información parcial o incompleta obtenida
mediante técnicas descriptivas. Los datos se analizan de una manera más detallada, se interpretan y se
infieren.


                                                                                                                    6
Estadística Descriptiva                                  _____________ _____________ __________MC Raúl Adalberto_Morelos



Si una muestra es representativa de una población, se puede deducir importantes conclusiones acerca
de ésta, a partir del análisis e interpretación de la misma.

Ejemplo 1.2: Supóngase ahora que el profesor de Historia decide usar las notas
             promedios en una de la clase de Historia para estimar la nota promedio obtenida en los
             diez grupos del mismo curso de Historia. El proceso para estimar esta nota será un
             problema de inferencia estadística. Obviamente, cualquier conclusión que realice el
             profesor acerca de los diez grupos del curso estará basada en una generalización que va
             más allá de los datos originalmente obtenidos en el curso de Historia. La generalización
             del profesor puede no ser completamente válida y él debe establecer cuanto tiene de
             cierto.

Al efectuar una investigación o experimento, es necesario definir qué datos se pretenden obtener de la
POBLACIÓN en estudio.

Para ello debemos definir los siguientes conceptos:
POBLACIÓN: Es una agrupación de todos los elementos que se están estudiando y de los cuales se
está tratando de obtener conclusiones. Se debe definir esta población para precisar si un elemento que
pertenece a la población.
POBLACIÓN FINITA: Cuando una población consta de un número limitado (finito) de elementos. Por
ejemplo, si se desea obtener información acerca de la capacidad didáctica de los 40 profesores de una
universidad, se obtendrán datos de una población finita.
POBLACIÓN INFINITA: Cuando una población consta de un número ilimitado de elementos. Por
ejemplo, la población formada por todos los posibles sucesos (cara, sol) en tiradas sucesivas de una
moneda es infinita, puesto que hipotéticamente la moneda puede lanzarse un número infinito de veces.
MUESTRA: Una muestra es una agrupación de algunos elementos de la población, pero no todos. La
mayoría de las veces no es posible o práctico observar todos los elementos de la población, en todo
caso se toma solo una parte de ella.
PARÁMETRO: Cuando una medida se calcula a partir de los datos de una población.
ESTADÍSTICO: Cuando una medida se calcula a partir de los datos de una muestra.

           MEDIDA                       ESTADÍSTICO (MUESTRA)                  PARAMETR0 (POBLACIÓN )
Media aritmética (Promedio)                                                                     µ
                                                         x
Desviación Estándar                                      S                                      σ
 Número de datos o elementos                             n                                      N
VARIABLE:           Es una característica que toma valores diferentes en personas, lugares y cosas diferentes.
VARIABLE ALEATORIA:                 Son variables cuyos valores son el resultados de factores fortuitos.
VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los valores que esta
puede obtener (estos valores se asocian a cualquier valor entero).


Ejemplos 1.3:
                    •     El número de automóviles vendidos en un mes.
                    •     El número de clientes esperando servicio en la caja de un supermercado.
                    •     El número de tubos electrónicos de T.V. producidos en una hora determinada.


                                                                                                                           7
Estadística Descriptiva                                  _____________ _____________ __________MC Raúl Adalberto_Morelos



VARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos los
contenidos en un intervalo de recta.

Ejemplo 1.4:
                    •     La cantidad de energía eléctrica producida en una planta hidroeléctrica en un día.
                    •     El tiempo necesario para completar el ensamblaje de un artículo en una planta.
                    •     La cantidad de petróleo bombeado cada hora en un pozo.

La estadística está desempeñando un importante papel ascendente en casi todas las facetas del
progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia se
extiende a la agricultura, biología, negocios, química, comunicaciones, economía, educación,
electrónica, medicina, física, ciencias políticas, psicología, sociología, y otros campos de la ciencia. Este
desarrollo de la estadística está ligada a los métodos científicos en la toma, organización, presentación
y análisis de los datos, tanto para la deducción de conclusiones como para tomar decisiones razonables
de acuerdo con tales análisis.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todos y cada
uno de nosotros. Los resultados estadísticos se pueden ver, aunque quizás no se comprendan, al recibir
nuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestra
satisfacción al consumir diversos productos y en nuestra propia salud.




                                                                                                                           8
Estadística Descriptiva                             _____________ _____________ __________MC Raúl Adalberto_Morelos



EJERCICIOS 1.1: ESTADÍSTICA GENERAL.

1) Identifique las variables aleatorias siguientes como discretas o continuas.

          a)   El número de transistores defectuosos en un embarque de 10,000 transistores.
          b)   El número de robos ocurridos en un almacén en un período de tiempo.
          c)   La cantidad de gasolina consumida por un vehículo en una prueba de 100 km.
          d)   Las ventas brutas de un supermercado en un día determinado.
          e)   El número de pólizas vendidas en una determinada semana por un agente de seguros.
          f)   La demanda diaria de energía eléctrica en una determinada ciudad.
          g)   La duración de una bombilla eléctrica observada en un experimento.


EJERCICIOS 1.2: ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Identifique, en dónde se está utilizando la estadística descriptiva y dónde la inferencial.

1.-       En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres
          trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas
          con base en estas calificaciones identifíquense aquellas que se derivan de métodos descriptivos
          y aquellos que se derivan de inferencia estadística.

a)        La calificación promedio de los tres trabajadores es 85, y la calificación promedio de las tres
          trabajadoras es 89.
b)        La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los
          trabajadores.
c)        En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones
          mas bajas que las trabajadoras.

2.-       Tres bombillas de marca A dejaron de funcionar después de 1100, 900 y 1000 hrs. de uso
          continuo. Cuatro bombillas de la marca B dejaron de funcionar después de 1050, 960, 1070 y
          840 hrs. de uso continuo. Se llega a las siguientes conclusiones, ¿Cuáles de ellas provienen de
          la estadística descriptiva y cuáles de la inferencial?

a)        La duración promedio de las tres bombillas marca A es de 1000 hrs mientras que la duración
          promedio de las cuatro bombillas marca B es de 980 hrs.
b)        La duración promedio de todas las bombillas marca A es mayor que todas las bombillas de la
          marca B.
c)        La diferencia entre los dos promedio es de 20.
d)        La diferencia entre los dos promedio es demasiado pequeña para llegar a la conclusión de que
          las bombillas marca A son mejores que la marca B.
e)        Si se selecciona y prueba otra bombilla de marca A, probablemente durará más que el promedio
          de las bombillas marca B.
f)        Usted decide comprar bombillas marca A en vez de bombillas marca B.




                                                                                                                      9
Estadística Descriptiva                                _____________ _____________ __________MC Raúl Adalberto_Morelos



Unidad 2:        DESCRIPCIÓN DE LOS DATOS.

Cuando los datos están organizados en una forma compactada y fácil de utilizar, se puede obtener
información del medio digna de confianza y utilizarla para decisiones inteligentes


MÉTODOS ESTADÍSTICOS

En un estudio estadístico los métodos estadísticos son divididos en cinco pasos básicos.
                      a) Recopilación.                    d) Análisis.
                      b) Organización.                    e) Interpretación.
                      c) Presentación.

Estrictamente hablando, no hay línea de división definitiva que separe los cinco pasos básicos. Algunos
de los métodos pueden ser usados en más de un paso.

a)        RECOPILACIÓN DE DATOS
          De acuerdo a la localización de la información los datos estadísticos pueden se clasificados en
          datos Internos y datos Externos.

          DATOS INTERNOS: Es cuando la información cuantitativa es obtenida dentro de la organización
          que hace el estudio estadístico; Tal como los sueldos de empleados de una lista de pagos,
          recibos de caja de la oficina de contabilidad de la organización.

          DATOS EXTERNOS: Es cuando la información es obtenida fuera de la organización. Los datos
          externos son usualmente obtenidos de dos maneras:

                      - Datos publicados:         (revistas, periódicos, instituciones de investigación,
                                                  universidades, publicaciones editadas por gobierno federal,
                                                  editores privados, etc...)

                      - Encuestas de datos originales (encuestas, entrevistas, etc..)

1).- Obtención de datos publicados. Los datos publicados pueden ser obtenidos fácilmente si las
fuentes de datos son conocidas por el lector.

En relación con esto, es importante conocer las clases de fuentes de datos y las fuentes de datos
publicados.

1.1) FUENTE PRIMARIA Y SECUNDARIA

Las fuentes de datos publicados pueden ser clasificadas en dos clases primarias y secundarias.
Una fuente de datos se denomina primaria cuando los datos obtenido de la publicación EDITADA por el
recopilador original de los datos.

La fuente llamada secundaria cuando los datos son obtenidos de una reimpresión, la cual es publicada
por una organización distinta del recopilador original.

FUENTES DE DATOS PUBLICADOS
Los siguientes siete grupos son las fuentes más importantes de datos publicados con relación a las
actividades de los negocios y económicos, aunque de ninguna manera puede considerarse como una
lista completa de fuentes.

                                                                                                                     10
Estadística Descriptiva                                _____________ _____________ __________MC Raúl Adalberto_Morelos



                    a).- Agencias gubernamentales
                    b).- Asociaciones empresariales
                    c).- Revistas y publicaciones periódicas de empresas
                    d).- Periódicos y almanaques
                    e).- Organizaciones privadas de servicio de estadística
                    f).- Organizaciones internacionales
                    g).- Otras organizaciones de negocios y educativas

ELABORACIÓN DE UNA ENCUESTA

El trabajo de elaborar una encuesta esta usualmente limitado por los factores del tiempo, dinero y mano
de obra disponible para el estudio.

En vez de recopilar información completa relacionada con el estudio, una muestra consistente de un
grupo de elementos representativos es ordinariamente sacada de la fuente de información (población)
en una encuesta.

Los métodos más comunes de recopilación de datos a través de muestras son: Observación Directa y
Formulación de Preguntas.

OBSERVACIÓN DIRECTA

El método de observación directa puede dar información exacta y es usualmente preferida, ya que
puede ser empleado efectiva y económicamente. Sin embargo, está limitado a unos pocos tipos de
estudio y es a menudo demasiado inconveniente en observaciones reales de ciertas operaciones.

Ejemplos:
      a).- Si un investigador desea conocer los precios de menudeo de los alimentos de una ciudad
      puede ir a un grupo seleccionado de tiendas para observar los precios marcados en los mismos.

          b).- Si deseamos conocer el ingreso recibido en una semana por un grupo de taxistas sería muy
          inconveniente observarlos a ellos. Sería más práctico y fácil obtener los resultados haciéndoles
          ciertas preguntas.


FORMULACIÓN DE PREGUNTAS

Hay 3 formas de hacer preguntas a fín, de recopilar datos originales.
                    a).- Entrevistas personales
                    b).- Por teléfono
                    c).- Cuestionario por correo

Al diseñar un cuestionario debemos de tener presente los siguientes puntos:

                    1).- El número de preguntas deberá ser conservado en un mínimo
                    2).- Las preguntas deberán ser breves y claras
                    3).- Preguntas ofensivas deberán ser evitadas
                    4).- Preguntas que induzcan a una respuesta no deberán ser usadas
                    5).- Las preguntas deberán ser fáciles de contestar
                    6).- Las preguntas deberán requerir contestaciones simples.



                                                                                                                     11
Estadística Descriptiva                           _____________ _____________ __________MC Raúl Adalberto_Morelos




Reglas de Redacción y contenido de las Preguntas:

1.- Facilitar la memoria: No debe preguntarse sobre hechos ocurridos hace mucho tiempo; las
preguntas deben limitarse al pasado inmediato (un mes máximo)
2.- No deben usarse más palabras de las que sean necesarias (máximo 20 por pregunta).
3.- Las palabras empleadas deben ser simples, fáciles de pronunciar y de ser posible de uso común.
4.- Deben evitarse al máximo emplear términos comerciales o de negocios y palabras cargadas o
insinuantes.

Ej. ¿Verdad que la Compañía X es la mejor de su ramo?

5.- Asimismo al elaborar la pregunta debe tenerse cuidado en no dar la respuesta.

Ej. ¿Asiste usted al cine por lo menos una vez a la semana?

6.- No debe forzarse a la persona a que realice cálculos, complicados porque ésta, tenderá a cansar
rápidamente al entrevistado.

Ej. ¿Cuántos Kgrs. de azúcar se consumen en su hogar?

7.- Cuando se tenga que realizar una pregunta que por su naturaleza sea embarazosa o difícil de
contestar, es necesario planear cuidadosamente su redacción, para evitar una gran cantidad de
contestaciones falsas.

Ej. ¿Cada cuántos días se baña usted?

8.- Al realizar preguntas referidas a tiempos es necesario fijar intervalos adecuados a las posibles
contestaciones y la pregunta debe referirse de preferencia a una fecha concreta.

Ej. ¿Cuándo fue la última vez que asistió usted al cine?

9.- Cuando tratan de medirse aspectos relacionados con la calidad de un producto, o bien su sabor, su
aroma, su aspecto y otras características similares, es recomendable el uso de respuestas
preformuladas, utilizando escalas de conceptos o de valores o una combinación de ambas.

Ej.
                          Excelente         3
                          Muy Bueno         2
                          Bueno             1
                          Regular           0
                          Malo              -1
                          Muy Malo          -2
                          Pésimo            -3

10.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que son
susceptibles de provocar reacciones de tipo Psicológico positivo o negativos y alterar la respuesta.

Ej. El Presidente de la República mencionó en su discurso. ¿Usted qué Opina?
En este caso el presidente eclipsa el asunto que se discutía.


                                                                                                                12
Estadística Descriptiva                                  _____________ _____________ __________MC Raúl Adalberto_Morelos



11.- Por último es conveniente destacar los siguientes puntos que influyen en forma determinante en la
redacción de un buen cuestionario:

                    •     No abrumar con palabras altisonantes.
                    •     Construir las preguntas gramaticalmente breves
                    •     No usar vulgarismos
                    •     No someter a negativas dobles.
                    •     Evitar dobles significados.
                    •     Evitar preguntas capciosas.
                    •     Mencionar lo que antecede, siempre que exista la posibilidad de olvido o confusión.

Elementos del Cuestionario.

Reporte: Es una breve introducción al tema, objetivo de la encuesta se usa para crear confianza y
cooperación en el encuestado.

Consigna: Es la indicación de como contesta a determinada pregunta, debe ser muy explícita                                 al
diseñarse y haber un número máximo e igual de las preguntas.

Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc.

Pregunta introductoria: Deben ser fáciles de contestar, están antes del tema principal y sirven para
introducirlo.

Preguntas Básicas: Es el elemento clave del cuestionario aquel están traducida las observaciones de la
investigación y deben ser lo suficientemente extensas para que cubra los mismos.

Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, como
cuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferente
manera la misma pregunta.

Pregunta de Clasificación: Tara de la información sobre el individuo, edad sexo domicilio, no. de hijos,
nacionalidad etc., son preguntas de identificación al final del cuestionario por que podrían influir en la
respuesta si fueran al principio.


ORGANIZACIÓN DE DATOS ESTADÍSTICOS

Dentro de una organización de datos estadísticos debemos tomar en cuenta:

          1).- Crítica y corrección de datos recopilados. Un corrector puede encontrar una o varias de las
          siguientes cosas que deberían ser corregidas y tratadas.
          a).- Las respuestas son inconsistentes
          b).- La escritura no es determinable
          c).- Las respuestas son incompletas
          d).- Se necesitan cálculos

2).- Clasificación de datos corregidos. Hay muchas formas de clasificar datos estadísticos en general las
clasificaciones pueden ser determinadas de acuerdo a 4 bases:
Tiempo, lugar, cantidad y cualidad.



                                                                                                                       13
Estadística Descriptiva                             _____________ _____________ __________MC Raúl Adalberto_Morelos



CUALITATIVA.- En esta clasificación la distinción es mas bien de clases que de cantidad. Por ejemplo,
cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferencia
cualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios,
administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con su
origen.

CUANTITATIVA.- Cuando los valores se modifican con respecto a una característica mensurable,
conviene una clasificación cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con él
numero de hijos, las empresas industriales, según él número de obreros empleados y también
desacuerdo con el valor de los artículos producidos. La mayoría de las distribuciones cuantitativas son
distribuciones de frecuencia, que son la forma básica de organización de los datos para sus análisis
estadísticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre bases
cuantitativas, mediante cambios muy ligeros.

CRONOLÓGICA.- Los datos cronológicos o las series cronológicas contienen cifras relativas a un
fenómeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrar
la cotización diaria de cierre de ciertas acciones durante un periodo de meses o años, puede registrarse
el coeficiente anual de natalidad de varios años, puede indicarse la producción mensual de carbón
durante un lapso dado de años. Las series cronológicas tiene un cierto modo algún parentesco con las
distribuciones cuantitativas, por el hecho de que cada año o mes sucesivo de una serie esta un año o
un mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o más bien los
acontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre sí.
Ocasionalmente una serie cronológica puede convertirse en una distribución de frecuencias.

GEOGRÁFICA.- La distribución geográfica es esencialmente un tipo de distribución cualitativa, pero en
general se considera como una clasificación especial. Por ejemplo, cuando se muestra la población de
cada unos de los estados, tenemos datos clasificados geográficamente. Aun cuando existe una
diferencia cualitativa entre dos estados cualesquiera, la distinción que se establece no es de clase sino
de situación. A veces es posible esperar una distribución geográfica en forma de distribución de
frecuencias.

3).- Tabulación de datos clasificados. Después de que se han decidido las clasificaciones adecuadas o
deseadas el siguiente paso en la organización de los datos es arreglar la masa de hechos cuantitativos
en una forma resumida basadas en las clasificaciones.

Este proceso se llama tabulación son:

          1).- Tarjetas de escritura manual
          2).- Hojas de registro
          3).- Tarjetas de perforación manual
          4).- Tarjetas perforadas
          5).- Procesamiento electrónico de datos




                                                                                                                  14
Estadística Descriptiva                                    _____________ _____________ __________MC Raúl Adalberto_Morelos



ORGANIZACIÓN DE LOS DATOS USANDO EL ARREGLO.

El ARREGLO de datos es una de las formas más simples de organizar la información, se organizan del
valor menor al mayor (en orden ascendente), o del mayor al menor (en orden descendente).

          Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto.

          - Rápidamente se pueden apreciar los valores menor y mayor en los datos.
          - Fácilmente se puede dividir los datos en secciones.
          - Se puede ver si algún valor aparece más de una vez en el arreglo.
          - Se puede observar la distancia entre valores sucesivos de datos.

A pesar de éstas ventajas, algunas veces el arreglo de datos no es de mucha utilidad. Cuando sea
necesario mostrar una gran cantidad de ellos, esto se tornará engorroso, porque se debe hacer la lista
de todas las observaciones. Para estos casos se necesita condensar la información y estar en
capacidad de usarla para tomar decisiones e interpretarla.


ORGANIZACIÓN DE LOS DATOS USANDO DISTRIBUCIÓN DE FRECUENCIAS

Una manera de simplificar los datos es usar una tabla de frecuencia o distribución de frecuencia. Como
se verá, la organización de los datos en una tabla de frecuencia muestra el comportamiento de la
distribución de manera más significativa.

La organización de los datos generalmente implica el arreglo de las observaciones en CLASES o
INTERVALOS. Al arreglo de los datos para expresar la frecuencia de ocurrencia de las observaciones
en cada una de estas clases se conoce como DISTRIBUCIÓN DE FRECUENCIA.

La construcción de una tabla de frecuencia se realiza de una serie de datos, los cuales primeramente
son recopilados y posteriormente organizados. La primera forma de organizarlos es dándoles un orden
ascendente o descendente. Los datos constituidos de esta manera están en un ARREGLO. Este
arreglo puede ser construido mediante el uso de marcas, y el número de veces que un valor está
repetido se le llama FRECUENCIA.

Ejemplo 2.1: Calificación final de Estadística de 80 Estudiantes de la carrera de LSCA.

                                             = RECOPILACION =

                          68, 84, 75, 82, 68, 90, 62, 88.3, 76, 93, 73, 79, 88, 73, 60, 93, 72, 53, 85, 75
                          53, 65.5, 75, 87, 74, 62, 95, 78, 62, 72, 66, 78, 82, 75, 94, 77, 69, 74, 68, 60
                          96, 78, 89, 60, 75, 95, 60, 79, 83, 72.6, 79, 60, 67, 97, 78, 85, 76, 65, 71, 75
                          65, 80, 73, 53, 88, 78, 63, 76, 53, 74, 86, 67, 73, 81, 72, 63, 76, 75, 85, 77.8

                                             = ORGANIZACION =

                          53, 53, 53, 53, 60, 60, 60, 60, 60, 62, 62, 62, 63, 63, 65, 65, 65.5, 66, 67, 67
                          68, 68, 68, 69, 72, 72, 72, 72, 72, 72.6, 73, 73, 73, 74, 74, 74, 75, 75, 75, 75
                          75, 75, 75, 76, 76, 76, 76, 77, 77.8, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 82
                          82, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88.3, 89, 90, 93, 93, 94, 95, 95, 96, 97




                                                                                                                         15
Estadística Descriptiva                            _____________ _____________ __________MC Raúl Adalberto_Morelos



                            TABLA DE FRECUENCIAS, ARREGO DE FRECUENCIAS
                                Valor       Marca     Frecuencia (f)
                                  53          llll          4
                                  60          llll          5
                                  62           lll          3
                                  63            ll          2
                                  ...         ...          ...

En la tabla la segunda columna es sólo auxiliar. En la tercera se presenta la Frecuencia de cada dato
posible (fi = al número de veces que ocurre la i-ésima observación posible).

        La información contenida en la tabla puede ser representada gráficamente en varias formas:
gráfica de barras, de líneas, por sectores, etc. El inconveniente de graficar cada dato contenido en la
gráfica anterior, es que si el número de datos diferentes es muy grande, se diluye la información.
Imagínese un gráfico de 25 o 50 barras. Este inconveniente es superado, al utilizar otras técnicas
apropiadas para el tratamiento de datos provenientes de una variable continua.

En el ejempo 2.1 encontramos 80 valores diferentes, distribuídos entre el dato menor (Dm) = 53 y el dato
mayor (DM) = 97, como puede verse en la ordenación (organización). Para el tratamiento adecuado,
procedemos a agrupar los datos por intervalos de clase de igual longitud, para lo cual necesitaremos
saber o calcular el número de intervalos que tendrá nuestra tabla.


NUMERO DE CLASES ó INTERVALOS (k)

No hay un criterio establecido para el número de agrupación de datos (intervalo de clase) a utilizar. El
primer paso para construir una tabla de frecuencia consiste en decidir cuantas CLASES o
INTERVALOS DE CLASE se van a utilizar. El número de clases depende del número de datos y del
rango de los mismos y de la información que el investigador desea obtener. Entre mayor sea el número
de datos, o más amplio el rango de los datos, mayor número de clases se necesitará para dividirlos. Por
supuesto, si se tiene sólo 10 datos, deja de tener sentido el hacer 10 clases. Como una norma, los
estadísticos usan entre 5 y 20 clases. Menos de 5 clases pueden concentrar la información y más de 20
clases pueden dispersar la información.

Hay muchos libros de texto que recomiendan un sínnumero de formas para determinar el
número adecuado de intervalos. Para nosotros debe ser claro que a mayor número de datos resulta
adecuado un mayor número de intervalos de clase, por lo que utilizaremos un criterio preciso, (aunque
personal), basado en la Regla de Sturges, que consiste en elegir k como el entero impar más
cercano a:

                          k = 1 + 3.3 ⋅ Log( N )               k = Número de clases.
                                                               N = Número de datos.

Podemos agregar que la experiencia y el uso a que esté destinado el agrupamiento, son criterios
determinantes en algunos casos.

La recomendación de elegir un número impar de intervalos es con el fin de mantener la posible simetría
de una distribución de datos.



Ejemplo 2.2: Para el problema de los 80 estudiantes de estadística Ejemplo 2.1.

                                                                                                                 16
Estadística Descriptiva                                    _____________ _____________ __________MC Raúl Adalberto_Morelos




          k = 1 + 3.3 Log (80) = 7.28 » 7 CLASES (Entero impar más cercano), entonces:
          k=7


AMPLITUD DE CLASES.

Debido a que se necesita tener los intervalos de clase de igual tamaño, el número de clases
determinará la amplitud ( i ) de cada clase. Para encontrar la amplitud de cada intervalo de clase se
utilizan las siguientes ecuaciones:

                    Rango (R) = DM - Dm = Dato mayor - Dato menor



                                           R Dato ⋅ Mayor − Dato ⋅ Menor
                                      i=     =
                                           k    Numero ⋅ Intervalos



Para el ejemplo 2.1 tendremos:

          R = 97 - 53 = 44                   i = 44/ 7 = 6.2857 ~= 6.3 (para datos continuos)
                                                               i = 7 (para datos discretos)


Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultaría engorroso el trabajar con
cuatro dígitos después del punto decimal, por lo que tomaremos la aproximación de 6.3 con ancho del
intervalo. Aquí debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestros
datos son discretos o continuos. Pues si fueran datos discretos tomaríamos i = 7, ya que si tomamos el
valor 6, no concordaría con el número de intervalos que previamente se habían calculado, (esto lo
podemos calcular con un pequeño despeje de i = R/k, lo cual tendríamos k = R/i ), y tendríamos que
utilizar un intervalo más para poder “meter” los valores más altos.

Al fijar los limites de clase, es necesario tomar en cuenta que el valor mínimo de los datos debe quedar
incluido en el primer intervalo de clase y el valor máximo en el último. Para que el valor mínimo de los
datos quede incluido en el primer intervalo de clase, el primer límite inferior de clase deberá escogerse
en tal forma que sea igual o menor que él. De la misma manera, para que el valor máximo de los datos
quede incluido en el último intervalo de clase, el último límite superior de clase deberá ser igual o mayor
que él.

          Los intervalos quedarían así:

          I1              I2          I3            I4           I5             I6            I7


  53.0          59.3           65.6        71.9          78.3          84.6          90.0           97.2
   a   ,         b



para introducir los datos en los intervalos tomaremos el criterio siguiente:

                                                                                                                         17
Estadística Descriptiva                                        _____________ _____________ __________MC Raúl Adalberto_Morelos




( a, b )     a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
             a; “a mayor que” y estrictamente menores que b; “b menor que”.

( a, b ]     a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
             a; “a mayor que” y estrictamente menores o iguales que b; “b menor o igual que”.

[ a, b ]     a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
             iguales que a; “a mayor o igual que” y estrictamente menores o iguales que b; “b menor o
             igual que”.

[ a, b )     a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
             iguales que a; “a mayor o igual que” y estrictamente menores que b; “b menor que”.


                                   CONSTRUCCIÓN DE UNA TABLA DE FRECUENCIAS.
                          CLASES         MARCA      FRECUENCIA         FRECUENCIAS           FRECUENCIA
                                                                                             ACUMULADA
                                        DE CLASE                        RELATIVAS
                                          xi                               fr                    C
                     Li     -   Ls                      f
                   53.0 - 59.3            56.15               4      4/80 = 0.05                      4
                   59.3 - 65.6            62.45              13     13/80 = 0.1625                   17
                   65.6 - 71.9            68.75               7      7/80 = 0.0875                   24
                   71.9 - 78.2            75.05              30     30/80 = 0.375                    54
                   78.2 - 84.5            81.35               9      9/80 = 0.1125                   63
                   84.5 - 90.8            87.65              10     10/80 = 0.125                    73
                   90.8 - 97.1            93.95               7      7/80 = 0.0875                   80
                  Suma de frecuencias =            ∑f   = 80      ∑ fr   = 1.0000


DATOS FUNDAMENTALES DE LA TABLA DE FRECUENCIA.

LÍMITES DE CLASE:                  Son los valores localizados en los extremos de una clase.

LÍMITE INFERIOR ó LÍMITE REAL INFERIOR (Li) = 53.0

LÍMITE SUPERIOR ó LÍMITE REAL SUPERIOR (Ls) = 59.3

TAMAÑO DE CLASE (i)::                   Es el recorrido de valores que pueden tomar los elementos de la
                                        frecuencia de una clase determinada. Se calcula restando los limites
                                        reales.

                                            i = TAMAÑO DE CLASE= Ls - Li = 59.3 -53.0 = 6.3

MARCA DE CLASE (xi) :                   Es el valor representativo de los elementos de la frecuencia. Se obtiene
                                        promediando el límite inferior y superior de una clase.

                                                            Li + Ls 53 .0 − 59 .3
                                        Marca ⋅ Clase =            =              = 56 15
                                                                                       .
                                                               2          2


                                                                                                                             18
Estadística Descriptiva                               _____________ _____________ __________MC Raúl Adalberto_Morelos



FRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las
                     clases y se expresa generalmente en porcentaje.

                                    fr = FRECUENCIA RELATIVA= 13/80 = 0.1625= 16.25%


FRECUENCIA ACUMULADA: Es la suma de las frecuencias de clase del intervalo en consideración y
                   de los intervalos anteriores.


Ejercicios 2.1: Resolver las siguientes cuestiones:

          1.-       Si la calificación mínima aprobatoria es de 70, ¿Cuántos alumnos acreditaron?
          2.-       ¿Cuántos alumnos acreditaron con menos de 80 ?
          3.-       Porcentaje de alumnos reprobados.
          4.-       Entre que rango de valores encontramos más calificaciones.
          5.-       Porcentaje de alumnos que obtuvieron 90 o más de calificación.
          6.-       Número de alumnos que obtuvieron una calificación menos de 90.
          7.-       ¿Puede determinarse en la distribución de frecuencia el número de calificaciones con 95.


c)        OTROS MÉTODOS DE PRESENTACIÓN DE DATOS:

          REPRESENTACIÓN DE DATOS ESTADÍSTICOS

En general hay 3 formas para presentar datos organizados:

                    a).- Presentación con palabras
                    b).- Tablas estadísticas
                    c).- Gráficas estadísticas


PRESENTACION CON PALABRAS .

          La combinación de cifras y texto no es un sistema muy eficaz ya que es necesario leer, o por lo
          menos registrar, todo el parrafo antes de que se pueda comprender el significado de todo el
          conjunto de cifras. Para la mayoría de las personas les resulta difícil aislar las cifras individuales
          que se presentan. Sin embargo, hay la ventaja de que el autor puede dirigir la atención hacia
          determinada cifra, haciéndola resaltar, y también puede llamar la atención sobre las
          comparaciones de importancia.


TABLAS ESTADÍSTICAS .

          Las tablas estadísticas pueden ser agrupadas en dos tipos de acuerdo con sus propósitos para
          los cuales nos sirven:


          TABLAS PARA PROPÓSITOS GENERALES:
          Proporcionan información para referencia o uso general. No se construyen para una exposición
          específica. En otras palabras, las tablas nos sirven como un depósito de información. Por
          ejemplo se tiene una tabla titulada "Empleo y Población" que muestra el número de empleados

                                                                                                                    19
Estadística Descriptiva                                  _____________ _____________ __________MC Raúl Adalberto_Morelos



          en manufactura, minería, construcción, transporte, comercio al mayoreo y menudeo, gobierno y
          otras áreas del país. Esta tabla es de propósitos generales, puesto que solamente dice hechos
          que no son para una discusión particular. Cuando las tablas de propósitos generales son
          utilizadas por un investigador, son usualmente colocadas en el apéndice del informe para fácil
          referencia.


          TABLAS PARA PROPÓSITOS ESPECIALES.
          Proporcionan información para una exposición particular. Una tabla para propósitos especiales
          debería ser diseñada de tal forma que un lector pueda dirigirse fácilmente a la tabla para
          comparación, análisis o énfasis concerniente a la exposición particular. La tabla debe ser
          construida de una manera breve y simple.


                                 PARTES PRINCIPALES DE UNA TABLA
TÍTULO:     Es una descripción del contenido de la tabla. Debe ser compacto y completo. Un
            título usualmente indica: ¿Qué son los datos incluidos? ¿Dónde está el área
            representada por los datos? ¿Cómo están los datos clasificados? ¿Cuándo
            ocurrieron los datos?
ENCABEZADO: Es el titulo de la parte superior de una columna o columnas. La tabla más simple
            tiene solamente dos columnas y dos encabezados: uno para los conceptos y otro
            para los datos. Sin embargo, muchas tablas tiene mas de dos encabezados y
            algunas veces tienen encabezados principales y subencabezados.

  NOTA DE   Son usualmente escritas justamente arriba de los encabezados y abajo del titulo.
ENCABEZADO: Son usadas para explicar ciertos puntos relacionados con la tabla completa que
            no han sido incluidos en el titulo o en el encabezado ni en los conceptos. Por
            ejemplo la unidad de los datos es frecuentemente escrita como una nota de
            encabezado, tal como "En miles" .

CONCEPTOS O Son las descripciones en hileras o filas de las tablas, son colocados al lado
  COLUMNA   izquierdo de la tabla. Usualmente representan las clasificaciones de las cifras
  MATRIZ:   incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada
            por los encabezados de la columna.

    CUERPO:               Es el contenido de los datos estadísticos. Los datos presentados en el cuerpo
                          son arreglados de acuerdo con las clasificaciones de los encabezados y
                          conceptos. Por lo tanto la presentación efectiva de los datos en la tabla depende
                          de los arreglos columnas y filas.

 NOTA DE PIE:             Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar
                          algunas partes incluidas en la tabla que no son explicadas en otras partes.

    FUENTE:               Es el origen de donde se obtuvo la información. Es usualmente escrita abajo de
                          las notas de pie. Si los datos fueron recopilados por la misma persona, es
                          costumbre no establecer la fuente de la tabla. Sin embargo, si los datos fueron
                          tomados de otras fuentes, las fuentes de los datos deberán ser declaradas en la
                          tabla. La declaración permitirá al lector comprobar o evaluar los datos, u obtener
                          información adicional de la fuente original.



                                                                                                                       20
Estadística Descriptiva                           _____________ _____________ __________MC Raúl Adalberto_Morelos



GRÁFICAS ESTADÍSTICAS
Hay una gran variedad de gráficas usadas para representar datos estadísticos, los tipos más comunes
de gráficas son:
                           1).- Gráfica de línea
                           2).- Gráfica de barras
                           3).- Gráficas de partes componentes
                           4).- Gráfica de dimensiones
                           5).- Pictogramas
                           6).- Mapas estadísticos.



GRÁFICAS DE LÍNEAS
Las curvas o gráfica de línea se usan a menudo para representar las series cronológicas, así como las
distribuciones de frecuencia. Los datos clasificados cualitativa y geográficamente raras a veces se
presentan por medio de líneas; en su lugar se usan gráficas de barras.

La Línea o líneas que representan los datos deberán resaltar claramente sobre el fondo de la gráfica.
La línea deberá, pues, dibujarse con un trazo mas grueso que las coordenadas de línea.
Cuando se trazan varias líneas en el mismo cuadrante, es esencial que cada línea se destaque con
claridad. Para ello se pueden usar tanto líneas continuas, de puntos y de guiones, como líneas gruesas
y delgadas. Cuando en una gráfica aparecen dos o más curva, deben distinguirse unas de otras. Esto
puede lograrse, de preferencia, rotulando las líneas. De ordinario es conveniente evitar el uso de mas
de dos o tres líneas en una gráfica. Especialmente si se cruzan, es muy probable que se produzca
alguna confusión.



GRÁFICAS DE BARRAS

Cuando se espera que la gráfica de simplemente una impresión muy general pueden hacerse gráficas
de barras simples, sin escalas. Cuando se desea dar una impresión menos vaga, se utilizara la escala y
si los intervalos de tiempo son diferentes, los espacios entre barra y barra también lo serán de acuerdo
a la magnitud de dichos intervalos.

Las gráficas de barras se usan para hacer representaciones de datos clasificados cronológicamente,
arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizan
comparaciones de datos clasificados cualitativa o geográficamente, se usan, por lo general, barras
horizontales.

Aun cuando no hay reglas establecidas para dibujar las gráficas de barras, son útiles ciertas
consideraciones:

1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas.
2.- Entre barra y barra deberá dejarse un espacio que no sea menos, aproximadamente, que la mitad
del ancho de una barra, ni mayor que el ancho de la misma.
3.- La escala es generalmente útil. La distancia a la que se colocara no deberá exceder de la mitad de
una barra a partir de la más alta, cuando son horizontales, o de la izquierda, cuando son verticales.
4.- Las líneas que sirven como guía ayudan a leer la gráfica.




                                                                                                                21
Estadística Descriptiva                              _____________ _____________ __________MC Raúl Adalberto_Morelos



Para representar gráficamente una serie cronológica pueden usarse una gráfica de barras o de líneas.
Si la serie abarca muchos años, por lo general, no es adecuada una gráfica de barras, que es difícil de
construir. Una gráfica lineal facilita el estudio de la variación general que ha experimentado la serie;
mientras que una gráfica de barras permite comparar determinados años con mayor facilidad.


REPRESENTACIÓN GRÁFICA DE UNA TABLA DE FRECUENCIA.
Los gráficos de distribuciones de frecuencias son útiles porque enfatizan y clasifican las tendencias que
no se perciben fácilmente en las tablas. Los gráficos también ayudan a resolver problemas relacionados
con las distribuciones de frecuencia. Permiten estimar algunos valores de un vistazo y proveen un
chequeo visual de lo correcto de las soluciones.

HISTOGRAMA:

Es un diagrama formado con rectángulos o barras cada uno de ellos pertenecientes a una clase. Cada
rectángulo tiene de ancho el tamaño de clase.

En el eje "Y" se grafica la frecuencia, y en el eje "X" los límites reales de clase. En el centro de su base
se señala la marca de clase.

Las ventajas de los histogramas son:

 -        El rectángulo muestra claramente cada clase separada en la distribución.
 -        El área de cada rectángulo, referida a todos los otros rectángulos, muestra la proporción del
          número total de observaciones que ocurren en cada clase.

                                                     HISTOGRAMA
                              30
                          F
                          r   25
                          e   20
                          c
                              15
                          u
                          e   10
                          n   5
                          c   0
                          i                    Intervalos de clase
                          a
                          s
POLÍGONO DE FRECUENCIA:

        Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es la
frecuencia del intervalo. Es un diagrama de líneas que se forma uniendo los centros (marca de clase) de
la parte superior de los rectángulos de un histograma mediante segmentos rectos.

          La ventaja de los polígonos de frecuencia son:

 -        El polígono de frecuencia es mucho más simple que el histograma.
 -        Esboza una idea del comportamiento de los datos más claramente.
 -        El polígono se va aplanando y curveando en la medida en que se aumenta el número de clase y
          el número de observaciones.



                                                                                                                   22
Estadística Descriptiva                                _____________ _____________ __________MC Raúl Adalberto_Morelos



              F                        POLIGONO DE FRECUENCIAS
              r   35
              e   30
              c
                  25
              u
              e   20
              n   15
              c   10
              i
                   5
              a
              s    0
                                                Intervalos de clase




OJIVA:

       Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo y
cuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convención de que antes
del primer intervalo considerado, la frecuencia acumulada es cero y después del último es el total de
datos (N).

                                                         OJIVA
                          F       90
                          r   A
                              c   80
                          e
                          c   u
                                  70
                          u   m
                              u   60
                          e
                          n   l
                                  50
                          c   a
                              d   40
                          i
                          a   a
                                  30
                          s   s
                                  20

                                  10

                                  0
                                                Intervalos de Clase




EJEMPLOS 2.2: PRESENTACIÓN ESCRITA DE DATOS ESTADÍSTICOS.

     Se presentan los Costos, Ingresos y utilidades ( en miles de pesos) durante 1991-1995 de la
compañía XXX en sus diferentes departamentos: Damas, caballeros y niños.

       Durante los últimos 5 años los costos fueron de 100, 200, 300, 350 y 400 en el departamento de
damas; de 120, 180, 310, 380 y 390 en el departamento de caballeros; y de 80, 100, 160, 290, 430 en el
departamento de niños.

       Los ingresos correspondientes obtenidos en este periodo fueron de 260, 390, 425, 560 y 730 en
el departamento de damas; de 300, 320, 480, 560 y 700 en el departamento de caballeros; y de 145,
210, 300, 410 y 625 en el departamento de niños.

                                                                                                                     23
Estadística Descriptiva                                           _____________ _____________ __________MC Raúl Adalberto_Morelos




Para lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y
310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento de
niños fueron de 65, 110, 140, 120 y 195.


EJEMPLOS: TABLAS ESTADÍSTICAS.


                          NÚMERO DE AUTOS MANUFACTURADOS Y VENDIDOS POR
Título
                                  G.M., K.W. Y M.S. COMPANY EN 1995
                                                        ( MILES DE AUTOS )
                                                                                                   Nota de Encabezado
                                 Compañía             Manufactu- Vendidos
         Encabezado                                     rados
                                G.M.                         10                 9.2

            Conceptos           K.W.                         14                12.8                Cuerpo

                                M.S.                         5*                  5
                                       FUENTE: Revista Journal, Enero de 1996, Pag. 13.
                                * La manufactura fue muy poca debido a que en los meses de
                                 Abril-Juniohubo huelga por parte del sindicato de trabajadores.




EJERCICIOS 21: DISTRIBUCIÓN DE FRECUENCIA

       Una máquina vendedora de proporciona 16 oz. de café si se insertan monedas adecuadas. Para
probar si la máquina esta operando adecuadamente se tomaron 30 vasos de café y se midieron.

                    15.7 15.9 15.2 16.0 16.2 16.4 15.7 15.9 15.4 16.0 16.3 16.6
                    15.8 15.9 15.6 16.0 16.3 16.8 15.8 15.9 15.6 16.1 16.3 16.8
                    15.8 16.0 15.6 16.2 16.4 16.9

a)        Realizar un arreglo de los datos de menor a mayor.
b)        Realizar una distribución de frecuencia.
c)        Cuando la máquina tiene un margen de ± 0.2 oz se dice que trabaja correctamente, no
          importando las onzas que proporcione después de 16 oz. ¿En qué porcentaje la máquina
          funciona adecuadamente?
d)        ¿En qué porcentaje la máquina no trabaja adecuadamente?
e)        ¿En qué porcentaje la máquina proporciona más de 16 oz de café?
f)        ¿Cuál es la probabilidad de una persona al usar la máquina le proporcione más de 16 oz de
          café?


GRÁFICAS CIRCULARES

Se emplean para demostrar la relación existente entre los componentes de una clase. Cada uno de los
sectores del círculo representa una parte de un agregado de un total.

Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual a
los 360 grados, o bien, cuando se trata de porcentajes, a 100%.

                                                                                                                                24
Estadística Descriptiva                          _____________ _____________ __________MC Raúl Adalberto_Morelos




Para evitar los cálculos resulta muy conveniente emplear un transportador de porcentajes que tiene
graduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemos
simplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, basta
multiplicar el porcentaje por este factor y el producto así obtenido equivale a los grados que le
corresponde en la circunferencia.

Si se trata de valores absolutos, y no de porcentajes o valores relativos, ese factor se obtendrá
dividiendo 360 entre el total, ya que la circunferencia se ha hecho igual a él.


PICTOGRAMAS

Las gráficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de los
datos que representan son más atractivas; sin embargo; como ya se señalo presentan mayores
dificultades, tanto para su elaboración como para su adecuada interpretación.
Este valor pictórico, puede conservarse usando varios dibujos pequeños que representen una cantidad
fija de los datos, del mismo tamaño, y arreglándolos de manera que se forme una gráfica de barras. A la
gráfica resultante se le llama pictograma.

Aunque este diagrama es esencialmente una gráfica de barras es más atractivo y, por lo tanto, hay
mayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representen
series cronológicas, se arreglan en forma horizontal, porque aparece más adecuado poner los dibujos
(cosas o personas) uno al lado del otro y no uno encima del otro.

Las reglas fundamentales para la construcción de pictogramas estadísticos son:

1.- Los símbolos deben explicarse por sí mismo
2.- Las cantidades mayores se indican por un número mayor de símbolos y no por símbolos más
    grandes
3.- Estos diagramas compran cantidades aproximadas y no detalles minuciosos
4.- Los pictogramas sólo deben utilizarse para hacer comparaciones y no afirmaciones aisladas


MAPAS ESTADÍSTICOS

Los mapas estadísticos son artificios gráficos que muestran la información cuantitativa sobre una base
geográfica. Los tipos más comunes son los mapas sombreados o rayados, los mapas punteados y los
mapas de alfileres.




                                                                                                               25
Estadística Descriptiva                              _____________ _____________ __________MC Raúl Adalberto_Morelos



MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS (Descriptivas)

Una vez que los datos han sido obtenidos y organizados, el investigador esta listo para realizar un
análisis descriptivo. En el tratamiento de los datos, es útil resumir sus características principales. Para
ello, se plantean las siguientes cuestiones: ¿Cuál es el dato de mayor frecuencia? ¿Cuál es el valor
central de la distribución? ¿Qué tan separados se encuentran los datos? Las respuestas a estas
interrogantes es por medio de las medidas descriptivas conocidas como de Tendencia Central, de
dispersión, de sesgo y kurtosis.

        La medida de tendencia central son los promedios o valores típicos representativos de un
conjunto de datos que tienden a situarse en el centro de dichos datos. Las tres medidas de tendencia
central más comunes son la media (X), mediana (Md) y moda (Mo).


MEDIA ARITMÉTICA ( X )

      Es la suma de las observaciones o datos entre el número de observaciones totales. Es una de
las medidas digna de confianza porque se determina con mayor certeza que otras medidas.
                                                      N

                                                     ∑x
                                                     I =1
                                                              i
                                              x =
                                                          N
VENTAJAS:

                Es familiar a la mayoría de la gente y muy sencilla de calcular.
                En ellas se reflejan todos los valores del conjunto de datos.
                Un conjunto de datos solo tiene una sola media.


DESVENTAJAS:

Puede afectarse por los valores extremos que no son representativos del resto de los valores.


MEDIANA ( Md )

          La mediana es el valor único de un conjunto de datos que mide al elemento central de los datos.

Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Si
el conjunto de datos tiene un número impar de elementos, el elemento de la mitad del arreglo es la
mediana { (N+1)/2 }. Si hay un número par de elementos, la mediana es el promedio de los dos
elementos de la mitad { N/2 }.

VENTAJAS:

                Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la
                 media.
                Se puede encontrar la mediana aún cuando los datos sean descripciones cualitativas
                 como el color o la claridad.



                                                                                                                   26
Estadística Descriptiva                              _____________ _____________ __________MC Raúl Adalberto_Morelos



DESVENTAJAS:

                     Debido a que la media es un promedio de posición, se deben de organizar los datos
                      antes de realizar cualquier tipo de cálculo. Esto consume tiempo para un conjunto de
                      datos muy grande.

MODA ( Mo )

          La moda es aquel valor que se repite más en un conjunto de datos.

VENTAJAS:

                     Se puede usar como una medida de localización central tanto para datos cualitativos
                      como cuantitativos.
                     La moda no esta afectada por los valores extremos.

DESVENTAJAS:

                     Muy a menudo no hay un valor modal porque el conjunto de datos no contiene valores
                      que se repiten más de una vez.
                     Otras veces, cada valor es la moda porque cada valor aparece el mismo número de
                      veces.
                     Cuando el conjunto de datos tiene dos, tres o más modas, éstas son difíciles de
                      interpretar y comparar.



MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

MEDIA ARITMETICA PARA DATOS AGRUPADOS (MÉTODO LARGO):


                                N                       x i = Marca de clase
                              ∑i x i
                               f                       ∑f   = N = Total de datos
                          x =   i=1
                                                       f = Frecuencia
                                      N


Método corto para el cálculo de la Media Aritmética:
                                                      A = Media supuesta
                                 N                         (marca de clase del intervalo central)
                                 ∑ f i ⋅ di           di = Desviación en unidades de intervalo
                                                      i = Amplitud del intervalo
                     x= A+       i =1
                                              ⋅i
                                        N


MEDIANA PARA DATOS AGRUPADOS


                                                                                                                   27
Estadística Descriptiva                               _____________ _____________ __________MC Raúl Adalberto_Morelos




                                            Linf = Límite inferior de la clase de la mediana
                                  N +1
                                         − C ant
                                            N = Total de datos
        Md = L inf +               2
                                                 ⋅i
                                            i = Amplitud del intervalo
                                         f Md
                                            fMd = Frec. de la clase mediana
                                            C = Frecuencia acumulada hasta antes de la clase
                                                 mediana.
                                            Clase Mediana, es la que contiene el dato central
                                            N/2 para datos pares ó (N+1)/2 para impares, y debemos
                                            observar que intervalo lo contiene, en la frecuencia
                                            acumulada
Se divide N/2 para encontrar la clase mediana para datos pares, (N+1)/2 para datos impares.


MODA PARA DATOS AGRUPADOS:
                                                          d1 = Frec. de la clase modal menos la frecuencia de la
                         d1                                   clase anterior.
           Mo = L inf +          ⋅i
                                                          d2 = Frec. de la clase modal menos la frecuencia de la

                         d1 + d2 
                                                               clase posterior.
                                                          i = Amplitud del intervalo.

                                                          La frecuencia de la clase modal es aquella que tiene la
                                                          mayor frecuencia. Si hay dos intervalos con igual
                                                          frecuencia se calculan los dos y sería una distribución
                                                          bimodal, si hay tres, sería trimodal y así suscesivamente.

MEDIDAS DE DISPERSIÓN:

       Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas de
dispersión se usan para poder verificar si el promedio es representativo o no de la muestra y como base
de control de la variación misma.

       Una dispersión pequeña indica un alto grado de uniformidad. Las medidas de dispersión son:
desviación estándar, varianza y rango.

VARIANZA:           La varianza es la suma de la distancia al cuadrado de la media y cada elemento de la
                    población entre el número total de elementos de la población.


La fórmula para datos no agrupados es:

                                 N                        S2 =Varianza.

                                 ∑ ( xi     − x) 2
                                                          xi = Dato individual o
                                                          marca de clase.

                          S2 =   i =1                      x = Media Aritmética.
                                                          N = Total de datos.
                                          N



Para la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo,
"dólares al cuadrado" o "dólares cuadrados", no son expresiones intuitivas claras de interpretar. Por

                                                                                                                    28
Estadística Descriptiva                                                       _____________ _____________ __________MC Raúl Adalberto_Morelos



esta razón, debe efectuarse un cambio significativo en la varianza para calcular una medida de
desviación útil, una que no presente problemas con las unidades de medidas y sea menos confusa.
Este parámetro es llamado la DESVIACIÓN ESTÁNDAR y es la raíz cuadrada de la varianza.
DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS

La desviación estándar permite determinar, con cierto grado de certeza dónde están localizados los
valores de una distribución de frecuencia con relación a la media.

Desviación estándar para datos agrupados (MÉTODO LARGO):
                                                                                         S = Desviación Estándar.
                                                                                         xi = Dato individual o marca
                                N                                                                de clase.

                            ∑ f (x − X ) i        i
                                                              2
                                                                                         X = Media Aritmética.

             S=              i =1                                                        N = Total de datos.
                                                                                         f = frecuencia del intervalo.
                                              N

Método corto para el cálculo de la desviación estándar:

                                                                          2                 S = Desviación Estándar.
                            n
                                              n        
                           ∑        fi ⋅ d   ∑ fi ⋅ di 
                                             i
                                              2                                             xi = Dato individual.
                                                                                            di = Desviación en unidades
             s=i           i =1
                                           −  i =1                            Ejemplo:            de intervalo.
                                    N              N                          En       el N = Total de datos.
                                                                              siguiente f = frecuencia del intervalo.
                                                       
                                                  ejemplo,
                                                                                            i = Amplitud de la clase.
                                                  aplicaremos todas las fórmulas antes mencionadas.
Seguiremos con el ejemplo de la página 18 de este documento.

               DISTRIBUCIÓN DE FRECUENCIAS PARA LAS CALIFICACIONES (PAG. 17)
                          CLASES                   MARCA          FRECUENCIA          FRECUENCIAS           FRECUENCIA
                                                                                                            ACUMULADA
                                                  DE CLASE                             RELATIVAS
                                                      xi                                  fr                    C
                     Li     -       Ls                                f
                   53.0 - 59.3                        56.15                4        4/80 = 0.05                      4
                   59.3 - 65.6                        62.45               13       13/80 = 0.1625                   17
                   65.6 - 71.9                        68.75                7        7/80 = 0.0875                   24
                   71.9 - 78.2                        75.05               30       30/80 = 0.375                    54
                   78.2 - 84.5                        81.35                9        9/80 = 0.1125                   63
                   84.5 - 90.8                        87.65               10       10/80 = 0.125                    73
                   90.8 - 97.1                        93.95                7        7/80 = 0.0875                   80
                  Suma de frecuencias =                       ∑f    = 80         ∑ fr   = 1.0000



Continuación de la Distribución de frecuencias para el método corto




                                                                                                                                            29
Estadística Descriptiva                                                               _____________ _____________ __________MC Raúl Adalberto_Morelos



                Desviación          Desviación                                                   Frecuencia de la clase
               Individual en       Individual al           FRECUENCIA de la clase             multiplicada por la desviación
               unidades de          cuadrado              multiplicada por la desviación         individual al cuadrado
                 intervalo                                           individual
                                                                                                          f d²
                   d                   d²                            f d
                   -3                  9                             -12                                  36
                   -2                  4                             -26                                  52
                   -1                  1                              -7                                   7
                    0                  0                               0                                   0
                    1                  1                               9                                   9
                    2                  4                              20                                  40
                    3                  9                              21                                  63
                                                     ∑f d=            5                    ∑f    d² = 207

Nota:
d = Desviación individual, se divide la distribución en 2 partes, colocando un cero en el intervalo
central, todos los valores de desviación individual hacia arriba son negativos y todos los valores de
desviación individual hacia abajo son positivos. Aquí suponemos que la media aritmética está al centro
de la distribución y que se comporta de forma NORMAL alejándose en una unidad tanto hacia arriba
como hacia abajo. El método funciona colocando CERO en cualquier intervalo, pero respetando los
signos tanto hacia arriba como hacia abajo. Por lo regular siempre se coloca en el intervalo central.

A = Media supuesta, se toma la MARCA DE CLASE del intervalo central ó donde hallamos colocado el
cero para iniciar la desviación individual, en este caso sería 75.05.

Calculando el promedio por el “método corto” tendremos:

                                                 N

                                            ∑ f ⋅d    i          i
                                                                                                   5
                      x = A+                 i =1
                                                                     ⋅ i = 75.05 +                   6.3 = 75.443
                                                     N                                            80
                                                                               2
                               n
                               n
                                                                                                                                    Pueden
                   ∑ fi ⋅ d  ∑ fi ⋅ di    i
                                             2

                                                207  5 
                                                          2                                                                          comprobarlo
             s = i i =1     −  i =1     = 6.3    −        = 10.12634                                                               con el cálculo
                        N           N         80  80 
                                                                                                                                   de la Media
                                                                                                                                     aritmética y la
                              
                                       
                                                                                                                                    desviación
                                                                                                                                     estándar
utilizando el método largo.

La mediana y la moda se calculan de forma normal.



Cálculo de la Mediana (Md):
                                                                             80 + 1
                                         N +1
                                                   − Cant                           − 24
           Md = L inf +                   2
                                                                ⋅ i = 71.9 +   2         6.3 = 75.365
                                                   f Md                          30                                                                 30
Estadística Descriptiva                                                       _____________ _____________ __________MC Raúl Adalberto_Morelos




NOTA:
No hay mucha diferencia entre utilizar 80/2 y (80+1)/2, en este caso debemos de utilizar la de datos pares, el resultado de la Md = 75.26


Cálculo de la Moda (Mo):

              d1                            30 − 7
Mo = L inf +            ⋅ i = 71.9 +                       6.3 = 75.193
              d1 + d 2               [ 30 − 7] + [ 30 − 9]




Bibliografía.
Anderson, D. (2007) Estadística para Administración y Economía. México: Pearson
Berenson, M., Levine, D. (1996) Estadística Básica en Administración, Conceptos y Aplicaciones. (6aEd.). México :Prentice Hall Hispanoamericana
Hildebrand, D. (1998). Estadística Aplicada a la Administración. México: Pearson
Levin, R. I., (2004). Estadística para Administración y Economía. México: Pearson
Levine, D., Krehbiel, T., Berenson, M. (2006). Estadística para Administración. (4ta. Ed.). México.:Printece Hall
Webster, A. (2005). Estadística Aplicada a los Negocios y la Economía. (3ra Ed. ). México: Prentice Hall.
Stephen, P. Shao (1970) Estadística para economistas y administradores de empresas. (6aEd.). México: Trillas




                                                                                                                                                  31

Más contenido relacionado

La actualidad más candente

Los Sistemas De InformacióN Y Su Importancia Para
Los Sistemas De InformacióN Y Su Importancia ParaLos Sistemas De InformacióN Y Su Importancia Para
Los Sistemas De InformacióN Y Su Importancia Para
Wylmar
 
Sistemas y Tecnologias de la Información
Sistemas y Tecnologias de la InformaciónSistemas y Tecnologias de la Información
Sistemas y Tecnologias de la Información
profgloria
 
Trabajo de modelo matematico
Trabajo de modelo matematicoTrabajo de modelo matematico
Trabajo de modelo matematico
Luis Casaña
 
Auditoria de sistemas
Auditoria de sistemasAuditoria de sistemas
Auditoria de sistemas
Paola Yèpez
 

La actualidad más candente (20)

Datos estándar estudio del trabajo 2
Datos estándar estudio del trabajo 2Datos estándar estudio del trabajo 2
Datos estándar estudio del trabajo 2
 
Investigación de operaciones
Investigación de operacionesInvestigación de operaciones
Investigación de operaciones
 
Modelos de sistem as de informacion
Modelos de sistem as de informacionModelos de sistem as de informacion
Modelos de sistem as de informacion
 
Medidas de tendencia central
Medidas de tendencia central Medidas de tendencia central
Medidas de tendencia central
 
Modelos matematicosl aplicados a ciencias agropecuarias
Modelos matematicosl aplicados a ciencias agropecuariasModelos matematicosl aplicados a ciencias agropecuarias
Modelos matematicosl aplicados a ciencias agropecuarias
 
Sistematización contable y financiera: Análisis de los Sistemas Contables
Sistematización contable y financiera: Análisis de los Sistemas ContablesSistematización contable y financiera: Análisis de los Sistemas Contables
Sistematización contable y financiera: Análisis de los Sistemas Contables
 
Los Sistemas De InformacióN Y Su Importancia Para
Los Sistemas De InformacióN Y Su Importancia ParaLos Sistemas De InformacióN Y Su Importancia Para
Los Sistemas De InformacióN Y Su Importancia Para
 
Clustering
ClusteringClustering
Clustering
 
Introducción a la investigación de operaciones
Introducción a la investigación de operacionesIntroducción a la investigación de operaciones
Introducción a la investigación de operaciones
 
Sistemas y Tecnologias de la Información
Sistemas y Tecnologias de la InformaciónSistemas y Tecnologias de la Información
Sistemas y Tecnologias de la Información
 
Historia de la investigación de operaciones
Historia de la investigación de operacionesHistoria de la investigación de operaciones
Historia de la investigación de operaciones
 
Importancia de la investigación de operaciones en las organizaciones
Importancia de la investigación de operaciones en las organizacionesImportancia de la investigación de operaciones en las organizaciones
Importancia de la investigación de operaciones en las organizaciones
 
Muestreo del-trabajo
Muestreo del-trabajo Muestreo del-trabajo
Muestreo del-trabajo
 
Cruz Maltesa
Cruz MaltesaCruz Maltesa
Cruz Maltesa
 
Trabajo de modelo matematico
Trabajo de modelo matematicoTrabajo de modelo matematico
Trabajo de modelo matematico
 
Tgs, complejidad y msb
Tgs, complejidad y msbTgs, complejidad y msb
Tgs, complejidad y msb
 
TAAC, Técnicas de auditoria asistida por computador
TAAC, Técnicas de auditoria asistida por computadorTAAC, Técnicas de auditoria asistida por computador
TAAC, Técnicas de auditoria asistida por computador
 
Auditoria de sistemas
Auditoria de sistemasAuditoria de sistemas
Auditoria de sistemas
 
1.2 Definición de simulación
1.2 Definición de simulación   1.2 Definición de simulación
1.2 Definición de simulación
 
Ejemplo de-simulación-continua
Ejemplo de-simulación-continuaEjemplo de-simulación-continua
Ejemplo de-simulación-continua
 

Destacado (8)

Material EstadíStica Ii
Material EstadíStica IiMaterial EstadíStica Ii
Material EstadíStica Ii
 
3289672
32896723289672
3289672
 
Nociones de estadisticas
Nociones de estadisticasNociones de estadisticas
Nociones de estadisticas
 
Fms
FmsFms
Fms
 
PowerPoint - Tema: Prueba de Hipotesis
PowerPoint - Tema: Prueba de HipotesisPowerPoint - Tema: Prueba de Hipotesis
PowerPoint - Tema: Prueba de Hipotesis
 
Ejercicio de datos agrupados
Ejercicio de datos agrupadosEjercicio de datos agrupados
Ejercicio de datos agrupados
 
Regla sturges
Regla sturgesRegla sturges
Regla sturges
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 

Similar a Estadistica general

Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdfTrabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
aljrzas
 
Trabajo tecnologia liceo departamental 11-3
Trabajo tecnologia liceo departamental 11-3Trabajo tecnologia liceo departamental 11-3
Trabajo tecnologia liceo departamental 11-3
sofia577892
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
JuanPistola
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
JaredOsoriol
 

Similar a Estadistica general (20)

Estadistica general
Estadistica generalEstadistica general
Estadistica general
 
Estadistica
EstadisticaEstadistica
Estadistica
 
LA ESTADISTICA
LA ESTADISTICALA ESTADISTICA
LA ESTADISTICA
 
Trabajo sistemas(finaaal)
Trabajo sistemas(finaaal)Trabajo sistemas(finaaal)
Trabajo sistemas(finaaal)
 
Trabajo sistemas
Trabajo sistemasTrabajo sistemas
Trabajo sistemas
 
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdfTrabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
 
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdfTrabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
 
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdfTrabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
 
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdfTrabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
Trabjo de Tecnologia. Métodos Estadísticos. 11-5.pdf
 
Trabajo de estadistica
Trabajo de estadisticaTrabajo de estadistica
Trabajo de estadistica
 
Trabajo tecnologia (1).pdf docuemnto de teconologia
Trabajo tecnologia (1).pdf docuemnto de teconologiaTrabajo tecnologia (1).pdf docuemnto de teconologia
Trabajo tecnologia (1).pdf docuemnto de teconologia
 
Trabajo tecnologia. Metodos estadísticos
Trabajo tecnologia. Metodos estadísticosTrabajo tecnologia. Metodos estadísticos
Trabajo tecnologia. Metodos estadísticos
 
Trabajo tecnologia liceo departamental 11-3
Trabajo tecnologia liceo departamental 11-3Trabajo tecnologia liceo departamental 11-3
Trabajo tecnologia liceo departamental 11-3
 
Trabajo en grupo de tecnología #1 (Excel)
Trabajo en grupo de tecnología #1 (Excel)Trabajo en grupo de tecnología #1 (Excel)
Trabajo en grupo de tecnología #1 (Excel)
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
Taller excel y estadistica 11-1 Stephania.pdf
Taller excel y estadistica 11-1 Stephania.pdfTaller excel y estadistica 11-1 Stephania.pdf
Taller excel y estadistica 11-1 Stephania.pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 

Último

ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
zulyvero07
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
El Fortí
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
JonathanCovena1
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Francisco158360
 

Último (20)

Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIAFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
Imperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperioImperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperio
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 

Estadistica general

  • 1. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos APUNTES DE ESTADÍSTICA DESCRIPTIVA MC Raúl Adalberto Morelos Centro de Estudios Superiores del Estado de Sonora Unidad Académica de San Luis Río Colorado, Sonora México. Revisión Noviembre 2011 1
  • 2. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Índice Tema Página Unidad 1 Conceptos Básicos ¿Qué es la estadística? ------------------------- 3 Datos estadísticos ----------------------------------------------------------- 4 Importancia Actual de la estadística ------------------------------------ 4 Clases de estadística ------------------------------------------------------- 5 Estadística Descriptiva ------------------------------------------------------ 6 Estadística Inferencial ------------------------------------------------------- 6 Definición del concepto de estadística ---------------------------------- 7 Ejercicio 1.1 -------------------------------------------------------------------- 9 Ejercicio 1.2 -------------------------------------------------------------------- 9 Unidad 2 Métodos estadísticos ------------------------------------------------------- 10 Recopilación de datos ------------------------------------------------------ 11 Organización de datos ----------------------------------------------------- 12 Organización de datos usando arreglos ------------------------------- 15 Organización de datos usando una distribución de frecuencias -------------------------------------------------------------------- 15 Número de clases o intervalos ------------------------------------------- 16 Amplitud de clases ---------------------------------------------------------- 17 Tabla de frecuencias -------------------------------------------------------- 18 Datos fundamentales de una tabla de frecuencia ------------------- 18 Otros métodos de presentación de datos ----------------------------- 19 Partes principales de una tabla ------------------------------------------ 20 Gráficas estadísticas -------------- ---------------------------------------- 21 Representación gráfica de una tabla de frecuencia ---------------- 22 Ejercicio 2.1 ------------------------------------------------------------------- 24 Medidas de tendencia central para datos NO agrupados --------- 26 Medidas de tendencia central para datos agrupados -------------- 27 Medidas de dispersión para datos No agrupados ------------------ 28 Medidas de dispersión para datos agrupados ----------------------- 29 Bibliografía --------------------------------------------------------------------- 29 2
  • 3. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos ESTADÍSTICA GENERAL. CONCEPTOS BÁSICOS ¿QUE ES LA ESTADÍSTICA? Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer lugar, comprender lo que él termino significa en la actualidad así como conocer algo de su origen. Como en la mayoría de los vocablos, la palabra “estadística” tiene diversos significados para diferentes personas. Cuando la mayoría de la gente escucha el término lo relaciona con cuadros o tablas llenas de cifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automóviles, etc., que ofrecen, por ejemplo, en los almanaques anuales, y que indudablemente usan el término con toda corrección. A decir verdad, el término en cuestión fue inicialmente usado para tabular las funciones del Estado en lo que respecta a los datos necesarios para una planeación idónea, reglamentaciones y recaudación de impuestos. Los cobradores de impuestos y los encargados de hacer este tipo de análisis eran llamados “estadísticos” por su dedicación a compaginar datos e informes requeridos por el Estado. En la actualidad, desde luego, la palabra “estadística” se aplica en este primer sentido para casi todo relacionado con los informes basados en hechos y consignados en base a números, lo que comúnmente se denomina: “Hechos y cifras”. Los anunciadores de radio y televisión nos informan que “en unos cuantos minutos darán la estadística del juego ...”y los periódicos con frecuencia publican artículos a cerca de concursos de belleza en los cuales brindan las “estadísticas” de las concursantes. Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con la materia los desconoce. La estadística es una rama del conocimiento el campo de las matemáticas aplicadas, que utiliza sus propios símbolos, términos, contenido, teoremas y técnicas. Cuando se estudia la “estadística” normalmente se pretende dominar algunas de estas técnicas. Para todos aquellos ya iniciados en los misterios de campo de las estadísticas, el vocablo tiene una segunda aceptación; las estadísticas son cantidades que han sido calculadas con datos de muestreo: una sola cantidad así calculada se denomina “estadística”. Por ejemplo, la media de la muestra es una estadística, así como también lo son la mediana de la muestra y el modo. La varianza de la muestra es una estadística, como también lo es la gama de la muestra. El coeficiente de correlación de la muestra es asimismo una estadística. La estadística está desarrollada para tratar con datos numéricos o información cuantitativa. La palabra "estadística", por lo tanto ha sido ampliamente referida ya sea a la información cuantitativa misma como a los métodos que tratan con la información. Los estadísticos prefieren llamar a la información cuantitativa Datos Estadísticos y a los métodos que tratan con la información los Métodos Estadísticos. Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales podemos recolectar, organizar, presentar y analizar datos numéricos de un conjunto de individuos permitiéndonos extraer conclusiones válidas y efectuar decisiones lógicas basadas en dicho análisis. Los DATOS son agrupaciones de cualquier número de observaciones relacionadas. Para que los datos sean útiles, las observaciones deben estar organizadas en tal forma que se puedan identificar tendencias y llegar a conclusiones lógicas. 3
  • 4. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos DATOS ESTADÍSTICOS La información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o conjuntos) de números que muestren relaciones significativas. En otras palabras, los datos Estadísticos son números que pueden ser comparados, analizados e interpretados. Un número aislado que no se compara o que no muestra relación significativa con otro número no es dato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos estadísticos, puesto que las edades pueden ser comparadas y analizadas, y los resultados de los análisis pueden ser interpretados. El área de la cual los datos estadísticos son recopilados, se le conoce como población o universo. Si deseamos tener las edades de 25 estudiantes en la clase de Biometría, podemos simplemente preguntar a cada estudiante su edad: así tenemos un conjunto completo de datos. Sin embargo recopilar tales datos de una población finita pero grande es algunas veces imposible o impráctico. A fin de evitar la tarea imposible o impráctica, usualmente se extrae una muestra de elementos representativos de la población. La muestra entonces, utilizada para el estudio estadístico y los resultados de la muestra son usados como las bases para describir, estimar o predecir las características de la población. Podemos resumir los significados del término “Estadística” como sigue: 1. La acepción publica de cifras y hechos, gráficas y mapas. El término en este sentido se usa en plural. 2. La materia propiamente dicha, con su terminología, metodología y conocimientos particulares. Bajo este concepto el término se usa en singular. 3. Cantidades calculadas sobre datos de muestreo, en cuyo caso el término se usa en plural. IMPORTANCIA ACTUAL DE LA ESTADÍSTICA La aplicación de las técnicas estadísticas se ha extendido tanto, y la influencia de la estadística en nuestra vida es tan grande, que difícilmente podemos ponderarla lo bastante. Nuestra abundancia agrícola actual se puede explicar parcialmente gracias a la aplicación de la estadística a los planos y a los análisis de los experimentos agrícolas. Este es un campo en el cual la técnica estadística se utilizó relativamente al principio. Algunas de las preguntas que los métodos de la estadística ayudan a contestar son: ¿Qué clase de maíz da los mejores rendimientos? ¿Qué clase de mezcla alimenticia se debe dar a las gallinas para que obtengan el mayor peso? ¿Qué clase de mezcla de semillas de pasto da mayor número de toneladas de forraje por hectárea? Todas estas preguntas y cientos mas nos afectan a todos en forma directa a través del mercado domestico. La metodología de la estadística también se usa constantemente en la investigación médica y farmacéutica. La eficacia de nuevos medicamentos se determina por medio de experimentos realizados primero en animales y, posteriormente, en seres humanos. Los adelantos de la investigación médicas y las nuevas drogas nos afectan casi a todos. La estadística también es empleada por los gobiernos. La información económica es objeto de estudio y afecta la política del gobierno en lo que respecta a los impuestos y a partidas asignables a obras públicas (tales como caminos, presas, etc.), a fondos para la asistencia pública, y otros. La estadística 4
  • 5. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos del desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Los métodos estadísticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar, desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teoría de las probabilidades y la estadística (especialmente un nuevo campo llamado teoría estadística de la toma de decisiones) se usan como ayuda para tomar decisiones sumamente importantes en los altos niveles. En cuanto a la industria privada, el empleo de las estadísticas es casi tan importante en sus efectos como en el sector gubernamental. Se usa las técnicas estadísticas para el control de calidad de los productos en proceso y para evaluar la aceptación de los nuevos productos que se van a lanzar al mercado. La estadística se emplea en el mercado, en las decisiones para la ampliación de los negocios, en el análisis de la eficacia de la publicidad, etc. Las compañías de seguros se basan en las estadísticas para fijar sus tarifas a un nivel realista. La lista sería interminable. La estadística se emplea en la geología, biología, psicología, sociología; en todo sector en el que las decisiones deben de hacerse a base de los datos o informes incompletos. Se usan también en pruebas educacionales, para medidas de seguridad en la ingeniería. La meteorología, la ciencia de la predicción del tiempo, también esta usando la estadística actualmente. Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría supuesto que las estadísticas ayudaran a un erudito o a un investigador histórico a determinar quien es el autor de obras en disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de las estadísticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literarios en los “Federalist Papers”. En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena tiene la pesca de las truchas; sobre cual sería el tipo más adecuado del vaso para el agua de los restaurantes; así como la estrategia óptima para juegos de destreza y azar, tales como el bridge, los solitarios, el veintiuno, el béisbol, etc. No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todo y en cada uno de nosotros. Los resultados de los estudios estadísticos se pueden ver, aunque quizás no se comprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios de las primas de seguros, en nuestra satisfacción al consumir diversos productos y en nuestra propia salud. CLASES DE ESTADÍSTICA La estadística normalmente se divide en dos grandes categorías: La estadística DESCRIPTIVA y la estadística INFERENCIAL. Como complemento a las breves consideraciones de los elementos básicos de la probabilidad, hay dos clases de estadísticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo de estadística es el de estadística descriptiva. La clasificación de datos; el trazo de los histogramas que corresponden a las distribuciones a una población; la representación de los datos por medio de otras clases de gráficas, tales como las lineales, las gráficas en barras, los pictogramas; él cómputo de medidas muestrales, medianas y modos; él cómputo de varianzas, las medidas de las desviaciones absolutas y de la gama; todas estas operaciones se refieren a la estadística descriptiva. La labor estadística ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadística descriptiva. 5
  • 6. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos ESTADÍSTICA DESCRIPTIVA Significado de Estadística La palabra “Estadística” ha sido frecuentemente referida a la información cuantitativa o numérica. También ha sido referida ampliamente a los métodos que se tratan con la información. Sin embargo esto debería aclararse y llamar a la información, datos estadísticos y a los métodos, métodos estadísticos. La estadística descriptiva es la parte de la estadística que agrupa las técnicas apropiadas para la organización, representación y descripción de un conjunto de datos con el propósito de resaltar sus rasgos más importantes y extraer la información esencial que contiene. En nuestros términos, diremos que la estadística descriptiva permite tener una visión “a vuelo de pájaro” de la variable que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para la toma de alguna decisión. En pocas palabras, la Estadística Descriptiva permite tener una visión “a vuelo de pájaro”, de la variable que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio más fino de la misma, para la toma de alguna decisión. Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de Historia. Como él está usando estadística para describir el comportamiento de esa clase y no para hacer una generalización acerca de varias clases, se puede decir que él está usando estadística descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal forma que sean más fáciles de entender son ejemplos de estadística descriptiva. ESTADÍSTICA INFERENCIAL Y su significado La segunda parte importante de la estadística se refiere a la Estadística Inferencial. Antes definimos a la estadística como la ciencia para tomar decisiones ante alguna incertidumbre; esto es, llegar a la mejor resolución sobre bases de una información incompleta. Con el fin de llegar a una decisión sobre una población, se toma una muestra (generalmente de unos cuantos de los miembros) de esa población. Dicha selección se hace, generalmente, al azar, a pesar de que existen varios medios de muestreo. En este libro nos circunscribimos al uso del muestreo al azar. Por lo que dicho término implica, se puede apreciar que se trata de un método de muestreo en los que los elementos que lo integran son seleccionados bajo un proceso que no esta bajo el control del investigador. Se conocen varias definiciones de matemáticas del muestreo del azar, pero nosotros lo aceptaremos como un muestreo en el que cada elemento escogido de la población tiene la misma oportunidad de ser seleccionado, y en el que la selección de cualquier elemento no afecta que se pueda seleccionar cualquier otro. Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la población. La inferencia que hacemos acerca de la población sobre bases de este tipo de muestreo se conoce como inferencia estadística. En otras palabras, la inferencia estadística es el empleo de la técnica de muestreo para llegar a determinadas conclusiones acerca de la población de la cual se han obtenido las muestras. De manera general, la Estadística Inferencial es: la Estadística mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información parcial o incompleta obtenida mediante técnicas descriptivas. Los datos se analizan de una manera más detallada, se interpretan y se infieren. 6
  • 7. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Si una muestra es representativa de una población, se puede deducir importantes conclusiones acerca de ésta, a partir del análisis e interpretación de la misma. Ejemplo 1.2: Supóngase ahora que el profesor de Historia decide usar las notas promedios en una de la clase de Historia para estimar la nota promedio obtenida en los diez grupos del mismo curso de Historia. El proceso para estimar esta nota será un problema de inferencia estadística. Obviamente, cualquier conclusión que realice el profesor acerca de los diez grupos del curso estará basada en una generalización que va más allá de los datos originalmente obtenidos en el curso de Historia. La generalización del profesor puede no ser completamente válida y él debe establecer cuanto tiene de cierto. Al efectuar una investigación o experimento, es necesario definir qué datos se pretenden obtener de la POBLACIÓN en estudio. Para ello debemos definir los siguientes conceptos: POBLACIÓN: Es una agrupación de todos los elementos que se están estudiando y de los cuales se está tratando de obtener conclusiones. Se debe definir esta población para precisar si un elemento que pertenece a la población. POBLACIÓN FINITA: Cuando una población consta de un número limitado (finito) de elementos. Por ejemplo, si se desea obtener información acerca de la capacidad didáctica de los 40 profesores de una universidad, se obtendrán datos de una población finita. POBLACIÓN INFINITA: Cuando una población consta de un número ilimitado de elementos. Por ejemplo, la población formada por todos los posibles sucesos (cara, sol) en tiradas sucesivas de una moneda es infinita, puesto que hipotéticamente la moneda puede lanzarse un número infinito de veces. MUESTRA: Una muestra es una agrupación de algunos elementos de la población, pero no todos. La mayoría de las veces no es posible o práctico observar todos los elementos de la población, en todo caso se toma solo una parte de ella. PARÁMETRO: Cuando una medida se calcula a partir de los datos de una población. ESTADÍSTICO: Cuando una medida se calcula a partir de los datos de una muestra. MEDIDA ESTADÍSTICO (MUESTRA) PARAMETR0 (POBLACIÓN ) Media aritmética (Promedio) µ x Desviación Estándar S σ Número de datos o elementos n N VARIABLE: Es una característica que toma valores diferentes en personas, lugares y cosas diferentes. VARIABLE ALEATORIA: Son variables cuyos valores son el resultados de factores fortuitos. VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los valores que esta puede obtener (estos valores se asocian a cualquier valor entero). Ejemplos 1.3: • El número de automóviles vendidos en un mes. • El número de clientes esperando servicio en la caja de un supermercado. • El número de tubos electrónicos de T.V. producidos en una hora determinada. 7
  • 8. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos VARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos los contenidos en un intervalo de recta. Ejemplo 1.4: • La cantidad de energía eléctrica producida en una planta hidroeléctrica en un día. • El tiempo necesario para completar el ensamblaje de un artículo en una planta. • La cantidad de petróleo bombeado cada hora en un pozo. La estadística está desempeñando un importante papel ascendente en casi todas las facetas del progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia se extiende a la agricultura, biología, negocios, química, comunicaciones, economía, educación, electrónica, medicina, física, ciencias políticas, psicología, sociología, y otros campos de la ciencia. Este desarrollo de la estadística está ligada a los métodos científicos en la toma, organización, presentación y análisis de los datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todos y cada uno de nosotros. Los resultados estadísticos se pueden ver, aunque quizás no se comprendan, al recibir nuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestra satisfacción al consumir diversos productos y en nuestra propia salud. 8
  • 9. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos EJERCICIOS 1.1: ESTADÍSTICA GENERAL. 1) Identifique las variables aleatorias siguientes como discretas o continuas. a) El número de transistores defectuosos en un embarque de 10,000 transistores. b) El número de robos ocurridos en un almacén en un período de tiempo. c) La cantidad de gasolina consumida por un vehículo en una prueba de 100 km. d) Las ventas brutas de un supermercado en un día determinado. e) El número de pólizas vendidas en una determinada semana por un agente de seguros. f) La demanda diaria de energía eléctrica en una determinada ciudad. g) La duración de una bombilla eléctrica observada en un experimento. EJERCICIOS 1.2: ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Identifique, en dónde se está utilizando la estadística descriptiva y dónde la inferencial. 1.- En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas con base en estas calificaciones identifíquense aquellas que se derivan de métodos descriptivos y aquellos que se derivan de inferencia estadística. a) La calificación promedio de los tres trabajadores es 85, y la calificación promedio de las tres trabajadoras es 89. b) La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los trabajadores. c) En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones mas bajas que las trabajadoras. 2.- Tres bombillas de marca A dejaron de funcionar después de 1100, 900 y 1000 hrs. de uso continuo. Cuatro bombillas de la marca B dejaron de funcionar después de 1050, 960, 1070 y 840 hrs. de uso continuo. Se llega a las siguientes conclusiones, ¿Cuáles de ellas provienen de la estadística descriptiva y cuáles de la inferencial? a) La duración promedio de las tres bombillas marca A es de 1000 hrs mientras que la duración promedio de las cuatro bombillas marca B es de 980 hrs. b) La duración promedio de todas las bombillas marca A es mayor que todas las bombillas de la marca B. c) La diferencia entre los dos promedio es de 20. d) La diferencia entre los dos promedio es demasiado pequeña para llegar a la conclusión de que las bombillas marca A son mejores que la marca B. e) Si se selecciona y prueba otra bombilla de marca A, probablemente durará más que el promedio de las bombillas marca B. f) Usted decide comprar bombillas marca A en vez de bombillas marca B. 9
  • 10. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Unidad 2: DESCRIPCIÓN DE LOS DATOS. Cuando los datos están organizados en una forma compactada y fácil de utilizar, se puede obtener información del medio digna de confianza y utilizarla para decisiones inteligentes MÉTODOS ESTADÍSTICOS En un estudio estadístico los métodos estadísticos son divididos en cinco pasos básicos. a) Recopilación. d) Análisis. b) Organización. e) Interpretación. c) Presentación. Estrictamente hablando, no hay línea de división definitiva que separe los cinco pasos básicos. Algunos de los métodos pueden ser usados en más de un paso. a) RECOPILACIÓN DE DATOS De acuerdo a la localización de la información los datos estadísticos pueden se clasificados en datos Internos y datos Externos. DATOS INTERNOS: Es cuando la información cuantitativa es obtenida dentro de la organización que hace el estudio estadístico; Tal como los sueldos de empleados de una lista de pagos, recibos de caja de la oficina de contabilidad de la organización. DATOS EXTERNOS: Es cuando la información es obtenida fuera de la organización. Los datos externos son usualmente obtenidos de dos maneras: - Datos publicados: (revistas, periódicos, instituciones de investigación, universidades, publicaciones editadas por gobierno federal, editores privados, etc...) - Encuestas de datos originales (encuestas, entrevistas, etc..) 1).- Obtención de datos publicados. Los datos publicados pueden ser obtenidos fácilmente si las fuentes de datos son conocidas por el lector. En relación con esto, es importante conocer las clases de fuentes de datos y las fuentes de datos publicados. 1.1) FUENTE PRIMARIA Y SECUNDARIA Las fuentes de datos publicados pueden ser clasificadas en dos clases primarias y secundarias. Una fuente de datos se denomina primaria cuando los datos obtenido de la publicación EDITADA por el recopilador original de los datos. La fuente llamada secundaria cuando los datos son obtenidos de una reimpresión, la cual es publicada por una organización distinta del recopilador original. FUENTES DE DATOS PUBLICADOS Los siguientes siete grupos son las fuentes más importantes de datos publicados con relación a las actividades de los negocios y económicos, aunque de ninguna manera puede considerarse como una lista completa de fuentes. 10
  • 11. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos a).- Agencias gubernamentales b).- Asociaciones empresariales c).- Revistas y publicaciones periódicas de empresas d).- Periódicos y almanaques e).- Organizaciones privadas de servicio de estadística f).- Organizaciones internacionales g).- Otras organizaciones de negocios y educativas ELABORACIÓN DE UNA ENCUESTA El trabajo de elaborar una encuesta esta usualmente limitado por los factores del tiempo, dinero y mano de obra disponible para el estudio. En vez de recopilar información completa relacionada con el estudio, una muestra consistente de un grupo de elementos representativos es ordinariamente sacada de la fuente de información (población) en una encuesta. Los métodos más comunes de recopilación de datos a través de muestras son: Observación Directa y Formulación de Preguntas. OBSERVACIÓN DIRECTA El método de observación directa puede dar información exacta y es usualmente preferida, ya que puede ser empleado efectiva y económicamente. Sin embargo, está limitado a unos pocos tipos de estudio y es a menudo demasiado inconveniente en observaciones reales de ciertas operaciones. Ejemplos: a).- Si un investigador desea conocer los precios de menudeo de los alimentos de una ciudad puede ir a un grupo seleccionado de tiendas para observar los precios marcados en los mismos. b).- Si deseamos conocer el ingreso recibido en una semana por un grupo de taxistas sería muy inconveniente observarlos a ellos. Sería más práctico y fácil obtener los resultados haciéndoles ciertas preguntas. FORMULACIÓN DE PREGUNTAS Hay 3 formas de hacer preguntas a fín, de recopilar datos originales. a).- Entrevistas personales b).- Por teléfono c).- Cuestionario por correo Al diseñar un cuestionario debemos de tener presente los siguientes puntos: 1).- El número de preguntas deberá ser conservado en un mínimo 2).- Las preguntas deberán ser breves y claras 3).- Preguntas ofensivas deberán ser evitadas 4).- Preguntas que induzcan a una respuesta no deberán ser usadas 5).- Las preguntas deberán ser fáciles de contestar 6).- Las preguntas deberán requerir contestaciones simples. 11
  • 12. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Reglas de Redacción y contenido de las Preguntas: 1.- Facilitar la memoria: No debe preguntarse sobre hechos ocurridos hace mucho tiempo; las preguntas deben limitarse al pasado inmediato (un mes máximo) 2.- No deben usarse más palabras de las que sean necesarias (máximo 20 por pregunta). 3.- Las palabras empleadas deben ser simples, fáciles de pronunciar y de ser posible de uso común. 4.- Deben evitarse al máximo emplear términos comerciales o de negocios y palabras cargadas o insinuantes. Ej. ¿Verdad que la Compañía X es la mejor de su ramo? 5.- Asimismo al elaborar la pregunta debe tenerse cuidado en no dar la respuesta. Ej. ¿Asiste usted al cine por lo menos una vez a la semana? 6.- No debe forzarse a la persona a que realice cálculos, complicados porque ésta, tenderá a cansar rápidamente al entrevistado. Ej. ¿Cuántos Kgrs. de azúcar se consumen en su hogar? 7.- Cuando se tenga que realizar una pregunta que por su naturaleza sea embarazosa o difícil de contestar, es necesario planear cuidadosamente su redacción, para evitar una gran cantidad de contestaciones falsas. Ej. ¿Cada cuántos días se baña usted? 8.- Al realizar preguntas referidas a tiempos es necesario fijar intervalos adecuados a las posibles contestaciones y la pregunta debe referirse de preferencia a una fecha concreta. Ej. ¿Cuándo fue la última vez que asistió usted al cine? 9.- Cuando tratan de medirse aspectos relacionados con la calidad de un producto, o bien su sabor, su aroma, su aspecto y otras características similares, es recomendable el uso de respuestas preformuladas, utilizando escalas de conceptos o de valores o una combinación de ambas. Ej. Excelente 3 Muy Bueno 2 Bueno 1 Regular 0 Malo -1 Muy Malo -2 Pésimo -3 10.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que son susceptibles de provocar reacciones de tipo Psicológico positivo o negativos y alterar la respuesta. Ej. El Presidente de la República mencionó en su discurso. ¿Usted qué Opina? En este caso el presidente eclipsa el asunto que se discutía. 12
  • 13. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos 11.- Por último es conveniente destacar los siguientes puntos que influyen en forma determinante en la redacción de un buen cuestionario: • No abrumar con palabras altisonantes. • Construir las preguntas gramaticalmente breves • No usar vulgarismos • No someter a negativas dobles. • Evitar dobles significados. • Evitar preguntas capciosas. • Mencionar lo que antecede, siempre que exista la posibilidad de olvido o confusión. Elementos del Cuestionario. Reporte: Es una breve introducción al tema, objetivo de la encuesta se usa para crear confianza y cooperación en el encuestado. Consigna: Es la indicación de como contesta a determinada pregunta, debe ser muy explícita al diseñarse y haber un número máximo e igual de las preguntas. Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc. Pregunta introductoria: Deben ser fáciles de contestar, están antes del tema principal y sirven para introducirlo. Preguntas Básicas: Es el elemento clave del cuestionario aquel están traducida las observaciones de la investigación y deben ser lo suficientemente extensas para que cubra los mismos. Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, como cuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferente manera la misma pregunta. Pregunta de Clasificación: Tara de la información sobre el individuo, edad sexo domicilio, no. de hijos, nacionalidad etc., son preguntas de identificación al final del cuestionario por que podrían influir en la respuesta si fueran al principio. ORGANIZACIÓN DE DATOS ESTADÍSTICOS Dentro de una organización de datos estadísticos debemos tomar en cuenta: 1).- Crítica y corrección de datos recopilados. Un corrector puede encontrar una o varias de las siguientes cosas que deberían ser corregidas y tratadas. a).- Las respuestas son inconsistentes b).- La escritura no es determinable c).- Las respuestas son incompletas d).- Se necesitan cálculos 2).- Clasificación de datos corregidos. Hay muchas formas de clasificar datos estadísticos en general las clasificaciones pueden ser determinadas de acuerdo a 4 bases: Tiempo, lugar, cantidad y cualidad. 13
  • 14. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos CUALITATIVA.- En esta clasificación la distinción es mas bien de clases que de cantidad. Por ejemplo, cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferencia cualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios, administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con su origen. CUANTITATIVA.- Cuando los valores se modifican con respecto a una característica mensurable, conviene una clasificación cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con él numero de hijos, las empresas industriales, según él número de obreros empleados y también desacuerdo con el valor de los artículos producidos. La mayoría de las distribuciones cuantitativas son distribuciones de frecuencia, que son la forma básica de organización de los datos para sus análisis estadísticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre bases cuantitativas, mediante cambios muy ligeros. CRONOLÓGICA.- Los datos cronológicos o las series cronológicas contienen cifras relativas a un fenómeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrar la cotización diaria de cierre de ciertas acciones durante un periodo de meses o años, puede registrarse el coeficiente anual de natalidad de varios años, puede indicarse la producción mensual de carbón durante un lapso dado de años. Las series cronológicas tiene un cierto modo algún parentesco con las distribuciones cuantitativas, por el hecho de que cada año o mes sucesivo de una serie esta un año o un mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o más bien los acontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre sí. Ocasionalmente una serie cronológica puede convertirse en una distribución de frecuencias. GEOGRÁFICA.- La distribución geográfica es esencialmente un tipo de distribución cualitativa, pero en general se considera como una clasificación especial. Por ejemplo, cuando se muestra la población de cada unos de los estados, tenemos datos clasificados geográficamente. Aun cuando existe una diferencia cualitativa entre dos estados cualesquiera, la distinción que se establece no es de clase sino de situación. A veces es posible esperar una distribución geográfica en forma de distribución de frecuencias. 3).- Tabulación de datos clasificados. Después de que se han decidido las clasificaciones adecuadas o deseadas el siguiente paso en la organización de los datos es arreglar la masa de hechos cuantitativos en una forma resumida basadas en las clasificaciones. Este proceso se llama tabulación son: 1).- Tarjetas de escritura manual 2).- Hojas de registro 3).- Tarjetas de perforación manual 4).- Tarjetas perforadas 5).- Procesamiento electrónico de datos 14
  • 15. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos ORGANIZACIÓN DE LOS DATOS USANDO EL ARREGLO. El ARREGLO de datos es una de las formas más simples de organizar la información, se organizan del valor menor al mayor (en orden ascendente), o del mayor al menor (en orden descendente). Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto. - Rápidamente se pueden apreciar los valores menor y mayor en los datos. - Fácilmente se puede dividir los datos en secciones. - Se puede ver si algún valor aparece más de una vez en el arreglo. - Se puede observar la distancia entre valores sucesivos de datos. A pesar de éstas ventajas, algunas veces el arreglo de datos no es de mucha utilidad. Cuando sea necesario mostrar una gran cantidad de ellos, esto se tornará engorroso, porque se debe hacer la lista de todas las observaciones. Para estos casos se necesita condensar la información y estar en capacidad de usarla para tomar decisiones e interpretarla. ORGANIZACIÓN DE LOS DATOS USANDO DISTRIBUCIÓN DE FRECUENCIAS Una manera de simplificar los datos es usar una tabla de frecuencia o distribución de frecuencia. Como se verá, la organización de los datos en una tabla de frecuencia muestra el comportamiento de la distribución de manera más significativa. La organización de los datos generalmente implica el arreglo de las observaciones en CLASES o INTERVALOS. Al arreglo de los datos para expresar la frecuencia de ocurrencia de las observaciones en cada una de estas clases se conoce como DISTRIBUCIÓN DE FRECUENCIA. La construcción de una tabla de frecuencia se realiza de una serie de datos, los cuales primeramente son recopilados y posteriormente organizados. La primera forma de organizarlos es dándoles un orden ascendente o descendente. Los datos constituidos de esta manera están en un ARREGLO. Este arreglo puede ser construido mediante el uso de marcas, y el número de veces que un valor está repetido se le llama FRECUENCIA. Ejemplo 2.1: Calificación final de Estadística de 80 Estudiantes de la carrera de LSCA. = RECOPILACION = 68, 84, 75, 82, 68, 90, 62, 88.3, 76, 93, 73, 79, 88, 73, 60, 93, 72, 53, 85, 75 53, 65.5, 75, 87, 74, 62, 95, 78, 62, 72, 66, 78, 82, 75, 94, 77, 69, 74, 68, 60 96, 78, 89, 60, 75, 95, 60, 79, 83, 72.6, 79, 60, 67, 97, 78, 85, 76, 65, 71, 75 65, 80, 73, 53, 88, 78, 63, 76, 53, 74, 86, 67, 73, 81, 72, 63, 76, 75, 85, 77.8 = ORGANIZACION = 53, 53, 53, 53, 60, 60, 60, 60, 60, 62, 62, 62, 63, 63, 65, 65, 65.5, 66, 67, 67 68, 68, 68, 69, 72, 72, 72, 72, 72, 72.6, 73, 73, 73, 74, 74, 74, 75, 75, 75, 75 75, 75, 75, 76, 76, 76, 76, 77, 77.8, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 82 82, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88.3, 89, 90, 93, 93, 94, 95, 95, 96, 97 15
  • 16. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos TABLA DE FRECUENCIAS, ARREGO DE FRECUENCIAS Valor Marca Frecuencia (f) 53 llll 4 60 llll 5 62 lll 3 63 ll 2 ... ... ... En la tabla la segunda columna es sólo auxiliar. En la tercera se presenta la Frecuencia de cada dato posible (fi = al número de veces que ocurre la i-ésima observación posible). La información contenida en la tabla puede ser representada gráficamente en varias formas: gráfica de barras, de líneas, por sectores, etc. El inconveniente de graficar cada dato contenido en la gráfica anterior, es que si el número de datos diferentes es muy grande, se diluye la información. Imagínese un gráfico de 25 o 50 barras. Este inconveniente es superado, al utilizar otras técnicas apropiadas para el tratamiento de datos provenientes de una variable continua. En el ejempo 2.1 encontramos 80 valores diferentes, distribuídos entre el dato menor (Dm) = 53 y el dato mayor (DM) = 97, como puede verse en la ordenación (organización). Para el tratamiento adecuado, procedemos a agrupar los datos por intervalos de clase de igual longitud, para lo cual necesitaremos saber o calcular el número de intervalos que tendrá nuestra tabla. NUMERO DE CLASES ó INTERVALOS (k) No hay un criterio establecido para el número de agrupación de datos (intervalo de clase) a utilizar. El primer paso para construir una tabla de frecuencia consiste en decidir cuantas CLASES o INTERVALOS DE CLASE se van a utilizar. El número de clases depende del número de datos y del rango de los mismos y de la información que el investigador desea obtener. Entre mayor sea el número de datos, o más amplio el rango de los datos, mayor número de clases se necesitará para dividirlos. Por supuesto, si se tiene sólo 10 datos, deja de tener sentido el hacer 10 clases. Como una norma, los estadísticos usan entre 5 y 20 clases. Menos de 5 clases pueden concentrar la información y más de 20 clases pueden dispersar la información. Hay muchos libros de texto que recomiendan un sínnumero de formas para determinar el número adecuado de intervalos. Para nosotros debe ser claro que a mayor número de datos resulta adecuado un mayor número de intervalos de clase, por lo que utilizaremos un criterio preciso, (aunque personal), basado en la Regla de Sturges, que consiste en elegir k como el entero impar más cercano a: k = 1 + 3.3 ⋅ Log( N ) k = Número de clases. N = Número de datos. Podemos agregar que la experiencia y el uso a que esté destinado el agrupamiento, son criterios determinantes en algunos casos. La recomendación de elegir un número impar de intervalos es con el fin de mantener la posible simetría de una distribución de datos. Ejemplo 2.2: Para el problema de los 80 estudiantes de estadística Ejemplo 2.1. 16
  • 17. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos k = 1 + 3.3 Log (80) = 7.28 » 7 CLASES (Entero impar más cercano), entonces: k=7 AMPLITUD DE CLASES. Debido a que se necesita tener los intervalos de clase de igual tamaño, el número de clases determinará la amplitud ( i ) de cada clase. Para encontrar la amplitud de cada intervalo de clase se utilizan las siguientes ecuaciones: Rango (R) = DM - Dm = Dato mayor - Dato menor R Dato ⋅ Mayor − Dato ⋅ Menor i= = k Numero ⋅ Intervalos Para el ejemplo 2.1 tendremos: R = 97 - 53 = 44 i = 44/ 7 = 6.2857 ~= 6.3 (para datos continuos) i = 7 (para datos discretos) Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultaría engorroso el trabajar con cuatro dígitos después del punto decimal, por lo que tomaremos la aproximación de 6.3 con ancho del intervalo. Aquí debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestros datos son discretos o continuos. Pues si fueran datos discretos tomaríamos i = 7, ya que si tomamos el valor 6, no concordaría con el número de intervalos que previamente se habían calculado, (esto lo podemos calcular con un pequeño despeje de i = R/k, lo cual tendríamos k = R/i ), y tendríamos que utilizar un intervalo más para poder “meter” los valores más altos. Al fijar los limites de clase, es necesario tomar en cuenta que el valor mínimo de los datos debe quedar incluido en el primer intervalo de clase y el valor máximo en el último. Para que el valor mínimo de los datos quede incluido en el primer intervalo de clase, el primer límite inferior de clase deberá escogerse en tal forma que sea igual o menor que él. De la misma manera, para que el valor máximo de los datos quede incluido en el último intervalo de clase, el último límite superior de clase deberá ser igual o mayor que él. Los intervalos quedarían así: I1 I2 I3 I4 I5 I6 I7 53.0 59.3 65.6 71.9 78.3 84.6 90.0 97.2 a , b para introducir los datos en los intervalos tomaremos el criterio siguiente: 17
  • 18. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos ( a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; “a mayor que” y estrictamente menores que b; “b menor que”. ( a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; “a mayor que” y estrictamente menores o iguales que b; “b menor o igual que”. [ a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; “a mayor o igual que” y estrictamente menores o iguales que b; “b menor o igual que”. [ a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; “a mayor o igual que” y estrictamente menores que b; “b menor que”. CONSTRUCCIÓN DE UNA TABLA DE FRECUENCIAS. CLASES MARCA FRECUENCIA FRECUENCIAS FRECUENCIA ACUMULADA DE CLASE RELATIVAS xi fr C Li - Ls f 53.0 - 59.3 56.15 4 4/80 = 0.05 4 59.3 - 65.6 62.45 13 13/80 = 0.1625 17 65.6 - 71.9 68.75 7 7/80 = 0.0875 24 71.9 - 78.2 75.05 30 30/80 = 0.375 54 78.2 - 84.5 81.35 9 9/80 = 0.1125 63 84.5 - 90.8 87.65 10 10/80 = 0.125 73 90.8 - 97.1 93.95 7 7/80 = 0.0875 80 Suma de frecuencias = ∑f = 80 ∑ fr = 1.0000 DATOS FUNDAMENTALES DE LA TABLA DE FRECUENCIA. LÍMITES DE CLASE: Son los valores localizados en los extremos de una clase. LÍMITE INFERIOR ó LÍMITE REAL INFERIOR (Li) = 53.0 LÍMITE SUPERIOR ó LÍMITE REAL SUPERIOR (Ls) = 59.3 TAMAÑO DE CLASE (i):: Es el recorrido de valores que pueden tomar los elementos de la frecuencia de una clase determinada. Se calcula restando los limites reales. i = TAMAÑO DE CLASE= Ls - Li = 59.3 -53.0 = 6.3 MARCA DE CLASE (xi) : Es el valor representativo de los elementos de la frecuencia. Se obtiene promediando el límite inferior y superior de una clase. Li + Ls 53 .0 − 59 .3 Marca ⋅ Clase = = = 56 15 . 2 2 18
  • 19. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos FRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las clases y se expresa generalmente en porcentaje. fr = FRECUENCIA RELATIVA= 13/80 = 0.1625= 16.25% FRECUENCIA ACUMULADA: Es la suma de las frecuencias de clase del intervalo en consideración y de los intervalos anteriores. Ejercicios 2.1: Resolver las siguientes cuestiones: 1.- Si la calificación mínima aprobatoria es de 70, ¿Cuántos alumnos acreditaron? 2.- ¿Cuántos alumnos acreditaron con menos de 80 ? 3.- Porcentaje de alumnos reprobados. 4.- Entre que rango de valores encontramos más calificaciones. 5.- Porcentaje de alumnos que obtuvieron 90 o más de calificación. 6.- Número de alumnos que obtuvieron una calificación menos de 90. 7.- ¿Puede determinarse en la distribución de frecuencia el número de calificaciones con 95. c) OTROS MÉTODOS DE PRESENTACIÓN DE DATOS: REPRESENTACIÓN DE DATOS ESTADÍSTICOS En general hay 3 formas para presentar datos organizados: a).- Presentación con palabras b).- Tablas estadísticas c).- Gráficas estadísticas PRESENTACION CON PALABRAS . La combinación de cifras y texto no es un sistema muy eficaz ya que es necesario leer, o por lo menos registrar, todo el parrafo antes de que se pueda comprender el significado de todo el conjunto de cifras. Para la mayoría de las personas les resulta difícil aislar las cifras individuales que se presentan. Sin embargo, hay la ventaja de que el autor puede dirigir la atención hacia determinada cifra, haciéndola resaltar, y también puede llamar la atención sobre las comparaciones de importancia. TABLAS ESTADÍSTICAS . Las tablas estadísticas pueden ser agrupadas en dos tipos de acuerdo con sus propósitos para los cuales nos sirven: TABLAS PARA PROPÓSITOS GENERALES: Proporcionan información para referencia o uso general. No se construyen para una exposición específica. En otras palabras, las tablas nos sirven como un depósito de información. Por ejemplo se tiene una tabla titulada "Empleo y Población" que muestra el número de empleados 19
  • 20. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos en manufactura, minería, construcción, transporte, comercio al mayoreo y menudeo, gobierno y otras áreas del país. Esta tabla es de propósitos generales, puesto que solamente dice hechos que no son para una discusión particular. Cuando las tablas de propósitos generales son utilizadas por un investigador, son usualmente colocadas en el apéndice del informe para fácil referencia. TABLAS PARA PROPÓSITOS ESPECIALES. Proporcionan información para una exposición particular. Una tabla para propósitos especiales debería ser diseñada de tal forma que un lector pueda dirigirse fácilmente a la tabla para comparación, análisis o énfasis concerniente a la exposición particular. La tabla debe ser construida de una manera breve y simple. PARTES PRINCIPALES DE UNA TABLA TÍTULO: Es una descripción del contenido de la tabla. Debe ser compacto y completo. Un título usualmente indica: ¿Qué son los datos incluidos? ¿Dónde está el área representada por los datos? ¿Cómo están los datos clasificados? ¿Cuándo ocurrieron los datos? ENCABEZADO: Es el titulo de la parte superior de una columna o columnas. La tabla más simple tiene solamente dos columnas y dos encabezados: uno para los conceptos y otro para los datos. Sin embargo, muchas tablas tiene mas de dos encabezados y algunas veces tienen encabezados principales y subencabezados. NOTA DE Son usualmente escritas justamente arriba de los encabezados y abajo del titulo. ENCABEZADO: Son usadas para explicar ciertos puntos relacionados con la tabla completa que no han sido incluidos en el titulo o en el encabezado ni en los conceptos. Por ejemplo la unidad de los datos es frecuentemente escrita como una nota de encabezado, tal como "En miles" . CONCEPTOS O Son las descripciones en hileras o filas de las tablas, son colocados al lado COLUMNA izquierdo de la tabla. Usualmente representan las clasificaciones de las cifras MATRIZ: incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada por los encabezados de la columna. CUERPO: Es el contenido de los datos estadísticos. Los datos presentados en el cuerpo son arreglados de acuerdo con las clasificaciones de los encabezados y conceptos. Por lo tanto la presentación efectiva de los datos en la tabla depende de los arreglos columnas y filas. NOTA DE PIE: Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes. FUENTE: Es el origen de donde se obtuvo la información. Es usualmente escrita abajo de las notas de pie. Si los datos fueron recopilados por la misma persona, es costumbre no establecer la fuente de la tabla. Sin embargo, si los datos fueron tomados de otras fuentes, las fuentes de los datos deberán ser declaradas en la tabla. La declaración permitirá al lector comprobar o evaluar los datos, u obtener información adicional de la fuente original. 20
  • 21. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos GRÁFICAS ESTADÍSTICAS Hay una gran variedad de gráficas usadas para representar datos estadísticos, los tipos más comunes de gráficas son: 1).- Gráfica de línea 2).- Gráfica de barras 3).- Gráficas de partes componentes 4).- Gráfica de dimensiones 5).- Pictogramas 6).- Mapas estadísticos. GRÁFICAS DE LÍNEAS Las curvas o gráfica de línea se usan a menudo para representar las series cronológicas, así como las distribuciones de frecuencia. Los datos clasificados cualitativa y geográficamente raras a veces se presentan por medio de líneas; en su lugar se usan gráficas de barras. La Línea o líneas que representan los datos deberán resaltar claramente sobre el fondo de la gráfica. La línea deberá, pues, dibujarse con un trazo mas grueso que las coordenadas de línea. Cuando se trazan varias líneas en el mismo cuadrante, es esencial que cada línea se destaque con claridad. Para ello se pueden usar tanto líneas continuas, de puntos y de guiones, como líneas gruesas y delgadas. Cuando en una gráfica aparecen dos o más curva, deben distinguirse unas de otras. Esto puede lograrse, de preferencia, rotulando las líneas. De ordinario es conveniente evitar el uso de mas de dos o tres líneas en una gráfica. Especialmente si se cruzan, es muy probable que se produzca alguna confusión. GRÁFICAS DE BARRAS Cuando se espera que la gráfica de simplemente una impresión muy general pueden hacerse gráficas de barras simples, sin escalas. Cuando se desea dar una impresión menos vaga, se utilizara la escala y si los intervalos de tiempo son diferentes, los espacios entre barra y barra también lo serán de acuerdo a la magnitud de dichos intervalos. Las gráficas de barras se usan para hacer representaciones de datos clasificados cronológicamente, arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizan comparaciones de datos clasificados cualitativa o geográficamente, se usan, por lo general, barras horizontales. Aun cuando no hay reglas establecidas para dibujar las gráficas de barras, son útiles ciertas consideraciones: 1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas. 2.- Entre barra y barra deberá dejarse un espacio que no sea menos, aproximadamente, que la mitad del ancho de una barra, ni mayor que el ancho de la misma. 3.- La escala es generalmente útil. La distancia a la que se colocara no deberá exceder de la mitad de una barra a partir de la más alta, cuando son horizontales, o de la izquierda, cuando son verticales. 4.- Las líneas que sirven como guía ayudan a leer la gráfica. 21
  • 22. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Para representar gráficamente una serie cronológica pueden usarse una gráfica de barras o de líneas. Si la serie abarca muchos años, por lo general, no es adecuada una gráfica de barras, que es difícil de construir. Una gráfica lineal facilita el estudio de la variación general que ha experimentado la serie; mientras que una gráfica de barras permite comparar determinados años con mayor facilidad. REPRESENTACIÓN GRÁFICA DE UNA TABLA DE FRECUENCIA. Los gráficos de distribuciones de frecuencias son útiles porque enfatizan y clasifican las tendencias que no se perciben fácilmente en las tablas. Los gráficos también ayudan a resolver problemas relacionados con las distribuciones de frecuencia. Permiten estimar algunos valores de un vistazo y proveen un chequeo visual de lo correcto de las soluciones. HISTOGRAMA: Es un diagrama formado con rectángulos o barras cada uno de ellos pertenecientes a una clase. Cada rectángulo tiene de ancho el tamaño de clase. En el eje "Y" se grafica la frecuencia, y en el eje "X" los límites reales de clase. En el centro de su base se señala la marca de clase. Las ventajas de los histogramas son: - El rectángulo muestra claramente cada clase separada en la distribución. - El área de cada rectángulo, referida a todos los otros rectángulos, muestra la proporción del número total de observaciones que ocurren en cada clase. HISTOGRAMA 30 F r 25 e 20 c 15 u e 10 n 5 c 0 i Intervalos de clase a s POLÍGONO DE FRECUENCIA: Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es la frecuencia del intervalo. Es un diagrama de líneas que se forma uniendo los centros (marca de clase) de la parte superior de los rectángulos de un histograma mediante segmentos rectos. La ventaja de los polígonos de frecuencia son: - El polígono de frecuencia es mucho más simple que el histograma. - Esboza una idea del comportamiento de los datos más claramente. - El polígono se va aplanando y curveando en la medida en que se aumenta el número de clase y el número de observaciones. 22
  • 23. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos F POLIGONO DE FRECUENCIAS r 35 e 30 c 25 u e 20 n 15 c 10 i 5 a s 0 Intervalos de clase OJIVA: Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo y cuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convención de que antes del primer intervalo considerado, la frecuencia acumulada es cero y después del último es el total de datos (N). OJIVA F 90 r A c 80 e c u 70 u m u 60 e n l 50 c a d 40 i a a 30 s s 20 10 0 Intervalos de Clase EJEMPLOS 2.2: PRESENTACIÓN ESCRITA DE DATOS ESTADÍSTICOS. Se presentan los Costos, Ingresos y utilidades ( en miles de pesos) durante 1991-1995 de la compañía XXX en sus diferentes departamentos: Damas, caballeros y niños. Durante los últimos 5 años los costos fueron de 100, 200, 300, 350 y 400 en el departamento de damas; de 120, 180, 310, 380 y 390 en el departamento de caballeros; y de 80, 100, 160, 290, 430 en el departamento de niños. Los ingresos correspondientes obtenidos en este periodo fueron de 260, 390, 425, 560 y 730 en el departamento de damas; de 300, 320, 480, 560 y 700 en el departamento de caballeros; y de 145, 210, 300, 410 y 625 en el departamento de niños. 23
  • 24. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Para lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y 310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento de niños fueron de 65, 110, 140, 120 y 195. EJEMPLOS: TABLAS ESTADÍSTICAS. NÚMERO DE AUTOS MANUFACTURADOS Y VENDIDOS POR Título G.M., K.W. Y M.S. COMPANY EN 1995 ( MILES DE AUTOS ) Nota de Encabezado Compañía Manufactu- Vendidos Encabezado rados G.M. 10 9.2 Conceptos K.W. 14 12.8 Cuerpo M.S. 5* 5 FUENTE: Revista Journal, Enero de 1996, Pag. 13. * La manufactura fue muy poca debido a que en los meses de Abril-Juniohubo huelga por parte del sindicato de trabajadores. EJERCICIOS 21: DISTRIBUCIÓN DE FRECUENCIA Una máquina vendedora de proporciona 16 oz. de café si se insertan monedas adecuadas. Para probar si la máquina esta operando adecuadamente se tomaron 30 vasos de café y se midieron. 15.7 15.9 15.2 16.0 16.2 16.4 15.7 15.9 15.4 16.0 16.3 16.6 15.8 15.9 15.6 16.0 16.3 16.8 15.8 15.9 15.6 16.1 16.3 16.8 15.8 16.0 15.6 16.2 16.4 16.9 a) Realizar un arreglo de los datos de menor a mayor. b) Realizar una distribución de frecuencia. c) Cuando la máquina tiene un margen de ± 0.2 oz se dice que trabaja correctamente, no importando las onzas que proporcione después de 16 oz. ¿En qué porcentaje la máquina funciona adecuadamente? d) ¿En qué porcentaje la máquina no trabaja adecuadamente? e) ¿En qué porcentaje la máquina proporciona más de 16 oz de café? f) ¿Cuál es la probabilidad de una persona al usar la máquina le proporcione más de 16 oz de café? GRÁFICAS CIRCULARES Se emplean para demostrar la relación existente entre los componentes de una clase. Cada uno de los sectores del círculo representa una parte de un agregado de un total. Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual a los 360 grados, o bien, cuando se trata de porcentajes, a 100%. 24
  • 25. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Para evitar los cálculos resulta muy conveniente emplear un transportador de porcentajes que tiene graduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemos simplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, basta multiplicar el porcentaje por este factor y el producto así obtenido equivale a los grados que le corresponde en la circunferencia. Si se trata de valores absolutos, y no de porcentajes o valores relativos, ese factor se obtendrá dividiendo 360 entre el total, ya que la circunferencia se ha hecho igual a él. PICTOGRAMAS Las gráficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de los datos que representan son más atractivas; sin embargo; como ya se señalo presentan mayores dificultades, tanto para su elaboración como para su adecuada interpretación. Este valor pictórico, puede conservarse usando varios dibujos pequeños que representen una cantidad fija de los datos, del mismo tamaño, y arreglándolos de manera que se forme una gráfica de barras. A la gráfica resultante se le llama pictograma. Aunque este diagrama es esencialmente una gráfica de barras es más atractivo y, por lo tanto, hay mayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representen series cronológicas, se arreglan en forma horizontal, porque aparece más adecuado poner los dibujos (cosas o personas) uno al lado del otro y no uno encima del otro. Las reglas fundamentales para la construcción de pictogramas estadísticos son: 1.- Los símbolos deben explicarse por sí mismo 2.- Las cantidades mayores se indican por un número mayor de símbolos y no por símbolos más grandes 3.- Estos diagramas compran cantidades aproximadas y no detalles minuciosos 4.- Los pictogramas sólo deben utilizarse para hacer comparaciones y no afirmaciones aisladas MAPAS ESTADÍSTICOS Los mapas estadísticos son artificios gráficos que muestran la información cuantitativa sobre una base geográfica. Los tipos más comunes son los mapas sombreados o rayados, los mapas punteados y los mapas de alfileres. 25
  • 26. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS (Descriptivas) Una vez que los datos han sido obtenidos y organizados, el investigador esta listo para realizar un análisis descriptivo. En el tratamiento de los datos, es útil resumir sus características principales. Para ello, se plantean las siguientes cuestiones: ¿Cuál es el dato de mayor frecuencia? ¿Cuál es el valor central de la distribución? ¿Qué tan separados se encuentran los datos? Las respuestas a estas interrogantes es por medio de las medidas descriptivas conocidas como de Tendencia Central, de dispersión, de sesgo y kurtosis. La medida de tendencia central son los promedios o valores típicos representativos de un conjunto de datos que tienden a situarse en el centro de dichos datos. Las tres medidas de tendencia central más comunes son la media (X), mediana (Md) y moda (Mo). MEDIA ARITMÉTICA ( X ) Es la suma de las observaciones o datos entre el número de observaciones totales. Es una de las medidas digna de confianza porque se determina con mayor certeza que otras medidas. N ∑x I =1 i x = N VENTAJAS:  Es familiar a la mayoría de la gente y muy sencilla de calcular.  En ellas se reflejan todos los valores del conjunto de datos.  Un conjunto de datos solo tiene una sola media. DESVENTAJAS: Puede afectarse por los valores extremos que no son representativos del resto de los valores. MEDIANA ( Md ) La mediana es el valor único de un conjunto de datos que mide al elemento central de los datos. Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Si el conjunto de datos tiene un número impar de elementos, el elemento de la mitad del arreglo es la mediana { (N+1)/2 }. Si hay un número par de elementos, la mediana es el promedio de los dos elementos de la mitad { N/2 }. VENTAJAS:  Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la media.  Se puede encontrar la mediana aún cuando los datos sean descripciones cualitativas como el color o la claridad. 26
  • 27. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos DESVENTAJAS:  Debido a que la media es un promedio de posición, se deben de organizar los datos antes de realizar cualquier tipo de cálculo. Esto consume tiempo para un conjunto de datos muy grande. MODA ( Mo ) La moda es aquel valor que se repite más en un conjunto de datos. VENTAJAS:  Se puede usar como una medida de localización central tanto para datos cualitativos como cuantitativos.  La moda no esta afectada por los valores extremos. DESVENTAJAS:  Muy a menudo no hay un valor modal porque el conjunto de datos no contiene valores que se repiten más de una vez.  Otras veces, cada valor es la moda porque cada valor aparece el mismo número de veces.  Cuando el conjunto de datos tiene dos, tres o más modas, éstas son difíciles de interpretar y comparar. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS MEDIA ARITMETICA PARA DATOS AGRUPADOS (MÉTODO LARGO): N x i = Marca de clase ∑i x i f ∑f = N = Total de datos x = i=1 f = Frecuencia N Método corto para el cálculo de la Media Aritmética: A = Media supuesta N (marca de clase del intervalo central) ∑ f i ⋅ di di = Desviación en unidades de intervalo i = Amplitud del intervalo x= A+ i =1 ⋅i N MEDIANA PARA DATOS AGRUPADOS 27
  • 28. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Linf = Límite inferior de la clase de la mediana N +1 − C ant N = Total de datos Md = L inf + 2 ⋅i i = Amplitud del intervalo f Md fMd = Frec. de la clase mediana C = Frecuencia acumulada hasta antes de la clase mediana. Clase Mediana, es la que contiene el dato central N/2 para datos pares ó (N+1)/2 para impares, y debemos observar que intervalo lo contiene, en la frecuencia acumulada Se divide N/2 para encontrar la clase mediana para datos pares, (N+1)/2 para datos impares. MODA PARA DATOS AGRUPADOS: d1 = Frec. de la clase modal menos la frecuencia de la  d1  clase anterior. Mo = L inf +  ⋅i d2 = Frec. de la clase modal menos la frecuencia de la  d1 + d2  clase posterior. i = Amplitud del intervalo. La frecuencia de la clase modal es aquella que tiene la mayor frecuencia. Si hay dos intervalos con igual frecuencia se calculan los dos y sería una distribución bimodal, si hay tres, sería trimodal y así suscesivamente. MEDIDAS DE DISPERSIÓN: Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas de dispersión se usan para poder verificar si el promedio es representativo o no de la muestra y como base de control de la variación misma. Una dispersión pequeña indica un alto grado de uniformidad. Las medidas de dispersión son: desviación estándar, varianza y rango. VARIANZA: La varianza es la suma de la distancia al cuadrado de la media y cada elemento de la población entre el número total de elementos de la población. La fórmula para datos no agrupados es: N S2 =Varianza. ∑ ( xi − x) 2 xi = Dato individual o marca de clase. S2 = i =1 x = Media Aritmética. N = Total de datos. N Para la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo, "dólares al cuadrado" o "dólares cuadrados", no son expresiones intuitivas claras de interpretar. Por 28
  • 29. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos esta razón, debe efectuarse un cambio significativo en la varianza para calcular una medida de desviación útil, una que no presente problemas con las unidades de medidas y sea menos confusa. Este parámetro es llamado la DESVIACIÓN ESTÁNDAR y es la raíz cuadrada de la varianza. DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS La desviación estándar permite determinar, con cierto grado de certeza dónde están localizados los valores de una distribución de frecuencia con relación a la media. Desviación estándar para datos agrupados (MÉTODO LARGO): S = Desviación Estándar. xi = Dato individual o marca N de clase. ∑ f (x − X ) i i 2 X = Media Aritmética. S= i =1 N = Total de datos. f = frecuencia del intervalo. N Método corto para el cálculo de la desviación estándar: 2 S = Desviación Estándar. n  n  ∑ fi ⋅ d ∑ fi ⋅ di  i 2 xi = Dato individual. di = Desviación en unidades s=i i =1 −  i =1  Ejemplo: de intervalo. N  N  En el N = Total de datos.   siguiente f = frecuencia del intervalo.   ejemplo, i = Amplitud de la clase. aplicaremos todas las fórmulas antes mencionadas. Seguiremos con el ejemplo de la página 18 de este documento. DISTRIBUCIÓN DE FRECUENCIAS PARA LAS CALIFICACIONES (PAG. 17) CLASES MARCA FRECUENCIA FRECUENCIAS FRECUENCIA ACUMULADA DE CLASE RELATIVAS xi fr C Li - Ls f 53.0 - 59.3 56.15 4 4/80 = 0.05 4 59.3 - 65.6 62.45 13 13/80 = 0.1625 17 65.6 - 71.9 68.75 7 7/80 = 0.0875 24 71.9 - 78.2 75.05 30 30/80 = 0.375 54 78.2 - 84.5 81.35 9 9/80 = 0.1125 63 84.5 - 90.8 87.65 10 10/80 = 0.125 73 90.8 - 97.1 93.95 7 7/80 = 0.0875 80 Suma de frecuencias = ∑f = 80 ∑ fr = 1.0000 Continuación de la Distribución de frecuencias para el método corto 29
  • 30. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos Desviación Desviación Frecuencia de la clase Individual en Individual al FRECUENCIA de la clase multiplicada por la desviación unidades de cuadrado multiplicada por la desviación individual al cuadrado intervalo individual f d² d d² f d -3 9 -12 36 -2 4 -26 52 -1 1 -7 7 0 0 0 0 1 1 9 9 2 4 20 40 3 9 21 63 ∑f d= 5 ∑f d² = 207 Nota: d = Desviación individual, se divide la distribución en 2 partes, colocando un cero en el intervalo central, todos los valores de desviación individual hacia arriba son negativos y todos los valores de desviación individual hacia abajo son positivos. Aquí suponemos que la media aritmética está al centro de la distribución y que se comporta de forma NORMAL alejándose en una unidad tanto hacia arriba como hacia abajo. El método funciona colocando CERO en cualquier intervalo, pero respetando los signos tanto hacia arriba como hacia abajo. Por lo regular siempre se coloca en el intervalo central. A = Media supuesta, se toma la MARCA DE CLASE del intervalo central ó donde hallamos colocado el cero para iniciar la desviación individual, en este caso sería 75.05. Calculando el promedio por el “método corto” tendremos: N ∑ f ⋅d i i 5 x = A+ i =1 ⋅ i = 75.05 + 6.3 = 75.443 N 80 2  n n  Pueden ∑ fi ⋅ d  ∑ fi ⋅ di  i 2 207  5  2 comprobarlo s = i i =1 −  i =1  = 6.3 − = 10.12634 con el cálculo N  N  80  80    de la Media aritmética y la     desviación estándar utilizando el método largo. La mediana y la moda se calculan de forma normal. Cálculo de la Mediana (Md): 80 + 1 N +1 − Cant − 24 Md = L inf + 2 ⋅ i = 71.9 + 2 6.3 = 75.365 f Md 30 30
  • 31. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos NOTA: No hay mucha diferencia entre utilizar 80/2 y (80+1)/2, en este caso debemos de utilizar la de datos pares, el resultado de la Md = 75.26 Cálculo de la Moda (Mo):  d1  30 − 7 Mo = L inf +   ⋅ i = 71.9 + 6.3 = 75.193  d1 + d 2  [ 30 − 7] + [ 30 − 9] Bibliografía. Anderson, D. (2007) Estadística para Administración y Economía. México: Pearson Berenson, M., Levine, D. (1996) Estadística Básica en Administración, Conceptos y Aplicaciones. (6aEd.). México :Prentice Hall Hispanoamericana Hildebrand, D. (1998). Estadística Aplicada a la Administración. México: Pearson Levin, R. I., (2004). Estadística para Administración y Economía. México: Pearson Levine, D., Krehbiel, T., Berenson, M. (2006). Estadística para Administración. (4ta. Ed.). México.:Printece Hall Webster, A. (2005). Estadística Aplicada a los Negocios y la Economía. (3ra Ed. ). México: Prentice Hall. Stephen, P. Shao (1970) Estadística para economistas y administradores de empresas. (6aEd.). México: Trillas 31