SlideShare una empresa de Scribd logo
1 de 61
REPÚBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DE EDUCACIÓN SUPERIOR
UNIDADES CURRICULARES ESPECIALIZADAS
ESTADÍSTICA IESTADÍSTICA I
Primer Trayecto – Tercer Trimestre
horas
Trabajo Acompañado
Trabajo Independiente
Horas por semana
Total horas en el período
Material elaborado por:
Márquez Zambrano, Luisa
“1805 -2005 Bicentenario del Juramento del Libertador Simón Bolívar en el Monte
Sacro”
Índice
pp.
Índice ii
Objetivo y Contenidos de la Unidad Curricular iv
Instrucciones Generales vi
Introducción vii
Unidad 1. Aspectos Generales de la Estadística 1
▪ Concepto, objeto y rama de la estadística. Síntesis histórica. 1
▪ Tipos de estadística 4
▪ Universo, población y variable 5
▪ Concepto de medición. Niveles y Escalas de medida.
▪ Clasificación de las escalas de medida. 8
▪ Tipos de investigación estadística. 11
▪ Importancia de la estadística en las ciencias administrativas y
económicas 12
Unidad 2. Obtención, Ordenamiento y Representación de Datos
Estadísticos 15
▪ Fuentes y métodos de recolección de datos.
Ventajas y limitaciones. 15
▪ Preparación de datos estadísticos. 18
▪ Razones, proporciones y porcentajes. 18
▪ Distribución de frecuencias. 20
▪ Presentación de los datos estadísticos mediante gráficos.
Tipos, normas y elementos. 21
Unidad 3. Medidas Estadísticas de Posición Central y No Central 25
▪ Medidas de tendencia central para datos simples
Media aritmética. 25
Media ponderada. 26
Media geométrica. 27
Mediana y moda. 28
▪ Medidas de tendencia central para datos simples
Media aritmética. 30
Mediana. 31
Moda. 32
Media geométrica. 33
▪ Medidas de tendencia no central
Percentiles, cuartiles y deciles. 33
ESTADÍSTICA I
ii
Unidad 4. Medidas de Dispersión o Variablidad 40
▪ La dispersión.
▪ Medidas de dispersión absolutas
Rango o recorrido 40
Desviación media 42
Varianza y desviación típica 42
▪ Medidas de dispersión relativas.
Coeficiente de variación 44
ESTADÍSTICA I
iii
Objetivos y Contenidos de la Unidad Curricular
Estadística I
El presente curso se estructura en cuatro unidades, las cuales permitirán analizar de
forma estadísticas los datos de tus actividades empresariales con el propósito de lograr
una toma de decisiones eficientes, es decir, que te permitan realizar evalúo económico y
social de las actividades que realices dentro de la organización en la cual te desempeñas.
Cada una de las unidades programáticas de este material contempla la presentación
teórica de los contenidos. A continuación se presentan el objetivo general de la unidad
curricular y los contenidos de la misma.
Objetivo General:
1. Analizar los datos estadísticos para la toma de decisiones apropiadas en el
diagnóstico, planificación e interpretación de los procesos inherentes a la
administración.
Contenidos:
UNIDAD 1. ASPECTOS GENERALES DE LA ESTADÍSTICA
▪ Concepto, objeto y rama de la estadística. Síntesis histórica.
▪ El dato estadístico: cuantitativo y cualitativo. Universo, población y variable
▪ Concepto de medición. Niveles y Escalas de medida. Clasificación de las
escalas de medida
▪ Importancia de la estadística en las ciencias administrativas y económicas.
▪ Tipos de investigación estadística.
UNIDAD 2. OBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOS ESTADÍSTICOS
▪ Fuentes y métodos de recolección de datos. Ventajas y limitaciones.
▪ Preparación de datos estadísticos.
▪ Presentación de los datos estadísticos mediante tablas y gráficos. Tipos,
normas y elementos.
▪ Análisis de los datos estadísticos. Razones, proporciones y porcentajes.
▪ Distribución de frecuencias.
ESTADÍSTICA I
iv
▪ Lectura e interpretación de tablas y gráficos.
UNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO CENTRAL.
▪ Media aritmética. Concepto, propiedades y cálculo para datos simples y
distribuciones de frecuencia.
▪ Media ponderada. Concepto, propiedades y cálculo para datos simples y
distribuciones de frecuencia. Concepto, propiedades y cálculo para datos
simples y distribuciones de frecuencia.
▪ Media geométrica. Concepto y propiedades para datos simples y
distribuciones de frecuencia.
▪ Mediana y moda. Concepto y propiedades para datos simples y
distribuciones de frecuencia.
▪ Percentiles, cuartiles y deciles. Concepto y propiedades para datos simples
y distribuciones de frecuencia.
UNIDAD 4. MEDIDAS DE DISPERSIÓN O VARIABILIDAD.
▪ La dispersión. Estadísticos de dispersión. Medidas absolutas y medidas
relativas. Fuentes y métodos de recolección de datos. Ventajas y
limitaciones.
▪ Recorrido: concepto características y formas de cálculo.
▪ Desviación media. Concepto, características y formas de cálculo.
▪ Varianza y desviación típica. Concepto, características y formas de cálculo.
▪ Coeficiente de variación. Concepto, características y formas de cálculo.
ESTADÍSTICA I
v
INSTRUCCIONES GENERALES
Este material estará conformado por aspectos teóricos y prácticos, esto significa
que aquí encontrarás los planteamientos fundamentales de cada contenido, con
ejemplos y algunas propuestas de ejercitación. También contarás con elementos
de ayuda que te brindarán información resaltante del contenido estudiado, estos
mensajes están resaltados de diferentes formas, a continuación se te presentan
sus significados:
Los recuadros rellenos y sombreados indican la exposición de
una definición.
La presentación de notas, datos curiosos o resúmenes se
realizarán por medio de cuadros de texto con borde irregular
Los cambios de letra indican la introducción de un ejemplo
Los recuadros de doble línea presentan interrogantes con las
que haremos reflexiones sobre el contenido que se está
trabajando.
Adelante la estadística de espera… y recuerda:
“Sólo en el diccionario el éxito está antes que el trabajo.”
Profesor Luis Huguet
ESTADÍSTICA I
vi
Introducción
Lind, Mason y Marchal (2001) en su libro “Estadística para administración y
contaduría” hacen referencia a una cita de H.C.Well, un escritor e historiador
inglés, quien dijo hace más de 100 años que “para ser un buen ciudadano, el
pensamiento estadístico sería un día tan importante como saber leer”. Estos
mismos autores afirman que Well no mencionó los negocios porque apenas
comenzaba la revolución francesa, sin embargo, aseguran que si ese escritor
tuviera hoy la posibilidad de hacer un comentario sobre las estadísticas
seguramente diría que “el pensamiento estadístico es necesario no sólo para ser
un buen ciudadano, sino también para la toma de decisiones acertadas en los
negocios”.
La estadística la aprendemos desde la educación básica, no obstante, pareciera
que no encontráramos el valor y la utilidad que ella tiene en la vida diaria. Aun en
las circunstancias más comunes de nuestro día a día empleamos estadística para
la toma de decisiones, por ejemplo, cada vez que vamos a bañarnos si
disponemos de un calentador de agua abrimos el chorro durante un rato hasta que
comienza a salir el agua caliente, metemos la mano, probamos la temperatura,
decidimos si se agrega más agua fría o no y cuando consideramos que la
temperatura es adecuada decidimos entrar a la regadera. En este caso tomamos
una decisión basándonos en una muestra, esta cotidianidad es una de las
técnicas empleadas por la estadística.
Estadística es el conjunto de técnicas que se emplean para la recolección,
organización, análisis e interpretación de datos, los resultados del análisis y la
interpretación nos permiten predecir determinados acontecimientos que nos
pueden favorecer en la administración de una empresa. Por ello la importancia de
esta unidad curricular dentro del plan de formación “Administración y Gestión” la
cual te brindará herramientas para toma de decisiones acertadas en los diferentes
procesos administrativos.
ESTADÍSTICA I
vii
UNIDAD I
ASPECTOS GENERALES DE LA ESTADÍSTICAASPECTOS GENERALES DE LA ESTADÍSTICA
ESTADÍSTICA I
¡Comencemos nuestro recorrido! En este
apartado encontrarás…
 Contenidos de la primera unidad
 Ejemplos
 Ejercicios propuestos
UNIDAD IUNIDAD I. ASPECTOS GENERALES DE LA ESTADÍSTICA.. ASPECTOS GENERALES DE LA ESTADÍSTICA.
Síntesis Histórica
Las inquietudes estadísticas se remontan a la antigüedad, pero el contenido de las
mismas ha variado notablemente a través del tiempo. Desde el cuarto milenio a.C.
los chinos realizaban censos de población y utilizaban tablas de estadística
aplicadas a los problemas agrícolas. Los egipcios, los griegos y los romanos también
realizaron múltiples investigaciones recurriendo a la estadística como herramienta.
Indudablemente, en esa época no se conocía la palabra estadística y nadie pensaba
en promover leyes de comportamiento de los datos recogidos con mayor o menor
exactitud, pero se conocían los procesos censales y catastrales que ayudaban a
describir situaciones reales.
Las primeras tentativas para sistematizar los conocimientos surgen en Alemania en
el Siglo XVII, mientras que en Inglaterra se logra un nuevo progreso al superar la
fase meramente descriptiva y comenzar a utilizar los datos con fines predictivos. Más
tarde, a partir del análisis de los juegos de azar, el cálculo de las probabilidades se
incorpora como un instrumento extremadamente poderoso para el estudio de
fenómenos cuyas causas son demasiado complejas para conocerlas totalmente y
poder analizarlas sin su uso.
A partir de comienzos del Siglo XX, la estadística logra su expansión definitiva
desarrollando su aplicación en todas las ramas del saber. La biología, la
meteorología, la investigación agronómica, la demografía, la psicología, la sociología
y muchas otras ciencias han sido transformadas mediante el empleo de métodos
estadísticos. Esta invasión de la estadística en todos los dominios de la investigación
pura o aplicada permite que los métodos estadísticos se desarrollen
permanentemente para dar respuesta a los distintos problemas a resolver.
Definición y Objeto de la Estadística
La Estadística tiene por objeto la recolección, presentación, análisis e interpretación
de observaciones o mediciones hechas sobre un conjunto de objetos, personas,
procesos, fenómenos, etc. Comúnmente es considerada como una colección de
hechos numéricos expresados en términos de una relación, y que han sido
recopilados a partir de otros datos numéricos.
A continuación se te presenta un cuadro con definiciones de estadística
planteadas por diferentes autores en diferentes años:
ESTADÍSTICA I
2
Autor Definición
Gini, 1953
La estadística es una técnica especial apta para el
estudio cuantitativo de los fenómenos de masa o
colectivo, cuya mediación requiere una masa de
observaciones de otros fenómenos más simples
llamados individuales o particulares
Yale y Kendal, 1954
La estadística es la ciencia que trata de la
recolección, clasificación y presentación de los
hechos sujetos a una apreciación numérica como base
a la explicación, descripción y comparación de los
fenómenos
Kendall y Buckland ,1980
Un valor resumido, calculado, como base en una
muestra de observaciones que generalmente, aunque
no por necesidad, se considera como una estimación
de parámetro de determinada población; es decir,
una función de valores de muestra.
Murria R. Spiegel, 1991
La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como
para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis
Lind, Mason y Marchal,
2001
La ciencia de reunir, organizar, presentar, analizar e
interpretar datos para ayudar a tomar las mejores
decisiones
Quizás el hecho más curioso que resalta de las definiciones anteriores es: ¿La
estadística es una ciencia o una técnica? En la actualidad se considera como un
poderoso auxiliar en la investigación. Por ello estudiaremos la estadística como un
conjunto de métodos que nos permiten evaluar datos cualitativos y cuantitativos.
Entendiendo por dato cuantitativo a aquel que está expresado de forma
numérica, por ejemplo: la edad, el peso, las calificaciones, etc. Mientras los datos
cualitativos reflejan, como su nombre lo indica, cualidades, características del
objeto que se analiza por ejemplo: Categorizar las los niveles de inasistencias de
un trabajador en muchas o pocas, la estatura en bajo, mediano o alto, opinar
sobre un producto calificándolo de muy bueno, bueno, regular o deficiente, etc.
ESTADÍSTICA I
¿Consideras que ha habido una diferencia u
avance notorio a través de los años en las
definiciones de estadística presentadas en el
cuadro anterior?
3
Tipos de Estadística
Dos corrientes de influencia han conducido al desarrollo de los métodos estadísticos.
Una de ellas, tenía por objeto mantener en orden registros del gobierno (de hecho,
estado y estadística vienen de la misma raíz latina, status). De ella evolucionaron las
actividades de conteo, medición, descripción, tabulación, ordenamiento y
levantamiento censal, que conforman lo que hoy conocemos como estadística
descriptiva. La segunda corriente de influencia se originó en las matemáticas de los
juegos de azar y condujo al desarrollo de la estadística inferencial o inductiva,
basada fundamentalmente en el concepto de probabilidad matemática.
Estadística Descriptiva:
La estadística descriptiva esta dedicada a descubrir las regularidades o
características existentes en un conjunto de datos mediante la utilización de gráficos
y de medidas numéricas de resumen. En otras palabras, resume y transforma datos
para poder interpretar la información. A través de la cuantificación y ordenamiento de
los datos intenta explicar los fenómenos observados, por lo que resulta una
herramienta de suma utilidad para la toma de decisiones.
Tienen por objeto fundamental describir y analizar las características de un
conjunto de datos, obteniéndose de esa manera conclusiones sobre las
características de dicho conjunto y sobre las relaciones existentes con otras
poblaciones, a fin de compararlas. No obstante puede no solo referirse a la
observación de todos los elementos de una población (observación exhaustiva)
sino también a la descripción de los elementos de una muestra (observación
parcial).
Estadística Inductiva o Inferencial:
Está fundamentada en los resultados obtenidos del análisis de una muestra de
población, con el fin de inducir o inferir el comportamiento o característica de la
población, de donde procede, por lo que recibe también el nombre de Inferencia
estadística. En resumen, son procedimientos estadísticos que se utilizan para
deducir o inferir algo acerca de un conjunto de datos numéricos (población),
seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica en
conocer clases numerosas de objetos, personas o eventos a partir de otras
relativamente pequeñas compuestas por los mismos elementos. La Estadística
ESTADÍSTICA I
Estadística Descriptiva:
Métodos para organizar, resumir y presentar datos de
manera informativa
4
inferencial permite, mediante la utilización de métodos estadísticos basados en la
teoría de las probabilidades, generalizar las conclusiones obtenidas a partir de una
muestra a la población de la que ha sido extraída. Es importante destacar que para
que las conclusiones sean válidas, se debe tratar que la muestra sea representativa
de la población.
Leamos el siguiente ejemplo
Universo, Población y Variable
La estadística está compuesta por métodos científicos mediante los cuales podemos
recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de
individuos u observaciones que nos permiten extraer conclusiones válidas y efectuar
decisiones lógicas basadas en dichos análisis.
En cualquier trabajo en el que se aplique, la estadística debe hacer referencia a un
conjunto de sujetos u objetos de análisis, conocido como población.
Población o Universo:
Es el conjunto de entidades u objetos que satisfacen una definición común y en los
que interesa analizar una o varias características. Aquí el término población tiene un
significado mucho más amplio que el usual, ya que puede referirse a personas,
cosas, actos, áreas geográficas e incluso al tiempo.
ESTADÍSTICA I
Imaginemos que nuestro profesor de estadística I calcula la
calificación promedio de nuestro grupo en primera unidad. Como
está empleando la estadística para describir el desempeño sin
generalizar estos resultados hacia otros grupos de Estadística I el
profesor está utilizando estadística descriptiva, con graficas, tablas
y diagramas muestra los datos de manera que sea más fácil su
entendimiento. Supongamos ahora que el mismo profesor decide
utilizar el promedio de calificaciones obtenidas por nosotros en la
primera unidad para estimar la calificación promedio que
obtendremos en el resto de las unidades de esta asignatura. El
proceso de estimación de tal promedio sería un problema
Estadística Inferencial:
Métodos usados para determinar algo acerca de la población
basándose en una muestra.
5
Una población se precisa como un conjunto finito o infinito de personas que
presentan características comunes, por lo que debe estar perfectamente definida
en el tiempo y en el espacio, de modo que ante la presencia de un potencial
integrante de la misma, se pueda decidir si forma parte o no de la población bajo
estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de
elementos que la integran quede perfectamente delimitado. Si, por ejemplo, estamos
analizando las escuelas primarias, debemos especificar cuáles y cuándo, por
ejemplo: Escuelas primarias de Caracas, año 1995.
El tamaño de una población viene dado por la cantidad de elementos que la
componen. Generalmente se simboliza esta información con la letra N, en el caso en
que sea una población finita, es decir, que podemos contabilizar y establecer un
límite de existencia.
Muestra:
Es un subconjunto de unidades de análisis de una población dada, destinado a
suministrar información sobre la población. Para que este subconjunto de unidades
de análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la
selección de los elementos.
Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la
población que se defina tenga tamaño infinito (incontable), y en consecuencia, no
fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la
observación exhaustiva puede ser muy elevado, el extenso tiempo de recolección de
la información, o más aún, la observación de los elementos puede ser destructiva.
En todos estos casos, la única manera de estudiar la población es obteniendo
muestras de ella. El tamaño de la muestra queda determinado por el número de
elementos que la forman y se simboliza con la letra n.
Ejemplo:
Si necesitamos conocer la cantidad de personas entre 20 y 30 años que
pertenecen a cooperativas en Venezuela, todas las personas que posean estas
características ( tener entre 20 y 30 años y trabajar en una cooperativa) serán
nuestra población, seguramente va a ser difícil buscar todas las cooperativas de
ESTADÍSTICA I
Población:
Es la recolección completa de todas las
observaciones de interés para el investigador.
Muestra:
Es una parte representativa de la población que se estudia y
se toma cuando la población es demasiado grande como
para estudiarla completa.
6
todo el país para conocer este dato, una forma de hacer la investigación es
seleccionando un grupo de estados del país, podría ser uno de cada región y
visitando sus cooperativas, para obtener la información, en este caso obtendremos
una muestra, en la cual encontraremos personas de todas las edades, pero estos
datos nos permitirán predecir de acuerdo a la cantidad de jóvenes en estos
estados la proporción de jóvenes que habrán en todas las cooperativas del país.
Observemos que este es una cose de estadística inferencial.
Variables:
Una variable es la característica de un objeto, persona o situación que es capaz
de modificarse en extensión y naturaleza, es decir, es una característica que varía
de un objeto a otro que no permanece constante y como consecuencia sirve para
singularizar un objeto o grupo de ellos. Debemos tener claro que a variable no es
el objeto de estudio en sí, sino sus características, por ejemplo si estuviéramos
analizando un local para alquilar el local no es variable, variables son sus
atributos: ubicación, tamaño, iluminación, ventilación, etc. Podemos encontrar dos
tipos de datos: Cualitativos y cuantitativos.
Variables Cualitativas:
Llamamos variable cualitativa a aquella no o puede ser expresada de forma
numérica, por ejemplo la religión, podemos decir que somos católicos, judíos,
protestantes, evangélicos, etc. Observemos que este es un dato que varía de un
individuo a otro pero no puede ser expresado de forma numérica.
Variables Cuantitativas: Es aquella variable que puede ser expresada de forma
numérica, por ejemplo el número de hijos por familia. Estas variables se dividen en
dos grupos: variables continuas y discretas.
Variable Discreta:
Es aquella que solo puede asumir ciertos valores, y ente éstos suele haber
huecos, generalmente se expresan en números enteros, por ejemplo, cantidad de
miembros de una cooperativa, podemos decir que está conformada por doce,
trece personas, pero nunca podremos decir que nuestra cooperativa está
conformada por 20,5 personas. Apreciemos el siguiente ejemplo:
Una variable discreta puede ser la cantidad de lapiceros que tenemos
disponibles en nuestro inventario, si contamos podemos decir que
tenemos 96 bolígrafos, el dato en este caso se expresa evitando
los rangos entre los valores, es decir, no podíamos decir que tenemos
ESTADÍSTICA I
7
95,2 lapiceros o 96,1. En este tipo de casos se expresa el dato en un
número entero.
Variables Continuas:
Es aquella que puede adoptar cualquier valor dentro de un rango específico, por
ejemplo, la duración de un viaje en carro de Caracas a Maracay, algunas veces
puede durar una hora y cuarenta y cinco minutos o dos horas, etc. Otro ejemplo de
variable continua el promedio de las calificaciones de un estudiante en cada lapso.
Veamos este otro ejemplo:
Una variable continua es nuestra temperatura corporal, cuando
tenemos fiebre nos tomamos la temperatura, la medida puede ir desde
los 36 grados hasta los 41, pero incluyendo los números decimales,
por ejemplo 36;36,1;36,2;…37;37,1…38;38,1…39,9;40…;40,5 etc.
El peso de las verduras que compramos periódicamente es una variable continua,
pues puede variar de forma ascendente o descendente incluyendo los decimales,
no hay vacíos entre los rangos, todos son continuos, de allí el nombre de la
variable.
Como resumen…
Concepto de Medición. Niveles de Medición de las Variables
Medición
Medición es la cuantificación del atributo de una variable, ¿Qué quiere decir esto?
Cuando medimos hacemos una estimación numérica de un objeto, pero no del
objeto en sí, medimos los indicadores de sus atributos, para ello contamos con
cuatro niveles de medición
ESTADÍSTICA I
Datos
Cualitativos o atributos Cuantitativos o numéricos
Discretos Continuos
8
Niveles de Medición
Los datos se pueden clasificar de acuerdo a cuatro niveles de medición. Los
niveles de medición indican que tipo de operación se puede hacer con los datos
para resumirlos, presentarlos y determinar que pruebas estadísticas pueden
llevarse a cabo con ellos. Existen cuatro niveles de medición: Nominal, ordinal, de
intervalo y de razón, estos niveles tienen un orden ascendente el más bajo de la
escala es el nominal y el más alto el de razón.
Medición Nominal
En el este tipo de medición los objetos sólo pueden ser nombrados o contados. No
hay un orden, consiste simplemente en clasificar observaciones dentro de ciertas
categorías, las cuales deben ser mutuamente excluyentes y colectivamente
exhaustivas. Mutuamente excluyentes significa que un individuo, objeto o medición
pertenece únicamente a una categoría, y exhaustiva significa que ningún
individuo, objeto o medición puede quedar sin categorías por ejemplo:
En la medición nominal un mismo objeto de análisis no pueden estar en dos
categorías, pero todos tienen que estar en una, no puede haber observación fuera
de una categoría. Para que no se nos olvide esta propiedad de la medición
nominal atendamos el siguiente ejemplo:
En un aula de clases vamos a clasificar las personas por lugar de nacimiento, una
misma persona no puede haber nacido en dos lugares, pero tampoco se puede
decir que no nació en ningún lado, por lo tanto, todos tenemos que estar en una
sola categoría.
Medición Ordinal
El siguiente nivel es el ordinal, en este caso las observaciones además de poder
ser clasificadas en categorías, también pueden ser ordenadas por rango, de
manera creciente o decreciente. Esto significa que una primera observación puede
ser mayor que la segunda, y esta a su vez mayor que la tercera, y así
sucesivamente. Sin embargo esto no implica una secuencia de intervalos iguales,
atendamos al siguiente ejemplo: Vamos a comprar un vehículo para transportar
ESTADÍSTICA I
En un nivel de medición ordinal, una categoría que podríamos
establecer es el sexo, clasificado en hombre y mujer, por lo que
los individuos que observamos sólo pueden pertenecen a un
grupo. Si estuviéramos realizando una observación de la imagen
de la izquierda diríamos: Hay un hombre y una mujer.
9
nuestra mercancía, tenemos tres opciones y los agrupamos de acuerdo a su
kilometraje, el primero tiene 25.000Km, el segundo 34.000Km y el último
35.500km, observemos que ordenamos las opciones de menor a mayor según la
cantidad de kilómetros, por ello lo “ordinal”, pero hay que resaltar que los
intervalos que los separa, o sea la cantidad de kilómetros entre cada carro son
diferentes, de 25.000 a 34.000 hay 9 kilómetros de diferencia, mientras que de
34.000 a 35.500 tan sólo hay kilómetro y medio. En la escala ordinal esto no
importa.
Medición de Intervalo
La medición de intervalo posee las características de la ordinal con la salvedad
que aquí la distancia entre los rangos son equivalentes, esto quiere decir que los
intervalos pueden ser sumados y restados. Por ejemplo, supongamos que hemos
medido cuatro calificaciones con una escala de intervalo las cuales son 10,8,7 y 5.
Con estos datos podemos afirmar que la diferencia entre el primero y el tercero es
equivalente a la diferencia entre el segundo y el cuarto, observemos: 10-7=3, 8-
5=3, sin embargo no podemos decir que el que sacó 8 tuvo el doble del que sacó
cinco, a pesar que la diferencia entre los que sacaron 10 y 7, es igual a la
diferencia de los que sacaron 8 y 5
Otra característica resaltante de la medición por intervalos es que este tipo de
variables no tiene cero absoluto, esto significa que el atributo que medimos no
tiene ausencia. Retomemos el ejemplo de la medición de la temperatura corporal,
si empleamos un termómetro y nos tomamos la temperatura podemos decir que
tenemos fiebre o no pero, pero el hecho de no tener fiebre no significa que
tengamos cero temperatura, por lo tanto aquí el cero (0) es relativo. Otro caso en
el que el cero es relativo es el número de calzado, no hay calzado número 0. Si
medimos el calzado en medición de intervalo diríamos, en una casa hay cinco
miembros familiares que calzan 15, 24, 25, 36 y 48.
La diferencia entre a y c= 6, entre b y d= 3 entre c y d=6 entre d y e=6,
observemos que la distancia entre a y c, c y d son es equivalente a la de d y e,
pero no por ello podemos decir que la persona e tiene el pie tres veces más
grande que la persona b.
Medición de Razón
ESTADÍSTICA I
a b c d e
25 28 31 37 43
10
Es el nivel más alto de medición, ella posee todas las características de las
escalas anteriores, con la diferencia de que aquí el cero si es absoluto, es decir, la
presencia del cero indica la ausencia del atributo observado. Un buen ejemplo de
un cero absoluto es la velocidad, si detenemos un vehículo la velocidad es cero,
porque hay ausencia de velocidad. Pero a medida que comenzamos a acelerar el
vehículo podemos decir que si vamos a 30 kilómetros recorreremos la mitad del
camino que un carro que va a 60. En la medición de razón la distancia entre los
rangos son exactamente iguales. Veamos otro ejemplo:
Tipo de Investigación Estadística
Cuando aplicamos los métodos estadísticos para el estudio de un fenómeno se
denomina investigación estadística, estos tipos son: La investigación Directa y la
investigación indirecta
Investigación Directa
Es aquella en la que el investigador observa directamente los casos o individuos
en los cuales se produce el fenómeno, entrando en contacto con ellos; sus
resultados se consideran datos estadísticos originales, por esto se llama también
investigación primaria. La mayoría de las investigaciones de carácter oficial,
demográficas, económicas o sociales son directas.
La investigación deirecta se divide en: exhaustiva o completa, y parcial o
incompleta. Son exhaustivas, aquellas en la que se estudian todos los elementos
que integran el universo, todas sus características o las necesarias para describir
totalmente la población estudiada.
Son investigaciones parciales o incompletas, cuando tan solo se estudia un
número limitado de los casos individuales que forman el universo o cuando se
estudian algunas manifestaciones del fenómeno que no lo describen totalmente;
se utiliza este tipo de investigación cuando es imposible el estudio del fenómeno
de forma completa. Este tipo de investigación puede ser representativa y no
representativa, estamos en el primer caso cuando las manifestaciones del
fenómeno estudiado son suficientes y necesarias para describir el fenómeno; en
caso contrario, caemos dentro de la no representativas.
Investigaciones Indirectas
Son aquellas en las que el investigador se vale de informaciones indirectas, de
resultados o cálculos de investigaciones anteriores o en base de los
conocimientos que tenga el investigador del fenómeno por experiencias anteriores.
Se dividen estas investigaciones en conjeturales (estimaciones) y secundarias. La
ESTADÍSTICA I
Las medidas de la regla, el cero indica la ausencia de medida, pero
la distancia del 0 al 1, ó del 1 al 2 es la misma que la del 2 al 3 ó la
del 3 al 4, y así sucesivamente, entre cada rango hay la misma
diferencia.
11
investigación conjetural es aquella en base a conocimientos parciales, opiniones o
cálculos, proporciona resultados primarios de valor práctico. Este tipo de
investigación puede tener el inconveniente de que, dado el carácter subjetivo de
estos conocimientos y opiniones, se pueden obtener resultados diferentes
utilizando varios investigadores para el estudio de un mismo fenómeno. La
investigación secundaria es aquella que se efectúa por reagrupaciones o
reelaboraciones de resultados de otras investigaciones; tiene a su favor este tipo
de investigación, que el costo y trabajo queda notablemente reducido.
La investigación indirecta conjetural puede ser: por aproximación, por analogía y
por proporción. Por proporción, es la que basada en el convencimiento que sobre
el fenómeno tiene el investigador, ya sea por experiencia o por resultado
anteriormente obtenido. Los datos que se obtienen en esta investigación serán
siempre aproximados al aplicarlos al fenómeno que estudia, pero sirven para tener
una idea general del mismo.
Por analogía, son aquellas basadas en el estudio de uno o varios fenómenos que
guardan cierta semejanza con el fenómeno a investigar, determinándose ciertas
modalidades y características de dicho fenómeno, por procedimientos inductivos.
La investigación conjetural por proporción, puede hacerse de parte a todo un
hecho a otro; en el primer caso, se observa una parte de fenómeno y sin mayor
rigor aplica a todo el fenómeno; en el caso de un hecho a otro, relacionan dos o
más hechos y a través del conocimiento de uno de ellos se determinan las
modalidades de otros.
Importancia de la Estadística en Administración
Si te has preguntado por qué un administrador debe saber sobre técnicas
estadísticas, te presentamos dos razones:
Los hombres y mujeres que se dedican a las actividades comerciales están en una
constante búsqueda de ganancias o excedentes que le permitan crecer o
ESTADÍSTICA I
El método inductivo se basa en la acumulación de datos cuya
tendencia nos permite generalizar el comportamiento de los
sistemas en estudio. La veracidad de sus conclusiones se ven
reafirmadas con la generación de más y más datos que
apunten en la misma dirección.
La estadística te permite
Solucionar problemas
Tomar decisiones
12
ampliarse en su área, la mayoría de ellos consideran que la estadística es
fundamental para el proceso de toma de decisiones, ¿Por qué?, porque permite
inferir cómo afectarán las posibles opciones de inversión. De igual forma, la
estadística ayuda a tomar decisiones para solucionar problemas que se suscitan
en el camino del desarrollo productivo. Recordemos que el desempeño laboral
como administrador exigirá el análisis de múltiples datos, los que debemos
manejar de forma útil para la organización, es decir, analizando los riesgos y las
oportunidades que representan.
ESTADÍSTICA I
13
Ejercicios Unidad 1
1) Escribe cinco ejemplos de datos cuantitativos y cinco de datos
cualitativos.
2) Realiza un ejemplo de una muestra de una población cualquiera.
3) Determina cual de los siguientes puntos es una población o una
muestra:
a) Los estudiantes de sexto grado de Venezuela
b) Los estudiantes de Misión Sucre región Caracas.
c) Todas las familias con mascotas de un municipio.
d) Los reportes de un día sobre la actividades realizadas en un liceo.
4) Clasifica en cualitativa y cuantitativas las siguientes variables:
a) Los literales de calificación en la escuela básica (A,B,C,D y E)
b) Cantidad de pacientes atendidos por Barrio Adentro.
c) El color de cabello de las personas de una comunidad.
d) Cantidad de hijos de nuestros vecinos.
5) Clasifica las siguientes variables como continuas o discretas
a) Número de camisas producidas por una cooperativa
b) Las horas de un día
c) Cantidad de estudiantes de nuestra comunidad
d) Kilos de pollo vendidos en Mercal
6) Cuál es el nivel de medición de las siguientes variables:
a) Una clasificación de los estudiantes de la zona en la que viven.
b) Calificaciones de los estudiantes en la primera prueba de estadística
c) Temas de los discursos del presidente Chávez
d) El número de horas por semana que estudia un alumnos de Misión Sucre
e) El año de fabricación del transporte público que cubre la ruta de nuestro
vecindario
f) Los periódicos vendidos cada domingo.
g) Grupos de estudiantes según su edad.
ESTADÍSTICA I
14
UNIDAD II
OBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOSOBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOS
ESTADÍSTICOSESTADÍSTICOS
ESTADÍSTICA I
¡Excelente! ya hemos llegado a la segunda
unidad, sigamos avanzando. En este
apartado encontrarás:
 Contenidos de la segunda unidad
 Ejemplos
 Ejercicios propuestos
15
UNIDAD 2. OBTENCIÓN,UNIDAD 2. OBTENCIÓN,
ORDENAMIENTO YORDENAMIENTO Y
REPRESENTACIÓN DE DATOSREPRESENTACIÓN DE DATOS
ESTADÍSTICOS.ESTADÍSTICOS.
Fuentes y Métodos de
Recolección de Datos
Fuentes de Datos
El lugar del cual obtenemos los datos
para realizar nuestros análisis
estadísticos se denomina fuente. Los
datos que requerimos para realizar
una evaluación estadística de los
procesos administrativos los
podemos encontrar por medio de
diversas fuentes las cuales pueden
ser; primarias o secundarias, u
oficiales o privadas. Llamamos
fuentes primarias la persona o
institución que ha recolectado los
datos, y secundaria si la persona o
institución que ha publicado los datos
no fue la que efectuó la investigación.
Los datos primarios y secundarios no
son dos clases esencialmente
diferentes de información, sino partes
de una misma secuencia: todo dato
secundario ha sido primario en sus
orígenes, y todo dato primario, a
partir del momento en que el
investigador concluye su trabajo, se
convierte en dato secundario para los
demás.
Los datos oficiales son todos aquellos
que hayamos en dependencias
gubernamentales, y por el contrario
los datos emitidos por entes no
gubernamentales los denominamos
privados.
Técnicas de Recolección de Datos
Existen diversas técnicas de
recolección de datos, aquí
mencionaremos las más comunes o
las más empleadas.
La Observación
Consiste en el uso
sistemático de nuestros
sentidos para captar la
realidad que queremos
estudiar.
Es una técnica antigua, a través de
sus sentidos, el hombre capta la
realidad que lo rodea, que luego
organiza intelectualmente. El uso de
nuestros sentidos es una fuente
inagotable de datos que, tanto para la
actividad científica como para la vida
práctica resulta de inestimable valor.
La observación es un proceso
cotidiano para nosotros, es parte de
nuestra experiencia de vida, pero
nuestras observaciones diarias al no
estar orientadas a un propósito
determinado carecen de controles
ESTADÍSTICA I
Datos Primarios: son aquellos
que el investigador obtiene
directamente de la realidad,
recolectándolos con sus propios
instrumentos.
Datos Secundarios: son
registros escritos que proceden
de un contacto con la práctica,
pero que ya han sido elegidos y
procesados por otros
investigadores.
Observación:
Es el registro visual de lo ocurre es
una situacional real, clasificando los
acontecimientos de acuerdo con
algún esquema pre estructurado y
cónsono con el problema que se
16
que nos alejen de los errores. Para
realizar un proceso de observación
con el propósito de recabar datos
debemos seguir algunos principios
básicos:
 Debe tener un propósito
específico.
 Debe ser planeada cuidadosa y
sistemáticamente.
 Debe llevarse, por escrito o de
forma audiovisual, un control
cuidadoso de la misma.
 Debe especificarse su duración y
frecuencia.
 Debe seguir los principios básicos
de validez y confiabilidad.
La principal ventaja de esta técnica
es que los hechos son percibidos
directamente, sin ninguna clase de
intermediación, colocándonos ante
una situación tal como ésta se da
naturalmente. De este modo, nunca
obtendremos distorsiones de la
realidad, las cuales solemos tener al
emplear una entrevista, ya que en
ellas los entrevistados colocan su
toque personal al brindar la
información. Otra ventaja es que la
conducta se describe en el momento
exacto en que está ocurriendo.
Además, las observaciones se
pueden realizar independientemente
de que las personas estén dispuestas
a cooperar o no, a diferencia de otros
métodos en los que sí necesitamos
de la cooperación de las personas
para obtener la información deseada.
Su principal desventaja reside en que
la presencia del observador puede
generar una alteración o modificación
en la conducta de los objetos
observados, destruyendo la
espontaneidad y por tanto alterando
la confiabilidad de los datos.
La Entrevista.
La entrevista es una
técnica en la cual es
investigador, de
acuerdo a la
información que necesita recolectar
elabora una serie de preguntas que
más tarde realiza a la persona que se
convertirá en su fuente. Las
entrevistas la mayoría de las veces
se realizan en persona, es decir,
visitando al entrevistado y registrando
la información ofrecida, ya sea con un
grabador o por escrito.
Como técnica de recolección de
datos la entrevista tiene muchas
ventajas; es aplicable a toda persona,
siendo muy útil con los analfabetos,
los niños o con aquellos que tienen
limitación física u orgánica que les
dificulte proporcionar una respuesta
escrita. Se le puede explicar al
entrevistado con qué propósito
estamos recogiendo los datos y esta
ayuda a que éste dirija mejor sus
respuestas.
A pesar de todas sus bondades la
entrevista también posee algunas
desventajas o limitaciones: Requiere
una mayor inversión de tiempo para
recoger la información, como las
respuestas pueden ser totalmente
abiertas se puede dificultar el análisis
de los datos y requiere de mucha
astucia para obtener los datos que se
desean canalizando las respuestas
del entrevistado aun cuando éste se
desoriente.
El Cuestionario
Es el método que
utiliza un instrumento
ESTADÍSTICA I
17
impreso. Como en el caso de la
entrevista, hay preguntas pero todas
están formuladas en un papel, ellas
están destinadas a obtener repuestas
sobre el problema en estudio y son
dadas por consultado a través de un
proceso de escritura, sin embargo, el
cuestionario puede ser llenado por el
encuestado o con ayuda de un
empadronador.
El cuestionario puede aplicarse a
grupos o individuos estando presente
el responsable de recoger la
información o no; puede enviarse por
diversos medios a los seleccionados
en la muestra. También puede
contratarse a una persona que
cumpla que aplique el cuestionario,
en estos casos se suele llamar cédula
de entrevista. Un ejemplo de esta
aplicación son los empadronadores
de los censos de población,
recordemos que ellos traen el
cuestionario con sus preguntas y sus
respuestas, la función que cumplen
es leer cada pregunta y marcar la
respuesta dada por el encuestado.
Las ventajas de esta administración
es que no quedarán preguntas en
blanco y también que puede ser
aplicada a analfabetos, niños o
personas con alguna discapacidad.
Cuando la aplicación cuestionario
queda en manos de los encuestados
se pueden presentar problemas
relacionados con la cantidad y calidad
de datos que pretende obtener para
el estudio. Estos problemas que a su
vez se convierten en desventaja son:
que el cuestionario no fuese devuelto;
que los consultados evadan la
respuesta a alguna pregunta o no
darle la importancia necesaria a las
respuestas proporcionadas. Debido a
esa posible pérdida de información se
recomienda cuando se use está
técnica se escoja una muestra más
grande de sujetos de estudio.
Existen tres tipos de cuestionarios:
Cuestionarios Abiertos. Son en
los que se pregunta al sujeto algo y
se le deja en libertad de responder
como quiera. Este tipo de
cuestionario es muy útil y proporciona
mucha información, pero requiere
más tiempo por parte del informante y
es más difícil de analizar por parte
responsable de recoger los datos.
Cuestionarios Cerrados. Están
estructurados de tal manera que al
informante se le ofrecen sólo
determinadas opciones de respuesta,
y debe seleccionar una de ellas. Este
cuestionario es más fácil de codificar
y contestar. Como desventaja, es que
al ofrecerle categorías al informante
se le están "sugiriendo" las
respuestas.
Cuestionarios Mixtos: poseen
ambos tipos de preguntas abiertas y
cerradas, por ello el nombre de
“mixtos”.
La mayoría de los cuestionarios
poseen la siguiente estructura:
 Titulo
 Instrucciones
 Identificación del encuestado (la
identificación no hace referencia al
nombre, en muchos estudios las
respuestas anónimas suelen ser
más objetivas, pero si vamos a
aplicar el cuestionario a una
población diversa podemos
identificarlos por edad, profesión,
etc.)
 Preguntas
 Observaciones
ESTADÍSTICA I
18
En general, en el proceso de
recolección de datos los métodos e
instrumentos y fuentes suelen
combinarse; cada una con sus
ventajas y desventajas, sus
características propias y la
información que se requiera, sin
embargo dan flexibilidad para que el
investigador determine su uso
apropiado según el estudio a realizar.
Preparación de los Datos
Estadísticos.
Una vez recogidos los datos pasamos
a su preparación para iniciar el
estudio, para poder lograr el análisis
estadístico es necesario ordenar los
datos y clasificarlos, lo primero que
hacemos es revisar los instrumentos
de recolección de información
aplicados, sobre todos si son
cuestionarios llenados por el
informante ya que en una entrevista
el entrevistador es el que registra las
respuestas.
Algunos autores proponen que
cuando quedan cuestionarios con
preguntas sin contestar las llenemos
con la respuesta que la mayoría
colocó, sin embargo esto se podría
considerar poco ético, pues no es la
respuesta del encuestado, en ese
caso la sugerencia es eliminar ese
cuestionario de la muestra.
Terminado este proceso pasamos al
agrupamiento.
En el caso de las entrevistas y
cuestionarios con preguntas abiertas
debemos crear categorías de acuerdo
con los puntos expresados por los
entrevistados de tal forma que
ninguna opinión o planteamiento se
queden sin categoría, pero también
de forma que ninguna opinión pueda
incluirse en dos categorías, es decir,
deben ser mutuamentemutuamente
excluyentesexcluyentes. Una vez bien
estructuradas las categorías
contamos la frecuencia de aparición
de cada categoría en las respuestas
dadas.
En el caso de ser un cuestionario de
preguntas cerradas se contabiliza la
frecuencia de aparición de cada
respuesta para luego elaborar una
tabla con la distribución de
frecuencias, tema que ampliaremos
más adelante.
Razones Proporciones y
Porcentajes
Una de las funciones de la estadística
es resumir todos los datos de un
conjunto para resaltar sus
características más importantes. Una
de las formas de realizar esta
actividad es relacionando los datos,
ya sea entre ellos mismos o con
datos similares, es decir, convertir los
valores absolutos en valores
relativos, ya veremos por qué.
Razones
La razón (R) es el valor que indica la
relación cuantitativa existente entre
dos cantidades, por ejemplo:
En una ciudad existen 54.000
empleados y 36.000 desempleados,
la razón de empleado a desempleado
se expresa así:
9
000.9
000.54
)(
)(
===
a
A
R
ESTADÍSTICA I
19
Siendo
A= Nro. de individuos con cierta
característica
a= Nro. de individuos que no poseen
cierta característica
La interpretación del ejemplo anterior
es que por cada 4 empleados hay 1
desempleado.
Al ser la razón un valor relativo no
depende de los valores absolutos de
los individuos que la forman, ya que
por ejemplo en una zona donde hay
90.000 empleados y 10.000
desempleados la razón sigue siendo
de 9.
Proporción
La proporción es una razón, pero su
diferencia con las razones anteriores,
es que el denominador del cociente
es el número total de unidades
enunciadas. La proporción se
representa con la siguiente fórmula:
N
A
p = siendo N= (A)+(a)
La proporción contraria sería
N
a
q
)(
=
Ambas p y q son complementarias y
si se suman debe dar igual a 1
p+q=1
Remplacemos las formulas con los
datos del ejercicio anterior
857,0
000.63
000.54
===
N
A
p
142,0
000.63
000.9)(
===
N
a
q
La proporción de empleados sería de
0,85, y la de desempleados de 0,142.
Ambas proporciones son
complementarias y si las sumamos
da igual a 1
Porcentajes
Como vimos en el apartado anterior
las proporciones vienen expresadas
en valores decimales, esto no es
ningún inconveniente, pero cuando se
quiere presentar al público los datos
utilizar decimales es confuso, por ello
se acostumbra a multiplicar las
proporciones por 100, para convertir
los valores decimales en enteros, es
decir, para convertirlos en
porcentajes.
100% ∗=
N
A
P
100
)(
% ∗=
N
a
Q
Convirtamos pues nuestras
proporciones en porcentajes:
%7,85100857,0
000.63
000.54
=∗===
N
A
P
%2,14100142,0
000.63
000.9)(
=∗===
N
a
q
¿Cómo interpretamos estos
porcentajes? De la misma manera
que lo hicimos con la proporción,
decimos que 85,7% de las personas
están empleadas y el 14,2 % están
desempleados. Observemos que si
tan sólo damos uno de los dos
porcentajes con su respectiva
interpretación, el segundo porcentaje
no es necesario darlo, pues si
decimos que en la cuidad “X” el
85,7% de las personas están
empleadas, ya podemos inferir la
minoría está desempleada, sin
necesidad de manejar el porcentaje
exacto.
Porcentajes de Cambio
ESTADÍSTICA I
20
Son los que muestran la diferencia
entre dos porcentajes; estos pueden
ser en aumento o en descenso,
veamos sus fórmulas:
100∗
−
=
m
mM
Pa
100∗
−
=
M
mM
Pd
Siendo
Pa= Porcentaje de aumento
Pd= Porcentaje de descenso o
disminución
M= Cantidad mayor
m= Cantidad menor
Ejemplo:
Si sabemos que el excedente de
nuestra cooperativa en el año 2004
fue de 100.000.000 de bolívares, y
para el año 2005 Bs. 135.000.000,
¿cuál fue el porcentaje de aumento?
=∗
−
= 100
m
mM
Pa
%35100
000.000.100
000.000.35
100
000.000.100
000.000.100000.000.135
=∗=
=∗
−
=
Pa
Pa
El porcentaje de aumento de nuestro
excedente fue de un 35% en un año.
Distribución de Frecuencias.
En muchas ocasiones habrás
observados tablas como esta:
Edades (en años) Frecuencia
1 a 5 26
6-10 44
11-15 32
Esta tabla se denomina Distribución
de Frecuencias. La estadística
descriptiva utiliza la distribución de
frecuencias para organizar y
presentar los datos. Lo deseable es
que logremos determinar de forma
correcta las distancias de los
intervalos que usaremos para agrupar
nuestros datos.
Ahora te preguntarás ¿Cómo elaboro
una distribución de frecuencias?, la
forma más fácil de aprenderlo es a
través de un ejemplo:
Observemos el siguiente grupo de
números y supongamos que son la
cantidad de viajes que realiza cada
día durante un mes la aerolínea
Conviasa
1
5
12
1
0
8 20
1
4
13
1
2
9 13
1
0
2
0
1
7
1
8
19
1
2
15 8 9 10
En esa tabla de datos buscamos el
valor mayor y el menor, para
ESTADÍSTICA I
Distribución de Frecuencias:
Es un agrupamiento de datos en
categorías mutuamente
excluyentes en el cual se registran
la cantidad de veces que se ha
observado cada categoría.
21
determinar la cantidad dedeterminar la cantidad de
clases,clases, para ello utilizamos la
fórmula 2
k
, empleándola de la
siguiente manera, en los vuelos de
Conviasa n = 20, asignemos a k un
valor arbitrario, por ejemplo 4,2
4
=16 si
n = 20, 4 clases no cubrirían todos los
datos, probemos con k=5, 2
5
=32, es
mayor que 20, cubriríamos
completamente a n, por lo que
deberíamos conformar 5 clases.
Ahora vamos a calcular la amplitud
del intervalo, recordando que, recordando que
debe ser el mismo para todasdebe ser el mismo para todas
las claseslas clases,, y que deben abarcar
desde el dato menor hasta el mayor,
lo calculamos a través de la siguiente
fórmula:
k
LH
i
−
〉
En la que i es el intervalo de la clase,
H el mayor número observado, L el
menor valor observado y k el número
de clases:
4,2
5
820
=
−
=
−
〉
k
LH
i
Redondeamos a 2 que será el
tamaño de nuestros intervalos,
recordemos que debemos tener 5
clases. Ahora organicemos nuestros
datos:
Cantidad de
Vuelos Frecuencia (f)
8 a 11 7
11 a 13 5
14 a 16 3
17 a 19 3
20 a 22 2
Ya construimos nuestra distribución
de frecuencias, es bueno acotar que
el punto medio de la clase se haya
en el punto medio entre el límite
superior y el límite inferior, en el
primer intervalo el punto medio entre
8 y 10 es 9. 9 es el punto medio de la
primera clase.
También podemos tener
distribuciones de frecuencia relativa,
que es la frecuencia absoluta entre la
cantidad total de observaciones (n):
Cantidad
de
Vuelos
Días al
Mes
Frecuenc
ia (f)
Frecuenci
a relativa
8 a 10 7 7/20 0,35
11 a 13 5 5/20 0,25
14 a 16 3 3/20 0,15
17 a 19 3 3/20 0,15
20 a 22 2 2/20 0,10
Total 20 20/20 1
Con la frecuencia relativa obtenemos
la fracción del número total de
ESTADÍSTICA I
22
observaciones, y si lo multiplicamos
por 100 los porcentajes. Si
interpretamos el cuadro anterior
según su frecuencia relativa
podíamos decir que el 35 % de los
días del mes Conviasa realiza entre 8
y 10 vuelos.
Presentación de los Datos
Estadísticos
A parte de la distribución
de frecuencias los datos
pueden también pueden
ser presentados en
gráficos contentivos de los mismos
datos que expresamos en la
distribución de frecuencias. Seguro te
preguntarás ¿Y si tienen los mismos
datos para que hacerlos? La
respuesta es que el gráfico permite
apreciar de forma más rápida los
datos obtenidos, ya lo
comprobaremos más adelante.
Existen una gran variedad de
gráficos, primero conoceremos los
dos más empleados en
administración, también
mencionaremos otros tipos de
gráficos de mucha utilidad, sin
embargo te invito a ampliar sobre
este tema a través de un arqueo
bibliográfico.
Histograma:
Es uno de los gráficos utilizados
mayormente empleado para
representar una distribución de
frecuencias
Polígono de frecuencia
Un polígono de frecuencia es
perecido al histograma. Consiste en
segmentos de línea que se conectan
por los puntos formados por la
intersección del punto medio de la
clase y de la frecuencia de clase. La
elaboración de un polígono de
frecuencias se hace colocando los
puntos medios de cada clase en el
eje x y la escala en el eje y, es decir,
las frecuentas de clase. Recordemos
que el punto medio representa los
valores de cada clase.
El histograma y el polígono de
frecuencia nos permiten tener una
visión de las principales
características de un conjunto de
datos, a pesar de tener ambos el
mismo propósito, el histograma tiene
la ventaja de representar cada
frecuencia como un rectángulo que
además incluye ambos valores del
intervalo. Por su parte el polígono de
frecuencia tiene una ventaja sobre el
histograma, permite comparar dos
distribuciones de frecuencia a la vez,
y si por ejemplo queremos hacer un
ESTADÍSTICA I
Histograma:
Gráfica en la que las clases se indican
en el eje y (horizontal) y las
frecuencias de la clase por eje x
(vertical). Las frecuencias quedan
representadas en el gráfico por la
altura de las barras, la que se trazan
una al lado de la otra.
23
9,00 12,00 15,00 18,00 21,00
Vuelos
2,00
3,00
4,00
5,00
6,00
7,00
Frecuencia
gráfico con los gastos de tres años
con una misma distribución de
frecuencias, fácilmente lo podemos
hacer.
0
20
40
60
80
100
1er
trim.
2do
trim.
3er
trim.
4to
trim.
Este
Oeste
Norte
Otras presentaciones gráficas de
datos
Gráfica por medio de línea.
Las gráficas por medio de línea son
muy útiles en la administración
porque podemos mostrar el cambio
de una variable en el tiempo, es decir,
si queremos ver la cantidad de
unidades vendidas de un producto
que fabricamos en nuestra
organización, este gráfico es la mejor
opción. Para su elaboración
colocamos la variable, que
continuando con nuestro ejemplo de
Conviasa, sería cantidad de vuelos
diarios sobre el eje y y el tiempo
sobre el eje x.
Gráfico de Barras.
Es un gráfico muy versátil, en el se
puede graficar cualquier tipo de
variable y en cualquier nivel de
medición. Las barras pueden ser
verticales u horizontales, y tampoco
hay mayor inconveniente en la
distribución de los datos a través de
los ejes del plano cartesiano.
Seguramente te preguntarás ¿En qué
se diferencian los histogramas del
gráfico de barras? Se diferencian en
algo que podría parecer tonto, pero
no, y es en la separación que existe
entre las barras. Los histogramas
poseen sus barras continuas porque
sus datos son de intervalo o de razón,
mientras que en los gráficos de barra
al poder admitir cualquier nivel de
medición cada barra representa una
variable que puede ser cualitativa o
cuantitativa.
ESTADÍSTICA I
0
20
40
60
80
100
1er
trim.
2do
trim.
3er
trim.
4to
trim.
Este
24
Diagrama Circular:
El diagrama circular, muy reconocido
por gráfico de torta es especial para
representar porcentajes. El diagrama
circular convierte los 360 grados del
círculo en el 100% de la variable que
estamos representando. Este es un
gráfico muy de muy fácil lectura, pues
las líneas que cortan la circunferencia
permiten, rápidamente, ver que clase
de la variable tiene el mayor
porcentaje.
35%
25%
15%
15%
10%
1
2
3
4
5
ESTADÍSTICA I
25
UNIDAD III
MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NOMEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO
CENTRALCENTRAL
ESTADÍSTICA I
¡Felicitaciones! Ya te
encuentras en la tercera
unidad, continua con tus
progresos.
Aquí encontrarás…
Contenidos de la
segunda unidad
Ejemplos
Ejercicios propuestos
26
UNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NOUNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO
CENTRALCENTRAL
Las medidas de tendencia central tienen como propósito hallar con toda precisión
el centro de un conjunto de observaciones
Medidas de Tendencia Central para datos Simples
La Media Aritmética
La media aritmética o media es la medida de tendencia central que
frecuentemente llamamos promedio, consiste en la suma de los valores del grupo
de datos dividida entre la cantidad de valores. La media aritmética de una
población se representa con el símbolo µ (mu), y la media aritmética de una
muestra se representa con el símbolo X (equis barra) y sus fórmulas son las
siguientes:
N
X∑
=µ
n
X
X
∑
=
Siendo:
Medidas de Posición
Central No Central
Cuartiles
(Qx)
Deciles
(Dx)
Percentiles
(Px)
Promedios Matemáticos Promedios No Matemáticos
Media
Aritmética
Media
Geométrica
MG
Media
Ponderada
Mediana (Med)
Moda (Mo)
X∑ La sumatoria d todos los datos
N Población
n Muestra
Ambas fórmulas son idénticas, con la única diferencia que en el primer caso
trabajamos con la población entera y en el segundo con una muestra.
Ejemplo: Durante cada hora de trabajo de un día una cooperativa produce las
siguientes cantidades de artículos de limpieza: 14, 19, 20, 15, 12, 18, 16, 10.¿Cuál
es el número medio de unidades producidas?
50,15
8
124
8
1016181215201914
==
+++++++
=
∑
=
N
X
µ
El numero medio de producción es de 15,5 artículos de limpieza, pero si
retomamos los contenidos estudiados en la primera unidad, la cantidad de
artículos producidos en un variable discreta, ya que si estuviésemos hablando de
jabones de baño no podemos decir que fabricamos 15 jabones y dejamos hecho la
mitad del siguiente, por lo tanto aquí aplicamos una regla que se denomina
redondeo.
De tal forma que de 15,5 redondeamos el número decimal, como 5 es ≥ a 5
redondeamos por exceso convertimos el 15, 5 en 16.
Media Ponderada
El redondeo de un número consiste en que una o varias de sus
cifras finales (de izquierda a derecha) se substituyen por ceros o
se ascienden o descienden si ese último número es mayor o
menor que 5
Propiedades de la Media Aritmética:
 Para calcular la media se toman todas los valores
 Un conjunto de datos sólo tiene una media. La media es única
 La media es una medida útil para compara dos o mas poblaciones
 La media aritmética es la única medida de posición en la que las suma
de las desviaciones de los valores de la media es siempre cero:
0)( =−∑ XX
Ejemplo: La media de 3, 8 y 4 es 5
0132)54()58()53()( =−++−=−+−+−=−∑ XX
La media ponderada o promedio ponderado es una media aritmética en al que
cada uno de los valores se le pondera de acuerdo a su importancia con el grupo
general. Las fórmulas de media ponderada poblacional y muestral son idénticas:
wµ ó
w
wX
X w
∑
∑
=
)(
Donde:
wX Media Ponderada
X Observación individual
W Peso o ponderación asignada a cada observación
Cuando calculamos la media aritmética no sale a discusión si cada uno de los
datos tiene igual importancia, sin embargo en ciertos casos puede ocurrir que
determinados datos tengan más valor que otro de su mismo conjunto, observemos
el siguiente ejemplo:
Un estudiante obtuvo las siguientes calificaciones en su curso de estadística I: 19,
20, 18 y 16. Sin embargo dentro de los porcentajes la tercera calificación es la que
tiene mayor ponderación o mayor valor, debido a que representaba el 30 % de la
calificación final, a continuación se reflejan los datos en la siguiente tabla:
Calificaciones Ponderación XW
19 1 19
20 1 20
18 3 54
16 1 16
6 109
16,18
6
109)(
==
∑
∑
=
w
wX
X w
El promedio ponderado de calificaciones de este estudiante es de 18,16 puntos.
Media Geométrica
La media geométrica es útil para encontrar el promedio de porcentajes,
proporciones, índices o tasas de crecimiento. Tiene mucha aplicación en el
comercio y en la economía debido a que nos interesa encontrar el porcentaje de
cambio en ventas, salarios o cualquier otro dato económico. La media de un
conjunto n de números positivos se define como la n-ésima raíz del producto de
los n valores. La formula de la media geométrica se escribe así:
n
nxxMG ))...(( 1=
La media geométrica será siempre menor o igual a la media aritmética, pero
nunca mayor.
Ejemplo: Un empleado gana 700.000 bolívares al mes, este año va a recibir un
5% de aumento y el próximo año un 15%, si sacamos la media aritmética de estos
de ambos porcentajes nos daría un promedio de 10%, pero el verdadero
promedio es 9, 886. Empleemos la fórmula de media geométrica:
09886,1)15,1)(05,1( ==MG
Verifiquemos: si el trabajador del que hablábamos gana Bs. 650.000 con los dos
aumentos su sueldo quedará:
650.000 * 0,05= 32.500
682.000 * 0,15= 102.370
Total con el aumento 784.870 bolívares
Ahora realicemos el cálculo con nuestra media geométrica
700.000*0,09886=64.259
714.259*0,09886=70.611,6
Total = Bs.784.870
Mediana y Moda
Mediana
La mediana o media posicional queda en la mitad un grupo de elementos
ordenados de forma ascendente o descendente. En este caso la mitad de los
números estará por debajo de la mediana y la otra mitad por encima de ella. La
mediana se obtiene con la siguiente ecuación:
2
1+
=
n
Med
Si el grupo de datos es impar la mediana se calcula así de la siguiente forma.
La mayoría de las calculadoras pueden calcular la raíz enésima de
cualquier número
Ejemplo: Calculemos la mediana de los kilos(ordenados de forma ascendente) de
materia prima utilizadas durante esta semana: 33, 36, 40, 45, 57,60 y 68.
4
2
8
2
17
2
1
==
+
=
+
=
n
Med
La mediana es el valor que está en la posición 4: 33, 36, 40, 45, 57,60 y 68.
Si el grupo de datos es par, aplicamos la misma ecuación promediando los dos
valores centrales, observemos el ejemplo:
Datos: 10, 15, 18, 25, 31, 36, 45, 60, 77, 80
5,5
2
11
2
110
2
1
==
+
=
+
=
n
Med
El punto 5,5 estaría entre los valores de las posiciones 5 y 6, por lo buscamos
ambos valores y los promediamos 10, 15, 18, 25, 32, 36, 45, 60, 77, 80
43
2
86
2
3632
==
+
=X
La mediana es 43.
Moda
Es la medida de tendencia central más fácil de recordar ya verás por qué:
Seguramente responderás… Por que lo usan muchas personas, o por que lo
vemos frecuentemente en la calle, y efectivamente eso es la moda, el dato que
más se repite dentro de nuestro conjunto de elementos. Veamos este ejemplo:
Edades de los niños de nuestra familia:
12, 1, 10, 1, 10, 2, 5, 7, 8, 9, 10, 11. El número que más se repite es el 10, a pesar
del que el 1 también se repite, el 10 se repite mayor número de veces.
Medidas de Tendencia Central para Datos Agrupados
Antes de avanzar, es correcto aclarar que las definiciones de nuestras medidas de
tendencia central se mantienen, a continuación se te presentan un resumen
repaso con las definiciones de todas.
¿Por qué sabemos que algún producto está de
moda?
Media Aritmética:
Es una medida de tendencia central que se obtiene dividiendo la
suma de los valores del conjunto de datos entre el número total de
Media Ponderada:
Es un caso especial de media aritmética pero cuando todos
los datos tienen diferentes valores o ponderaciones que los
discrimina según su importancia
Media Geométrica:
Es una medida que calcula los promedios de los porcentajes
Media Aritmética para Valores Agrupados
Para aproximar la media aritmética de datos organizados en una distribución de
frecuencias, comenzamos por asumir que las observaciones de cada clase están
representadas por el punto medio de la clase. La media de una distribución de
frecuencias se calcula así:
n
fX
X
∑
=
En la que
X = media aritmética
X= valor o punto medio de cada clase
f= frecuencia de cada clase
fX= frecuencia en cada clase por el punto medio de la clase
fX∑ = suma de estos productos
n= número total de frecuencias
Ejemplo:
Calculemos la media del precio de venta de los vehículos del plan Venezuela
Móvil
Precio de Venta de
vehículos
(millones de bolívares)
Frecuenc
ia
18 a 23 25
23 a 28 28
28 a 33 26
33 a 38 17
38 a 42 13
Total 109
Mediana:
Observación de la mitad de los datos después de que se han colocado de forma
ordenada
Moda:
Es el valor que más se repite dentro de su conjunto, es decir, posee mayor
frecuencia
Al precio de venta medio de los vehículos puede estimarse a partir de datos
agrupados en una distribución de frecuencias, lo primero que debemos calcular es
el punto medio de cada clase, para eso le calculamos el promedio: 18+23/2=20,5
luego ese valor medio se multiplica por la frecuencia, como se muestra en la
siguiente tabla:
9,28
109
5,149.3
==
∑
=
n
fX
X
Decimos entonces que la media del precio de venta del plan Venezuela Móvil es
de Bs. 28.800.000.
La Mediana Para Valores Agrupados
La mediana es el valor por debajo del cual se encuentran una mitad de los valores
y por encima del cual se encuentra la otra mitad. Como los datos están
organizados en una distribución de frecuencias, se ha perdido algo de información.
Así no podemos calcular la mediana exacta, sin embargo, se puede estimar de la
siguiente manera:
)(2 i
f
CF
n
LMed
−
+=
Donde:
L= Límite inferior de la clase que contiene la mediana.
n= Número de frecuencias.
f= frecuencia en la clase mediana.
CF= número de las frecuencias acumuladas en las clases que preceden a la clase
que contiene la mediana.
i= amplitud de la clase en la que se encuentra la mediana.
Precios de
venta
Frecuencia
(f)
Punto Medio
(X)
fX
18 a 23 25 20,5 512,5
23 a 28 28 25,5 714
28 a 33 26 30,5 793
33 a 38 17 35,5 603,5
38 a 43 13 40,5 526,5
Total 109 3.149,5
Utilicemos los datos del ejemplo anterior, pero en esta oportunidad debemos
calcular la frecuencia acumulada, que no es más que la suma acumulada de las
frecuencias de cada clase o categoría, veámoslo en la siguiente tabla:
Precios de Venta Frecuencia (f)
Frecuencia
Acumulada
18 a 23 25 25
23 a 28 28 53
28 a 33 26 79
33 a 38 17 96
38 a 43 13 109
Total 109
Debemos localizar en cual clase se encuentra la mediana, para eso dividimos el
total de la frecuencia entre 2,
2
n =190/2=54,5. Ahora buscamos en la frecuencia
acumulada el grupo de intervalos que tenga a este número:
Precios de Venta Frecuencia (f)
Frecuencia
Acumulada
18 a 23 25 25
23 a 28 28 53
28 a 33 26 79
33 a 38 17 96
38 a 43 13 109
Total 109
Podemos apreciar fácilmente que el tercer grupo de intervalos es el que posee al
número en la posición 54,5 debido a que el anterior sólo llega hasta el número 53,
observemos este diagrama.
Sustituyamos ahora los valores:
000.288.28000.288000.000.28)000.000.5(
26
53
2
109
000.000.28)(2 =+=
−
+=
−
+= i
f
CF
n
LMed
53 79
? Mediana
Bs. 28.000.000 Bs.33.000.000
La mediana del precio de venta es 28.288.000.
Si comparamos la mediana con la media aritmética se nos presenta una
diferencia, pero recordemos que…
Moda Para Datos Agrupados
Siendo la moda el valor con más frecuencia, sólo debemos buscar dentro de
nuestra distribución de frecuencias los intervalos con mayor cantidad de
frecuencia, revisemos la tabla de precios de venta del Plan Venezuela Móvil.
Precios de Venta Frecuencia (f)
18 a 23 25
23 a 28 28
28 a 33 26
33 a 38 17
38 a 43 13
Total 109
El intervalo de 23 a 28 millones es que tiene mayor cantidad de observaciones,
por lo tanto para determinar la moda calculamos el punto medio de la clase:
23+28/2=25,5; por lo tanto la moda del precio de venta es Bs. 25.500.000.
Media Geométrica para Datos Agrupados
La media geométrica para datos agrupados se determina con la siguiente
ecuación:
nf
n
fn f
XXXMG ...21
21=
Donde
X= punto medio de los intervalos
f = frecuencia
Recuerda
No podremos determinar una mediana exacta porque
hemos perdidos datos en el proceso de agrupación
La media geométrica se calcula para promedios de porcentajes
Relación entre Media, Mediana y Moda
En las distribuciones simétricas la media, la mediana y la moda
coinciden en el valor, mientras que en una distribución
asimétrica positiva la media es mayor que la mediana, pero por
el contrario, si la distribución es asimétrica negativa, la media es
menor que la mediana.
Simétrica Asimétrica negativa Asimétrica positiva
Medidas de Posición No Central
Los cuartiles, deciles y percentiles se asemejan a la mediana por que dividen la
distribución en partes iguales, la mediana lo hace en dos los que están por encima
y or debajo de ella, mientras que los cuartiles dividen los valores en cuatro partes
iguales, los deciles en diez y los percentiles en cien. A continuación se te
muestran las ecuaciones necesarias para su cálculo:
Medidas de Posición No
Central
Datos simples Datos Agrupados
Cuartiles
4
nx
Qx
∗
=
Deciles
10
nx
Dx
∗
=
Percentiles
100
nx
Px
∗
=
Cuartiles
Los cuartiles dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales, Los cuartiles son denotados como Q1, Q2, Q3. El
segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual
o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión
(ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las
tres cuartas partes (75%) de los datos.
Para Datos Simples
Media MediaMedia
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
Cuando n es par:
4
1 n
Qx
∗
= Recordemos que x representa el valor del cuartel que puede ser 1,2 y 3
Cuando n es impar:
Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos un número
grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los
cuartiles cuando se trata de datos agrupados es la siguiente:
k= 1,2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Deciles
Los deciles dividen la continuidad de los datos ordenados en diez partes
porcentualmente iguales. Los deciles se denotan D1, D2,..., D9, que se leen
primer decil, segundo decil, etc.
Para Datos Simples
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
10
nx
Dx
∗
= Cuando n es par:
10
)1( +
=
nx
Dx Cuando n es impar:
Siendo x el número del decil.
Para Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
El cuarto decil, es aquel valor de la variable que supera al 40%, de las
observaciones y es superado por el 60% de las observaciones.
El quinto decil corresponde a la mediana.
El noveno decil supera al 90% y es superado por el 10% restante.
Donde (para todos):
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Centiles o Percentiles
Los percentiles son una de las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales
como peso, estatura, etc. Los percentiles dividen los datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.
Para Datos Simples
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
Para los percentiles, cuando n es par:
100
nx
Px
∗
=
100
)1( +∗
=
nx
Px
Cuando n es impar:
Siendo x, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.
Para Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan
mediante la fórmula:
k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las
observaciones y es superado por el 40% de las observaciones.
El percentil 99 supera 99% de los datos y es superado a su vez por el 1%
restante.
Ejemplo
Determinación del primer cuartil, el séptimo decil y el treintavo percentil, de la
siguiente tabla:
Salarios
(en miles de
bolívares)
Número de
Empleados
(f1)
Frecuencia
Acumulada
200-299 85 85
300-399 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463
Como son datos agrupados, se utiliza la fórmula
Siendo,
La posición del primer cuartil.
La posición del septimo decil.
La posición del treintavo percentil.
Entonces,
El primer cuartil:
115.5 – 85 = 30.75
Li = 300, Ic = 100 , fi = 90
El 7 decil:
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70
El percentil 30
Posición:
138.9 – 85 = 53.9
fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por
debajo de Bs.334.000; que bajo Bs. 541.570 gana el 57% de los empleados y
sobre Bs. 359.880, gana el 70% de los empleados.
UNIDAD IV
MEDIDAS DE DISPERSIÓN O VARIABILIDADMEDIDAS DE DISPERSIÓN O VARIABILIDAD
¡MAGNÍFICO!
Llegamos a la última unidad
de esta divertida unidad curricular
Aquí encontrarás…
 Contenidos de la segunda
unidad
 Ejemplos
 Ejercicios propuestos
UNIDAD 4. MEDIDAS DE DISPERSIÓNUNIDAD 4. MEDIDAS DE DISPERSIÓN
Las medidas de tendencia central por sí solas carecen de significado, pues de
nada sirve saber el promedio sin conocer la dispersión, qué significa esto, saber
cuanto se alejan las observaciones de su propio promedio, observemos el
siguiente ejemplo:
A continuación se te presenta el monto en bolívares de ventas mensuales de las
empresas “XXX” y “ZZZ”
Meses
Empresa
“XXX”
Empresa
“ZZZ”
Julio 1.500.000 4.800.000
Agosto 1.800.000 3.900.000
Septiembre 2.000.000 2.000.000
Octubre 2.300.000 1.400.000
Noviembre 2.500.000 700.000
Diciembre 2.800.000 100.000
Total 12.900.000 12.900.000
Empresa “XXX” 000.150.2=X Empresa “ZZZ” 000.150.2=X
Ambas tienen la misma media en ventas, pero si realizamos el análisis
considerando cada una de las ventas del mes podemos apreciar que la situación
de la empresa “ZZZ” es muy delicada, debido a que el último mes de facturación
se aleja mucho de la media. Por esto la importancia de las medidas de dispersión.
Existen dos grupos de medidas de dispersión. El primer grupo es el de las
medidas de dispersión absolutas que vienen expresado por las mismas medidas
que identifican a la serie de datos; el segundo grupo es el de las medias de
dispersión relativas que son relaciones entre las medidas de dispersión y las
medidas de tendencia central, expresado en valores abstractos (porcentajes).
Medidas de Dispersión Absolutas
Medidas de Dispersión:
Miden que tanto se dispersan los datos recabados de su media
El Rango
El rango o recorrido es la medida de dispersión más sencilla, consiste en calcular
la diferencia entre el valor mayor o el valor menor de la observación:
VmVMR −=
Revisemos el siguiente ejemplo:
Horas diarias dedicadas al estudio por un grupo de estudiantes del plan de
formación Administración y Gestión:
1,5 2 3 2,5
2 3 3,5 4
2 2,5 1 1
Calculemos la media aritmética 23,2
12
28
≈==X . Podemos decir que todos los
alumnos dedican aproximadamente dos horas diarias al estudio. Calculemos el
Rango, R=Vm-Vm=4-1=3. El rango de 3 es la distancia entre los límites. El rango
es una medida de dispersión débil pues sólo incluye dos valores del conjunto.
El rango es una buena opción cuando comparamos dos situaciones similares,
retomemos el ejemplo al principio de la unidad
Monto en bolívares de ventas mensuales de las empresas “XXX” y “ZZZ”
Meses
Empresa
“XXX”
Empresa
“ZZZ”
Julio 1.500.000 4.800.000
Agosto 1.800.000 3.900.000
Septiembre 2.000.000 2.000.000
Octubre 2.300.000 1.400.000
Noviembre 2.500.000 700.000
Diciembre 2.800.000 100.000
Total 12.900.000 12.900.000
Empresa “XXX” 000.150.2=X Empresa “ZZZ” 000.150.2=X
Calculemos el rango de cada una
XXX= 2.800.000 - 1.500.000=1.300.000
ZZZ= 4.800.000 – 100.000= 4.700.000
Podemos concluir que la media de la empresa XXX es más representativa que la
de la empresa ZZZ.
Para calcular el rango de datos agrupados tomamos el límite inferior de la primera
clase y el límite superior de la última clase. Ejemplo.
Utilicemos la distribución e frecuencias del Plan Venezuela Móvil trabajado en la
unidad anterior
Precios de Venta del
Vehículo
Frecuencia (f)
18 a 23 25
23 a 28 28
28 a 33 26
33 a 38 17
38 a 43 13
Total 109
8,21
5
109
==X 251843 =−=−= VmVMR
El rango es 25 millones.
Desviación Media
La desviación media mide la cantidad media en que los valores de la población, o
de la muestra, varían de la media. Se define así:
n
XX
DM
−∑
=
Donde
Xes el valor de cada observación
X = es la media aritmética de los valores
n= es el número de observaciones en la muestra
= indica el valor absoluto. En otras palabras se hace caso omiso de los signos
de las desviaciones medias, ¿Por qué? Porque si no lo hiciéramos así las
desviaciones positivas y negativas se anularían, y al desviación siempre sería
cero, y una medida de dispersión cero sería completamente inútil.
Ejemplo
1,5 2 3 2,5
2 3 3,5 4
2 2,5 1 1
Número de (X-X) Desviación Absoluta
horas
1,5
1,5-2,3=-
0,8
0,8
2 2-2,3=-0,3 0,3
3 3-2,3=0,7 0,7
3,5 3,5-2,3=1,2 1,2
4 4-2,3 1,7
4,7
194,0
5
7,4
≈==
−∑
=
n
XX
DM El número de horas estudiada se desvía de la
media en una hora
Varianza y Desviación Estándar
La varianza y la desviación estándar son medidas de dispersión basadas en la
desviación media, pero en lugar de usar valores absolutos, elevamos al cuadrado
las desviaciones. Elevar al cuadrado significa eliminar los números negativos. La
variancia y la desviación son las medidas de dispersión más útiles, pues
proporcionan una medida más significativa sobre el punto de dispersión
Varianza poblacional y Desviación Estándar para datos simples
Recordemos que la población son todas las observaciones que hemos recabado,
es decir, los datos. Su fórmula es:
1
)( 2
2
−
−∑
=
n
XX
S i
Donde
2
S =varianza poblacional
X= valor de una observación de la población
X = media aritmética de la población
n= Número de observaciones de la población
Ejemplo:
Varianza: La media aritmética de las desviaciones de la
media elevadas al cuadrado.
Desviación Estándar: La raíz cuadrada positiva de la varianza
Un corredor de seguros vende tres pólizas por los siguientes precios en millones:
32, 23 y 26
27
3
262332
=
++
=X
El precio de las pólizas de seguro está estrechamente agrupado
alrededor de los 27 millones de bolívares y pueden fluctuar entre los 3.740.000
bolívares.
Varianza Poblacional y Desviación Estándar para Datos Agrupados
1
22
2
−
−∑
=
n
XnfM
S 2
ss =
Ejemplo:
El director de Conviasa requiere conocer el número de pasajeros atendidos por
día para determinar si la variación de pasajeros es grande, ya que de ello depende
la ampliación en la flota de aviones, la distribución de frecuencias es la siguiente:
Pasajeros
(Clases)
Días
(Frecuenci
a)
Punto Medio
(M)
fM M
2
fM
2
50-59 3 54,5 163,5 2.970,25 8.910,75
60-69 7 64,5 451,5 4.160,25 29.121,75
70-79 18 74,5 1341 5.550,25 99.904,50
80-89 12 84,5 1014 7.140,25 85.683
90-99 8 94,5 756 8.930,25 71.442
100-09 2 104,5 209 10.920,25 21.840,5
TOTAL 50 3.935 316.902,50
7,78
50
935.3
==
∑
=
n
fM
X g Por lo tanto
31,147
49
)7,78(505,902.316
1
222
2
=
−
=
−
−∑
=
n
XnfM
S
14,1231,1472
=== ss
74,32
== SS
14
3
11625
3
)2726()2723()2732( 222
2
=
++
=
−+−+−
=S
El director de Conviasa ya puede decidir si los aviones que utilizan actualmente
pueden acomodar fluctuaciones hasta de 12 pasajeros en los días de tránsito
pesado.
Medidas Relativas de Dispersión
Las medidas de dispersión estudiadas hasta ahora no nos permiten hacer
comparaciones entre la dispersión de los valores de varias distribuciones, ya que
todas ellas están afectadas por la unidad de medida en que se expresan los datos;
de allí que la comparación sería imposible porque cada medida vendría expresada
en unidades diferentes. Además varias distribuciones pueden tener un mismo
tener un mismo valor para determinada medida de dispersión y ser la variabilidad
de sus datos en relación con la media, diferente.
Por ello la existencia de medidas de dispersión relativa que se expresan en
porcentaje (valores abstractos) y se determinan por la relación existente entre una
medida de dispersión absoluta y una medida de la tendencia central, relación que
nos permite compara la variabilidad de los datos entre varias series.
La medida de dispersión relativa de mayor importancia es el coeficiente de
variación, que se expresa en porcentajes y se calcula por la relación que existe
entre la desviación estándar y la media aritmética. Su fórmula es la siguiente:
100
X
CV
σ
=
Ejercicios Unidades 2, 3 y 4
1) Qué tipo de instrumento de recolección de datos aplicarías en as
siguiente situaciones y por qué.
a.Para registrar el comportamiento de niños en un parque público.
b.para supervisar la correcta ejecución de una obra en tu comunidad.
c. Para registrar los hábitos alimenticios de tus familiares y amigos en una
reunión
d.Para contratar nuevos personal para tu empresa
e.Para solucionar un problema entre el personal que labora en una
organización.
f. Para conocer la opinión del público sobre los productos que produces.
2) Realiza un censo en tu comunidad sobre dos variables de tu interés, por
ejemplo: cantidad de papeleras por acera, cantidad de vecinos que
participan en las misiones, etc. Luego:
a.Clasifica las variables según su nivel de medición
b.Realiza el proceso de recolección de datos (con al menos 20
observaciones, muestras)
c. Elabora la distribución de frecuencias para ambos casos
d.Selecciona el gráfico que más se adecue a tu variable y presenta en los
resultados obtenidos.
e.Calcula la media aritmética, la mediana y la moda de las variables
estudiadas, con su respectiva medida de dispersión (Varianza y
desviación estándar)
3) Calcula la media, mediana y la moda de las edades de tu grupo familiar
4) Calcula la razón de postes de alumbrado público en buen y mal estado
que están en el trayecto que va desde tu casa hasta tu sitio de estudio o
de trabajo.
FELICITACIONES!!!!
Concluimos exitosamente este proceso de
aprendizaje, esperamos que lo hayas
disfrutado.
Respuestas
Unidad I
1) Escribe cinco ejemplos de datos cuantitativos y cinco de datos cualitativos.
Respuesta abierta
2) Realiza un ejemplo de una población y su muestra.
Respuesta abierta
3) Determina cual de los siguientes puntos es una población o una muestra:
Los estudiantes de sexto grado de Venezuela. Población
Los estudiantes de Caracas pertenecientes a Misión Sucre. Muestra
Todas las familias con mascotas de un municipio. Población
Los reportes de un día sobre las actividades realizadas en un liceo.
Muestra
4) Clasifica en cualitativa y cuantitativas las siguientes variables:
Los literales de calificación en la escuela básica (A,B,C,D y E) Cualitativa
El color de cabello de las personas de una comunidad. Cualitativa
Cantidad de pacientes atendidos por Barrio Adentro. Cuantitativa
Cantidad de hijos de nuestros vecinos. Cuantitativa
5) Clasifica las siguientes variables como continuas o discretas
Número de camisas producidas por una cooperativa. Discreta
Las horas de un día. Continua
Cantidad de estudiantes de nuestra comunidad. Discreta
Kilos de pollo vendidos en Mercal. Continua
6) Cuál es el nivel de medición de las siguientes variables:
Calificaciones de los estudiantes en la primera prueba de estadística.
Razón
Una clasificación de los estudiantes de la zona en la que viven Nominal
Temas de los discursos del presidente Chávez. Nominal
El número de horas por semana que estudia alumno de Misión Sucre.
Razón
El año de fabricación del transporte público que cubre la ruta de nuestro
vecindario. Intervalo
Los periódicos vendidos cada domingo. Razón
Grupos de estudiantes según su edad. Ordinal
Unidades 2, 3 y 4
1) Qué tipo de instrumento de recolección de datos aplicarías en as siguiente
situaciones y por qué.
a.Para registrar el comportamiento de niños en un parque público.
Observación
b.Para supervisar la correcta ejecución de una obra en tu comunidad.
Observación, Entrevistas
c. Para conocer los hábitos alimenticios de tus familiares y amigos en una
reunión. Cuestionario
d.Para contratar nuevos personal para tu empresa. Entrevista
e.Para solucionar un problema entre el personal que labora en una
organización. Entrevista
f. Para conocer la opinión del público sobre los productos que produces.
Cuestionario
2) Realiza un censo en tu comunidad sobre dos variables de tu interés, por
ejemplo: cantidad de papeleras por acera, cantidad de vecinos que
participan en las misiones, etc. Luego:
g.Clasifica las variables según su nivel de medición
h.Realiza el proceso de recolección de datos (con al menos 20
observaciones, muestras)
i. Elabora la distribución de frecuencias para ambos casos
j. Selecciona el gráfico que más se adecue a tu variable y presenta en los
resultados obtenidos.
k. Calcula la media aritmética, la mediana y la moda de las variables
estudiadas, con su respectiva medida de dispersión (Varianza y
desviación estándar)
Respuesta Abierta según los datos obtenidos
3) Calcula la media, mediana y la moda de las edades de tu grupo familiar
Respuesta Abierta según los datos obtenidos
4) Calcula la razón de postes de alumbrado público en buen y mal estado
que están en el trayecto que va desde tu casa hasta tu sitio de estudio o de
trabajo.
Respuesta Abierta según los datos obtenidos
Bibliografía
KAZMIER, L. (1998) Estadística Aplicada a la Administración y a la Economía.
Mac Graw Hill. México
LIND, D, Mason, R y Marchal, W (2001) Estadística para Administración y
Economía. Mac Graw Hill. México.
RIVAS, E. (2000) Estadística General. Ediciones de la Biblioteca. UCV. Caracas
WEBSTER, A. (2000) Estadística aplicada a los Negocios y a la Economía.
Mac Graw Hill, Santa Fé de Bogotá.

Más contenido relacionado

La actualidad más candente

1.8. histograma
1.8.  histograma1.8.  histograma
1.8. histogramaITCM
 
Términos básicos en estadística
Términos básicos en estadísticaTérminos básicos en estadística
Términos básicos en estadísticaGabriel Marval'
 
Diapositiva de Estadistica Aplicada Licdo. Uriel Castellanos, UPEL-IMPM, gru...
Diapositiva de Estadistica Aplicada  Licdo. Uriel Castellanos, UPEL-IMPM, gru...Diapositiva de Estadistica Aplicada  Licdo. Uriel Castellanos, UPEL-IMPM, gru...
Diapositiva de Estadistica Aplicada Licdo. Uriel Castellanos, UPEL-IMPM, gru...Erika Carolina Colina Morales
 
Datos cuantitativos mapa conceptual
Datos cuantitativos mapa conceptualDatos cuantitativos mapa conceptual
Datos cuantitativos mapa conceptualLuis Gutierrez
 
Escala y tipos de escalas Original
Escala y tipos de escalas OriginalEscala y tipos de escalas Original
Escala y tipos de escalas Originalcaremquintans
 
Tasas de interes
Tasas de interes Tasas de interes
Tasas de interes ana suniaga
 
Programa estadístico SPSS Equipo 3
Programa estadístico SPSS Equipo 3Programa estadístico SPSS Equipo 3
Programa estadístico SPSS Equipo 3Fisioterapiateamht
 
MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)
MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)
MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)Videoconferencias UTPL
 
Investigación acción participativa
Investigación acción participativaInvestigación acción participativa
Investigación acción participativaAna Maria Franco
 
Ramas de la estadística
Ramas de la estadísticaRamas de la estadística
Ramas de la estadísticaTina Campos
 
Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...
Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...
Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...Vinícius M. Kern
 
Ecuaciones de valor
Ecuaciones de valorEcuaciones de valor
Ecuaciones de valorbillod
 
Números indices
Números indices Números indices
Números indices Daniel Baez
 
Procesamiento electronico de datos
Procesamiento electronico de datosProcesamiento electronico de datos
Procesamiento electronico de datosvladimir
 
ELEMENTOS ESTADÍSTICOS
ELEMENTOS ESTADÍSTICOSELEMENTOS ESTADÍSTICOS
ELEMENTOS ESTADÍSTICOSGnOpE
 
Escalas de Medicion, Importancia y Aplicacion de las Escalas Jhony Perez
Escalas de Medicion, Importancia y Aplicacion de las Escalas Jhony PerezEscalas de Medicion, Importancia y Aplicacion de las Escalas Jhony Perez
Escalas de Medicion, Importancia y Aplicacion de las Escalas Jhony PerezJhonyPerez9
 
Interes simple (1)
Interes simple  (1)Interes simple  (1)
Interes simple (1)Byron Quito
 

La actualidad más candente (20)

Ubv estadistica
Ubv   estadisticaUbv   estadistica
Ubv estadistica
 
Tasas de interes
Tasas de interesTasas de interes
Tasas de interes
 
1.8. histograma
1.8.  histograma1.8.  histograma
1.8. histograma
 
Términos básicos en estadística
Términos básicos en estadísticaTérminos básicos en estadística
Términos básicos en estadística
 
Diapositiva de Estadistica Aplicada Licdo. Uriel Castellanos, UPEL-IMPM, gru...
Diapositiva de Estadistica Aplicada  Licdo. Uriel Castellanos, UPEL-IMPM, gru...Diapositiva de Estadistica Aplicada  Licdo. Uriel Castellanos, UPEL-IMPM, gru...
Diapositiva de Estadistica Aplicada Licdo. Uriel Castellanos, UPEL-IMPM, gru...
 
Datos cuantitativos mapa conceptual
Datos cuantitativos mapa conceptualDatos cuantitativos mapa conceptual
Datos cuantitativos mapa conceptual
 
Escala y tipos de escalas Original
Escala y tipos de escalas OriginalEscala y tipos de escalas Original
Escala y tipos de escalas Original
 
Tasas de interes
Tasas de interes Tasas de interes
Tasas de interes
 
Programa estadístico SPSS Equipo 3
Programa estadístico SPSS Equipo 3Programa estadístico SPSS Equipo 3
Programa estadístico SPSS Equipo 3
 
MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)
MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)
MATEMÁTICAS FINANCIERAS ( I Bimestre Abril Agosto 2011)
 
Investigación acción participativa
Investigación acción participativaInvestigación acción participativa
Investigación acción participativa
 
Ramas de la estadística
Ramas de la estadísticaRamas de la estadística
Ramas de la estadística
 
Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...
Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...
Cosmovisión, estrategia y métodos de investigación: opciones teórico-metodoló...
 
Ecuaciones de valor
Ecuaciones de valorEcuaciones de valor
Ecuaciones de valor
 
Números indices
Números indices Números indices
Números indices
 
Procesamiento electronico de datos
Procesamiento electronico de datosProcesamiento electronico de datos
Procesamiento electronico de datos
 
ELEMENTOS ESTADÍSTICOS
ELEMENTOS ESTADÍSTICOSELEMENTOS ESTADÍSTICOS
ELEMENTOS ESTADÍSTICOS
 
Escalas de Medicion, Importancia y Aplicacion de las Escalas Jhony Perez
Escalas de Medicion, Importancia y Aplicacion de las Escalas Jhony PerezEscalas de Medicion, Importancia y Aplicacion de las Escalas Jhony Perez
Escalas de Medicion, Importancia y Aplicacion de las Escalas Jhony Perez
 
Interes simple (1)
Interes simple  (1)Interes simple  (1)
Interes simple (1)
 
Unidad i
Unidad iUnidad i
Unidad i
 

Destacado

Lideratge per a l'aprenentatge. Joan Badia #AgostMe21
Lideratge per a l'aprenentatge. Joan Badia #AgostMe21Lideratge per a l'aprenentatge. Joan Badia #AgostMe21
Lideratge per a l'aprenentatge. Joan Badia #AgostMe21MenorcaEdu21
 
Prinzipien agiler Entwicklung
Prinzipien agiler EntwicklungPrinzipien agiler Entwicklung
Prinzipien agiler EntwicklungNEOMO GmbH
 
El realismo (2)
El realismo (2)El realismo (2)
El realismo (2)jhonxd14
 
Taller de aprendizaje RIVERA GONZALEZ NINDE
Taller de aprendizaje RIVERA GONZALEZ NINDETaller de aprendizaje RIVERA GONZALEZ NINDE
Taller de aprendizaje RIVERA GONZALEZ NINDENinde Rivera Gonzalez
 
Tics aplicadas a la educación
Tics aplicadas a la educaciónTics aplicadas a la educación
Tics aplicadas a la educacióncavenama3
 
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...Martin Blenkle
 
Practica I Capacidad de disolucion del agua UNAM
Practica I Capacidad de disolucion del agua UNAMPractica I Capacidad de disolucion del agua UNAM
Practica I Capacidad de disolucion del agua UNAMJpbmn
 
infamy Präsentation
infamy Präsentationinfamy Präsentation
infamy Präsentationfuzzy
 
Asesoría para el uso de las tic en la formación ACTIVIDAD 1
Asesoría para el uso de las tic en la formación ACTIVIDAD 1Asesoría para el uso de las tic en la formación ACTIVIDAD 1
Asesoría para el uso de las tic en la formación ACTIVIDAD 1Pipe_martinez
 
Segundo tutorial netvibes de como se puede publicar la información organizada...
Segundo tutorial netvibes de como se puede publicar la información organizada...Segundo tutorial netvibes de como se puede publicar la información organizada...
Segundo tutorial netvibes de como se puede publicar la información organizada...Tatiana Bello
 

Destacado (20)

Lideratge per a l'aprenentatge. Joan Badia #AgostMe21
Lideratge per a l'aprenentatge. Joan Badia #AgostMe21Lideratge per a l'aprenentatge. Joan Badia #AgostMe21
Lideratge per a l'aprenentatge. Joan Badia #AgostMe21
 
Prinzipien agiler Entwicklung
Prinzipien agiler EntwicklungPrinzipien agiler Entwicklung
Prinzipien agiler Entwicklung
 
El realismo (2)
El realismo (2)El realismo (2)
El realismo (2)
 
TIC
TICTIC
TIC
 
Taller de aprendizaje RIVERA GONZALEZ NINDE
Taller de aprendizaje RIVERA GONZALEZ NINDETaller de aprendizaje RIVERA GONZALEZ NINDE
Taller de aprendizaje RIVERA GONZALEZ NINDE
 
Proyecto
ProyectoProyecto
Proyecto
 
Actividades
ActividadesActividades
Actividades
 
Bienvenidos!!!
Bienvenidos!!!Bienvenidos!!!
Bienvenidos!!!
 
Formas verbales
Formas verbalesFormas verbales
Formas verbales
 
Historia del reggae
Historia  del reggaeHistoria  del reggae
Historia del reggae
 
Tics aplicadas a la educación
Tics aplicadas a la educaciónTics aplicadas a la educación
Tics aplicadas a la educación
 
Presentación
PresentaciónPresentación
Presentación
 
Exposicion spyware
Exposicion spywareExposicion spyware
Exposicion spyware
 
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
 
Informatica
InformaticaInformatica
Informatica
 
Practica I Capacidad de disolucion del agua UNAM
Practica I Capacidad de disolucion del agua UNAMPractica I Capacidad de disolucion del agua UNAM
Practica I Capacidad de disolucion del agua UNAM
 
infamy Präsentation
infamy Präsentationinfamy Präsentation
infamy Präsentation
 
Asesoría para el uso de las tic en la formación ACTIVIDAD 1
Asesoría para el uso de las tic en la formación ACTIVIDAD 1Asesoría para el uso de las tic en la formación ACTIVIDAD 1
Asesoría para el uso de las tic en la formación ACTIVIDAD 1
 
Presión en un fluido
Presión en un fluidoPresión en un fluido
Presión en un fluido
 
Segundo tutorial netvibes de como se puede publicar la información organizada...
Segundo tutorial netvibes de como se puede publicar la información organizada...Segundo tutorial netvibes de como se puede publicar la información organizada...
Segundo tutorial netvibes de como se puede publicar la información organizada...
 

Similar a Estadistica i

Similar a Estadistica i (20)

Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...
 
Clase1 unidad1
Clase1 unidad1Clase1 unidad1
Clase1 unidad1
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
Hamletmatamata cap 1
Hamletmatamata cap 1Hamletmatamata cap 1
Hamletmatamata cap 1
 
Estadistica modulo i
Estadistica modulo iEstadistica modulo i
Estadistica modulo i
 
Conlasticlaestadisticaesdivertida
ConlasticlaestadisticaesdivertidaConlasticlaestadisticaesdivertida
Conlasticlaestadisticaesdivertida
 
.Guia n5matematicaii ciclodeem
.Guia n5matematicaii ciclodeem.Guia n5matematicaii ciclodeem
.Guia n5matematicaii ciclodeem
 
Present. sig jpf
Present. sig jpfPresent. sig jpf
Present. sig jpf
 
Present. sig jpf
Present. sig jpfPresent. sig jpf
Present. sig jpf
 
Presentacion_Tema1_estadistica_uc3m .pdf
Presentacion_Tema1_estadistica_uc3m .pdfPresentacion_Tema1_estadistica_uc3m .pdf
Presentacion_Tema1_estadistica_uc3m .pdf
 
Trabajo estadistica yenni (1)
Trabajo estadistica yenni (1)Trabajo estadistica yenni (1)
Trabajo estadistica yenni (1)
 
Iii ciclo unidad_de_estadistica_
Iii ciclo unidad_de_estadistica_Iii ciclo unidad_de_estadistica_
Iii ciclo unidad_de_estadistica_
 
III ciclo unidad_de_estadistica
III ciclo unidad_de_estadisticaIII ciclo unidad_de_estadistica
III ciclo unidad_de_estadistica
 
Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2
 
Ensayo 1
Ensayo 1Ensayo 1
Ensayo 1
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica introduccion
Estadistica introduccionEstadistica introduccion
Estadistica introduccion
 
Estadistica semana 1
Estadistica semana 1Estadistica semana 1
Estadistica semana 1
 

Estadistica i

  • 1. REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DE EDUCACIÓN SUPERIOR UNIDADES CURRICULARES ESPECIALIZADAS ESTADÍSTICA IESTADÍSTICA I Primer Trayecto – Tercer Trimestre horas Trabajo Acompañado Trabajo Independiente Horas por semana Total horas en el período Material elaborado por: Márquez Zambrano, Luisa “1805 -2005 Bicentenario del Juramento del Libertador Simón Bolívar en el Monte Sacro”
  • 2. Índice pp. Índice ii Objetivo y Contenidos de la Unidad Curricular iv Instrucciones Generales vi Introducción vii Unidad 1. Aspectos Generales de la Estadística 1 ▪ Concepto, objeto y rama de la estadística. Síntesis histórica. 1 ▪ Tipos de estadística 4 ▪ Universo, población y variable 5 ▪ Concepto de medición. Niveles y Escalas de medida. ▪ Clasificación de las escalas de medida. 8 ▪ Tipos de investigación estadística. 11 ▪ Importancia de la estadística en las ciencias administrativas y económicas 12 Unidad 2. Obtención, Ordenamiento y Representación de Datos Estadísticos 15 ▪ Fuentes y métodos de recolección de datos. Ventajas y limitaciones. 15 ▪ Preparación de datos estadísticos. 18 ▪ Razones, proporciones y porcentajes. 18 ▪ Distribución de frecuencias. 20 ▪ Presentación de los datos estadísticos mediante gráficos. Tipos, normas y elementos. 21 Unidad 3. Medidas Estadísticas de Posición Central y No Central 25 ▪ Medidas de tendencia central para datos simples Media aritmética. 25 Media ponderada. 26 Media geométrica. 27 Mediana y moda. 28 ▪ Medidas de tendencia central para datos simples Media aritmética. 30 Mediana. 31 Moda. 32 Media geométrica. 33 ▪ Medidas de tendencia no central Percentiles, cuartiles y deciles. 33 ESTADÍSTICA I ii
  • 3. Unidad 4. Medidas de Dispersión o Variablidad 40 ▪ La dispersión. ▪ Medidas de dispersión absolutas Rango o recorrido 40 Desviación media 42 Varianza y desviación típica 42 ▪ Medidas de dispersión relativas. Coeficiente de variación 44 ESTADÍSTICA I iii
  • 4. Objetivos y Contenidos de la Unidad Curricular Estadística I El presente curso se estructura en cuatro unidades, las cuales permitirán analizar de forma estadísticas los datos de tus actividades empresariales con el propósito de lograr una toma de decisiones eficientes, es decir, que te permitan realizar evalúo económico y social de las actividades que realices dentro de la organización en la cual te desempeñas. Cada una de las unidades programáticas de este material contempla la presentación teórica de los contenidos. A continuación se presentan el objetivo general de la unidad curricular y los contenidos de la misma. Objetivo General: 1. Analizar los datos estadísticos para la toma de decisiones apropiadas en el diagnóstico, planificación e interpretación de los procesos inherentes a la administración. Contenidos: UNIDAD 1. ASPECTOS GENERALES DE LA ESTADÍSTICA ▪ Concepto, objeto y rama de la estadística. Síntesis histórica. ▪ El dato estadístico: cuantitativo y cualitativo. Universo, población y variable ▪ Concepto de medición. Niveles y Escalas de medida. Clasificación de las escalas de medida ▪ Importancia de la estadística en las ciencias administrativas y económicas. ▪ Tipos de investigación estadística. UNIDAD 2. OBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOS ESTADÍSTICOS ▪ Fuentes y métodos de recolección de datos. Ventajas y limitaciones. ▪ Preparación de datos estadísticos. ▪ Presentación de los datos estadísticos mediante tablas y gráficos. Tipos, normas y elementos. ▪ Análisis de los datos estadísticos. Razones, proporciones y porcentajes. ▪ Distribución de frecuencias. ESTADÍSTICA I iv
  • 5. ▪ Lectura e interpretación de tablas y gráficos. UNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO CENTRAL. ▪ Media aritmética. Concepto, propiedades y cálculo para datos simples y distribuciones de frecuencia. ▪ Media ponderada. Concepto, propiedades y cálculo para datos simples y distribuciones de frecuencia. Concepto, propiedades y cálculo para datos simples y distribuciones de frecuencia. ▪ Media geométrica. Concepto y propiedades para datos simples y distribuciones de frecuencia. ▪ Mediana y moda. Concepto y propiedades para datos simples y distribuciones de frecuencia. ▪ Percentiles, cuartiles y deciles. Concepto y propiedades para datos simples y distribuciones de frecuencia. UNIDAD 4. MEDIDAS DE DISPERSIÓN O VARIABILIDAD. ▪ La dispersión. Estadísticos de dispersión. Medidas absolutas y medidas relativas. Fuentes y métodos de recolección de datos. Ventajas y limitaciones. ▪ Recorrido: concepto características y formas de cálculo. ▪ Desviación media. Concepto, características y formas de cálculo. ▪ Varianza y desviación típica. Concepto, características y formas de cálculo. ▪ Coeficiente de variación. Concepto, características y formas de cálculo. ESTADÍSTICA I v
  • 6. INSTRUCCIONES GENERALES Este material estará conformado por aspectos teóricos y prácticos, esto significa que aquí encontrarás los planteamientos fundamentales de cada contenido, con ejemplos y algunas propuestas de ejercitación. También contarás con elementos de ayuda que te brindarán información resaltante del contenido estudiado, estos mensajes están resaltados de diferentes formas, a continuación se te presentan sus significados: Los recuadros rellenos y sombreados indican la exposición de una definición. La presentación de notas, datos curiosos o resúmenes se realizarán por medio de cuadros de texto con borde irregular Los cambios de letra indican la introducción de un ejemplo Los recuadros de doble línea presentan interrogantes con las que haremos reflexiones sobre el contenido que se está trabajando. Adelante la estadística de espera… y recuerda: “Sólo en el diccionario el éxito está antes que el trabajo.” Profesor Luis Huguet ESTADÍSTICA I vi
  • 7. Introducción Lind, Mason y Marchal (2001) en su libro “Estadística para administración y contaduría” hacen referencia a una cita de H.C.Well, un escritor e historiador inglés, quien dijo hace más de 100 años que “para ser un buen ciudadano, el pensamiento estadístico sería un día tan importante como saber leer”. Estos mismos autores afirman que Well no mencionó los negocios porque apenas comenzaba la revolución francesa, sin embargo, aseguran que si ese escritor tuviera hoy la posibilidad de hacer un comentario sobre las estadísticas seguramente diría que “el pensamiento estadístico es necesario no sólo para ser un buen ciudadano, sino también para la toma de decisiones acertadas en los negocios”. La estadística la aprendemos desde la educación básica, no obstante, pareciera que no encontráramos el valor y la utilidad que ella tiene en la vida diaria. Aun en las circunstancias más comunes de nuestro día a día empleamos estadística para la toma de decisiones, por ejemplo, cada vez que vamos a bañarnos si disponemos de un calentador de agua abrimos el chorro durante un rato hasta que comienza a salir el agua caliente, metemos la mano, probamos la temperatura, decidimos si se agrega más agua fría o no y cuando consideramos que la temperatura es adecuada decidimos entrar a la regadera. En este caso tomamos una decisión basándonos en una muestra, esta cotidianidad es una de las técnicas empleadas por la estadística. Estadística es el conjunto de técnicas que se emplean para la recolección, organización, análisis e interpretación de datos, los resultados del análisis y la interpretación nos permiten predecir determinados acontecimientos que nos pueden favorecer en la administración de una empresa. Por ello la importancia de esta unidad curricular dentro del plan de formación “Administración y Gestión” la cual te brindará herramientas para toma de decisiones acertadas en los diferentes procesos administrativos. ESTADÍSTICA I vii
  • 8. UNIDAD I ASPECTOS GENERALES DE LA ESTADÍSTICAASPECTOS GENERALES DE LA ESTADÍSTICA ESTADÍSTICA I ¡Comencemos nuestro recorrido! En este apartado encontrarás…  Contenidos de la primera unidad  Ejemplos  Ejercicios propuestos
  • 9. UNIDAD IUNIDAD I. ASPECTOS GENERALES DE LA ESTADÍSTICA.. ASPECTOS GENERALES DE LA ESTADÍSTICA. Síntesis Histórica Las inquietudes estadísticas se remontan a la antigüedad, pero el contenido de las mismas ha variado notablemente a través del tiempo. Desde el cuarto milenio a.C. los chinos realizaban censos de población y utilizaban tablas de estadística aplicadas a los problemas agrícolas. Los egipcios, los griegos y los romanos también realizaron múltiples investigaciones recurriendo a la estadística como herramienta. Indudablemente, en esa época no se conocía la palabra estadística y nadie pensaba en promover leyes de comportamiento de los datos recogidos con mayor o menor exactitud, pero se conocían los procesos censales y catastrales que ayudaban a describir situaciones reales. Las primeras tentativas para sistematizar los conocimientos surgen en Alemania en el Siglo XVII, mientras que en Inglaterra se logra un nuevo progreso al superar la fase meramente descriptiva y comenzar a utilizar los datos con fines predictivos. Más tarde, a partir del análisis de los juegos de azar, el cálculo de las probabilidades se incorpora como un instrumento extremadamente poderoso para el estudio de fenómenos cuyas causas son demasiado complejas para conocerlas totalmente y poder analizarlas sin su uso. A partir de comienzos del Siglo XX, la estadística logra su expansión definitiva desarrollando su aplicación en todas las ramas del saber. La biología, la meteorología, la investigación agronómica, la demografía, la psicología, la sociología y muchas otras ciencias han sido transformadas mediante el empleo de métodos estadísticos. Esta invasión de la estadística en todos los dominios de la investigación pura o aplicada permite que los métodos estadísticos se desarrollen permanentemente para dar respuesta a los distintos problemas a resolver. Definición y Objeto de la Estadística La Estadística tiene por objeto la recolección, presentación, análisis e interpretación de observaciones o mediciones hechas sobre un conjunto de objetos, personas, procesos, fenómenos, etc. Comúnmente es considerada como una colección de hechos numéricos expresados en términos de una relación, y que han sido recopilados a partir de otros datos numéricos. A continuación se te presenta un cuadro con definiciones de estadística planteadas por diferentes autores en diferentes años: ESTADÍSTICA I 2
  • 10. Autor Definición Gini, 1953 La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares Yale y Kendal, 1954 La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos Kendall y Buckland ,1980 Un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra. Murria R. Spiegel, 1991 La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis Lind, Mason y Marchal, 2001 La ciencia de reunir, organizar, presentar, analizar e interpretar datos para ayudar a tomar las mejores decisiones Quizás el hecho más curioso que resalta de las definiciones anteriores es: ¿La estadística es una ciencia o una técnica? En la actualidad se considera como un poderoso auxiliar en la investigación. Por ello estudiaremos la estadística como un conjunto de métodos que nos permiten evaluar datos cualitativos y cuantitativos. Entendiendo por dato cuantitativo a aquel que está expresado de forma numérica, por ejemplo: la edad, el peso, las calificaciones, etc. Mientras los datos cualitativos reflejan, como su nombre lo indica, cualidades, características del objeto que se analiza por ejemplo: Categorizar las los niveles de inasistencias de un trabajador en muchas o pocas, la estatura en bajo, mediano o alto, opinar sobre un producto calificándolo de muy bueno, bueno, regular o deficiente, etc. ESTADÍSTICA I ¿Consideras que ha habido una diferencia u avance notorio a través de los años en las definiciones de estadística presentadas en el cuadro anterior? 3
  • 11. Tipos de Estadística Dos corrientes de influencia han conducido al desarrollo de los métodos estadísticos. Una de ellas, tenía por objeto mantener en orden registros del gobierno (de hecho, estado y estadística vienen de la misma raíz latina, status). De ella evolucionaron las actividades de conteo, medición, descripción, tabulación, ordenamiento y levantamiento censal, que conforman lo que hoy conocemos como estadística descriptiva. La segunda corriente de influencia se originó en las matemáticas de los juegos de azar y condujo al desarrollo de la estadística inferencial o inductiva, basada fundamentalmente en el concepto de probabilidad matemática. Estadística Descriptiva: La estadística descriptiva esta dedicada a descubrir las regularidades o características existentes en un conjunto de datos mediante la utilización de gráficos y de medidas numéricas de resumen. En otras palabras, resume y transforma datos para poder interpretar la información. A través de la cuantificación y ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial). Estadística Inductiva o Inferencial: Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por lo que recibe también el nombre de Inferencia estadística. En resumen, son procedimientos estadísticos que se utilizan para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos. La Estadística ESTADÍSTICA I Estadística Descriptiva: Métodos para organizar, resumir y presentar datos de manera informativa 4
  • 12. inferencial permite, mediante la utilización de métodos estadísticos basados en la teoría de las probabilidades, generalizar las conclusiones obtenidas a partir de una muestra a la población de la que ha sido extraída. Es importante destacar que para que las conclusiones sean válidas, se debe tratar que la muestra sea representativa de la población. Leamos el siguiente ejemplo Universo, Población y Variable La estadística está compuesta por métodos científicos mediante los cuales podemos recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de individuos u observaciones que nos permiten extraer conclusiones válidas y efectuar decisiones lógicas basadas en dichos análisis. En cualquier trabajo en el que se aplique, la estadística debe hacer referencia a un conjunto de sujetos u objetos de análisis, conocido como población. Población o Universo: Es el conjunto de entidades u objetos que satisfacen una definición común y en los que interesa analizar una o varias características. Aquí el término población tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo. ESTADÍSTICA I Imaginemos que nuestro profesor de estadística I calcula la calificación promedio de nuestro grupo en primera unidad. Como está empleando la estadística para describir el desempeño sin generalizar estos resultados hacia otros grupos de Estadística I el profesor está utilizando estadística descriptiva, con graficas, tablas y diagramas muestra los datos de manera que sea más fácil su entendimiento. Supongamos ahora que el mismo profesor decide utilizar el promedio de calificaciones obtenidas por nosotros en la primera unidad para estimar la calificación promedio que obtendremos en el resto de las unidades de esta asignatura. El proceso de estimación de tal promedio sería un problema Estadística Inferencial: Métodos usados para determinar algo acerca de la población basándose en una muestra. 5
  • 13. Una población se precisa como un conjunto finito o infinito de personas que presentan características comunes, por lo que debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado. Si, por ejemplo, estamos analizando las escuelas primarias, debemos especificar cuáles y cuándo, por ejemplo: Escuelas primarias de Caracas, año 1995. El tamaño de una población viene dado por la cantidad de elementos que la componen. Generalmente se simboliza esta información con la letra N, en el caso en que sea una población finita, es decir, que podemos contabilizar y establecer un límite de existencia. Muestra: Es un subconjunto de unidades de análisis de una población dada, destinado a suministrar información sobre la población. Para que este subconjunto de unidades de análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la selección de los elementos. Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la población que se defina tenga tamaño infinito (incontable), y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la observación exhaustiva puede ser muy elevado, el extenso tiempo de recolección de la información, o más aún, la observación de los elementos puede ser destructiva. En todos estos casos, la única manera de estudiar la población es obteniendo muestras de ella. El tamaño de la muestra queda determinado por el número de elementos que la forman y se simboliza con la letra n. Ejemplo: Si necesitamos conocer la cantidad de personas entre 20 y 30 años que pertenecen a cooperativas en Venezuela, todas las personas que posean estas características ( tener entre 20 y 30 años y trabajar en una cooperativa) serán nuestra población, seguramente va a ser difícil buscar todas las cooperativas de ESTADÍSTICA I Población: Es la recolección completa de todas las observaciones de interés para el investigador. Muestra: Es una parte representativa de la población que se estudia y se toma cuando la población es demasiado grande como para estudiarla completa. 6
  • 14. todo el país para conocer este dato, una forma de hacer la investigación es seleccionando un grupo de estados del país, podría ser uno de cada región y visitando sus cooperativas, para obtener la información, en este caso obtendremos una muestra, en la cual encontraremos personas de todas las edades, pero estos datos nos permitirán predecir de acuerdo a la cantidad de jóvenes en estos estados la proporción de jóvenes que habrán en todas las cooperativas del país. Observemos que este es una cose de estadística inferencial. Variables: Una variable es la característica de un objeto, persona o situación que es capaz de modificarse en extensión y naturaleza, es decir, es una característica que varía de un objeto a otro que no permanece constante y como consecuencia sirve para singularizar un objeto o grupo de ellos. Debemos tener claro que a variable no es el objeto de estudio en sí, sino sus características, por ejemplo si estuviéramos analizando un local para alquilar el local no es variable, variables son sus atributos: ubicación, tamaño, iluminación, ventilación, etc. Podemos encontrar dos tipos de datos: Cualitativos y cuantitativos. Variables Cualitativas: Llamamos variable cualitativa a aquella no o puede ser expresada de forma numérica, por ejemplo la religión, podemos decir que somos católicos, judíos, protestantes, evangélicos, etc. Observemos que este es un dato que varía de un individuo a otro pero no puede ser expresado de forma numérica. Variables Cuantitativas: Es aquella variable que puede ser expresada de forma numérica, por ejemplo el número de hijos por familia. Estas variables se dividen en dos grupos: variables continuas y discretas. Variable Discreta: Es aquella que solo puede asumir ciertos valores, y ente éstos suele haber huecos, generalmente se expresan en números enteros, por ejemplo, cantidad de miembros de una cooperativa, podemos decir que está conformada por doce, trece personas, pero nunca podremos decir que nuestra cooperativa está conformada por 20,5 personas. Apreciemos el siguiente ejemplo: Una variable discreta puede ser la cantidad de lapiceros que tenemos disponibles en nuestro inventario, si contamos podemos decir que tenemos 96 bolígrafos, el dato en este caso se expresa evitando los rangos entre los valores, es decir, no podíamos decir que tenemos ESTADÍSTICA I 7
  • 15. 95,2 lapiceros o 96,1. En este tipo de casos se expresa el dato en un número entero. Variables Continuas: Es aquella que puede adoptar cualquier valor dentro de un rango específico, por ejemplo, la duración de un viaje en carro de Caracas a Maracay, algunas veces puede durar una hora y cuarenta y cinco minutos o dos horas, etc. Otro ejemplo de variable continua el promedio de las calificaciones de un estudiante en cada lapso. Veamos este otro ejemplo: Una variable continua es nuestra temperatura corporal, cuando tenemos fiebre nos tomamos la temperatura, la medida puede ir desde los 36 grados hasta los 41, pero incluyendo los números decimales, por ejemplo 36;36,1;36,2;…37;37,1…38;38,1…39,9;40…;40,5 etc. El peso de las verduras que compramos periódicamente es una variable continua, pues puede variar de forma ascendente o descendente incluyendo los decimales, no hay vacíos entre los rangos, todos son continuos, de allí el nombre de la variable. Como resumen… Concepto de Medición. Niveles de Medición de las Variables Medición Medición es la cuantificación del atributo de una variable, ¿Qué quiere decir esto? Cuando medimos hacemos una estimación numérica de un objeto, pero no del objeto en sí, medimos los indicadores de sus atributos, para ello contamos con cuatro niveles de medición ESTADÍSTICA I Datos Cualitativos o atributos Cuantitativos o numéricos Discretos Continuos 8
  • 16. Niveles de Medición Los datos se pueden clasificar de acuerdo a cuatro niveles de medición. Los niveles de medición indican que tipo de operación se puede hacer con los datos para resumirlos, presentarlos y determinar que pruebas estadísticas pueden llevarse a cabo con ellos. Existen cuatro niveles de medición: Nominal, ordinal, de intervalo y de razón, estos niveles tienen un orden ascendente el más bajo de la escala es el nominal y el más alto el de razón. Medición Nominal En el este tipo de medición los objetos sólo pueden ser nombrados o contados. No hay un orden, consiste simplemente en clasificar observaciones dentro de ciertas categorías, las cuales deben ser mutuamente excluyentes y colectivamente exhaustivas. Mutuamente excluyentes significa que un individuo, objeto o medición pertenece únicamente a una categoría, y exhaustiva significa que ningún individuo, objeto o medición puede quedar sin categorías por ejemplo: En la medición nominal un mismo objeto de análisis no pueden estar en dos categorías, pero todos tienen que estar en una, no puede haber observación fuera de una categoría. Para que no se nos olvide esta propiedad de la medición nominal atendamos el siguiente ejemplo: En un aula de clases vamos a clasificar las personas por lugar de nacimiento, una misma persona no puede haber nacido en dos lugares, pero tampoco se puede decir que no nació en ningún lado, por lo tanto, todos tenemos que estar en una sola categoría. Medición Ordinal El siguiente nivel es el ordinal, en este caso las observaciones además de poder ser clasificadas en categorías, también pueden ser ordenadas por rango, de manera creciente o decreciente. Esto significa que una primera observación puede ser mayor que la segunda, y esta a su vez mayor que la tercera, y así sucesivamente. Sin embargo esto no implica una secuencia de intervalos iguales, atendamos al siguiente ejemplo: Vamos a comprar un vehículo para transportar ESTADÍSTICA I En un nivel de medición ordinal, una categoría que podríamos establecer es el sexo, clasificado en hombre y mujer, por lo que los individuos que observamos sólo pueden pertenecen a un grupo. Si estuviéramos realizando una observación de la imagen de la izquierda diríamos: Hay un hombre y una mujer. 9
  • 17. nuestra mercancía, tenemos tres opciones y los agrupamos de acuerdo a su kilometraje, el primero tiene 25.000Km, el segundo 34.000Km y el último 35.500km, observemos que ordenamos las opciones de menor a mayor según la cantidad de kilómetros, por ello lo “ordinal”, pero hay que resaltar que los intervalos que los separa, o sea la cantidad de kilómetros entre cada carro son diferentes, de 25.000 a 34.000 hay 9 kilómetros de diferencia, mientras que de 34.000 a 35.500 tan sólo hay kilómetro y medio. En la escala ordinal esto no importa. Medición de Intervalo La medición de intervalo posee las características de la ordinal con la salvedad que aquí la distancia entre los rangos son equivalentes, esto quiere decir que los intervalos pueden ser sumados y restados. Por ejemplo, supongamos que hemos medido cuatro calificaciones con una escala de intervalo las cuales son 10,8,7 y 5. Con estos datos podemos afirmar que la diferencia entre el primero y el tercero es equivalente a la diferencia entre el segundo y el cuarto, observemos: 10-7=3, 8- 5=3, sin embargo no podemos decir que el que sacó 8 tuvo el doble del que sacó cinco, a pesar que la diferencia entre los que sacaron 10 y 7, es igual a la diferencia de los que sacaron 8 y 5 Otra característica resaltante de la medición por intervalos es que este tipo de variables no tiene cero absoluto, esto significa que el atributo que medimos no tiene ausencia. Retomemos el ejemplo de la medición de la temperatura corporal, si empleamos un termómetro y nos tomamos la temperatura podemos decir que tenemos fiebre o no pero, pero el hecho de no tener fiebre no significa que tengamos cero temperatura, por lo tanto aquí el cero (0) es relativo. Otro caso en el que el cero es relativo es el número de calzado, no hay calzado número 0. Si medimos el calzado en medición de intervalo diríamos, en una casa hay cinco miembros familiares que calzan 15, 24, 25, 36 y 48. La diferencia entre a y c= 6, entre b y d= 3 entre c y d=6 entre d y e=6, observemos que la distancia entre a y c, c y d son es equivalente a la de d y e, pero no por ello podemos decir que la persona e tiene el pie tres veces más grande que la persona b. Medición de Razón ESTADÍSTICA I a b c d e 25 28 31 37 43 10
  • 18. Es el nivel más alto de medición, ella posee todas las características de las escalas anteriores, con la diferencia de que aquí el cero si es absoluto, es decir, la presencia del cero indica la ausencia del atributo observado. Un buen ejemplo de un cero absoluto es la velocidad, si detenemos un vehículo la velocidad es cero, porque hay ausencia de velocidad. Pero a medida que comenzamos a acelerar el vehículo podemos decir que si vamos a 30 kilómetros recorreremos la mitad del camino que un carro que va a 60. En la medición de razón la distancia entre los rangos son exactamente iguales. Veamos otro ejemplo: Tipo de Investigación Estadística Cuando aplicamos los métodos estadísticos para el estudio de un fenómeno se denomina investigación estadística, estos tipos son: La investigación Directa y la investigación indirecta Investigación Directa Es aquella en la que el investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus resultados se consideran datos estadísticos originales, por esto se llama también investigación primaria. La mayoría de las investigaciones de carácter oficial, demográficas, económicas o sociales son directas. La investigación deirecta se divide en: exhaustiva o completa, y parcial o incompleta. Son exhaustivas, aquellas en la que se estudian todos los elementos que integran el universo, todas sus características o las necesarias para describir totalmente la población estudiada. Son investigaciones parciales o incompletas, cuando tan solo se estudia un número limitado de los casos individuales que forman el universo o cuando se estudian algunas manifestaciones del fenómeno que no lo describen totalmente; se utiliza este tipo de investigación cuando es imposible el estudio del fenómeno de forma completa. Este tipo de investigación puede ser representativa y no representativa, estamos en el primer caso cuando las manifestaciones del fenómeno estudiado son suficientes y necesarias para describir el fenómeno; en caso contrario, caemos dentro de la no representativas. Investigaciones Indirectas Son aquellas en las que el investigador se vale de informaciones indirectas, de resultados o cálculos de investigaciones anteriores o en base de los conocimientos que tenga el investigador del fenómeno por experiencias anteriores. Se dividen estas investigaciones en conjeturales (estimaciones) y secundarias. La ESTADÍSTICA I Las medidas de la regla, el cero indica la ausencia de medida, pero la distancia del 0 al 1, ó del 1 al 2 es la misma que la del 2 al 3 ó la del 3 al 4, y así sucesivamente, entre cada rango hay la misma diferencia. 11
  • 19. investigación conjetural es aquella en base a conocimientos parciales, opiniones o cálculos, proporciona resultados primarios de valor práctico. Este tipo de investigación puede tener el inconveniente de que, dado el carácter subjetivo de estos conocimientos y opiniones, se pueden obtener resultados diferentes utilizando varios investigadores para el estudio de un mismo fenómeno. La investigación secundaria es aquella que se efectúa por reagrupaciones o reelaboraciones de resultados de otras investigaciones; tiene a su favor este tipo de investigación, que el costo y trabajo queda notablemente reducido. La investigación indirecta conjetural puede ser: por aproximación, por analogía y por proporción. Por proporción, es la que basada en el convencimiento que sobre el fenómeno tiene el investigador, ya sea por experiencia o por resultado anteriormente obtenido. Los datos que se obtienen en esta investigación serán siempre aproximados al aplicarlos al fenómeno que estudia, pero sirven para tener una idea general del mismo. Por analogía, son aquellas basadas en el estudio de uno o varios fenómenos que guardan cierta semejanza con el fenómeno a investigar, determinándose ciertas modalidades y características de dicho fenómeno, por procedimientos inductivos. La investigación conjetural por proporción, puede hacerse de parte a todo un hecho a otro; en el primer caso, se observa una parte de fenómeno y sin mayor rigor aplica a todo el fenómeno; en el caso de un hecho a otro, relacionan dos o más hechos y a través del conocimiento de uno de ellos se determinan las modalidades de otros. Importancia de la Estadística en Administración Si te has preguntado por qué un administrador debe saber sobre técnicas estadísticas, te presentamos dos razones: Los hombres y mujeres que se dedican a las actividades comerciales están en una constante búsqueda de ganancias o excedentes que le permitan crecer o ESTADÍSTICA I El método inductivo se basa en la acumulación de datos cuya tendencia nos permite generalizar el comportamiento de los sistemas en estudio. La veracidad de sus conclusiones se ven reafirmadas con la generación de más y más datos que apunten en la misma dirección. La estadística te permite Solucionar problemas Tomar decisiones 12
  • 20. ampliarse en su área, la mayoría de ellos consideran que la estadística es fundamental para el proceso de toma de decisiones, ¿Por qué?, porque permite inferir cómo afectarán las posibles opciones de inversión. De igual forma, la estadística ayuda a tomar decisiones para solucionar problemas que se suscitan en el camino del desarrollo productivo. Recordemos que el desempeño laboral como administrador exigirá el análisis de múltiples datos, los que debemos manejar de forma útil para la organización, es decir, analizando los riesgos y las oportunidades que representan. ESTADÍSTICA I 13
  • 21. Ejercicios Unidad 1 1) Escribe cinco ejemplos de datos cuantitativos y cinco de datos cualitativos. 2) Realiza un ejemplo de una muestra de una población cualquiera. 3) Determina cual de los siguientes puntos es una población o una muestra: a) Los estudiantes de sexto grado de Venezuela b) Los estudiantes de Misión Sucre región Caracas. c) Todas las familias con mascotas de un municipio. d) Los reportes de un día sobre la actividades realizadas en un liceo. 4) Clasifica en cualitativa y cuantitativas las siguientes variables: a) Los literales de calificación en la escuela básica (A,B,C,D y E) b) Cantidad de pacientes atendidos por Barrio Adentro. c) El color de cabello de las personas de una comunidad. d) Cantidad de hijos de nuestros vecinos. 5) Clasifica las siguientes variables como continuas o discretas a) Número de camisas producidas por una cooperativa b) Las horas de un día c) Cantidad de estudiantes de nuestra comunidad d) Kilos de pollo vendidos en Mercal 6) Cuál es el nivel de medición de las siguientes variables: a) Una clasificación de los estudiantes de la zona en la que viven. b) Calificaciones de los estudiantes en la primera prueba de estadística c) Temas de los discursos del presidente Chávez d) El número de horas por semana que estudia un alumnos de Misión Sucre e) El año de fabricación del transporte público que cubre la ruta de nuestro vecindario f) Los periódicos vendidos cada domingo. g) Grupos de estudiantes según su edad. ESTADÍSTICA I 14
  • 22. UNIDAD II OBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOSOBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOS ESTADÍSTICOSESTADÍSTICOS ESTADÍSTICA I ¡Excelente! ya hemos llegado a la segunda unidad, sigamos avanzando. En este apartado encontrarás:  Contenidos de la segunda unidad  Ejemplos  Ejercicios propuestos 15
  • 23. UNIDAD 2. OBTENCIÓN,UNIDAD 2. OBTENCIÓN, ORDENAMIENTO YORDENAMIENTO Y REPRESENTACIÓN DE DATOSREPRESENTACIÓN DE DATOS ESTADÍSTICOS.ESTADÍSTICOS. Fuentes y Métodos de Recolección de Datos Fuentes de Datos El lugar del cual obtenemos los datos para realizar nuestros análisis estadísticos se denomina fuente. Los datos que requerimos para realizar una evaluación estadística de los procesos administrativos los podemos encontrar por medio de diversas fuentes las cuales pueden ser; primarias o secundarias, u oficiales o privadas. Llamamos fuentes primarias la persona o institución que ha recolectado los datos, y secundaria si la persona o institución que ha publicado los datos no fue la que efectuó la investigación. Los datos primarios y secundarios no son dos clases esencialmente diferentes de información, sino partes de una misma secuencia: todo dato secundario ha sido primario en sus orígenes, y todo dato primario, a partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los demás. Los datos oficiales son todos aquellos que hayamos en dependencias gubernamentales, y por el contrario los datos emitidos por entes no gubernamentales los denominamos privados. Técnicas de Recolección de Datos Existen diversas técnicas de recolección de datos, aquí mencionaremos las más comunes o las más empleadas. La Observación Consiste en el uso sistemático de nuestros sentidos para captar la realidad que queremos estudiar. Es una técnica antigua, a través de sus sentidos, el hombre capta la realidad que lo rodea, que luego organiza intelectualmente. El uso de nuestros sentidos es una fuente inagotable de datos que, tanto para la actividad científica como para la vida práctica resulta de inestimable valor. La observación es un proceso cotidiano para nosotros, es parte de nuestra experiencia de vida, pero nuestras observaciones diarias al no estar orientadas a un propósito determinado carecen de controles ESTADÍSTICA I Datos Primarios: son aquellos que el investigador obtiene directamente de la realidad, recolectándolos con sus propios instrumentos. Datos Secundarios: son registros escritos que proceden de un contacto con la práctica, pero que ya han sido elegidos y procesados por otros investigadores. Observación: Es el registro visual de lo ocurre es una situacional real, clasificando los acontecimientos de acuerdo con algún esquema pre estructurado y cónsono con el problema que se 16
  • 24. que nos alejen de los errores. Para realizar un proceso de observación con el propósito de recabar datos debemos seguir algunos principios básicos:  Debe tener un propósito específico.  Debe ser planeada cuidadosa y sistemáticamente.  Debe llevarse, por escrito o de forma audiovisual, un control cuidadoso de la misma.  Debe especificarse su duración y frecuencia.  Debe seguir los principios básicos de validez y confiabilidad. La principal ventaja de esta técnica es que los hechos son percibidos directamente, sin ninguna clase de intermediación, colocándonos ante una situación tal como ésta se da naturalmente. De este modo, nunca obtendremos distorsiones de la realidad, las cuales solemos tener al emplear una entrevista, ya que en ellas los entrevistados colocan su toque personal al brindar la información. Otra ventaja es que la conducta se describe en el momento exacto en que está ocurriendo. Además, las observaciones se pueden realizar independientemente de que las personas estén dispuestas a cooperar o no, a diferencia de otros métodos en los que sí necesitamos de la cooperación de las personas para obtener la información deseada. Su principal desventaja reside en que la presencia del observador puede generar una alteración o modificación en la conducta de los objetos observados, destruyendo la espontaneidad y por tanto alterando la confiabilidad de los datos. La Entrevista. La entrevista es una técnica en la cual es investigador, de acuerdo a la información que necesita recolectar elabora una serie de preguntas que más tarde realiza a la persona que se convertirá en su fuente. Las entrevistas la mayoría de las veces se realizan en persona, es decir, visitando al entrevistado y registrando la información ofrecida, ya sea con un grabador o por escrito. Como técnica de recolección de datos la entrevista tiene muchas ventajas; es aplicable a toda persona, siendo muy útil con los analfabetos, los niños o con aquellos que tienen limitación física u orgánica que les dificulte proporcionar una respuesta escrita. Se le puede explicar al entrevistado con qué propósito estamos recogiendo los datos y esta ayuda a que éste dirija mejor sus respuestas. A pesar de todas sus bondades la entrevista también posee algunas desventajas o limitaciones: Requiere una mayor inversión de tiempo para recoger la información, como las respuestas pueden ser totalmente abiertas se puede dificultar el análisis de los datos y requiere de mucha astucia para obtener los datos que se desean canalizando las respuestas del entrevistado aun cuando éste se desoriente. El Cuestionario Es el método que utiliza un instrumento ESTADÍSTICA I 17
  • 25. impreso. Como en el caso de la entrevista, hay preguntas pero todas están formuladas en un papel, ellas están destinadas a obtener repuestas sobre el problema en estudio y son dadas por consultado a través de un proceso de escritura, sin embargo, el cuestionario puede ser llenado por el encuestado o con ayuda de un empadronador. El cuestionario puede aplicarse a grupos o individuos estando presente el responsable de recoger la información o no; puede enviarse por diversos medios a los seleccionados en la muestra. También puede contratarse a una persona que cumpla que aplique el cuestionario, en estos casos se suele llamar cédula de entrevista. Un ejemplo de esta aplicación son los empadronadores de los censos de población, recordemos que ellos traen el cuestionario con sus preguntas y sus respuestas, la función que cumplen es leer cada pregunta y marcar la respuesta dada por el encuestado. Las ventajas de esta administración es que no quedarán preguntas en blanco y también que puede ser aplicada a analfabetos, niños o personas con alguna discapacidad. Cuando la aplicación cuestionario queda en manos de los encuestados se pueden presentar problemas relacionados con la cantidad y calidad de datos que pretende obtener para el estudio. Estos problemas que a su vez se convierten en desventaja son: que el cuestionario no fuese devuelto; que los consultados evadan la respuesta a alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas. Debido a esa posible pérdida de información se recomienda cuando se use está técnica se escoja una muestra más grande de sujetos de estudio. Existen tres tipos de cuestionarios: Cuestionarios Abiertos. Son en los que se pregunta al sujeto algo y se le deja en libertad de responder como quiera. Este tipo de cuestionario es muy útil y proporciona mucha información, pero requiere más tiempo por parte del informante y es más difícil de analizar por parte responsable de recoger los datos. Cuestionarios Cerrados. Están estructurados de tal manera que al informante se le ofrecen sólo determinadas opciones de respuesta, y debe seleccionar una de ellas. Este cuestionario es más fácil de codificar y contestar. Como desventaja, es que al ofrecerle categorías al informante se le están "sugiriendo" las respuestas. Cuestionarios Mixtos: poseen ambos tipos de preguntas abiertas y cerradas, por ello el nombre de “mixtos”. La mayoría de los cuestionarios poseen la siguiente estructura:  Titulo  Instrucciones  Identificación del encuestado (la identificación no hace referencia al nombre, en muchos estudios las respuestas anónimas suelen ser más objetivas, pero si vamos a aplicar el cuestionario a una población diversa podemos identificarlos por edad, profesión, etc.)  Preguntas  Observaciones ESTADÍSTICA I 18
  • 26. En general, en el proceso de recolección de datos los métodos e instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus características propias y la información que se requiera, sin embargo dan flexibilidad para que el investigador determine su uso apropiado según el estudio a realizar. Preparación de los Datos Estadísticos. Una vez recogidos los datos pasamos a su preparación para iniciar el estudio, para poder lograr el análisis estadístico es necesario ordenar los datos y clasificarlos, lo primero que hacemos es revisar los instrumentos de recolección de información aplicados, sobre todos si son cuestionarios llenados por el informante ya que en una entrevista el entrevistador es el que registra las respuestas. Algunos autores proponen que cuando quedan cuestionarios con preguntas sin contestar las llenemos con la respuesta que la mayoría colocó, sin embargo esto se podría considerar poco ético, pues no es la respuesta del encuestado, en ese caso la sugerencia es eliminar ese cuestionario de la muestra. Terminado este proceso pasamos al agrupamiento. En el caso de las entrevistas y cuestionarios con preguntas abiertas debemos crear categorías de acuerdo con los puntos expresados por los entrevistados de tal forma que ninguna opinión o planteamiento se queden sin categoría, pero también de forma que ninguna opinión pueda incluirse en dos categorías, es decir, deben ser mutuamentemutuamente excluyentesexcluyentes. Una vez bien estructuradas las categorías contamos la frecuencia de aparición de cada categoría en las respuestas dadas. En el caso de ser un cuestionario de preguntas cerradas se contabiliza la frecuencia de aparición de cada respuesta para luego elaborar una tabla con la distribución de frecuencias, tema que ampliaremos más adelante. Razones Proporciones y Porcentajes Una de las funciones de la estadística es resumir todos los datos de un conjunto para resaltar sus características más importantes. Una de las formas de realizar esta actividad es relacionando los datos, ya sea entre ellos mismos o con datos similares, es decir, convertir los valores absolutos en valores relativos, ya veremos por qué. Razones La razón (R) es el valor que indica la relación cuantitativa existente entre dos cantidades, por ejemplo: En una ciudad existen 54.000 empleados y 36.000 desempleados, la razón de empleado a desempleado se expresa así: 9 000.9 000.54 )( )( === a A R ESTADÍSTICA I 19
  • 27. Siendo A= Nro. de individuos con cierta característica a= Nro. de individuos que no poseen cierta característica La interpretación del ejemplo anterior es que por cada 4 empleados hay 1 desempleado. Al ser la razón un valor relativo no depende de los valores absolutos de los individuos que la forman, ya que por ejemplo en una zona donde hay 90.000 empleados y 10.000 desempleados la razón sigue siendo de 9. Proporción La proporción es una razón, pero su diferencia con las razones anteriores, es que el denominador del cociente es el número total de unidades enunciadas. La proporción se representa con la siguiente fórmula: N A p = siendo N= (A)+(a) La proporción contraria sería N a q )( = Ambas p y q son complementarias y si se suman debe dar igual a 1 p+q=1 Remplacemos las formulas con los datos del ejercicio anterior 857,0 000.63 000.54 === N A p 142,0 000.63 000.9)( === N a q La proporción de empleados sería de 0,85, y la de desempleados de 0,142. Ambas proporciones son complementarias y si las sumamos da igual a 1 Porcentajes Como vimos en el apartado anterior las proporciones vienen expresadas en valores decimales, esto no es ningún inconveniente, pero cuando se quiere presentar al público los datos utilizar decimales es confuso, por ello se acostumbra a multiplicar las proporciones por 100, para convertir los valores decimales en enteros, es decir, para convertirlos en porcentajes. 100% ∗= N A P 100 )( % ∗= N a Q Convirtamos pues nuestras proporciones en porcentajes: %7,85100857,0 000.63 000.54 =∗=== N A P %2,14100142,0 000.63 000.9)( =∗=== N a q ¿Cómo interpretamos estos porcentajes? De la misma manera que lo hicimos con la proporción, decimos que 85,7% de las personas están empleadas y el 14,2 % están desempleados. Observemos que si tan sólo damos uno de los dos porcentajes con su respectiva interpretación, el segundo porcentaje no es necesario darlo, pues si decimos que en la cuidad “X” el 85,7% de las personas están empleadas, ya podemos inferir la minoría está desempleada, sin necesidad de manejar el porcentaje exacto. Porcentajes de Cambio ESTADÍSTICA I 20
  • 28. Son los que muestran la diferencia entre dos porcentajes; estos pueden ser en aumento o en descenso, veamos sus fórmulas: 100∗ − = m mM Pa 100∗ − = M mM Pd Siendo Pa= Porcentaje de aumento Pd= Porcentaje de descenso o disminución M= Cantidad mayor m= Cantidad menor Ejemplo: Si sabemos que el excedente de nuestra cooperativa en el año 2004 fue de 100.000.000 de bolívares, y para el año 2005 Bs. 135.000.000, ¿cuál fue el porcentaje de aumento? =∗ − = 100 m mM Pa %35100 000.000.100 000.000.35 100 000.000.100 000.000.100000.000.135 =∗= =∗ − = Pa Pa El porcentaje de aumento de nuestro excedente fue de un 35% en un año. Distribución de Frecuencias. En muchas ocasiones habrás observados tablas como esta: Edades (en años) Frecuencia 1 a 5 26 6-10 44 11-15 32 Esta tabla se denomina Distribución de Frecuencias. La estadística descriptiva utiliza la distribución de frecuencias para organizar y presentar los datos. Lo deseable es que logremos determinar de forma correcta las distancias de los intervalos que usaremos para agrupar nuestros datos. Ahora te preguntarás ¿Cómo elaboro una distribución de frecuencias?, la forma más fácil de aprenderlo es a través de un ejemplo: Observemos el siguiente grupo de números y supongamos que son la cantidad de viajes que realiza cada día durante un mes la aerolínea Conviasa 1 5 12 1 0 8 20 1 4 13 1 2 9 13 1 0 2 0 1 7 1 8 19 1 2 15 8 9 10 En esa tabla de datos buscamos el valor mayor y el menor, para ESTADÍSTICA I Distribución de Frecuencias: Es un agrupamiento de datos en categorías mutuamente excluyentes en el cual se registran la cantidad de veces que se ha observado cada categoría. 21
  • 29. determinar la cantidad dedeterminar la cantidad de clases,clases, para ello utilizamos la fórmula 2 k , empleándola de la siguiente manera, en los vuelos de Conviasa n = 20, asignemos a k un valor arbitrario, por ejemplo 4,2 4 =16 si n = 20, 4 clases no cubrirían todos los datos, probemos con k=5, 2 5 =32, es mayor que 20, cubriríamos completamente a n, por lo que deberíamos conformar 5 clases. Ahora vamos a calcular la amplitud del intervalo, recordando que, recordando que debe ser el mismo para todasdebe ser el mismo para todas las claseslas clases,, y que deben abarcar desde el dato menor hasta el mayor, lo calculamos a través de la siguiente fórmula: k LH i − 〉 En la que i es el intervalo de la clase, H el mayor número observado, L el menor valor observado y k el número de clases: 4,2 5 820 = − = − 〉 k LH i Redondeamos a 2 que será el tamaño de nuestros intervalos, recordemos que debemos tener 5 clases. Ahora organicemos nuestros datos: Cantidad de Vuelos Frecuencia (f) 8 a 11 7 11 a 13 5 14 a 16 3 17 a 19 3 20 a 22 2 Ya construimos nuestra distribución de frecuencias, es bueno acotar que el punto medio de la clase se haya en el punto medio entre el límite superior y el límite inferior, en el primer intervalo el punto medio entre 8 y 10 es 9. 9 es el punto medio de la primera clase. También podemos tener distribuciones de frecuencia relativa, que es la frecuencia absoluta entre la cantidad total de observaciones (n): Cantidad de Vuelos Días al Mes Frecuenc ia (f) Frecuenci a relativa 8 a 10 7 7/20 0,35 11 a 13 5 5/20 0,25 14 a 16 3 3/20 0,15 17 a 19 3 3/20 0,15 20 a 22 2 2/20 0,10 Total 20 20/20 1 Con la frecuencia relativa obtenemos la fracción del número total de ESTADÍSTICA I 22
  • 30. observaciones, y si lo multiplicamos por 100 los porcentajes. Si interpretamos el cuadro anterior según su frecuencia relativa podíamos decir que el 35 % de los días del mes Conviasa realiza entre 8 y 10 vuelos. Presentación de los Datos Estadísticos A parte de la distribución de frecuencias los datos pueden también pueden ser presentados en gráficos contentivos de los mismos datos que expresamos en la distribución de frecuencias. Seguro te preguntarás ¿Y si tienen los mismos datos para que hacerlos? La respuesta es que el gráfico permite apreciar de forma más rápida los datos obtenidos, ya lo comprobaremos más adelante. Existen una gran variedad de gráficos, primero conoceremos los dos más empleados en administración, también mencionaremos otros tipos de gráficos de mucha utilidad, sin embargo te invito a ampliar sobre este tema a través de un arqueo bibliográfico. Histograma: Es uno de los gráficos utilizados mayormente empleado para representar una distribución de frecuencias Polígono de frecuencia Un polígono de frecuencia es perecido al histograma. Consiste en segmentos de línea que se conectan por los puntos formados por la intersección del punto medio de la clase y de la frecuencia de clase. La elaboración de un polígono de frecuencias se hace colocando los puntos medios de cada clase en el eje x y la escala en el eje y, es decir, las frecuentas de clase. Recordemos que el punto medio representa los valores de cada clase. El histograma y el polígono de frecuencia nos permiten tener una visión de las principales características de un conjunto de datos, a pesar de tener ambos el mismo propósito, el histograma tiene la ventaja de representar cada frecuencia como un rectángulo que además incluye ambos valores del intervalo. Por su parte el polígono de frecuencia tiene una ventaja sobre el histograma, permite comparar dos distribuciones de frecuencia a la vez, y si por ejemplo queremos hacer un ESTADÍSTICA I Histograma: Gráfica en la que las clases se indican en el eje y (horizontal) y las frecuencias de la clase por eje x (vertical). Las frecuencias quedan representadas en el gráfico por la altura de las barras, la que se trazan una al lado de la otra. 23
  • 31. 9,00 12,00 15,00 18,00 21,00 Vuelos 2,00 3,00 4,00 5,00 6,00 7,00 Frecuencia gráfico con los gastos de tres años con una misma distribución de frecuencias, fácilmente lo podemos hacer. 0 20 40 60 80 100 1er trim. 2do trim. 3er trim. 4to trim. Este Oeste Norte Otras presentaciones gráficas de datos Gráfica por medio de línea. Las gráficas por medio de línea son muy útiles en la administración porque podemos mostrar el cambio de una variable en el tiempo, es decir, si queremos ver la cantidad de unidades vendidas de un producto que fabricamos en nuestra organización, este gráfico es la mejor opción. Para su elaboración colocamos la variable, que continuando con nuestro ejemplo de Conviasa, sería cantidad de vuelos diarios sobre el eje y y el tiempo sobre el eje x. Gráfico de Barras. Es un gráfico muy versátil, en el se puede graficar cualquier tipo de variable y en cualquier nivel de medición. Las barras pueden ser verticales u horizontales, y tampoco hay mayor inconveniente en la distribución de los datos a través de los ejes del plano cartesiano. Seguramente te preguntarás ¿En qué se diferencian los histogramas del gráfico de barras? Se diferencian en algo que podría parecer tonto, pero no, y es en la separación que existe entre las barras. Los histogramas poseen sus barras continuas porque sus datos son de intervalo o de razón, mientras que en los gráficos de barra al poder admitir cualquier nivel de medición cada barra representa una variable que puede ser cualitativa o cuantitativa. ESTADÍSTICA I 0 20 40 60 80 100 1er trim. 2do trim. 3er trim. 4to trim. Este 24
  • 32. Diagrama Circular: El diagrama circular, muy reconocido por gráfico de torta es especial para representar porcentajes. El diagrama circular convierte los 360 grados del círculo en el 100% de la variable que estamos representando. Este es un gráfico muy de muy fácil lectura, pues las líneas que cortan la circunferencia permiten, rápidamente, ver que clase de la variable tiene el mayor porcentaje. 35% 25% 15% 15% 10% 1 2 3 4 5 ESTADÍSTICA I 25
  • 33. UNIDAD III MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NOMEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO CENTRALCENTRAL ESTADÍSTICA I ¡Felicitaciones! Ya te encuentras en la tercera unidad, continua con tus progresos. Aquí encontrarás… Contenidos de la segunda unidad Ejemplos Ejercicios propuestos 26
  • 34. UNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NOUNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO CENTRALCENTRAL Las medidas de tendencia central tienen como propósito hallar con toda precisión el centro de un conjunto de observaciones Medidas de Tendencia Central para datos Simples La Media Aritmética La media aritmética o media es la medida de tendencia central que frecuentemente llamamos promedio, consiste en la suma de los valores del grupo de datos dividida entre la cantidad de valores. La media aritmética de una población se representa con el símbolo µ (mu), y la media aritmética de una muestra se representa con el símbolo X (equis barra) y sus fórmulas son las siguientes: N X∑ =µ n X X ∑ = Siendo: Medidas de Posición Central No Central Cuartiles (Qx) Deciles (Dx) Percentiles (Px) Promedios Matemáticos Promedios No Matemáticos Media Aritmética Media Geométrica MG Media Ponderada Mediana (Med) Moda (Mo)
  • 35. X∑ La sumatoria d todos los datos N Población n Muestra Ambas fórmulas son idénticas, con la única diferencia que en el primer caso trabajamos con la población entera y en el segundo con una muestra. Ejemplo: Durante cada hora de trabajo de un día una cooperativa produce las siguientes cantidades de artículos de limpieza: 14, 19, 20, 15, 12, 18, 16, 10.¿Cuál es el número medio de unidades producidas? 50,15 8 124 8 1016181215201914 == +++++++ = ∑ = N X µ El numero medio de producción es de 15,5 artículos de limpieza, pero si retomamos los contenidos estudiados en la primera unidad, la cantidad de artículos producidos en un variable discreta, ya que si estuviésemos hablando de jabones de baño no podemos decir que fabricamos 15 jabones y dejamos hecho la mitad del siguiente, por lo tanto aquí aplicamos una regla que se denomina redondeo. De tal forma que de 15,5 redondeamos el número decimal, como 5 es ≥ a 5 redondeamos por exceso convertimos el 15, 5 en 16. Media Ponderada El redondeo de un número consiste en que una o varias de sus cifras finales (de izquierda a derecha) se substituyen por ceros o se ascienden o descienden si ese último número es mayor o menor que 5 Propiedades de la Media Aritmética:  Para calcular la media se toman todas los valores  Un conjunto de datos sólo tiene una media. La media es única  La media es una medida útil para compara dos o mas poblaciones  La media aritmética es la única medida de posición en la que las suma de las desviaciones de los valores de la media es siempre cero: 0)( =−∑ XX Ejemplo: La media de 3, 8 y 4 es 5 0132)54()58()53()( =−++−=−+−+−=−∑ XX
  • 36. La media ponderada o promedio ponderado es una media aritmética en al que cada uno de los valores se le pondera de acuerdo a su importancia con el grupo general. Las fórmulas de media ponderada poblacional y muestral son idénticas: wµ ó w wX X w ∑ ∑ = )( Donde: wX Media Ponderada X Observación individual W Peso o ponderación asignada a cada observación Cuando calculamos la media aritmética no sale a discusión si cada uno de los datos tiene igual importancia, sin embargo en ciertos casos puede ocurrir que determinados datos tengan más valor que otro de su mismo conjunto, observemos el siguiente ejemplo: Un estudiante obtuvo las siguientes calificaciones en su curso de estadística I: 19, 20, 18 y 16. Sin embargo dentro de los porcentajes la tercera calificación es la que tiene mayor ponderación o mayor valor, debido a que representaba el 30 % de la calificación final, a continuación se reflejan los datos en la siguiente tabla: Calificaciones Ponderación XW 19 1 19 20 1 20 18 3 54 16 1 16 6 109 16,18 6 109)( == ∑ ∑ = w wX X w El promedio ponderado de calificaciones de este estudiante es de 18,16 puntos. Media Geométrica La media geométrica es útil para encontrar el promedio de porcentajes, proporciones, índices o tasas de crecimiento. Tiene mucha aplicación en el comercio y en la economía debido a que nos interesa encontrar el porcentaje de cambio en ventas, salarios o cualquier otro dato económico. La media de un conjunto n de números positivos se define como la n-ésima raíz del producto de los n valores. La formula de la media geométrica se escribe así:
  • 37. n nxxMG ))...(( 1= La media geométrica será siempre menor o igual a la media aritmética, pero nunca mayor. Ejemplo: Un empleado gana 700.000 bolívares al mes, este año va a recibir un 5% de aumento y el próximo año un 15%, si sacamos la media aritmética de estos de ambos porcentajes nos daría un promedio de 10%, pero el verdadero promedio es 9, 886. Empleemos la fórmula de media geométrica: 09886,1)15,1)(05,1( ==MG Verifiquemos: si el trabajador del que hablábamos gana Bs. 650.000 con los dos aumentos su sueldo quedará: 650.000 * 0,05= 32.500 682.000 * 0,15= 102.370 Total con el aumento 784.870 bolívares Ahora realicemos el cálculo con nuestra media geométrica 700.000*0,09886=64.259 714.259*0,09886=70.611,6 Total = Bs.784.870 Mediana y Moda Mediana La mediana o media posicional queda en la mitad un grupo de elementos ordenados de forma ascendente o descendente. En este caso la mitad de los números estará por debajo de la mediana y la otra mitad por encima de ella. La mediana se obtiene con la siguiente ecuación: 2 1+ = n Med Si el grupo de datos es impar la mediana se calcula así de la siguiente forma. La mayoría de las calculadoras pueden calcular la raíz enésima de cualquier número
  • 38. Ejemplo: Calculemos la mediana de los kilos(ordenados de forma ascendente) de materia prima utilizadas durante esta semana: 33, 36, 40, 45, 57,60 y 68. 4 2 8 2 17 2 1 == + = + = n Med La mediana es el valor que está en la posición 4: 33, 36, 40, 45, 57,60 y 68. Si el grupo de datos es par, aplicamos la misma ecuación promediando los dos valores centrales, observemos el ejemplo: Datos: 10, 15, 18, 25, 31, 36, 45, 60, 77, 80 5,5 2 11 2 110 2 1 == + = + = n Med El punto 5,5 estaría entre los valores de las posiciones 5 y 6, por lo buscamos ambos valores y los promediamos 10, 15, 18, 25, 32, 36, 45, 60, 77, 80 43 2 86 2 3632 == + =X La mediana es 43. Moda Es la medida de tendencia central más fácil de recordar ya verás por qué: Seguramente responderás… Por que lo usan muchas personas, o por que lo vemos frecuentemente en la calle, y efectivamente eso es la moda, el dato que más se repite dentro de nuestro conjunto de elementos. Veamos este ejemplo: Edades de los niños de nuestra familia: 12, 1, 10, 1, 10, 2, 5, 7, 8, 9, 10, 11. El número que más se repite es el 10, a pesar del que el 1 también se repite, el 10 se repite mayor número de veces. Medidas de Tendencia Central para Datos Agrupados Antes de avanzar, es correcto aclarar que las definiciones de nuestras medidas de tendencia central se mantienen, a continuación se te presentan un resumen repaso con las definiciones de todas. ¿Por qué sabemos que algún producto está de moda? Media Aritmética: Es una medida de tendencia central que se obtiene dividiendo la suma de los valores del conjunto de datos entre el número total de Media Ponderada: Es un caso especial de media aritmética pero cuando todos los datos tienen diferentes valores o ponderaciones que los discrimina según su importancia Media Geométrica: Es una medida que calcula los promedios de los porcentajes
  • 39. Media Aritmética para Valores Agrupados Para aproximar la media aritmética de datos organizados en una distribución de frecuencias, comenzamos por asumir que las observaciones de cada clase están representadas por el punto medio de la clase. La media de una distribución de frecuencias se calcula así: n fX X ∑ = En la que X = media aritmética X= valor o punto medio de cada clase f= frecuencia de cada clase fX= frecuencia en cada clase por el punto medio de la clase fX∑ = suma de estos productos n= número total de frecuencias Ejemplo: Calculemos la media del precio de venta de los vehículos del plan Venezuela Móvil Precio de Venta de vehículos (millones de bolívares) Frecuenc ia 18 a 23 25 23 a 28 28 28 a 33 26 33 a 38 17 38 a 42 13 Total 109 Mediana: Observación de la mitad de los datos después de que se han colocado de forma ordenada Moda: Es el valor que más se repite dentro de su conjunto, es decir, posee mayor frecuencia
  • 40. Al precio de venta medio de los vehículos puede estimarse a partir de datos agrupados en una distribución de frecuencias, lo primero que debemos calcular es el punto medio de cada clase, para eso le calculamos el promedio: 18+23/2=20,5 luego ese valor medio se multiplica por la frecuencia, como se muestra en la siguiente tabla:
  • 41. 9,28 109 5,149.3 == ∑ = n fX X Decimos entonces que la media del precio de venta del plan Venezuela Móvil es de Bs. 28.800.000. La Mediana Para Valores Agrupados La mediana es el valor por debajo del cual se encuentran una mitad de los valores y por encima del cual se encuentra la otra mitad. Como los datos están organizados en una distribución de frecuencias, se ha perdido algo de información. Así no podemos calcular la mediana exacta, sin embargo, se puede estimar de la siguiente manera: )(2 i f CF n LMed − += Donde: L= Límite inferior de la clase que contiene la mediana. n= Número de frecuencias. f= frecuencia en la clase mediana. CF= número de las frecuencias acumuladas en las clases que preceden a la clase que contiene la mediana. i= amplitud de la clase en la que se encuentra la mediana. Precios de venta Frecuencia (f) Punto Medio (X) fX 18 a 23 25 20,5 512,5 23 a 28 28 25,5 714 28 a 33 26 30,5 793 33 a 38 17 35,5 603,5 38 a 43 13 40,5 526,5 Total 109 3.149,5
  • 42. Utilicemos los datos del ejemplo anterior, pero en esta oportunidad debemos calcular la frecuencia acumulada, que no es más que la suma acumulada de las frecuencias de cada clase o categoría, veámoslo en la siguiente tabla: Precios de Venta Frecuencia (f) Frecuencia Acumulada 18 a 23 25 25 23 a 28 28 53 28 a 33 26 79 33 a 38 17 96 38 a 43 13 109 Total 109 Debemos localizar en cual clase se encuentra la mediana, para eso dividimos el total de la frecuencia entre 2, 2 n =190/2=54,5. Ahora buscamos en la frecuencia acumulada el grupo de intervalos que tenga a este número: Precios de Venta Frecuencia (f) Frecuencia Acumulada 18 a 23 25 25 23 a 28 28 53 28 a 33 26 79 33 a 38 17 96 38 a 43 13 109 Total 109 Podemos apreciar fácilmente que el tercer grupo de intervalos es el que posee al número en la posición 54,5 debido a que el anterior sólo llega hasta el número 53, observemos este diagrama. Sustituyamos ahora los valores: 000.288.28000.288000.000.28)000.000.5( 26 53 2 109 000.000.28)(2 =+= − += − += i f CF n LMed 53 79 ? Mediana Bs. 28.000.000 Bs.33.000.000
  • 43. La mediana del precio de venta es 28.288.000. Si comparamos la mediana con la media aritmética se nos presenta una diferencia, pero recordemos que… Moda Para Datos Agrupados Siendo la moda el valor con más frecuencia, sólo debemos buscar dentro de nuestra distribución de frecuencias los intervalos con mayor cantidad de frecuencia, revisemos la tabla de precios de venta del Plan Venezuela Móvil. Precios de Venta Frecuencia (f) 18 a 23 25 23 a 28 28 28 a 33 26 33 a 38 17 38 a 43 13 Total 109 El intervalo de 23 a 28 millones es que tiene mayor cantidad de observaciones, por lo tanto para determinar la moda calculamos el punto medio de la clase: 23+28/2=25,5; por lo tanto la moda del precio de venta es Bs. 25.500.000. Media Geométrica para Datos Agrupados La media geométrica para datos agrupados se determina con la siguiente ecuación: nf n fn f XXXMG ...21 21= Donde X= punto medio de los intervalos f = frecuencia Recuerda No podremos determinar una mediana exacta porque hemos perdidos datos en el proceso de agrupación La media geométrica se calcula para promedios de porcentajes Relación entre Media, Mediana y Moda En las distribuciones simétricas la media, la mediana y la moda coinciden en el valor, mientras que en una distribución asimétrica positiva la media es mayor que la mediana, pero por el contrario, si la distribución es asimétrica negativa, la media es menor que la mediana. Simétrica Asimétrica negativa Asimétrica positiva
  • 44. Medidas de Posición No Central Los cuartiles, deciles y percentiles se asemejan a la mediana por que dividen la distribución en partes iguales, la mediana lo hace en dos los que están por encima y or debajo de ella, mientras que los cuartiles dividen los valores en cuatro partes iguales, los deciles en diez y los percentiles en cien. A continuación se te muestran las ecuaciones necesarias para su cálculo: Medidas de Posición No Central Datos simples Datos Agrupados Cuartiles 4 nx Qx ∗ = Deciles 10 nx Dx ∗ = Percentiles 100 nx Px ∗ = Cuartiles Los cuartiles dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales, Los cuartiles son denotados como Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. Para Datos Simples Media MediaMedia
  • 45. Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Cuando n es par: 4 1 n Qx ∗ = Recordemos que x representa el valor del cuartel que puede ser 1,2 y 3 Cuando n es impar: Datos Agrupados Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: k= 1,2,3 Donde: Lk = Límite real inferior de la clase del cuartil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k Deciles Los deciles dividen la continuidad de los datos ordenados en diez partes porcentualmente iguales. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Para Datos Simples Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: 10 nx Dx ∗ = Cuando n es par: 10 )1( + = nx Dx Cuando n es impar: Siendo x el número del decil. Para Datos Agrupados Para datos agrupados los deciles se calculan mediante la fórmula.
  • 46. k= 1,2,3,... 9 Donde: Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra fórmula para calcular los deciles: El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es superado por el 60% de las observaciones. El quinto decil corresponde a la mediana. El noveno decil supera al 90% y es superado por el 10% restante. Donde (para todos): L1 = limite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Centiles o Percentiles Los percentiles son una de las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc. Los percentiles dividen los datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99. Para Datos Simples Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
  • 47. Para los percentiles, cuando n es par: 100 nx Px ∗ = 100 )1( +∗ = nx Px Cuando n es impar: Siendo x, el número del percentil. Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75. Para Datos Agrupados Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula: k= 1,2,3,... 99 Donde: Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra forma para calcular los percentiles es: Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante. El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones. El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante. Ejemplo Determinación del primer cuartil, el séptimo decil y el treintavo percentil, de la siguiente tabla:
  • 48. Salarios (en miles de bolívares) Número de Empleados (f1) Frecuencia Acumulada 200-299 85 85 300-399 90 175 400-499 120 295 500-599 70 365 600-699 62 427 700-800 36 463 Como son datos agrupados, se utiliza la fórmula Siendo, La posición del primer cuartil. La posición del septimo decil. La posición del treintavo percentil. Entonces, El primer cuartil: 115.5 – 85 = 30.75 Li = 300, Ic = 100 , fi = 90 El 7 decil:
  • 49. Posición: 324.1 – 295 = 29.1 Li = 500, fi = 70 El percentil 30 Posición: 138.9 – 85 = 53.9 fi = 90 Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de Bs.334.000; que bajo Bs. 541.570 gana el 57% de los empleados y sobre Bs. 359.880, gana el 70% de los empleados.
  • 50. UNIDAD IV MEDIDAS DE DISPERSIÓN O VARIABILIDADMEDIDAS DE DISPERSIÓN O VARIABILIDAD ¡MAGNÍFICO! Llegamos a la última unidad de esta divertida unidad curricular Aquí encontrarás…  Contenidos de la segunda unidad  Ejemplos  Ejercicios propuestos
  • 51. UNIDAD 4. MEDIDAS DE DISPERSIÓNUNIDAD 4. MEDIDAS DE DISPERSIÓN Las medidas de tendencia central por sí solas carecen de significado, pues de nada sirve saber el promedio sin conocer la dispersión, qué significa esto, saber cuanto se alejan las observaciones de su propio promedio, observemos el siguiente ejemplo: A continuación se te presenta el monto en bolívares de ventas mensuales de las empresas “XXX” y “ZZZ” Meses Empresa “XXX” Empresa “ZZZ” Julio 1.500.000 4.800.000 Agosto 1.800.000 3.900.000 Septiembre 2.000.000 2.000.000 Octubre 2.300.000 1.400.000 Noviembre 2.500.000 700.000 Diciembre 2.800.000 100.000 Total 12.900.000 12.900.000 Empresa “XXX” 000.150.2=X Empresa “ZZZ” 000.150.2=X Ambas tienen la misma media en ventas, pero si realizamos el análisis considerando cada una de las ventas del mes podemos apreciar que la situación de la empresa “ZZZ” es muy delicada, debido a que el último mes de facturación se aleja mucho de la media. Por esto la importancia de las medidas de dispersión. Existen dos grupos de medidas de dispersión. El primer grupo es el de las medidas de dispersión absolutas que vienen expresado por las mismas medidas que identifican a la serie de datos; el segundo grupo es el de las medias de dispersión relativas que son relaciones entre las medidas de dispersión y las medidas de tendencia central, expresado en valores abstractos (porcentajes). Medidas de Dispersión Absolutas Medidas de Dispersión: Miden que tanto se dispersan los datos recabados de su media
  • 52. El Rango El rango o recorrido es la medida de dispersión más sencilla, consiste en calcular la diferencia entre el valor mayor o el valor menor de la observación: VmVMR −= Revisemos el siguiente ejemplo: Horas diarias dedicadas al estudio por un grupo de estudiantes del plan de formación Administración y Gestión: 1,5 2 3 2,5 2 3 3,5 4 2 2,5 1 1 Calculemos la media aritmética 23,2 12 28 ≈==X . Podemos decir que todos los alumnos dedican aproximadamente dos horas diarias al estudio. Calculemos el Rango, R=Vm-Vm=4-1=3. El rango de 3 es la distancia entre los límites. El rango es una medida de dispersión débil pues sólo incluye dos valores del conjunto. El rango es una buena opción cuando comparamos dos situaciones similares, retomemos el ejemplo al principio de la unidad Monto en bolívares de ventas mensuales de las empresas “XXX” y “ZZZ” Meses Empresa “XXX” Empresa “ZZZ” Julio 1.500.000 4.800.000 Agosto 1.800.000 3.900.000 Septiembre 2.000.000 2.000.000 Octubre 2.300.000 1.400.000 Noviembre 2.500.000 700.000 Diciembre 2.800.000 100.000 Total 12.900.000 12.900.000 Empresa “XXX” 000.150.2=X Empresa “ZZZ” 000.150.2=X Calculemos el rango de cada una XXX= 2.800.000 - 1.500.000=1.300.000 ZZZ= 4.800.000 – 100.000= 4.700.000
  • 53. Podemos concluir que la media de la empresa XXX es más representativa que la de la empresa ZZZ. Para calcular el rango de datos agrupados tomamos el límite inferior de la primera clase y el límite superior de la última clase. Ejemplo. Utilicemos la distribución e frecuencias del Plan Venezuela Móvil trabajado en la unidad anterior Precios de Venta del Vehículo Frecuencia (f) 18 a 23 25 23 a 28 28 28 a 33 26 33 a 38 17 38 a 43 13 Total 109 8,21 5 109 ==X 251843 =−=−= VmVMR El rango es 25 millones. Desviación Media La desviación media mide la cantidad media en que los valores de la población, o de la muestra, varían de la media. Se define así: n XX DM −∑ = Donde Xes el valor de cada observación X = es la media aritmética de los valores n= es el número de observaciones en la muestra = indica el valor absoluto. En otras palabras se hace caso omiso de los signos de las desviaciones medias, ¿Por qué? Porque si no lo hiciéramos así las desviaciones positivas y negativas se anularían, y al desviación siempre sería cero, y una medida de dispersión cero sería completamente inútil. Ejemplo 1,5 2 3 2,5 2 3 3,5 4 2 2,5 1 1 Número de (X-X) Desviación Absoluta
  • 54. horas 1,5 1,5-2,3=- 0,8 0,8 2 2-2,3=-0,3 0,3 3 3-2,3=0,7 0,7 3,5 3,5-2,3=1,2 1,2 4 4-2,3 1,7 4,7 194,0 5 7,4 ≈== −∑ = n XX DM El número de horas estudiada se desvía de la media en una hora Varianza y Desviación Estándar La varianza y la desviación estándar son medidas de dispersión basadas en la desviación media, pero en lugar de usar valores absolutos, elevamos al cuadrado las desviaciones. Elevar al cuadrado significa eliminar los números negativos. La variancia y la desviación son las medidas de dispersión más útiles, pues proporcionan una medida más significativa sobre el punto de dispersión Varianza poblacional y Desviación Estándar para datos simples Recordemos que la población son todas las observaciones que hemos recabado, es decir, los datos. Su fórmula es: 1 )( 2 2 − −∑ = n XX S i Donde 2 S =varianza poblacional X= valor de una observación de la población X = media aritmética de la población n= Número de observaciones de la población Ejemplo: Varianza: La media aritmética de las desviaciones de la media elevadas al cuadrado. Desviación Estándar: La raíz cuadrada positiva de la varianza
  • 55. Un corredor de seguros vende tres pólizas por los siguientes precios en millones: 32, 23 y 26 27 3 262332 = ++ =X El precio de las pólizas de seguro está estrechamente agrupado alrededor de los 27 millones de bolívares y pueden fluctuar entre los 3.740.000 bolívares. Varianza Poblacional y Desviación Estándar para Datos Agrupados 1 22 2 − −∑ = n XnfM S 2 ss = Ejemplo: El director de Conviasa requiere conocer el número de pasajeros atendidos por día para determinar si la variación de pasajeros es grande, ya que de ello depende la ampliación en la flota de aviones, la distribución de frecuencias es la siguiente: Pasajeros (Clases) Días (Frecuenci a) Punto Medio (M) fM M 2 fM 2 50-59 3 54,5 163,5 2.970,25 8.910,75 60-69 7 64,5 451,5 4.160,25 29.121,75 70-79 18 74,5 1341 5.550,25 99.904,50 80-89 12 84,5 1014 7.140,25 85.683 90-99 8 94,5 756 8.930,25 71.442 100-09 2 104,5 209 10.920,25 21.840,5 TOTAL 50 3.935 316.902,50 7,78 50 935.3 == ∑ = n fM X g Por lo tanto 31,147 49 )7,78(505,902.316 1 222 2 = − = − −∑ = n XnfM S 14,1231,1472 === ss 74,32 == SS 14 3 11625 3 )2726()2723()2732( 222 2 = ++ = −+−+− =S
  • 56. El director de Conviasa ya puede decidir si los aviones que utilizan actualmente pueden acomodar fluctuaciones hasta de 12 pasajeros en los días de tránsito pesado. Medidas Relativas de Dispersión Las medidas de dispersión estudiadas hasta ahora no nos permiten hacer comparaciones entre la dispersión de los valores de varias distribuciones, ya que todas ellas están afectadas por la unidad de medida en que se expresan los datos; de allí que la comparación sería imposible porque cada medida vendría expresada en unidades diferentes. Además varias distribuciones pueden tener un mismo tener un mismo valor para determinada medida de dispersión y ser la variabilidad de sus datos en relación con la media, diferente. Por ello la existencia de medidas de dispersión relativa que se expresan en porcentaje (valores abstractos) y se determinan por la relación existente entre una medida de dispersión absoluta y una medida de la tendencia central, relación que nos permite compara la variabilidad de los datos entre varias series. La medida de dispersión relativa de mayor importancia es el coeficiente de variación, que se expresa en porcentajes y se calcula por la relación que existe entre la desviación estándar y la media aritmética. Su fórmula es la siguiente: 100 X CV σ =
  • 57. Ejercicios Unidades 2, 3 y 4 1) Qué tipo de instrumento de recolección de datos aplicarías en as siguiente situaciones y por qué. a.Para registrar el comportamiento de niños en un parque público. b.para supervisar la correcta ejecución de una obra en tu comunidad. c. Para registrar los hábitos alimenticios de tus familiares y amigos en una reunión d.Para contratar nuevos personal para tu empresa e.Para solucionar un problema entre el personal que labora en una organización. f. Para conocer la opinión del público sobre los productos que produces. 2) Realiza un censo en tu comunidad sobre dos variables de tu interés, por ejemplo: cantidad de papeleras por acera, cantidad de vecinos que participan en las misiones, etc. Luego: a.Clasifica las variables según su nivel de medición b.Realiza el proceso de recolección de datos (con al menos 20 observaciones, muestras) c. Elabora la distribución de frecuencias para ambos casos d.Selecciona el gráfico que más se adecue a tu variable y presenta en los resultados obtenidos. e.Calcula la media aritmética, la mediana y la moda de las variables estudiadas, con su respectiva medida de dispersión (Varianza y desviación estándar) 3) Calcula la media, mediana y la moda de las edades de tu grupo familiar 4) Calcula la razón de postes de alumbrado público en buen y mal estado que están en el trayecto que va desde tu casa hasta tu sitio de estudio o de trabajo.
  • 58. FELICITACIONES!!!! Concluimos exitosamente este proceso de aprendizaje, esperamos que lo hayas disfrutado.
  • 59. Respuestas Unidad I 1) Escribe cinco ejemplos de datos cuantitativos y cinco de datos cualitativos. Respuesta abierta 2) Realiza un ejemplo de una población y su muestra. Respuesta abierta 3) Determina cual de los siguientes puntos es una población o una muestra: Los estudiantes de sexto grado de Venezuela. Población Los estudiantes de Caracas pertenecientes a Misión Sucre. Muestra Todas las familias con mascotas de un municipio. Población Los reportes de un día sobre las actividades realizadas en un liceo. Muestra 4) Clasifica en cualitativa y cuantitativas las siguientes variables: Los literales de calificación en la escuela básica (A,B,C,D y E) Cualitativa El color de cabello de las personas de una comunidad. Cualitativa Cantidad de pacientes atendidos por Barrio Adentro. Cuantitativa Cantidad de hijos de nuestros vecinos. Cuantitativa 5) Clasifica las siguientes variables como continuas o discretas Número de camisas producidas por una cooperativa. Discreta Las horas de un día. Continua Cantidad de estudiantes de nuestra comunidad. Discreta Kilos de pollo vendidos en Mercal. Continua 6) Cuál es el nivel de medición de las siguientes variables: Calificaciones de los estudiantes en la primera prueba de estadística. Razón Una clasificación de los estudiantes de la zona en la que viven Nominal Temas de los discursos del presidente Chávez. Nominal El número de horas por semana que estudia alumno de Misión Sucre. Razón El año de fabricación del transporte público que cubre la ruta de nuestro vecindario. Intervalo Los periódicos vendidos cada domingo. Razón Grupos de estudiantes según su edad. Ordinal
  • 60. Unidades 2, 3 y 4 1) Qué tipo de instrumento de recolección de datos aplicarías en as siguiente situaciones y por qué. a.Para registrar el comportamiento de niños en un parque público. Observación b.Para supervisar la correcta ejecución de una obra en tu comunidad. Observación, Entrevistas c. Para conocer los hábitos alimenticios de tus familiares y amigos en una reunión. Cuestionario d.Para contratar nuevos personal para tu empresa. Entrevista e.Para solucionar un problema entre el personal que labora en una organización. Entrevista f. Para conocer la opinión del público sobre los productos que produces. Cuestionario 2) Realiza un censo en tu comunidad sobre dos variables de tu interés, por ejemplo: cantidad de papeleras por acera, cantidad de vecinos que participan en las misiones, etc. Luego: g.Clasifica las variables según su nivel de medición h.Realiza el proceso de recolección de datos (con al menos 20 observaciones, muestras) i. Elabora la distribución de frecuencias para ambos casos j. Selecciona el gráfico que más se adecue a tu variable y presenta en los resultados obtenidos. k. Calcula la media aritmética, la mediana y la moda de las variables estudiadas, con su respectiva medida de dispersión (Varianza y desviación estándar) Respuesta Abierta según los datos obtenidos 3) Calcula la media, mediana y la moda de las edades de tu grupo familiar Respuesta Abierta según los datos obtenidos 4) Calcula la razón de postes de alumbrado público en buen y mal estado que están en el trayecto que va desde tu casa hasta tu sitio de estudio o de trabajo. Respuesta Abierta según los datos obtenidos
  • 61. Bibliografía KAZMIER, L. (1998) Estadística Aplicada a la Administración y a la Economía. Mac Graw Hill. México LIND, D, Mason, R y Marchal, W (2001) Estadística para Administración y Economía. Mac Graw Hill. México. RIVAS, E. (2000) Estadística General. Ediciones de la Biblioteca. UCV. Caracas WEBSTER, A. (2000) Estadística aplicada a los Negocios y a la Economía. Mac Graw Hill, Santa Fé de Bogotá.