Este libro lo desarrollé durante mi etapa escolar. Éste libro presenta todo lo que necesario a nivel básico de los conocimientos de estadística. No olvides que, si utilizarás ideas de éste documento, por favor hacer mención en el informe.
2. PRÓLOGO
El escribir un texto sobre estadística acarrea resolver varios
problemas simultáneamente tales como el tener que
satisfacer las necesidades del estudiante y las del lector
común. Esta faceta de complica aún más, cuando
pensamos en los diferentes niveles de estudios.
La solución del dilema anterior tiene que ser acompañada
también por la solución del problema de la amplitud o sea
qué partes de la estadística hay que abarcar o cubrir.
Estos dos primeros problemas los hemos resuelto en la
obra cubriendo íntegramente la estadística fundamental.
Estos temas, más algunos otros adicionales proporcionan
al lector las herramientas para resolver los problemas
básicos y complementarios de estadística.
Las Matemáticas y todo lo relacionado con ellas ha sido
materia de calumnias y falsas imágenes, así por ejemplo
Hollywood nos ha presentado al matemático como un ser
descuidado y distraído; a la profesora de matemáticas
como una mujer fea y sin ningún atributo, ni siquiera físico,
y por último, el público en general tiene la sensación de
que las matemáticas es una materia árida y aburrida.
Con respecto a las profesoras, “ladies first”, debo confesar
que en Colombia he conocido mujeres muy guapas y con
muchos atributos dedicados a la docencia de las
ÍNDICE
1. Introducción a la estadística
1.1. Reseña histórica de la estadística.
1.2. Importancia de la estadística.
1.3. Definición de estadística
2. Conceptos básicos.
2.1. Población.
2.2. Muestra.
2.3. Dota estadístico.
2.4. Variable estadística.
2.4.1.Variable cualitativa.
a) Nominal.
b) Ordinal.
2.4.2.Variable cuantitativa.
a) Discreta.
b) Continua.
3. Fuentes y de recolección de datos.
3.1. Fuentes.
3.2. Técnicas e instrumentos de recolección de datos.
4. Etapas del método estadístico.
5. Organización y presentación de datos.
5.1. Distribución de frecuencias de datos no agrupados.
5.1.1.Frecuencia absoluta
5.1.2.Frecuencia relativa
5.1.3.Frecuencia porcentual.
5.2. Distribución de frecuencias de datos agrupados.
5.2.1.Rango
5.2.2.Marca de clase
3. 5.2.3.Amplitud de intervalo
5.2.4.Frecuencia absoluta (fi) se una clase.
5.2.5.Frecuenciaabsolutaacumulada(Fi) de unaclase.
5.2.6.Frecuencia relativa (hi) de una clase.
5.2.7.Frecuenciarelativaacumulada(Hi) de una clase.
5.3. Gráficos.
5.3.1.Diagrama de barras.
5.3.2.Histograma de frecuencias.
5.3.3.Polígonos de frecuencias.
5.3.4.Polígonos de frecuencias acumuladas.
5.3.5.Diagrama de sectores.
6. Medidas de tendencia central.
6.1. Datos no agrupados.
6.2. Datos agrupados.
7. Medidas de dispersión.
7.1. Rango o recorrido.
7.2. Desviación media.
7.3. Varianza.
7.4. Desviación estándar.
7.5. Coeficiente de variación.
8. Bibliografía.
matemáticas. En cuanto a los matemáticos, según sus
biógrafoshan sido hombres muy normales,elegantes,muy
agudos y que han vivido de acuerdo a su época.
Quizás en el futuro me decida a escribir una obra dedicada
únicamente a la especialidad de lo que comprende la
Estadística.
Cualquiersugerenciaycrítica constructivaserábienrecibiday
agradecida.
4. INTRODUCCIÓN
La estadísticaesla disciplinaque estudiacómose producenlas
cosas que hacen falta para satisfacer nuestras necesidades,
pero a nivel técnico, a nivel de indicadores numéricos
referenciales de los diferentes sectores productivos.
En los últimos años, la Estadística ha llegado a construir una
herramienta de trabajo en muchos campos de la actividad
intelectual.Másaúnenla investigacióncientífica,laestadística
esuna técnicamuyimportante,yaque susmétodosytécnicas,
ayudan en la búsqueda permanente de nuevos conocimientos
en cualquier área de estudios.
La empresa,entérminosestadísticos,esunaprácticaen busca
de una teoría. Este libro tiene por finalidad ilustrar
adecuadamente a los interesados,para examinar el progreso
de esabúsquedaempresarial anivel de la referenciahistórica,
presente ylaproyecciónfuturade las unidadeseconómicasde
producción.
El objetivoprincipal de lapresente obraesprecisamentellenar
el vacío que existe para su fácil y mejor aprendizaje,
desarrollando los conceptos básicos de la Estadística y su
aplicación como instrumento para estudiar e investigar, de tal
manera que permita disponer una herramienta de trabajo
práctico y comprensible.
1.1. Reseña histórica de la estadística.
Historia de la Estadística
Las estadísticas son tan antiguas como la humanidad misma.
Los esfuerzosdel hombreporevaluarde formacuantitativalas
característicasque lorodean,diocomoresultadolaestadística.
En Egipto, se hacían recopilaciones regulares de datos de la
administración estatal. Los hebreos utilizaron datos
estadísticos a menudo; así la Biblia menciona el censo que
Moisés levantó a instancias de Jehová. En el año 2258 A.C. el
emperador Yao dispuso el levantamiento de un censo en la
China. En Roma, se llevaban registros numéricos para fines
tributarios,entiempode Octavio Augustose realizóun censo.
Algunos sostienen que en año 0, año del nacimiento de
Jesucristo está relacionado con un empadronamiento.
Se sabe que en el año 727, los árabesrealizaronencenso más
o menoscompletoenlapenínsulaIbérica.Enlaedadmediaya
se encuentran estadísticas sistematizadas. El clero se dedicó a
la recopilación,ordenamiento y estudio de los datos de tipo
demográfico. En el Siglo XV durante el gobierno de los Reyes
Católicos, en el Siglo XVI reinado de Felipe II y siguientes,se
levantaron censos relativamente complejos. Es digno
mencionar el llamado censo del Marqués de la Enseñada en
1748; así como tambiénlasnumerosasestadísticaseconómicas
contenidas en el Archivo de Indias de Sevilla. En América
morenaesposibleencontraralgunosantecedentesestadísticos
en la época pre colombina. Aun cuando los pobladores del
Tahuantinsuyo no conocían la estadística como tal, estaban
5. familiarizados con los datos e informes sobre aspectos
demográficos y económicos.
En el ImperioIncaicoexistíalacostumbre de registrartodoslos
hechos demográficos y socio económicos, lo cual permitió
desarrollar técnicas de recopilación y archivo de datos. El inca
y su esforzada élite cooperadora, conocían por medio de los
Quipus el potencial humano y económico del Imperio y en
consecuencia, deducían las necesidades que era necesario
satisfacer. El Quipu consistía de un cordón central de lana del
que pendían otros cordones unidos por otros, que se
diferenciabanentre sípor su grosor, color,númeroy formade
nudos.El “nudo” dice Garcilasode la Vega,expresael número
pero no la palabra. La Yupana o Abaco, era el accesorio del
Quipu, y facilitaba el cálculo de grandes cantidades. El Quipu
Camayoc era el funcionarioque conocía la técnica del registro
por medio de los nudos. En el Cusco estaba la Oficina Central
de los Quipus. El Quipu sirvió a los antiguos peruanos para
levantar censos de población cada cierto número de años. El
Imperio Incaico era una sociedad veraz, y por tanto todos
estaban acostumbrados a decir la verdad en el acto censal.
Durante el DespotismoIlustrado de Federico Guillermo I y de
Federico el Grande de Prusia, la estadística pasó a ser una
organización estatal. Desde hace mucho tiempo la Iglesia se
dedicóarecopilardatosdemográficos,yapartirdel Conciliode
Trento (1545-1563) se establece la obligatoriedad de inscribir
los nacimientos, matrimonios y defunciones.
Los antecedentes históricos de las estadísticas se encuentran
fundamentalmente en la Demografía, recién a mediados del
6. Siglo XVIII se considera a la Estadística como una disciplina
independiente.EnAlemania,se creóporprimeravez lacátedra
de Estadística, originándose la Escuela Universitaria
Administrativa,laque considerabaque laestadísticacomouna
descripción de los fenómenos pertenecientes al Estado según
la orientación de Vito de Seckendorff (1626-1689) y Herman
Conring (1606-1681), quién en 1660 empezó a dictar un curso
en la Universidad de Helnstadt. Su discípulo Godofredo de
Achenwall (1719-1772), fue el primer gran teórico de la
Estadísticaenlenguaalemanayle dioelnombre de Estadística,
basándose en el origen etimológico “Status”.
Por la mismaépoca,en Inglaterranace la EscuelaDemográfica
o de losaritméticospolíticos,quienesse proponíandeterminar
en forma cuantitativa las leyes empíricas que regían el
comportamiento de losfenómenospolíticosysociales, que de
ninguna manera eran independientes del volumen, estructura
y distribución de la población. Entre los miembros de esta
escuela destacaron William Petty (1623-1687), Edmundo
Halley(1662-1742), DevenantyJohn Graunt (1620-1674), este
último realizó un trabajo matemático en estadística vital y
económica.En Alemania,estaorientaciónenduraluchacon la
escuela de Achewall y Schlözer obtuvo el primer éxito
definitivo gracias al esfuerzo de Johann Peter Süssmilch.
Por la época contemporánea, en Francia se originó la Escuela
Probabilística, basados en los problemas de juegos de azar
planteadosaBlasPascal (1623-1647) por el Caballerode Mére.
La solución de estos problemas motivó el auge de Cálculo de
Probabilidades, con destacada participación de Fernat (1601-
1665), Laplace (1749-1827), Poisson(1777-1855), loshermanos
regresión y correlación, William Gosset (estudiante) y Sir
Ronald A. Fisher (1890-1962) quienes desarrollaron métodos
de trabajo usados en el análisis estadístico y en la prueba de
hispótisis. Por su parte Jerzy Neyman, conjuntamente con el
hijo de Pearson crearon el Teorema del Muestreo.
7. 1.2.Importancia de la Estadística.
La estadística resulta fundamental para conocer el
comportamientode ciertoseventos, porloquehaadquiridoun
papel clave enla investigación.Se usacomo un valiosoauxiliar
y en los diferentes campos del conocimiento y en las variadas
ciencias. Es un lenguaje que permite comunicar información
basada en datos cuantitativos.
Es tan importante que casi no existe actividadhumanaen que
no esté involucrada la Estadística. Las decisiones más
importantesde nuestravidase tomanconbase enlaaplicación
de la Estadística. Pongamos algunos ejemplos.
La estadística es de gran importancia en la investigación
científica debido a que:
Permite unadescripciónmásexacta.
Nos obligaaser clarosy exactosennuestros
procedimientosyennuestropensar.
Permite resumirlosresultadosde manera
significativaycómoda.
Nos permite deducirconclusionesgenerales.
La evolución de la estadística ha llegado al punto en que su
proyección se percibe en casi todas las áreas de trabajo.
También abarca la recolección, presentación y
caracterizaciónde informaciónparaayudar tantoen el análisis
e interpretación de datos como en el proceso de la toma de
decisiones. La estadística es parte esencial de la forma
profesional, es hasta cierto punto una parte necesaria para
toda profesión.
Bernouilli (Daniel, Jacob y Nicolás), Guass y De Moivré (1667-
1754). Poco tiempodespuésel Cálculode Probabilidadestoma
gran impulso debido a los trabajos de los franceses Borel,
Frechet y Levy y de los rusos Tchevyshev (1821-1894),
Tchuprov, Markov, Kintchine y Kolgomorov (nacido en 1903).
Entre los ingleses destacó el clérigo Tomas Bayes.
Durante el Siglo XIX y a principios del XX el trabajo estadístico
se caracterizaba por el estudio de grandes masas de datos. La
idea básica era la recolección completa de datos. Pero, a
principiosdel SigloXXIyespecíficamente alrededorde losaños
treinta, se produjo un nuevo giro en el desarrollo de la
Estadística. Nació la estadística Moderna, la Estadística
InductivaoInferenciaEstadística,laEstadísticaAnalítica.Antes
se espera obtener información de cada detalle en particular,
actualmente se buscan métodos que hagan posible obtener
conclusiones generales a partir de muestras y estudios
parciales. En la Estadística Moderna la palabra clave es
“muestra”.
Estos cambiosen la teoría y la práctica estadística,requirieron
cada vezmás de las matemáticassuperiores;entoncessurge la
Estadística Matemática como una rama de alta matemática,
cuyos procedimientos característicos son el análisis de la
varianza,el cálculo de recoleccionesylaspruebasde hipótesis
estadísticas.
En el campo de la estadística Moderna destacaron Francisco
Galton(1822-1911), Karl Pearsonque desarrollaronideassobre
8. 1.3.Definición de estadística.
La estadística esunacienciaformal yuna
herramienta que estudia el uso y los análisis provenientes
de una muestra representativa
de datos, busca explicar las
correlaciones y dependencias de
un fenómeno físico o natural, de
ocurrencia en
forma aleatoria o condicional.
Sin embargo, la estadística es más
que eso, es decir, es la
herramienta fundamental que
permite llevar a cabo el proceso relacionado con
la investigación científica.
Distribución normal
Es transversal a una amplia variedad de disciplinas, desde
la física hasta las ciencias sociales, desde las ciencias de la
salud hasta el control de calidad.
Se usa para la toma de decisiones en áreas de negocios o
instituciones gubernamentales.
2. Conceptos básicos.
2.1. Población: Una población es el conjunto de
todos los elementos a los que se somete a un
estudio estadístico.
2.4.2 Variable cuantitativa: Es la que se expresa
mediante un número, por tanto se pueden realizar
operaciones aritméticas con ella. Podemos distinguir
dos tipos:
a) Discreta: Es aquella que toma valoresaislados, es
decir, no admite valores intermedios entre los
valores específicos. Por ejemplo:
- El númerode hermanosde 5amigos:2;1;0;1;3.
b) Continua: Es aquella que puede tomar valores
comprendidos entre dos números. Por ejemplo:
- La alturade los 5 amigos: 1,77; 1,78; 1,75; 1,72;
1,73.
- En la práctica medimos la altura con dos
decimales, pero también podemos trabajar tres
decimales.
3 Fuentes de recolección de datos.
3.1. Fuentes: Es el lugar, la institución o persona donde están
los datos que se necesitan para cada una de las variables o
aspectos de la investigación. Las fuentes de información son:
a) Fuentes Primarias: Cuando los datos se obtienen
directamente de la misma persona o entidad utilizando
ciertas técnicas.
Ejemplo:Llevar a cabo una encuestapara conocer el grado de
satisfacción laboral enostrabajadoresdeunaempresa¿?.
b) Fuentes Secundarias: Cuando los datos ya han sido
elaborados y procesados por otras personas o instituciones.
9. Ejemplo: La información estadística que publica el INEI de los
diferentes ministerios delPerú.
3.2. Técnicas e instrumentos de recolección de datos.
- La investigaciónestábasadaendiversosinstrumentos
que permiten la recopilación de información en diferentes
áreas involucradas en el problema.
Observación: Consiste en una técnica de visualización
de hechos, la cual se encuentra respaldada
generalmente por una lista de cotejo que posee los
principales criterios que se desean observar, esta lista
de cotejo posee tres opcionesde respuestascerradas,
no,si ya veces;estopermiteconocerlainformaciónde
formacerradayconcreta.Posee enlapartesuperiorlas
generalidades o datos relevantesde la que se observa
y enla parte inferiorun apartado para observaciones.
Encuesta: Consiste en una serie de preguntas con
opciones múltiples, referentes a una temática
determinadaque permiteconocerel puntode vistade
las personas hacia el problema que se trata y a su vez
permite recopilar información sobre el grado de
conocimiento de los temas tratados en la presente
investigación.
Entrevista: Consiste en una conversación preparada
comounadinámicade preguntasyrespuestasabiertas,
en las cuales se socializa sobre una temática
determinada relacionada con la problemática a
estudiar,estatécnicapermite conocerel puntode vista
de diferentes partes involucradas en la discusión.
2.2. Muestra: Una muestra es
un conjunto representativo
de la población de
referencia, el número de
individuos de una muestra
es menor que el de la
población.
2.3. Dato estadístico: Un dato es cada uno de los
valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5
veces obtenemos 5 datos: cara, cara, cruz, cara,
cruz.
2.4. Variable estadística.
2.4.1. Variable cualitativa: Se refieren a
característica o cualidadesque nopuedensermedidas
por números. Podemos distinguir dos tipos:
a) Nominal: Presentan modalidades no numéricas
que no admiten criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades:
soltero, casado, separado, divorciado, viudo.
b) Ordinal: Presentan modalidades no numérica, en
las que existe un orden. Por ejemplo:
a. La nota de un examen:
suspenso, aprobado,
notable, sobresaliente.
b. El lugar en una carrera:
primero, segundo,
tercero.
10. 4 Etapas del método estadístico
El métodoestadístico,partede laobservacióndeunfenómeno,
y como no puede siempre mantener las mismas condiciones
predeterminadas o a voluntad del investigador, deja que
actúen libremente, pero se registran las diferentes
observaciones y se analizan sus variaciones.
Para el planteamiento de la investigación, por norma general,
se siguen las siguientes etapas:
1.1 Planteamiento del problema
1.2 Fijación de los objetivos.
1.3 Formulación de la hipótesis.
1.4 Definición de la unidad de observación y de la unidad de
medida.
1.5 Determinación de la población y de la muestra.
1.6 La recolección.
1.7 Crítica, clasificación y ordenación.
1.8 Tabulación.
1.9 Presentación.
1.10 Análisis
1.11 Publicación.
1.1 PLANTEAMIENTO DEL PROBLEMA
Al abordarunainvestigaciónse debe tenerbiendefinidoquése
va a investigarypor qué se pretende estudiaralgo.Esdecir,se
debe establecer una delimitación clara, concreta e inteligible
sobre el o los fenómenosque se pretendenestudiardel tema,
para ver, su accesibilidad y consultar los resultados obtenidos
por investigacionessimilares, someter nuestras proporciones
1.5 DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA.
Estadísticamente, la población se define como un conjunto de
individuos u objetos que poseen una o varias características
comunes. No se refiere esta definición únicamente a los seres
vivientes; una población puede estar constituida por los
habitantesde unpaíso por lospecesde unestanque,asícomo
por los establecimientos comerciales de un barrio o las
unidades de vivienda de una ciudad.
Existen desde el punto de vista de su manejabilidad
poblaciones finitas e infinitas. Aquí el término infinito no está
siendo tomado con el rigor semántico de la palabra; por
ejemplo, los peces dentro de un estanque son un conjunto
finito; sin embargo, en términos estadísticos, puede ser
considerado como infinito.
En la práctica, estudiartodosy cada uno de loselementosque
conforman la población no es aconsejable, ya sea por la poca
disponibilidad de recursos, por la homogeneidad de sus
elementos,porque avecesesnecesariodestruirloque se está
midiendo;poresose recurre al análisisdeloselementosdeuna
muestra con el fin de hacer inferencias respecto al total de la
población.
1.6 LA RECOLECCIÓN.
Una de las etapas más importantes de la investigación es la
recolecciónde lainformación,lacual hade partir,amenosque
se tengaexperienciaconlasmuestrasanálogas,deunaovarias
muestras piloto en las cuales se pondrán a prueba los
cuestionarios yse obtendráunaaproximacióndelavariabilidad
de la población, con el fin de calcular el tamaño exacto de la
muestraque conduzcaa una estimaciónde losparámetroscon
11. la precisión establecida. El establecimiento de la fuentes y
causes de información, así como la cantidad y complejidad de
las preguntas,de acuerdo con los objetivosde lainvestigación
son decisiones que se han de tomar teniendo en cuenta la
disponibilidad de los recursos financieros, humanos y de
tiempo y las limitacionesque se tengan en la zona geográfica,
el grado de desarrollo, la ausencia técnica, etc.
1.7 CRÍTICA, CLASIFICACIÓN Y ORDENACIÓN.
Después de haber reunido toda la información pertinente, se
necesitaladepuracióndatosrecogidos.Parahacerla crítica de
una información es fundamental el conocimiento de la
población por parte de quién depura para poder detectar
falsedadesen las respuestas,incomprensiónde las preguntas,
respuestas al margen, amén de todas las posibles causas de
nulidad de todo un cuestionario.
Separado el material de “desecho” con la información
depuradase procede aestablecerlasclasificacionesrespectivas
y con ayuda de hojas de trabajo, en las que se establecen los
cruces necesarios entre las preguntas, se ordenan las
respuestas y se preparan los modelos de tabulación de las
diferentes variables que intervienen en la investigación.
El avance tecnológicoyla popularizaciónde loscomputadores
hacen que estas tareas, manualmente dispendiosas, puedan
ser realizadas en poco tiempo.
básicas a un análisis lógico, es decir, se debe hacer una
ubicación histórica y teórica del problema.
1.2 FIJACIÓN DE LOS OBJETIVOS.
Luego de tener claro lo que se pretende investigar, debemos
presupuestar hasta dónde queremos llegar, en otras palabras,
debemos fijar cuales son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a
confusiones o ambigüedades y debe, además, establecerse
diferenciación entre lo de corto, mediano y largo plazo, así
como entre los objetivos generales y los específicos.
1.3 FORMULACIÓN DE LAS HIPÓTESIS.
Una hipótesis es ante todo, una explicación provisional de los
hechos objeto de estudio, y su formulación depende del
conocimiento que el investigador posea sobre la población
investigada. Una hipótesis estadística debe ser susceptible de
docimar, esto es, debe poderse probar para su aceptación o
rechazo.
1.4 DEFINICIÓN DE LA UNIDAD DE OBSERVACION Y DE LA
UNIDAD DE MEDIDA.
La unidad de observación, entendida como cada uno de los
elementos constituyentes de la población estudiada, debe
definirse previamente, resaltando todas sus características;
pues, al fin de cuentas, es a ellas a las que se les hará la
medición. La unidad de observación puede estar constituida
por una o varios individuos u objetos y de nominarse
respectivamente simple o compleja.
12. 1.8 LA TABULACIÓN
Una tablaes un resumende informaciónrespectoauna o más
variables,que ofrececlaridadal lectorsobre loque sepretende
describir;para su fácil interpretaciónunatabladebe tenerpor
lo menos:Un título adecuado,el cual debe ser claro y conciso.
La cuantificación de los diferentes ítems de las variables,y las
notas de pie de cuadro que hagan claridad sobre situaciones
especiales de la tabla, u otorguen los créditos a la fuente de
información.
1.9 LA PRESENTACIÓN.
Una información estadística adquiere más claridad cuando se
presenta en la forma adecuada. Los cuadros, tablas y gráficos
facilitanel análisis,perose debe tenercuidadoconlasvariables
que se vana presentarylaformade hacerlo.Noesaconsejable
saturaruninforme contablasygráficosredundantesque,antes
que claridad, crean confusión.
Además la selección de determinada tabla o gráfico para
mostrar resultados, debe hacerse no sólo en función de las
variables que relaciona, sino del lector a quien va dirigido el
informe.
1.10 EL ANÁLISIS
La técnica estadística ofrece métodos y procedimientos
objetivos que convierten las especulaciones de primera mano
en aseveraciones cuya confiabilidad puede ser evaluada y
ofrecer una premisa medible en la toma de una decisión.
Es el análisisdonde se cristalizalainvestigación.Estaes la fase
de determinaciónde los parámetros y estadísticos mostrables
para las estimacionese inferencias respecto a la población, el
5.2. DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS.
5.2.1. Rango: En estadística descriptiva se denomina rango
estadístico(R) o recorridoestadístico al intervaloentre el valor
máximoyel valormínimo;por ello,comparte unidadesconlos
datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor esel rango,más dispersosestánlosdatosde un
conjunto.
Por ejemplo, para una serie de datos de carácter cuantitativo,
como lo es la estatura medida en centímetros, tendríamos:
Es posible ordenar los datos como sigue:
donde la notación x(i) indica que se trata del elemento i-ésimo
de la serie de datos. De este modo,el rango sería la diferencia
entre el valor máximo (k) y el mínimo; o, lo que es lo mismo:
En nuestro ejemplo, con cinco valores, nos da que R = 185-
155 = 30.
13. 5.2.3. Marca de clase:
La marca de clase es el punto medio de cada intervalo.
Es el valor que representa a todo el intervalo para cáculo de
algunos parámetros como la media aritmética o la desviación
típica. Se representa por ci o xi.
ajuste de modelosylaspruebasde lashipótesisplanteadas,con
el fin de establecer y redactar las conclusiones definitivas.
1.11 PUBLICACIÓN
Toda conclusiónesdignade sercomunicadaa un auditorio.Es
más,hay otrosestudiososdelmismoproblemaa quienesse les
puede aportar información, conocimientosy otros puntos de
vista acerca de él.
5. ORGANIZACIÓN Y PRESNTACIÓN DE DATOS.
5.1. Distribución de frecuencias de datos no
agrupados.
Definiremos como frecuencia de un dato el número de veces
que este aparece en el colectivo. Siendo N la suma de las
respectivas frecuencias de cada dato (N=∑Xi). Éste N será
denominado como frecuencia total. A efectos prácticos,
asumiremos las siguientes definiciones de frecuencias:
5.1.1. Frecuencia absoluta: Es el número de veces que
aparece dicho valor de la variable y se representa por F.
5.1.2. Frecuencia relativa: Es el cociente entre la
frecuencia absoluta y el tamaño de la muestra. Lo
denotaremos por.
5.1.3. Frecuencia porcentual: Llamada también
frecuencia relativa porcentual. Se obtiene multiplicando la
frecuencia relativa por 100. La suma de las frecuencias
porcentuales es siempre 100%. Se calcula así:
xi fi xi · fi xi
2
· fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
14. 5.2.3. Amplitud de un intervalo.
Es la distancia entre el límite exacto inferior y el límite exacto
superior de un intervalo. Se calcula restando del límite
verdadero más alto el límite verdadero más bajo. La amplitud
de intervalo puede ser igual o diferente para todos los
intervalos.
5.2.4. Frecuencia absoluta (fi) de una clase.
Es el númerode vecesque se repite el valorde la variable “Xi”
(DISCRETA O CONTINUA). Ejemplo:
. Sea las notas de 10 alumnos en una prueba pre test:
Xi = 12; 11; 10; 12; 13; 12; 10; 11; 13; 12; 13.
5.2.7. Frecuencia relativa acumulada (Hi) de una clase.
Es lasuma de todaslasFrecuenciasrelativassimplesanteriores
a ella. Así;
Ejemplo: Sea las notas de 10 alumnos en una prueba:
Xi = 12; 11; 10; 12; 13; 13; 12; 10; 13; 12; 13.
5.3. GRÁFICOS.
5.3.1. Diagrama de barras.
Un diagrama de barras se utiliza para de presentar datos
cualitativos o datos cuantitativos de tipo discreto.
Se representan sobre unos ejes de coordenadas,en el eje de
abscisas se colocan los valores de la variable, y sobre
el eje de ordenadas las frecuencias absolutas o
relativas o acumuladas.
Los datos se representan mediante barras de una altura
proporcional a la frecuencia.
15. Grupo
sanguíneo
fi
A 6
B 4
AB 1
0 9
20
5.3.2. Histograma de frecuencias.
Un histograma es una representación gráfica de
una variable en forma
de barras.
Se utilizan para variables
continuas o para variables
discretas,conungrannúmerode
datos, y que se han agrupado
en clases.
En el eje abscisas se construyen
unos rectángulos que tienenpor
base la amplitud del intervalo, y por altura,
la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a
la frecuencia de los valores representados.
5.2.5. Frecuencia absoluta acumulada (Fi) de una clase.
Es la sumade todas las frecuencias absolutasanterioresaella.
Así:
Ejemplo:
Sea la nota de 10 alumnos de una prueba pre test:
Xi = 12; 11; 10; 12; 13; 12; 10; 13; 12; 13.
5.2.6. Frecuencia relativa (hi) de una clase.
Es el cociente de la Frecuencia Absoluta “fi” entre el total de
datos “n”: así;
Ejemplo: Sean las notas de 10 alumnos:
Xi = 12; 11; 10; 12; 13; 12; 10; 13; 12; 13.
16. 5.3.3. Polígonos de frecuencias.
Polígono de
frecuenciaesel nombre
que recibe una clase de
gráfico que se crea a
partir de un histograma
de frecuencia. Estos
histogramas emplean
columnas verticales
para
reflejar frecuencias: el
polígono de frecuencia es realizado uniendo los puntos de
mayor altura de estas columnas.
5.3.4. Polígonos de frecuencias acumuladas.
Un gráfico que recoja las
frecuencias acumuladas por
debajo de cualquiera de las
fronteras de clase superiores
respecto de dicha frontera se
llama un polígono de
frecuenciasacumuladasuojiva.
5.3.5. Diagrama de sectores.
Un diagrama de sectores se puede utilizarparatodotipo
de variables,perose usa frecuentemente para
las variables cualitativas.
determinadamáquinaenunprocesode produccióno las
ventas de un negocio.
Las medidasde tendenciacentral sontambién
frecuentementeusadaspara comparar un grupo de datoscon
otro,por ejemplo:el promediode ventasobtenido porun
grupode vendedoresde unazonacomparadocon el
promediode ventas otrogrupode vendedoresde otrazona,
el promediode reclamosde clientesde unasucursal,
comparadocon el promediode reclamosde otrasucursal.
6.1. Datosno agrupados.
6.1.1. Mediaaritmética
La mediaaritmética,opromedioaritmético,eslasumade los
valoresdel grupode datos divididaentre lacantidadde
valores.Sufórmulase puede describirde la siguiente manera:
Media= µ = X =
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
6.1.2. MediaPonderada.
Es una mediaaritméticaendonde a cada uno de losvaloresle
es asignada una ponderación de acuerdo con la importancia
relativa en el grupo. Es obtenido como sigue: primero,
multiplicar cada valor por la ponderación asignada al valor
correspondiente; segundo, sumar estos productos; y tercero,
dividir la suma de los productos entre la suma de las
ponderaciones. Las fórmulas para la media ponderada
poblacional y muestra son idénticas:
µw = Xw =
∑𝑤 𝑋
∑𝑤
17. 6.1.3. Mediana
Es el valordel elementocentral delconjunto.
Para encontrarla mediana,primeroarreglarlosvaloresdel
conjuntode acuerdoa sumagnitud;esdecir,arreglarlos
valoresdel máspequeñoal másgrande o del más grande al
más pequeñoydespuéslocalizarel valorcentral,esdecir,el
númerode valoressobre lamedianaesel mismoque el
númerode valoresdebajo de lamediana.Si el númerode
valoresenunconjuntode datos noagrupadoses par, nohay
medianaverdadera.
El valorde la medianase supone,porlotanto, que esigual al
valorpromedio entre losdoselementoscentralesenel
arreglo
Med = X [(n/2) + (1/2)]
6.1.4. Moda.
Tambiénllamadamodoo promediotípicode un conjuntode
valores;lamodaes el valorel cual ocurre más
frecuentementeenel conjunto.Si unvaloresseleccionadoal
azar del conjuntodado,unvalor modal esel valormás
probable a serseleccionado.Así,lamodaesgeneralmente
consideradacomoel valormás típico enuna serie de datosla
cual esllamada,poresarazón, UNIMODAL.
Los datos se representanenun círculo, de modoque
el ángulo de cada sector es proporcional a la frecuencia
absoluta correspondiente.
6. MEDIDAS DE TENDENCIA CENTRAL.
Las medidasde tendenciacentral se utilizanconbastante
frecuenciapararesumir unconjuntode cantidadesodatos
numéricosafinde describirlosdatos cuantitativosque los
forman.
Ejemplosde ello,puedenser:laedadpromedioolaestatura
promediode los estudiantesde launiversidadoel peso
promediode lasbolsasde cereal que son llenadasporuna
Alumnos
Ángul
o
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Sin deporte 6 72°
Total 30 360°
18. 6.1.5. Media geométrica.
La mediageométricaG, de un conjuntode valoreses la raíz n-
ésimadel producto de losvaloresde dichoconjunto:Si haydos
valores,laraíz cuadrada del producto de estosdos;si son tres,
es la raíz cúbica del producto de los tres valores.
La fórmula general es:
6.2. Datos agrupados.
6.2.1. Media aritmética.
La mediaaritmética(X) esel valorpromediode unconjunto
de datos numéricos. Es igual al cociente de la suma de los
productos de cada frecuencia absoluta con su respectiva
marca de clase, entre el total de datos.
X =
∑ 𝑓𝑖 . 𝑋𝑚
𝑛
6.2.2. Mediana.
Es el valor numérico que ocupa el valor central de la
muestra,ypor lotanto dejaal 50% de ellasobre dichovalor
y al otro 50% por debajo de él.
Una vez localizado el centro de la distribución de un conjunto
de datos, lo que procede es buscar una medida de dispersión
de los datos. La dispersión o variación es una característica
importante de un conjunto de datos porque intenta dar una
idea de cuán esparcidos se encuentran éstos.
Existendiversasmedidas de dispersión, algunas de ellas son:
7.1. Rango.
El rango de un conjuntode númerosesladiferenciaentre el
mayor y el menorde todosellos.
Datos no agrupados
Hay 2 manerasde expresaréstamedida:
1) La diferenciaentre losvaloresmayoresymenor
2) Los valoresmayory menordel grupo
Datos agrupados
Hay dos formaspara determinarel rangopara datos
agrupados:
1) Rango = punto mediode laclase más alta– puntomediode
la más baja
2) Rango = límite superiorde laclase más alta– límite inferior
de la más baja
19. 7.2. Desviación media.
La desviaciónmediaodesviaciónpromedioesabreviadapor
MD. Mide la desviaciónpromediode valoresconrespectoala
mediadel grupo,sintomaren cuentael signode la
desviación.
Datos no agrupados
X esla mediaaritméticade losnúmerosy [xj – X] esel valor
absolutode ladesviaciónde xj respectode x.(El valor
absolutode unnúmeroesel númerosin signoy se denota
con dosbarras verticales).
Datos agrupados
Si x1,x2,…,xk ocurrencon frecuenciasf1,f2,…,fk,
respectivamente,ladesviaciónmediaes:
6.2.3. Moda.
Es el valorde lavariablequemásse repite;esdecir,el quetiene
mayor frecuencia absoluta. Dependiendo de los datos, es
posible quelamodano exista,ytampocoque puedahabermás
de una.
7. MEDIDAS DE DISPERSIÓN.
Los estudios estadísticos permiten hacer inferencias de una
característica de una población a partir de la información
contenida en una muestra. Los métodos numéricos que
describen a los conjuntos de observaciones tienen como
objetivo dar una imagen mental de la distribución de
frecuencias.
20. 7.3. Varianza.
Se define como el cuadrado de la desviación estándar y e
representa como s2.
Datos no agrupados
7.4. Desviación estándar.
La desviación estándar se denota por s.
Datos no agrupados
Se define como:
Datos agrupados
Si x1, x2,…, xk ocurren con frecuencias f1, f2,…, fk,
respectivamente, la desviación típica se expresa como:
7.5. Coeficiente de variación.
DEDICADOPARA MI
ABUELITOQUE DESDE
EL CIELOME CUIDA Y
CUIDA A MI FAMILIA.
21. La variación o dispersión real, tal como se determina de la
desviación estándar u otra medida de dispersión, se llama
dispersión absoluta.
La dispersión relativa es:
A la dispersiónrelativa se le llama coeficiente de variación o
coeficiente de dispersión si la dispersión absoluta es la
desviación estándar s y el promedio es la media x. Se define
como:
Y se expresa en general como porcentaje.