2. Historia de la Estadística
La estadística estudia la recolección, análisis e interpretación de datos, ya sea
para ayudar en la toma de decisiones o para explicar condiciones regulares o
irregulares de algún fenómeno o estudio aplicado, en
forma aleatoria o condicionada.
Desde los comienzos de la civilización han existido formas sencillas de estadística,
pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas,
palos de madera y paredes de cuevas para contar el número de personas,
animales o ciertas cosas. Hacia el año 3000 a.C. los babilonios usaban ya
pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción
agrícola y de los géneros vendidos o cambiados mediante trueque.
Los egipcios analizaban los datos de la población y la renta del país mucho antes
de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de Números y
Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene
dos censos de la población de Israel y el segundo describe el bienestar material de
las diversas tribus judías. En China existían registros numéricos similares con
anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya
información se utilizaba hacia el 594 a.C. para cobrar impuestos.
Nociones de estadística Santiago Cardo Jarana
3. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos
sobre la población, superficie y renta de todos los territorios bajo su control.
Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa.
Los reyes carolingios Pipino, el Breve, y Carlomagno ordenaron hacer estudios
minuciosos de las propiedades de la Iglesia en los años 758 y 762
respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey
Guillermo I de Inglaterra encargó un censo. La información obtenida con este
censo, llevado a cabo en 1086, se recoge en el Domesday Book.
El registro de nacimientos y defunciones comenzó en Inglaterra a principios del
siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población,
titulado Observations on the London Bills of Mortality (Comentarios sobre las
partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad
en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el
astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad
Nociones de estadística Santiago Cardo Jarana
4. En el siglo XIX, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la
necesidad de reducir la información a valores numéricos.
En nuestros días, la estadística se ha convertido en un método efectivo para
describir con exactitud los valores de datos económicos, políticos, sociales,
psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar
dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y
tabular los datos, sino sobre todo en el proceso de interpretación de esa
información.
El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con
gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados
de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil
para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y
la cantidad de datos necesarios en un determinado estudio estadístico.
Nociones de estadística Santiago Cardo Jarana
5. Cronograma
Egipto, alrededor del año 3050 a. de C.,
prolijos datos relativos a la población y la
riqueza del país
3000 a. de C. los babilonios utilizaban
ya pequeñas tablillas de arcilla para
recopilar datos sobre la producción.
En el antiguo Israel, la Biblia da
referencia, en el libro de los
N ú m e r o s, de los datos
estadísticos de recuentos de la
población hebrea
Los griegos y romanos, efectuaron
censos periódicamente con fines
tributarios, sociales y militares
En 1066, el rey Guillermo I
encargó un censo en el año
1086 S. XV, XVI y XVII, Leonardo de Vinci,
Copérnico, Galileo Galilei, W. Harvey, F.
Bacon y Descartes hicieron operaciones
con base en el método científico.
Nociones de estadística Santiago Cardo Jarana
6. Enrique VII tenía de la peste, en
el año 1532 empezaron a
registrarse en Inglaterra las
defunciones causadas por esta
enfermedad
1540, el alemán Sebastián Muster realizó
una compilación estadística de los
recursos nacionales,
El primer empleo de los datos
estadísticos para fines ajenos a la
política tuvo lugar en 1691 y estuvo a
cargo de Gaspar Neumann
Godofredo Achenwall, profesor
de la Universidad de Gotinga,
acuñó en 1760 la palabra
estadística,
XVII encontramos
correspondencia relativa a la
probabilidad en los juegos de
azar entre los matemáticos
franceses Blaise Pascal y
Pierre de Fermat,
Nociones de estadística Santiago Cardo Jarana
7. XIX comienzan a asentar las bases
teóricas de la teoría de
probabilidades Joseph Louis
Lagrange y Pierre Simon de
Laplace, Carl Friedrich Gauss, y
Simeón-Denis Poisson.
Ronald Arnold Fisher la situó como una
poderosa herramienta para la planeación y
análisis de experimentos. Pearson,
desarrolló el análisis de varianza y
desarrollo numerosas técnicas de análisis
multivariante. Su libro Statistical Methods
for Research Workers publicado en 1925,
ha sido probablemente el libro de
estadística más utilizado a lo largo de
muchos años. En el siglo XIX, con la
generalización del método
científico para estudiar todos
los fenómenos de las ciencias
naturales y sociales, los
investigadores vieron la
necesidad de reducir la
información a valores
numéricos para evitar la
ambigüedad de las
descripciones verbales.
Nociones de estadística Santiago Cardo Jarana
9. Aplicaciones
La estadística puede presentarse en diferentes niveles de dificultad matemática y puede
estar dirigida hacia aplicaciones en distintos campos de la investigación. De acuerdo
con esto, se han escrito muchos libros de texto sobre estadística empresarial,
estadística educativa, estadística médica, estadística psicológica,…, e inclusive sobre
estadística para historiadores.
Cada área de la investigación científica puede beneficiarse del análisis estadístico.
Para quien formula las políticas económicas y para quien ayuda al presidente y a otros
funcionarios públicos sobre procedimientos económicos apropiados, la estadística ha
demostrado ser una herramienta valiosa.
Las decisiones sobre las tasas tributarias, los programas sociales, el gasto de defensa y
muchos otros asuntos pueden hacerse de manera inteligente tan sólo con la ayuda del
análisis estadístico. Los hombres y mujeres de negocios, en su eterna búsqueda de la
rentabilidad, consideran que la estadística es esencial en el proceso de toma de
decisiones. Los esfuerzos en control de calidad, minimización de costos, combinación
de productos e inventarios, y una gran cantidad de otros asuntos empresariales,
pueden manejarse efectivamente a través del uso de procedimientos estadísticos
comprobados.
Nociones de estadística Santiago Cardo Jarana
10. Para quienes están en el área de la investigación de mercados, la estadística es de
gran ayuda en el momento de determinar como de probable es que un producto nuevo
sea exitoso. La estadística también es muy útil para evaluar las oportunidades de
inversión por parte de asesores financieros. Los contadores, los jefes de personal, y los
fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del análisis
estadístico. Incluso un investigador en el campo de la medicina, interesado en la
efectividad de un nuevo medicamento, considera la estadística una aliada.
Así pues, la teoría general de la estadística es aplicable a cualquier campo científico en
el cual se hacen observaciones. El estudio y aplicación de los métodos estadísticos son
necesarios en todos los campos del conocimiento, sean éstos de nivel técnico o
científico.
Nociones de estadística Santiago Cardo Jarana
11. En mercadotecnia, entre otras cosas, la estadística puede ser utilizada para:
• Estimar la proporción de clientes que prefieren un producto en vez de otro y la
razón de esto.
• Sacar conclusiones respecto a la estrategia de publicidad que sería más útil para
el incremento de ventas de un producto.
• Mejorar la calidad de los productos fabricados o de los servicios procurados por
la organización
Nociones de estadística Santiago Cardo Jarana
12. Población, Muestra E Individuo
Población. Es el conjunto de todos los elementos cuyo conocimiento nos interesa y
serán objeto de nuestro estudio.
Muestra. Es el subconjunto, extraído de la población, cuyo estudio sirve para añadir
características de toda la población
Individuo. Es cada uno de los elementos de que forman la población o muestra.
POBLACIÓN MUESTRA
Cartas Figuras
Coches Color blanco
Alumnos Hombres
Naranjos Naranja agria
Población de Dos hermanas Empadronados
Nociones de estadística Santiago Cardo Jarana
13. Tipos de variables
Existen dos tipos de variable según la medición
Variable cualitativa. Son las variables que expresan distintas cualidades,
características o modalidad. Cada modalidad que se presenta se denomina atributo o
categoría y la medición consiste en una clasificación de dichos atributos.
Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores
posibles como ”sí” y “no”, ”hombre” y “mujer” o son politómicas cuando pueden adquirir
tres o más valores.
Dentro de ellas podemos distinguir:
Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar
distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que
el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.
Variable cualitativa nominal en esta variable los valores no pueden ser sometidos a un
criterio de orden como por ejemplo los colores o el lugar de residencia.
Nociones de estadística Santiago Cardo Jarana
14. Variable cuantitativa. Son las variables que se expresan mediante cantidades
numéricas. Las variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la
escala de valores que puede tomar. Estas separaciones o interrupciones indican la
ausencia de valores entre los distintos valores específicos que la variable pueda asumir.
Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un
intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la
altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del
aparato medidor, en teoría permiten que siempre exista un valor entre dos variables,
también puede ser el dinero o un salario dado y se puede identificar las clases de
variables (cualitativas y cuantitativas).
Nota: Las clases de variables se pueden ser cualitativas y cuantitativas
Nociones de estadística Santiago Cardo Jarana
15. Según la influencia existen dos tipos:
Variables independientes Son las que el investigador escoge para establecer
agrupaciones en el estudio. Un tipo especial son las variables de control, que
modifican al resto de las variables independientes y que de no tenerse en cuenta
adecuadamente pueden alterar los resultados por medio de un sesgo.
Variables dependientes Son las variables de respuesta que se observan en el
estudio y que podrían estar influenciadas por los valores de las variables
independientes.
Hayman (1974) la define como propiedad o característica que se trata de cambiar
mediante la manipulación de la variable independiente.
La variable dependiente es el factor que es observado y medido para determinar el
efecto de la variable independiente.
Nociones de estadística Santiago Cardo Jarana
16. Otras
Variable interviniente
Son aquellas características o propiedades que de una manera u otra afectan el
resultado que se espera y están vinculadas con las variables independientes y
dependientes.
Variable moderadora
Según Tuckman: representan un tipo especial de variable independiente, que es
secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre
la variable independiente primaria y las variables dependientes. Son las variables que
expresan distintas cualidades, características o modalidad. Cada modalidad que se
presenta se denomina atributo o categoría y la medición consiste en una clasificación
de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo
pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas
cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir.
Nociones de estadística Santiago Cardo Jarana
17. Organización de variables
Variable cualitativa
Un diagrama de barras, también conocido Los Diagrama de sectores
como diagrama de columnas, este esta consisten en dividir un círculo en
conformado por tantos sectores como valores de la
barras rectangulares de longitudinales proporcion variable. La amplitud de cada sector
al al de los valores que representan. Los gráficos debe ser proporcional a la
de barras son usados para comparar dos o más frecuencia del valor
valores. Las barras pueden estar orientadas correspondiente.
horizontal o verticalmente
Nociones de estadística Santiago Cardo Jarana
18. VARIABLES CUANTITATIVAS
Discreta: Diagrama de barras, diagrama Continua: Histograma, es un caso
de sectores (anteriormente particular del diagrama anterior en el
desarrollados) caso de variables continuas. Si los
intervalos son correlativos, los
rectángulos aparecen pegados en la
representación gráfica. En caso de
que la amplitud de los intervalos no se
igual para todos, hay que hacer
coincidir el área del rectángulo con la
frecuencia del intervalo. Un ejemplo
muy utilizado de histograma es una
pirámide de población
Nociones de estadística Santiago Cardo Jarana
19. Determinas la forma de cálculo
Moda: es el valor con una mayor frecuencia en una distribución de datos.
Hablaremos de una distribución bimodal cuando encontremos dos modas, es decir, dos
datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de
los datos es en la que encontramos tres modas. Si todas las variables tienen la misma
frecuencia diremos que no hay moda.
Mediana: representa el valor de la variable de posición central en un conjunto de
datos ordenados. De acuerdo con esta definición el conjunto de datos menores o
iguales que la mediana representarán el 50% de los datos, y los que sean mayores que
la mediana representarán el otro 50% del total de datos de la muestra. La mediana
coincide con el percentil 50, con el segundo cuartil y con el quinto decil. Su cálculo no
se ve afectado por valores extremos.
Nociones de estadística Santiago Cardo Jarana
20. Media Existen numerosos ejemplos de medias , una de las pocas propiedades
compartidas por todas las medias es cualquier media está comprendida entre el
valor máximo y el valor mínimo del conjunto de datos.
∑x f
i i
X=
∑f i
Nociones de estadística Santiago Cardo Jarana
21. Varianza, Desvió Típico Y
Coeficiente de Variación
Varianza: (que suele representarse como σ2) de una variables aleatorias es una medida
de dispersión definida como la esperanza del cuadrado de la desviación de dicha
variable respecto a su media.
∑xi
2
fi
σ =
2
−X2
∑f i
La desviación estándar (denotada con el símbolo σ) es una medida de centralización o
dispersión para variables de ratio y de intervalo.
Se define como la raíz cuadrada de la Varianza. Junto con este valor, la desviación
típica es una medida (cuadrática) que informa de la media de distancias que tienen los
datos respecto de su media aritmética, expresada en las mismas unidades que
la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que presentan
los datos en su distribución respecto de la media aritmética de dicha distribución, con
objeto de tener una visión de los mismos más acorde con la realidad al momento de
describirlos e interpretarlos para la toma de decisiones.
σ = σ2
Nociones de estadística Santiago Cardo Jarana
22. Mapa Conceptual
Variables estadísticas
Cuantitativas Cualitativas
Discretas Continuas Análisis
Valores Intervalo Medidas de
aislados de valores posición
Mediana
Parámetros Cuartiles
estadísticos
Percentiles
media
varianza Desviación Coeficiente
∑x f
i i
X=
∑x 2
fi típica de variación
∑f
i
i σ2 = − X2
σ
∑f i σ = σ2 CV =
X
Nociones de estadística Santiago Cardo Jarana
23. Estudio de 3 variables
Meses de edad de 50 niños en el momento de andar por primera vez
Meses Niños fi fi*xi^2 Fi %
9 1 9 81 1 2
10 4 40 400 5 10
11 9 99 1089 14 28 Q1
12 16 192 2304 30 60 Me
13 11 143 1859 41 82 Q3
112 1568 49 98 Media 12,2
14 8
15 225 50 100 o2= 1,68
15 1
o= 1,296
∑ 50 610 7526 cv 0,106
16
14 Según los resultados podemos concluir q se trata de
12 un estudio donde los distintos elementos no se
10
encuentran muy dispersos (tal y como indica el
8
grafico), ya q su desviación típica es baja, por lo que
6
muchos individuos no están muy separados de la
media.
4
2
0
9 10 11 12 13 14 15
Cálculos efectuados con Excell
Nociones de estadística Santiago Cardo Jarana
24. Los pesos de los 65 compañeros de gimnasio
Peso fi Marca marca*fi fi*marca^2 Fi %
[50 60) 8 55 440 24200 8 12,31
[60 70) 10 65 650 42250 18 27,69 q1
[70 80) 16 75 1200 90000 34 52,31 me
[80 90) 14 85 1190 101150 48 73,85
[90 100) 10 95 950 90250 58 89,23 q3
[100 110) 5 105 525 55125 63 96,92
[110 120) 2 115 230 26450 65 100
∑ 65 5185 429425
18
16
Media 79,769
14
σ2= 243,445
12
10 σ= 15,603
8
6
cv 0,196
4
2
0
[50,60) [60,70) [70,80) [80,90) [90,100) [100,110) [110,120)
Cálculos efectuados con Excell
Nociones de estadística Santiago Cardo Jarana