El resumen presenta los conceptos fundamentales de la estadística descriptiva para variables cuantitativas. Explica cómo se recolectan y presentan los datos cuantitativos, describiendo el proceso para construir tablas de frecuencias para variables discretas y continuas. Se detalla cómo dividir los datos continuos en intervalos de clases, calcular las frecuencias absolutas y relativas, y representarlos gráficamente. Finalmente, introduce otra alternativa para clasificar datos continuos usando un gráfico de tallo-hoja. El documento ofrece una guía concisa
El Teorema Central del Límite establece que la suma de una gran cantidad de variables aleatorias independientes con la misma distribución se aproxima a una distribución normal, independientemente de la distribución original de las variables individuales. Este teorema se aplica a problemas que involucran promedios y probabilidades en muestras grandes.
Este documento describe la distribución muestral de proporciones. Explica cómo calcular la media y desviación estándar de la distribución muestral de proporciones a partir de una población, así como cómo usar la aproximación normal para calcular probabilidades relacionadas a la proporción muestral. También incluye ejemplos numéricos para ilustrar los conceptos.
Un estudio examinó las historias de 484 personas que cuidan a familiares dependientes y encontró que 450 personas experimentaban cansancio en el rol de cuidador, incluyendo 168 hombres y 282 mujeres. Usando una prueba de chi-cuadrado al 99% de confianza, el estudio determinó que existe una relación entre experimentar cansancio en el rol de cuidador y el sexo.
Este documento describe los elementos fundamentales de la estadística, incluyendo frecuencia, amplitud, intervalo, porcentaje, límite de clase, tamaño de intervalo y punto medio. También explica las medidas estadísticas comunes como la media aritmética, mediana y modo, y cuando se utiliza cada una.
El documento explica la regla para calcular el cuadrado de un polinomio. Según la regla, el cuadrado de un polinomio es igual a la suma de los cuadrados de cada uno de sus términos más el doble de las combinaciones binarias que pueden formarse con los términos, considerando el signo resultante de la multiplicación. La regla se aplica independientemente del número de términos del polinomio.
Este documento habla sobre la organización y representación gráfica de datos estadísticos. Explica que una vez recolectados los datos en bruto, estos deben organizarse en tablas de frecuencias o distribuciones de frecuencias para analizar patrones. Luego, los gráficos como histogramas, polígonos y ojivas permiten visualizar la información de manera global. Finalmente, introduce conceptos como media, mediana y moda para medir tendencias centrales en los datos, y medidas de dispersión para cuantificar su variabilidad.
Este documento explica las medidas de tendencia central y dispersión. Define la media, mediana y moda como las medidas de tendencia central más utilizadas para resumir conjuntos de datos. También describe medidas de dispersión como la desviación estándar y varianza que indican qué tan dispersos están los datos respecto al valor central. Además, ofrece ejemplos del cálculo de la moda, media aritmética y geométrica.
El documento presenta los objetivos de una unidad sobre rectas en el plano y sus ecuaciones. Se describen seis objetivos específicos relacionados con sistemas de coordenadas, distancias entre puntos, pendientes de rectas, ecuaciones de rectas y posiciones relativas entre rectas. El documento también incluye ejemplos para ilustrar los conceptos.
El Teorema Central del Límite establece que la suma de una gran cantidad de variables aleatorias independientes con la misma distribución se aproxima a una distribución normal, independientemente de la distribución original de las variables individuales. Este teorema se aplica a problemas que involucran promedios y probabilidades en muestras grandes.
Este documento describe la distribución muestral de proporciones. Explica cómo calcular la media y desviación estándar de la distribución muestral de proporciones a partir de una población, así como cómo usar la aproximación normal para calcular probabilidades relacionadas a la proporción muestral. También incluye ejemplos numéricos para ilustrar los conceptos.
Un estudio examinó las historias de 484 personas que cuidan a familiares dependientes y encontró que 450 personas experimentaban cansancio en el rol de cuidador, incluyendo 168 hombres y 282 mujeres. Usando una prueba de chi-cuadrado al 99% de confianza, el estudio determinó que existe una relación entre experimentar cansancio en el rol de cuidador y el sexo.
Este documento describe los elementos fundamentales de la estadística, incluyendo frecuencia, amplitud, intervalo, porcentaje, límite de clase, tamaño de intervalo y punto medio. También explica las medidas estadísticas comunes como la media aritmética, mediana y modo, y cuando se utiliza cada una.
El documento explica la regla para calcular el cuadrado de un polinomio. Según la regla, el cuadrado de un polinomio es igual a la suma de los cuadrados de cada uno de sus términos más el doble de las combinaciones binarias que pueden formarse con los términos, considerando el signo resultante de la multiplicación. La regla se aplica independientemente del número de términos del polinomio.
Este documento habla sobre la organización y representación gráfica de datos estadísticos. Explica que una vez recolectados los datos en bruto, estos deben organizarse en tablas de frecuencias o distribuciones de frecuencias para analizar patrones. Luego, los gráficos como histogramas, polígonos y ojivas permiten visualizar la información de manera global. Finalmente, introduce conceptos como media, mediana y moda para medir tendencias centrales en los datos, y medidas de dispersión para cuantificar su variabilidad.
Este documento explica las medidas de tendencia central y dispersión. Define la media, mediana y moda como las medidas de tendencia central más utilizadas para resumir conjuntos de datos. También describe medidas de dispersión como la desviación estándar y varianza que indican qué tan dispersos están los datos respecto al valor central. Además, ofrece ejemplos del cálculo de la moda, media aritmética y geométrica.
El documento presenta los objetivos de una unidad sobre rectas en el plano y sus ecuaciones. Se describen seis objetivos específicos relacionados con sistemas de coordenadas, distancias entre puntos, pendientes de rectas, ecuaciones de rectas y posiciones relativas entre rectas. El documento también incluye ejemplos para ilustrar los conceptos.
Este documento presenta los conceptos básicos de sucesiones y criterios de convergencia. Introduce las definiciones de sucesión, sucesión convergente y divergente. Explica cómo calcular el límite de una sucesión y determinar si es convergente. También cubre propiedades de límites de sucesiones como adición y multiplicación.
El documento habla sobre los polinomios. Define un polinomio como una función que asigna valores a variables mediante la suma de términos con coeficientes y potencias de la variable. Explica conceptos como grado, suma, producto, división, máximo común divisor y teorema fundamental del álgebra.
Este documento presenta una serie de ejercicios resueltos sobre cálculo de integrales dobles en coordenadas rectangulares cartesianas. En total se presentan 7 problemas que involucran calcular áreas, volúmenes y otras cantidades mediante el uso de integrales dobles. Cada problema contiene la formulación del problema, la solución paso a paso y el resultado final de la integral doble correspondiente.
El #profesorsergiollanos #EduTuber te explica cómo construir una #TablaDeFrecuencias para datos agrupados, el diagrama de puntos, el polígono de frecuencias, el histograma, la ojiva, la media o promedio, la mediana, la moda, los cuartiles y el diagrama de caja y bigotes. #QuédateEnCasa y estudia estadística #Conmigo. Puedes ver la clase acá: https://youtu.be/27VUFTcqAfE
Este documento describe las pruebas no paramétricas, las cuales no dependen de la forma de la distribución poblacional y se usan cuando las variables no cumplen con los supuestos de las pruebas paramétricas. Explica dos pruebas no paramétricas comúnmente usadas: la prueba signo-rango de Wilcoxon, para comparar dos muestras relacionadas, y la prueba suma de rangos de Wilcoxon, para comparar dos poblaciones independientes. Proporciona ejemplos detallados de cómo aplicar cada prueba
Metodo (Gauss, Sustitucion, Eliminacion)briellamem
El documento describe el método de pivoteo para resolver un sistema de ecuaciones lineales. El método involucra tomar un elemento del sistema como pivote y realizar operaciones en las otras ecuaciones para obtener ceros debajo del pivote. Esto permite determinar sucesivamente los valores de cada variable despejando ecuaciones.
La notación sumatoria se utiliza en estadística para indicar la suma de grandes cantidades de datos. Se representa con la letra griega mayúscula Sigma (Σ), que indica la suma de los términos desde el límite inferior hasta el superior. Algunas propiedades de la sumatoria incluyen que la suma de una constante es igual a esa constante multiplicada por el número de términos, y que la suma del producto de una constante por una variable es igual al producto de la constante por la suma de la variable.
Este documento presenta varios problemas de combinatoria y probabilidad resueltos paso a paso. Incluye cálculos de factoriales, permutaciones sin y con repetición, arreglos, y pruebas ordenadas. Explica conceptos como permutaciones circulares y cómo contar arreglos cuando hay restricciones como la agrupación de elementos.
Este documento resume los conceptos clave del análisis de regresión lineal, incluyendo: 1) la estimación de parámetros por mínimos cuadrados para determinar la ecuación de regresión, 2) el cálculo del error estándar de estimación, y 3) el uso de intervalos de predicción y confianza. Contiene dos ejemplos numéricos que ilustran estos conceptos.
Este documento resume los conceptos básicos de las series cronológicas, incluyendo que son sucesiones de observaciones ordenadas en el tiempo, pueden ser de flujo o de nivel, y sus componentes principales son la tendencia, variación estacional, variación cíclica y variación aleatoria. También describe las características, clasificación, gráficos e índices comúnmente usados para analizar series temporales.
Problemas resueltos de geometria analitica planaCarlos Chaparro
Este documento presenta varios problemas de geometría analítica plana. El primer problema demuestra que cuatro puntos dados forman los vértices de un cuadrado. El segundo problema halla las coordenadas del tercer vértice de un triángulo equilátero. El tercer problema encuentra el punto en una recta que dista el doble de uno de los puntos dados que del otro.
Este documento presenta información estadística sobre las edades de 30 alumnos de un instituto británico. Incluye tablas con los datos de edad, cálculos como el promedio, rango e intervalos. Explica las partes principales de una tabla estadística como número, título, encabezado, cuerpo, nota al pie, fuente y elaboración. También incluye gráficos como un histograma y una ojiva para visualizar la distribución de edades.
Este documento presenta la resolución de 6 problemas relacionados con distribuciones de probabilidad. En el primer problema se resume un caso sobre el funcionamiento de una máquina de refrescos y se concluye que la decisión tomada fue razonable. Los problemas 2 a 5 involucran el cálculo de probabilidades utilizando distribuciones normales y chi cuadrado. El sexto problema pide encontrar valores críticos de chi cuadrado para diferentes niveles de significancia.
Este documento presenta conceptos básicos sobre distribuciones de probabilidad para variables aleatorias discretas. Introduce las nociones de variable aleatoria, función de probabilidad y distribución de probabilidad. Explica las diferencias entre variables aleatorias discretas y continuas. Además, describe las distribuciones binomial, hipergeométrica y de Poisson como modelos probabilísticos comunes para variables discretas, ilustrando sus propiedades con ejemplos.
Este documento define transformaciones lineales y proporciona ejemplos de funciones que son y no son transformaciones lineales. Una transformación lineal T de un espacio vectorial U a otro V debe cumplir dos condiciones: T(u1 + u2) = T(u1) + T(u2) y T(αu) = αT(u). Se demuestra un teorema y se enumeran propiedades de las transformaciones lineales.
Este documento presenta tres ejemplos que ilustran el cálculo de medidas estadísticas descriptivas y la construcción de gráficos. El primer ejemplo muestra los signos visibles de anorexia en estudiantes mediante una tabla de frecuencias y un diagrama de barras. El segundo ejemplo calcula medidas de tendencia central, dispersión y construye un diagrama de caja para datos sobre el tiempo requerido para tratamientos. El tercer ejemplo analiza datos sobre el tiempo que tardan estudiantes en dormirse durante clases a través de diagramas de caja
El documento introduce el concepto de variable aleatoria y explica que es una función que asigna números reales a los resultados de un experimento aleatorio. Explica que las variables aleatorias pueden ser discretas o continuas dependiendo del espacio muestral asociado. También define la distribución de probabilidad de una variable aleatoria y cómo calcular su esperanza matemática y varianza.
La distribución normal es la más importante en estadística debido a su frecuencia de aparición y sus aplicaciones teóricas. Fue descubierta de forma independiente por De Moivre, Laplace y Gauss en relación con la teoría de los errores de observación. Sus características principales son que tiene forma de campana, es simétrica respecto a su media y depende de dos parámetros: la media y la desviación típica.
Este documento presenta los conceptos básicos de sucesiones y criterios de convergencia. Introduce las definiciones de sucesión, sucesión convergente y divergente. Explica cómo calcular el límite de una sucesión y determinar si es convergente. También cubre propiedades de límites de sucesiones como adición y multiplicación.
El documento habla sobre los polinomios. Define un polinomio como una función que asigna valores a variables mediante la suma de términos con coeficientes y potencias de la variable. Explica conceptos como grado, suma, producto, división, máximo común divisor y teorema fundamental del álgebra.
Este documento presenta una serie de ejercicios resueltos sobre cálculo de integrales dobles en coordenadas rectangulares cartesianas. En total se presentan 7 problemas que involucran calcular áreas, volúmenes y otras cantidades mediante el uso de integrales dobles. Cada problema contiene la formulación del problema, la solución paso a paso y el resultado final de la integral doble correspondiente.
El #profesorsergiollanos #EduTuber te explica cómo construir una #TablaDeFrecuencias para datos agrupados, el diagrama de puntos, el polígono de frecuencias, el histograma, la ojiva, la media o promedio, la mediana, la moda, los cuartiles y el diagrama de caja y bigotes. #QuédateEnCasa y estudia estadística #Conmigo. Puedes ver la clase acá: https://youtu.be/27VUFTcqAfE
Este documento describe las pruebas no paramétricas, las cuales no dependen de la forma de la distribución poblacional y se usan cuando las variables no cumplen con los supuestos de las pruebas paramétricas. Explica dos pruebas no paramétricas comúnmente usadas: la prueba signo-rango de Wilcoxon, para comparar dos muestras relacionadas, y la prueba suma de rangos de Wilcoxon, para comparar dos poblaciones independientes. Proporciona ejemplos detallados de cómo aplicar cada prueba
Metodo (Gauss, Sustitucion, Eliminacion)briellamem
El documento describe el método de pivoteo para resolver un sistema de ecuaciones lineales. El método involucra tomar un elemento del sistema como pivote y realizar operaciones en las otras ecuaciones para obtener ceros debajo del pivote. Esto permite determinar sucesivamente los valores de cada variable despejando ecuaciones.
La notación sumatoria se utiliza en estadística para indicar la suma de grandes cantidades de datos. Se representa con la letra griega mayúscula Sigma (Σ), que indica la suma de los términos desde el límite inferior hasta el superior. Algunas propiedades de la sumatoria incluyen que la suma de una constante es igual a esa constante multiplicada por el número de términos, y que la suma del producto de una constante por una variable es igual al producto de la constante por la suma de la variable.
Este documento presenta varios problemas de combinatoria y probabilidad resueltos paso a paso. Incluye cálculos de factoriales, permutaciones sin y con repetición, arreglos, y pruebas ordenadas. Explica conceptos como permutaciones circulares y cómo contar arreglos cuando hay restricciones como la agrupación de elementos.
Este documento resume los conceptos clave del análisis de regresión lineal, incluyendo: 1) la estimación de parámetros por mínimos cuadrados para determinar la ecuación de regresión, 2) el cálculo del error estándar de estimación, y 3) el uso de intervalos de predicción y confianza. Contiene dos ejemplos numéricos que ilustran estos conceptos.
Este documento resume los conceptos básicos de las series cronológicas, incluyendo que son sucesiones de observaciones ordenadas en el tiempo, pueden ser de flujo o de nivel, y sus componentes principales son la tendencia, variación estacional, variación cíclica y variación aleatoria. También describe las características, clasificación, gráficos e índices comúnmente usados para analizar series temporales.
Problemas resueltos de geometria analitica planaCarlos Chaparro
Este documento presenta varios problemas de geometría analítica plana. El primer problema demuestra que cuatro puntos dados forman los vértices de un cuadrado. El segundo problema halla las coordenadas del tercer vértice de un triángulo equilátero. El tercer problema encuentra el punto en una recta que dista el doble de uno de los puntos dados que del otro.
Este documento presenta información estadística sobre las edades de 30 alumnos de un instituto británico. Incluye tablas con los datos de edad, cálculos como el promedio, rango e intervalos. Explica las partes principales de una tabla estadística como número, título, encabezado, cuerpo, nota al pie, fuente y elaboración. También incluye gráficos como un histograma y una ojiva para visualizar la distribución de edades.
Este documento presenta la resolución de 6 problemas relacionados con distribuciones de probabilidad. En el primer problema se resume un caso sobre el funcionamiento de una máquina de refrescos y se concluye que la decisión tomada fue razonable. Los problemas 2 a 5 involucran el cálculo de probabilidades utilizando distribuciones normales y chi cuadrado. El sexto problema pide encontrar valores críticos de chi cuadrado para diferentes niveles de significancia.
Este documento presenta conceptos básicos sobre distribuciones de probabilidad para variables aleatorias discretas. Introduce las nociones de variable aleatoria, función de probabilidad y distribución de probabilidad. Explica las diferencias entre variables aleatorias discretas y continuas. Además, describe las distribuciones binomial, hipergeométrica y de Poisson como modelos probabilísticos comunes para variables discretas, ilustrando sus propiedades con ejemplos.
Este documento define transformaciones lineales y proporciona ejemplos de funciones que son y no son transformaciones lineales. Una transformación lineal T de un espacio vectorial U a otro V debe cumplir dos condiciones: T(u1 + u2) = T(u1) + T(u2) y T(αu) = αT(u). Se demuestra un teorema y se enumeran propiedades de las transformaciones lineales.
Este documento presenta tres ejemplos que ilustran el cálculo de medidas estadísticas descriptivas y la construcción de gráficos. El primer ejemplo muestra los signos visibles de anorexia en estudiantes mediante una tabla de frecuencias y un diagrama de barras. El segundo ejemplo calcula medidas de tendencia central, dispersión y construye un diagrama de caja para datos sobre el tiempo requerido para tratamientos. El tercer ejemplo analiza datos sobre el tiempo que tardan estudiantes en dormirse durante clases a través de diagramas de caja
El documento introduce el concepto de variable aleatoria y explica que es una función que asigna números reales a los resultados de un experimento aleatorio. Explica que las variables aleatorias pueden ser discretas o continuas dependiendo del espacio muestral asociado. También define la distribución de probabilidad de una variable aleatoria y cómo calcular su esperanza matemática y varianza.
La distribución normal es la más importante en estadística debido a su frecuencia de aparición y sus aplicaciones teóricas. Fue descubierta de forma independiente por De Moivre, Laplace y Gauss en relación con la teoría de los errores de observación. Sus características principales son que tiene forma de campana, es simétrica respecto a su media y depende de dos parámetros: la media y la desviación típica.
1. UNIVERSIDAD NACIONAL PEDRO RUIZ
GALLO
ESCUELA DE INGENIERÍA AGRÍCOLA
ESTADÍSTICA
PRESENTACIÓN DE LOS DATOS DE
VARIABLES CUANTITATIVAS
Bio.Est. Wilver Rodríguez López. M.Sc.
2. Recolección de datos
• En una investigación, la recolección de los
datos es un paso crucial e indispensable.
• Los datos se obtienen de una medición o
de un conteo de las variables de interés
(cuantitativas o cualitativas) en la
población o muestra.
3. Agricultos Zona de Edad Sexo
Procedencia
Datos de una 1
2
3
N
N
C
30
43
58
M
M
F
muestra de 30 4
5
6
S
N
O
61
70
42
M
M
F
agricultores 7
8
S
N
58
39
F
M
9 C 60 F
registrados en la 10
11
C
S
55
57
M
M
12 N 49 M
comunidad de 13
14
N
O
61
69
F
M
Olmos. Lima.
15 O 43 M
16 C 46 F
17 N 69 M
Año 2011 . 18
19
20
N
S
O
44
59
62
M
F
M
21 O 66 M
22 S 71 M
23 S 70 F
24 S 65 M
25 O 37 M
26 N 40 F
27 N 61 F
28 C 65 M
29 C 56 M
30 S 38 M
4. Presentación de datos
Después de recopilar y revisar los
datos necesarios para la
investigación, se deben clasificar y
presentar de forma adecuada para
permitir su análisis e interpretación.
5. Caso de las variables
cuantitativas discretas
Las variables cuantitativas discretas son:
Aquellas representadas sólo por números enteros, como
número de hijos, número de pulsaciones por minuto, número
de dientes cariados, número de camas por centro de salud, etc.
Se creará una tabla de frecuencias a partir de la siguiente
información de 20 agricultores:
Agricultor 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
# de hijos 3 2 0 5 4 0 1 0 1 2 2 1 4 3 0
6. Haciendo un conteo de la información, se puede establecer que de los 15 agricultores 4 de ellos no tienen
hijos, 3 de ellos tienen un hijo, 3 de ellos tienen dos hijos, 2 de ellos tienen tres hijos, 2 de ellos tienen
cuatro hijos y sólo 1 tiene más de 4 hijos.
Estas cifras constituyen la frecuencia absoluta simple (fi) de cada valor (0, 1, 2, 3, 4 y más de 4)
Con esta información se puede hallar también las frecuencias absolutas acumuladas (Fi = F(i-1) + fi).
Para obtener la frecuencia relativa simple (hi%) se procede a aplicar la fórmula establecida (fi/n x 100).
Finalmente, la frecuencia relativa acumulada (Hi%) también se halla con la fórmula correspondiente (Fi/n
x 100).
Agricultos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
# de hijos 3 2 0 5 4 0 1 0 1 2 2 1 4 3 0
# de hijos fi Fi hi% Hi%
0
1
2
3
4
más de 4
TOTAL
7. El resultado es la siguiente tabla de frecuencias:
# de hijos fi Fi hi% Hi%
0 4 4 26.7 26.7
1 3 7 20 46.7
2 3 10 20 66.7
3 2 12 13.3 80
4 2 14 13.3 93.3
más de 4 1 15 6.7 100
TOTAL 15 100
8. Gráfica para variable
cuantitativa discreta
Gráfica de Barras
Gráfica Nº 1
Agricultores, según número de hijos. Comunidad de Olmos. Año
2011
30
25
20
15
10
%
d
u
o
5
g
c
e
a
r
s
t
l
i
0
0 1 2 3 4 Más de 4
Número de hijos
9. Caso de las variables
cuantitativas continuas
En el caso de las variables continuas, hay una cantidad muy
grande de posibles valores.
Cuando se manejan más de 30 observaciones es necesario usar
intervalos que permitan ordenar de forma práctica los valores.
Sólo cuando se dividen los valores en intervalos encontramos en la tabla de
frecuencias: clase, marca de clase y límites reales.
Para crearlos existe un procedimiento e implica la aparición de 3
nuevas columnas:
Clase: indica el número de intervalo del que se trata.
Marca de clase (Xi): es un promedio de los límites del intervalo de clase i.
Es el número representativo del intervalo.
Límites reales: cada intervalo tiene números que representan sus límites,
pero los límites reales indican los verdaderos valores que toma una
medición, ya que los límites nominales son aparentes.
10. PROCEDIMIENTO PARA CONSTRUIR
TABLAS DE FRECUENCIAS
1.- Encontrar la amplitud (A) del conjunto de datos, es decir el valor
máximo menos el valor mínimo, mas una unidad de medida.
A=(Vmax - Vmin)+ 1
Ejemplo.- Considerando los datos de edad dado en el tabla
tenemos:
A=(71 - 30) + 1= 42
Nota: Si los valores máximo y mínimo están expresados hasta
décimas se incrementará un décimo (0.1); si los valores están
expresados en centésimos, se agregará un centésimo (0.01) y
así sucesivamente.
11. 2-Determinar el número de intervalos (k), utilizando
la siguiente fórmula:
k= 1 + 3.322 log n
En relación al ejemplo se tiene que:
k=1 + 3.322 log 30 = 5.9
En este caso K puede ser: 4, 5 o 6; se elige el valor que es
submúltiplo de A, es decir 6 . Asumiendo K= 6
3-Determinar la amplitud del intervalo de clase (C), utilizando
la siguiente expresión:
C= A / k
Para nuestro ejemplo: C= 42 / 6 = 7
12. 4- Determinar los límites. El Vmin es el límite inferior de la
primera clase y su respectivo límite superior será Vmin + (C-1);
el límite inferior de la segunda clase es el límite superior de la
primera clase mas uno y el respectivo límite superior será igual al
límite inferior mas (C-1); y así sucesivamente hasta completar el
número de intervalos.
En relación al ejemplo se tiene:
Edad 30 + (7 – 1 )
mínima
30-36 36 + 7, así sucesivamente
37-43
30 + 7, así
sucesivamente
44-50
51-57 Edad
máxima
58-64
65-71
13. Nota:
Si los límites están expresados hasta décimas entonces se
tendrá que el límite superior de la primera clase es:
Vmin + (C-0.1);
si está expresado hasta centésimas será
Vmin + (C-0.01) y así sucesivamente.
5- La clasificación de los datos de una variable continua
puede hacerse manualmente o en forma automatizada.
16. Otra forma de formar inter valos
de clase.
Determinar el Rango: R= Vmax – Vmin
R= 71-30= 41
Nº de intervalos: K= 1+3,32log(n)
K= 1+3,32log(30)= 5,9 ⇛6
Amplitud de cada intervalo: C=R/K
C=41/6 = 6,8 ⇛7
Nuevo Rango de Trabajo: Rt = KxC =6x7=42
Exceso: E=Rt-R= 42-41=1
Primer Intervalo: 29 36
18. Propiedades de las frecuencias
Las frecuencias absolutas son siempre valores enteros.
La suma de las frecuencias absolutas es igual n.
Las frecuencias relativas son siempre valores fraccionarios.
O < h1 < 1
La suma de las frecuencias relativas es igual 1
El último valor de las frecuencias absolutas acumuladas es
igual a n
El último valor correspondiente a las frecuencias relativas
debe ser igual a 1
19. donde:
fi: Frecuencia absoluta del i-ésimo intervalo, nos indica número de veces
que aparece repetido dicho valor en el conjunto de observaciones
estudiadas.
Fi: Frecuencia absoluta acumulada de la clase i nos indica la suma de
las
frecuencias absolutas de los iguales o inferiores a el.
F1=f1
F2=f1+f2
hi%: Frecuencia relativa de la clase i es el cociente entre la frecuencia
absoluta y el número total de observaciones multiplicando por 100.
hi% = fi/n*100
20. Hi%: Frecuencia relativa acumulada de la clase i, es la frecuencia
absoluta acumulada dividido por el número total de observaciones. Hi% =
Fi/n*100
Xi: Es la marca de clase de la clase i se determina mediante el promedio
de los límites de dicho intervalo.
Limites reales: Si los límites nominales de los intervalos de clase están
expresados en enteros los límites reales de cada intervalo se determina
restando y sumando media unidad al límite inferior y superior
respectivamente de cada intervalo.
22. Un diagrama de tallos y hojas consiste en una serie de hileras
horizontales de números. El número utilizado para designar una hilera es
un tallo y el resto de números en la hilera se denominan hojas.
23. Se tienen los siguientes datos –perímetro de tallo (cm) de una
muestra de plantas, por ejemplo- ordenados de forma
creciente:
33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.0
34.1 34.2 34.2 34.2 34.2 34.2 34.3 34.3
34.5 34.5 34.6 34.6 34.6 34.7 34.7 34.8
34.9 35.1 35.1 35.2 35.2 35.3 35.6 35.8
36.0 36.1 36.5
24. Para la clasificación de datos, se deben identificar los valores
entre los cuales se encuentra la distribución, es decir, el dato
menor y el dato mayor.
33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.0
34.1 34.2 34.2 34.2 34.2 34.2 34.3 34.3
34.5 34.5 34.6 34.6 34.6 34.7 34.7 34.8
34.9 35.1 35.1 35.2 35.2 35.3 35.6 35.8
36.0 36.1 36.5
Dato menor: 33.1cm
Dato mayor: 36.5cm
25. Se deben identificar los tallos -los números que van a
designar las hileras- los cuales deben contener a todos los
valores de la distribución (del 33.1 al 36.5). La elección de
los tallos depende de la unidad con la que se quiera trabajar:
enteros, décimas, centésimas... En el caso del ejemplo, los
datos están dados indicando décimas por lo que trabajar con
tallos enteros es la opción más precisa y cómoda.
Los tallos serían entonces: 33, 34, 35 y 36.
26. Sin embargo, no se puede realizar un diagrama de tallos y hojas
con menos de 5 tallos. Por lo tanto, los tallos propuestos se
deben dividir (desdoblar) en una especie de intervalo,
produciendo el doble. La división del tallo debe distinguirse
visualmente: 33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.0
34.1 34.2 34.2 34.2 34.2 34.2 34.3 34.3
34.5 34.5 34.6 34.6 34.6 34.7 34.7 34.8
34.9 35.1 35.1 35.2 35.2 35.3 35.6 35.8
36.0 36.1 36.5
27. Seguidamente, se realiza el proceso de clasificación en sí. Todos
los datos, dependiendo de su valor, se colocan a lado de su
respectivo tallo. En el ejemplo, los datos cuyo valor se
encuentre entre 33.0 y 33.4 se deben colocar en la hilera del
tallo 33*. Se debe indicar el valor decimal exacto de cada dato a
la derecha del tallo. En el ejemplo hay 2 valores entre 33.0 y
33.4. Para clasificar el primero (33.1) se agrega al diagrama de
tallos y hojas de la siguiente manera:
33*1
› Para clasificar el segundo dato que corresponde a este
tallo (33.4):
33*14
28. Lo mismo se realiza con cada tallo y lo valores que le
correspondan:
en la hilera del tallo 33. se debe colocar los números
67789, correspondientes a los valores 33.6, 33.7, 33.7,
33.8, 33.8 y 33.9.
a la hilera del tallo 34* se debe colocar 012222233
correspondientes a los valores que se encuentran entre 34.0
y 34.4.
etc.
29. Al clasificar todos los valores en sus tallos respectivos, se
obtiene el diagrama:
30. Análisis de la distribución usando
Tallos y Hojas
Las principales características de la
distribución que se observan fácilmente en
el diagrama de tallos y hojas son:
Hay 35 observaciones.
El dato menor es 33.1cm.
El dato mayor es 36.5cm.
El rango de los valores observados es de 3.4cm
(dato mayor – dato menor).
De los 35 datos, 18 están alrededor de 34cm.
Los casos mayores a 36cm son pocos.
La distribución de los datos es asimétrica: distribución
heterogénea.
31. Presentación de datos de variables
cuantitativas
La presentación de los datos se hace fundamentalmente utilizando dos
métodos:
el método tabular y
el método gráfico.
32. 2.2.1 Método tabular
Consiste en una presentación resumida de la información
usando tablas o cuadros, pudiendo ser estos univariantes o
bivariantes.
Si se utiliza este método se debe asegurar la implementación
de los 5 elementos que constituyen a los cuadros y tablas:
Número
título,
Cuerpo,
Fuente y
notas aclaratorias. (Opcional)
33. Título
Es un enunciado breve e informativo acerca del
contenido del cuadro.
El título ideal debe contestar las siguientes
preguntas:
¿Qué contiene el cuadro? (¿QUE?)
¿Cómo se presenta este contenido? (¿COMO?)
¿De dónde se presenta? (¿DONDE?)
¿Cuándo se obtuvo la información? (¿CUANDO?)
34. Ejemplo:
Se tiene una muestra de 60 agricultores provenientes de 4 zonas
del país, inscritos en la comunidad de Olmos en el año 2011.
El titulo se redactaría contestando a:
¿Qué?: Agricultores inscritos en la comunidad de Olmos año
2011
¿Cómo?: Zona de procedencia
¿Dónde?: Olmos- Lambayeque
¿Cuándo?: 2011
35. Cuerpo
Contiene la información que se obtuvo de las observación de
la(s) variable(s) que se quiere(n) presentar. En este caso, está
conformado por las frecuencias y porcentajes respectivos a
las observaciones de edad.
Notas aclaratorias
Generalmente se presenta como ‘Fuente’, y es en donde se
indica el lugar de donde se obtuvo la información.
Por ejemplo:
Fuente: Archivos de consejo distrital de Olmos. Años 2011.
36. Si se presenta la información con intervalos de clase, en caso de tratarse de
variables continuas, el título también cambia. Por ejemplo, si la
información de los 30 agricultores según la edad y con intervalos de clase,
el título sería:
Cuadro #3: Agricultores, según edad. Olmos- Lambayeque. Años
2011.
Edad Número Porcentaje
30 – 36 1 3.3
37 – 43 7 23.3
44 – 50 3 10
51 – 57 3 10
58 – 64 8 26.7
65 – 71 8 26.7
Total 30 100
Fuente: Archivos del consejo distrital de Olmos. Año 2011.
37. Método Gráfico
En esencia, un gráfico estadístico es la presentación de la información por
medio de figuras geométricas.
El objetivo primordial de un gráfico es dar una impresión visual de
conjunto para una rápida y fácil comprensión.
No deben considerarse como sustitutos de un tratamiento estadístico de
los datos, sino más bien como ayuda visual para interpretar problemas
estadísticos.
Debe ser sencillo y explicativo; en un buen gráfico se puede:
Apreciar tendencias, variaciones, cambios y realizar visualmente
comparaciones.
Relacionar 2 o más series de datos superpuestos en un mismo gráfico.
39. Un gráfico estadístico está constituido por 4 partes:
Número
Titulo, Gráfica Nº 1
Agricultores, según edad. Olmos- Lambayeque.
cuerpo y Años 2011.
fuente.
9
8
7
6
5
4
3
2
1
0
30-36 37-43 44-50 51-57 58-64 65-71
Edad
A
N
o
u
g
d
s
c
e
r
º
t
l
i
40. b) Variable continua
Es una variable que admite valores numéricos reales, es decir, que
pueden contener décimas, centésimas, milésimas, etc. La precisión de la
observación, en este tipo de variable, sólo se ve limitado por el método
o instrumento con el cual se mide.
Edad
Temperatura
Para la presentación tabular, se utiliza la tabla de frecuencia univariable. En casos de
tener una gran cantidad de datos, estos pueden ser agrupados en intervalos.
Clase Edad Xi fi Fi hi% Hi% Límites
reales
1 30 – 36 33 1 1 3.3 3.3 29.5 – 36.5
2 37 – 43 40 7 8 23.3 26.6 36.5 – 43.5
3 44 – 50 47 3 11 10.0 36.6 43.5 – 50.5
4 51 – 57 54 3 14 10.0 46.6 50.5 – 57.5
5 58 – 64 61 8 22 26.7 73.3 57.5 – 64.5
6 65 – 71 68 8 30 26.7 100 64.5 – 71.5
30
Edad
10
Para la presentación gráfica se utiliza un 8
6
4
histograma: 2
0
30-36 37-43 44-50 51-57 58-64 65-71
41. Histograma
Muestra la distribución de datos cuantitativos
El área es proporcional a la frecuencia respectiva
Representa a la frecuencias absolutas o relativas
Tiene como base los límites reales de los intervalos de
clase.
43. Polígono de frecuencias
(simples),
Este gráfico se obtiene uniendo los puntos medios
superiores de los rectángulos del histograma,
formándose de esta manera un gráfico lineal, el cual
debe llevarse hasta el eje x en los extremos del límite
inferior del primer intervalo y superior del último
intervalo respectivamente.
El área total bajo el polígono equivale al área del
histograma.
44. GRAFICO N° 5
AGRICULTORES, SEGÙN EDAD. OLMOS-LAMBAYEQUE.
Agricultores, según edad. Olmos-Lambayeque. Años 2011
AÑO 2011
20
Número de agricultores
16
12
8
4
0
33 40 47 54 61 68
Edad (años)
Fuente: Cuadro N°3
45. Polígono de frecuencias
(acumuladas) OJIVA
Denominado también ojiva, utiliza las frecuencias
absolutas o relativas acumuladas, y consiste en un
gráfico lineal que nos permite observar la cantidad de
elementos que quedan por encima o por debajo de
determinados valores de los límites de los intervalos de
clase.
La ojiva se obtiene uniendo los puntos que le
corresponden a las frecuencias acumuladas de los
respectivos límites superiores de cada intervalo.
46. GRAFICO N°6
HISTOGRAMA Y POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS
AGRICULTORES, SEGÚN EDAD. OLMOS-LAMBAYEQUE. AÑO 2011
H¡% 100
80
60
40
20
0
33 40 47 54 61 68
Edad (años)
Fuente: Archivos. Consejo distrital de Olmos. Años 2011