el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
Punteo de lectura cap. 2
1. Licenciatura en Educación Preescolar
Procesamiento de información estadística
Pérez Ferrer Diana Laura
06 de septiembre de 2017. 2 “B” (3er. Semestre)
CAPITULO 2. ANÁLISIS DESCRIPTIVO Y PRESENTACIÓN DE DATOS DE UNA
VARIABLE
2.1 Gráficas, diagramas de Pareto y diagramas de tallo y hojas.
Datos cualitativos
1. Gráficas de pastel y gráficas de barras: se usan para resumir datos
cualitativos. Ambas graficas muestran la cantidad de datos que pertenecen a
cada categoría solo que en el de pastel de manera proporcional de un circulo y
en el de barras como un área rectangular.
2. Diagrama de Pareto: gráfica de barra con las barras ordenadas de la categoría
más numerosa a la menos numerosa. Incluye grafica de línea que muestra
porcentajes acumulados y conteos de barras.
Popular en aplicaciones de control de calidad.
Datos cuantitativos
1. Mostrar su distribución es una de las principales razones de la construcción
de graficas de datos cuantitativos.
2. Distribución: patrón de variabilidad que muestran los datos de una variable.
Muestra frecuencia de cada valor de la variable.
3. Gráfica de puntos: describe los datos de una muestra al representar cada valor
de datos con un punto colocado a lo largo de una escala.
4. Presentación de tallo y hojas: presenta los datos de una muestra con los
dígitos reales que constituyen los valores de datos. Cada valor numérico se
divide en dos partes:
a. Los dígitos iniciales con el tallo.
b. Los dígitos posteriores son las hojas.
Los tallos se ubican a lo largo del eje principal y para cada valor de
datos se ubica una hoja de modo que muestre la distribución de los
datos.
2.2 Distribuciones de frecuencia e histogramas.
1. Distribución de frecuencias: listado, expresado en forma de tabla, relaciona los
valores de una variable con su frecuencia.
2. La frecuencia (f) es el número de veces que el valor x ocurre en la muestra.
3. El ancho de clase es la diferencia entre los límites de clase superior e inferior.
4. Para clasificar datos es útil usar un cuadro estándar.
5. El punto medio de clase es el valor numérico que esta exactamente en medio
de cada clase. Se encuentra al sumar los límites de clase y dividir entre 2.
6. Histograma: grafica de barras que representa una distribución de frecuencias
de una variable cuantitativa.
7. Tiene los siguientes componentes:
a. Un título, identifica población o muestra de interés.
b. Escala vertical, identifica frecuencias en las diversas clases.
2. Licenciatura en Educación Preescolar
Procesamiento de información estadística
Pérez Ferrer Diana Laura
06 de septiembre de 2017. 2 “B” (3er. Semestre)
c. Escala horizontal, identifica a variable x. los valores para los límites de
clase o puntos medios de clase pueden etiquetarse a lo largo del eje x.
8. La frecuencia relativa se encuentra al dividir la frecuencia de clase entre el
número total de observaciones.
9. Formas de histogramas: simétrico, normal o triangular; simétrico, uniforme o
rectangular; sesgada a la derecha; sesgada a la izquierda; forma de j y
bimodal.
10. La clase modal clase con la frecuencia más alta.
11. Distribución bimodal tiene dos clases de frecuencia alta, separadas por
clases con frecuencias menores.
12. Ojiva: grafico de línea de una frecuencia acumulada o distribución de
frecuencias relativas acumuladas.
a. Título, identifica población o muestra.
b. Escala vertical que identifica las frecuencias acumuladas o las
frecuencias relativas acumuladas.
c. Escala horizontal, identifica los límites de clase superiores.
13. La ojiva puede usarse para hacer enunciados porcentuales acerca de datos
numéricos.
2.3 Medidas de tendencia central.
1. Son valores numéricos que ubican el centro de un conjunto de datos. Promedio
se asocia con todas las medidas de tendencia central.
2. Media (promedio), se encuentra al sumar todos los valores de la variable x y
dividir la suma entre el número de dichos valores, n.
3. Mediana, valor de los datos que ocupan la posición media cuando los datos se
clasifican en orden de acuerdo con su tamaño.
a. La profundidad de la mediana se encuentra al sumar los números de
posición de los datos más pequeños y los datos más grandes y dividir la
suma por 2.
4. Moda valor de x que ocurre con más frecuencia.
Si dos o más valores en una muestra están empatados en la frecuencia más
alta, se dice que no hay moda.
5. Medio rango número exactamente a la mitad entre un dato de valor más bajo,
L y un dato de valor más alto, H. se encuentra al promediar los valores bajo y
alto.
6. Regla de redondeo, cuando se redondea una respuesta, se tiene el acuerdo
de conservar en la respuesta un lugar decimal más del que estaba en la
información original.
2.4 Medidas de dispersión.
1. Rango, diferencia en valor entre los datos con valor más alto, H y los datos con
valor más bajo, L.
2. Desviación de la media es la diferencia entre x y la media.
a. La desviación es cero cuando x es igual a la media.
3. Licenciatura en Educación Preescolar
Procesamiento de información estadística
Pérez Ferrer Diana Laura
06 de septiembre de 2017. 2 “B” (3er. Semestre)
b. La desviación es positiva cuando x es más grande que la media.
c. La desviación es negativa cuando x es menor que la media.
3. La suma de las desviaciones siempre es cero porque las desviaciones de los
valores x menores que la media (que son negativos) cancelan a aquellos
valores x mayores que la media (que son positivos).
4. Las desviaciones al cuadrado se usan para encontrar la varianza.
5. Varianza muestral, s2, es la media de las desviaciones al cuadrado, calculada
con n-1 como el divisor. (n es el tamaño muestral; el número de datos en la
muestra).
a. El numerador para la varianza muestral con frecuencia se llama suma
de cuadrados para x y se simboliza SS(x)
6. Desviación estándar muestral, s, es la raíz cuadrada positiva de la varianza.
7. La unidad de medida para la desviación estándar es la misma que la unidad
de medida para los datos.
8. La unidad de medida para la varianza se considera como unidades al
cuadrado.
2.5 Medidas de posición.
1. Se usan para describir la posición que un valor de datos especifico posee en
relación con el resto de los datos cuando están en el orden clasificado.
a. Cuartiles: valores de la variable que dividen los datos clasificados en
cuartos; cada conjunto de datos tiene tres cuartiles.
i. Cuartil medio, valor numérico a la mitad entre el primer cuartil y
el tercer cuartil.
b. Percentiles: valores de la variable que dividen un conjunto de datos en
100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles.
2. Resumen de 5 números, está compuesto por lo siguiente:
a. L, valor más pequeño en el conjunto de datos.
b. Q1, el primer cuartil o P25 (percentil 25)
c. x~, la mediana
d. Q3, tercer cuartil o P75 (percentil 75)
e. H, valor más grande en el conjunto de datos.
3. Rango intercuartílico, diferencia entre el primer y tercer cuartil. Rango de
50% medio de los datos.
4. Diagrama de cajas y bigotes, representación gráfica del resumen de 5
números. Los cinco valores numéricos se ubican en una escala, vertical u
horizontal. La caja se usa para mostrar la mitad media de los datos que yacen
entre los dos cuartiles.
Los bigotes son segmentos de línea que se usan para mostrar la otra mitad de
lo datos.
5. Valor estándar o valor z, posición que un valor particular de x tiene en
relación con la media, medido en desviaciones estándar.
El valor calculado de z se redondea a la centésima más cercana.
4. Licenciatura en Educación Preescolar
Procesamiento de información estadística
Pérez Ferrer Diana Laura
06 de septiembre de 2017. 2 “B” (3er. Semestre)
Pueden usarse para ayudar a comparar dos valores brutos que provengan de
poblaciones separadas.
2.6 Interpretación y comprensión de la desviación estándar.
1. Regla empírica, esta regla se aplica específicamente a una distribución
normal (con forma de campana), pero se aplica con frecuencia como una guía
interpretativa a cualquier distribución montada.
a. Puede usarse para determinar si un conjunto de datos tiene una
distribución aproximadamente normal.
2. Teorema de Chebyshev, proporciona información acerca de cuanto de los
datos caerá dentro de intervalos con centro en la media para todas las
distribuciones.
a. La proporción de cualquier distribución que yazca dentro de k
desviaciones estándar de la media es al menos 1 –
1
𝑘2
, donde k es
cualquier número positivo mayor que 1. Este se aplica a todas las
distribuciones de datos.
2.7 El arte del engaño estadístico.
1. Engaño gráfico. Las gráficas en las que la escala de frecuencia comienza en
cero tienden a enfatizar el tamaño de los números involucrados, mientras que
las gráficas que se recortan pueden tender a enfatizar la variación en los
números sin importar el tamaño real de los números.
Repaso del capítulo.
1. Técnicas graficas básicas: graficas de pastel, graficas de barras, diagramas de
Pareto, graficas de puntos, diagramas de tallo y hojas, histogramas y graficas
de cajas y bigotes. Que se usan para presentar datos muestrales en forma
gráfica.
2. Medidas de tendencia central, media, mediana, moda, rango medio y cuartil
medio.
3. Medidas de dispersión, rango, varianza, desviación estándar.
4. Medidas de posición, cuartiles, percentiles y valores z.