SlideShare una empresa de Scribd logo
1 de 131
ESTADÍSTICA
Cátedra de Bioestadística y Diseño Experimental
Licenciatura Bromatología
Ing. Agr. Marta C. Leaño
Año 2023
Objetivos de la asignatura Estadística:
• Adquirir capacidades para realizar relevamiento de información
estadística.
• Adquirir pensamiento crítico, reflexivo y habilidades de redacción
con términos estadísticos.
• Fomentar y practicar el aprendizaje en grupo y cooperativo.
• Realizar el análisis de datos estadísticos univariados y bivariados
(análisis descriptivo e inferencias estadísticas paramétrica).
• Realizar algunos análisis de datos de estadística no paramétrica.
ESTADÍSTICA
¿Que imaginas?
• ESTADÍSTICA
Promedio
Investigación
Censos
Encuestas
UNIDAD 1
ESTADÍSTICA DESCRIPTIVA
• Identificar y definir poblaciones y muestras.
• Definir unidad de observación y unidad de análisis.
• Identificar los distintos tipos de variables y sus escalas de
mediciones.
• Reconocer tipos de datos.
• Realizar e interpretar las tablas de frecuencias.
• Realizar e interpretar gráficos exploratorios e indicar los estadísticos.
• Aprender a definir, calcular y realizar las interpretaciones de medidas
de resumen de series simples y series de datos agrupados.
OBJETIVOS: UNIDAD 1
¿Qué ES LA ESTADÍSTICA?
La estadística es una rama de las matemáticas que permite recopilar,
organizar y analizar datos según la necesidad, por ejemplo para
describir los datos, obtener un resultado, comparar información,
tomar mejores decisiones, entre muchas cosas más.
DEFINICIÓN DE ESTADÍSTICA
Estadística es un conjunto de métodos para planear estudios y
experimentos, obtener datos y luego organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en los datos (Triola
2009).
La estadística es una materia rica e interesante, con aplicaciones
extensas, reales y significativas en diversas áreas.
La asistencia a clases y la dedicación constantes en estudio, ustedes tendrán éxito
al dominar los conceptos básicos de la estadística en este curso.
ESTADÍSTICA
Estadística descriptiva
Distribuciones de probabilidades
Inferencia estadística
Modelización y Predicción
ESTADÍSTICA
TIPOS DE ESTADÍSTICA
Hay dos tipos de Estadísticas:
 Estadística descriptiva: ayuda a organizar y
presentar una gran cantidad de datos a través de
estadísticos, tablas y gráficos permitiendo
presentar los resultados en forma ordenada.
 Estadística inferencial: se encarga de realizar
deducciones y conclusiones a partir de una muestra
de datos. Es útil para tomar decisiones o establecer
cuál es la tendencia de un grupo de información.
ESTADÍSTICA DESCRIPTIVA
 Detallada
 Simple
 Gráfica
 Esquemática
 Clara
Una planificación estadística debe definir una seria de aspectos, de manera
que la misma puede ser manipulada por todas las personas que forman el
eventual equipo de investigación. La planificación estadística debe ser:
PLANIFICACIÓN ESTADISTICA
Una planificación estadística (PE) se realiza con el objeto de ordenar el
trabajo de obtención y reunión de datos u observaciones, para factibilizar la
aplicación de los métodos estadísticos.
PLANIFICACIÓN ESTADISTICA (PE)
La buena planificación estadística ayuda al científico a organizar las tareas
necesarias para la investigación.
PRESENTACIÓN DE LA INFORMACIÓN
ESTADÍSTICA RELEVADA
La forma de presentarlos datos es importante porque:
* El análisis de los datos es más fácil.
* Permite poner la información a disposición de otras personas
La forma de presentar la información es la siguiente (M. L.
Dodino, 2012):
1. Tabular
2. Gráfica
3. Numérica
4. Textual
Depende del tipo de variable
PRESENTACIÓN TABULAR o tabulación de datos
Ordenamiento sistemático de los datos en filas y
columnas, de acuerdo a criterios de clasificación que
interesen, utilizando números de tal forma que:
• Los números puedan ser interpretados
• Se puedan extraer conclusiones y hacer comparaciones
N° U Variable
1
2
3
4
5
6
.
.
.
n
El relevamiento de los datos se realiza en papel donde se crea una
tabla para ese fin donde se anota los valores observados de la variable
de respuesta o en una planilla Excel, en una Tablet o en el celular, etc.
La tabla se puede realizar de la siguiente manera:
PRESENTACIÓN DE LOS DATOS: Tablas o cuadros:
Tabla o cuadro: es un ordenamiento de filas y columnas de la información
estadística.
Contiene:
• Título
• Número de tabla
• Encabezado
• Columna matriz
• Cuerpo o contenido
* Título de Tabla
Debe dar una idea de la información que contiene la tabla.
Debe ser claro y llamativo
Un título bien confeccionada debe decir:
1. Qué son los datos presentados?
2. Dónde se recogieron los datos (lugar físico)?
3. Cuándo ocurrió el fenómeno?
** Encabezado
Aparece en la primer fila.
Indican otras clasificaciones de los datos
*** Columna matriz
Es lo que aparece en la primer columna e indican otras clasificaciones de
los datos
*v. Cuerpo o contenido de la tabla
Son los números que aparecen en las celdas de la tabla que están
ordenados y distribuidos según las características predeterminadas.
v*. Notas y fuente
Es una aclaración, observación, una advertencia o un comentario.
La fuente es el lugar donde se extrajo los datos.
1. Qué son los datos presentados?
2. Dónde se recogieron los datos (lugar físico)?
3. Cuándo ocurrió el fenómeno (fecha)?
4. Cómo y bajo que criterios de clasificación?
Una buena tabla permite responder las siguientes preguntas:
Ejemplo de un cuadro
Extraído del Boletín epidemiológico de la provincia de Jujuy, N° 24 – 2022.
Extraído del Boletín epidemiológico de la provincia de Jujuy, N° 13 – 2022.
POBLACIÓN ( N )
Una población es un conjunto de elementos acotados en un tiempo y en un
espacio determinado, con alguna característica común observable o medible.
Si la población es finita o contable, diremos que el tamaño poblacional es el
número de elementos de la misma o número de unidades potenciales de
análisis y lo denotaremos con N.
POBLACIÓN
Finita
Infinita
Población es el conjunto completo de todos los elementos (puntuaciones,
personas, medidas, etcétera) que se va estudiar. El conjunto es completo
porque incluye a todos los sujetos que se estudiarán Triola 2009.
Censo: en este caso la población es el conjunto de datos de cada
uno de los miembros de la población.
DEFINICIONES
Parámetro es una medición numérica que describe algunas características
de una población. Esta medición esta basado en la población.
Estadístico es una medición numérica que describe algunas características
de una muestra. Esta medición esta basado en la muestra.
MUESTRA ( n )
Muestra es todo subconjunto de elementos de la población.
Tamaño muestral es el número de elementos de la población que
conforman la muestra y se denota con la letra n.
Muestra es un subconjunto de miembros seleccionados de una
población.
Los datos muestrales deben reunirse de una forma adecuada, como a
través de un proceso de selección aleatoria.
Un elemento muestral es la entidad de la muestra.
En una muestra aleatoria los miembros de la población se
seleccionan de
forma que cada miembro individual tenga la misma posibilidad de
ser elegido.
Población
Muestra
N
n
Tamaño
Esquema 1. Representación de población y muestra de abejas
DATOS
Datos son las observaciones recolectadas (como mediciones, géneros,
respuestas de encuestas, etc.) en una población o en una muestra.
Los datos discretos resultan cuando el número de
valores posibles es un número finito o un número
entero que “puede contarse”. Ej. cantidad de
cerezas que consumieron, en dic 2022, los 15
alumnos de estadística de la carrera de Lic.
Bromatología de la FCA de la UNJu.
Los datos continuos (numéricos) resultan de un
infinito de posibles valores que corresponden a
alguna escala continua que cubre un rango de
valores sin huecos, interrupciones o saltos.
Pueden asumir valores decimales. Ej. Peso de
cada una de las paltas de la muestra de la Finca
Las Palmeras de Monterrico.
Fig. 1
Fig. 2
UNIDAD DE OBSERVACIÓN
UNIDAD DE ANÁLISIS
La unidad de observación es la unidad descripta por los datos que uno analiza.
Ej. podría ser un individuo si analizo el peso de las personas.
Un estudio puede tener una unidad de observación y una unidad de análisis
diferente. por ejemplo, en la investigación barrial, el diseño de la investigación
puede recopilar datos a nivel individual de observación, pero el nivel de análisis
puede ser a nivel de barrios, extrayendo conclusiones sobre las características
de los barrios a partir de datos recogidos de particulares (la unidad de
observación serían los vecinos y la unidad de análisis serían los barrios).
La unidad de análisis es la entidad principal que se está analizando en un
estudio. Es a "quién" se está estudiando.
La UO es la unidad física que nos interesa estudiar u observar con fines de
investigación. Ej. un paciente, un hogar, un cajón de manzanas.
VARIABLE
Variable es una característica que puede asumir distintos valores
sobre las distintas unidades de estudio, de allí se generan los
datos para el análisis estadístico.
Variable es toda característica sujeta a medición o cuenta, y que
varía para cada elemento de la población o muestra
Una variable es una característica, propiedad o atributo, con
respecto a la cual los elementos de una población o muestra
difieren de alguna forma.
Variable respuesta o variable de interés es una característica que
puede asumir distintos valores sobre las distintas unidades de
estudio, la cual se analiza, representa e interpreta.
Variables Aleatorias es aquella variable que para cada valor que
asume le corresponde una probabilidad.
VARIABLE
Constante, es una característica que asume siempre el mismo
valor para todos los casos o unidades de estudio.
ESCALA DE MEDICIÓN DE VARIABLES
Las escalas de medición de las variables puede ser:
1. Nominal: corresponde a un atributo que se le asigna a la variable, como
características se consideran que los atributos son mutuamente excluyentes
entre sí, es decir, no pueden pertenecer a dos o más a tributos
simultáneamente; no existe relación de jerarquía y únicamente pueden
asignarse en categorías.
2. Ordinal: son aquellas que establecen un orden de 2 o + niveles que puede
estar dado de forma creciente o decreciente. En ellas se establece una jerarquía
mediante un valor numérico, sin que exista un intervalo numérico definido
uniformemente
3. Intervalo: entre sus propiedad se considera que establecen un orden y
jerarquía, pero a diferencia que las variables ordinales, en estas si existe un
intervalo de magnitud igual en la medición. En las variables de intervalo el cero
no significa la ausencia de valor, si no un punto asignado en la escala de
medición. La difer. entre valores tiene un tamaño constante. Se aplica a vacc.
4. Razón: presenta características similares que las variables de intervalo,
excepto que el cero es un valor absoluto. En este caso el cero representa la
ausencia de la propiedad observada. El cero es el punto de partida, las
diferencias y los cocientes (proporciones) tienen significado.
ESCALA DE MEDICIÓN DE VARIABLES
Variable
aleatoria
1.Cuantitativa
2.Cualitativa
1. 1. Discreta: Toma valores enteros,
provienen de contar. N° cajas de Petri
por laboratorio en San Pedro…
2.1. Ordinal: tiene un orden, jerarquía
predeterminado. Categorías de
ocupación en empresas….
1. 2. Continua: puede tomar cualquier
valor en un intervalo dado, vienen de
medición. Peso de las pipetas….
TIPOS DE VARIABLES
2.2. Nominal: clasificar, no tiene un
orden predeterminado. Sexo de
alumnos que estudian bromatología….
Fig. N° 3 Peso de los quesos elaborados con leche de vaca durante el
ultimo fin de semana de noviembre del 2021 en el Valle de Catamarca.
Variable aleatoria cuantitativa continua: si los valores que puede asumir
la variable corresponden potencialmente a cualquier número real, por
supuesto en el rango de variación de la misma; se pueden medir en
decimales
Las variables continuas surgen a partir de procesos de medición como
pueden ser pesadas o determinaciones de longitudes, tiempos, áreas y
volúmenes.
TIPOS DE VARIABLES
Fig. N° 4 Cantidad de microorganismos presentes en cada
inflorescencia de brócoli registrados el 20 de noviembre del 2022, en
el comercio Fru-Ver de Ciudad Perico.
Variable aleatoria cuantitativa discreta: si los valores posibles de una
variable cuantitativa son números enteros y provienen de un proceso
de conteo. Son números indivisibles.
TIPOS DE VARIABLES
Las variables aleatorias cualitativas Ordinales son aquellas que el valor será
una categoría que requiere un orden, puede ser creciente o decreciente.
Fig. N° 5 Distintas clases sociales de Argentina.Fuente Consultora w. (www. Infobae.com 8 de Agosto del 2022.
Clases sociales:
Alta
Media alta
Media baja
Baja superior
Baja.
TIPOS DE VARIABLES
Ej. Sancor
Serenísima
Ramolac
Ricrem
….
Fig. N° 6 Nombres de las marcas de quesos en las heladeras mostrador de
los supermercados de la Ciudad de Rosario registrados la primera
quincena de enero de 2022.
Las variables aleatorias cualitativas Nominales son aquellas que representa
una cualidad, atributo o categoría que no tiene ningún sentido ordenar.
Las categorías representan a diferentes clases o nombres de la variable y no
requiere un orden.
Cuando tienen dos categorías, también son llamadas binarias o dicotómicas.
TIPOS DE VARIABLES
Atributo que se le asigna a la variable, como características se consideran
que los atributos son mutuamente excluyentes entre sí.
Fig. N° 8 Nombre de los productos
alimenticios de la mesa de una familia de
Cafayate, Salta, observados el 24 de
diciembre del 2022.
Fig. N° 7 Nombre de las frutas del
plato que contienen vitamina C
EJEMPLO DE VARIABLES
EJEMPLOS DE VARIABLES
Fig. 9
Fig. 10
Fig. 11
Fig. 12
* Estudios observacionales: las variables respuestas
pueden ser obtenidas desde unidades de análisis
que se encuentran bajo condiciones en las que no
hubo ningún tipo de intervención por parte del
investigador y por tanto se registran u observan los
valores de la variable tal cual se dan en la realidad.
DATOS
Observacionales
Manera de obtener información estadística
Por lo general obtenemos datos de dos tipos o fuentes distintas : los estudios
observacionales y los experimentales.
Fig. 13
Manera de obtener información estadística
** Estudios experimentales: las variables respuestas
pueden ser obtenidas desde unidades de análisis
que se encuentran bajo condiciones a las que fueron
expuestas intencionalmente por el investigador. El
investigador modifica las condiciones y decide bajo
qué valores de éstas desea registrar la respuesta.
DATOS
Experimentales
Fig. 14 Fig. 15
Esquema 2. Estudios estadísticos para obtener datos estadísticos
SERIES
Serie simple o S. Datos
No Agrupados
Serie de Frecuencias
o S. Datos Agrupados
la cantidad de valores o datos es muy
grande; por lo que se hace
conveniente, organizar los datos de
manera de analizarlos por “parte” o
“pedazos”, de la Serie.
formada por pocos datos, fácil de
analizar.
SERIES DE DATOS
Una Serie Simple está formada por pocos datos que se pueden
estudiar y analizar rápidamente, es fácil organizarlos.
No es necesario agrupar los datos o valores para su análisis.
1. SERIE SIMPLE O S. DE DATOS NO AGRUPADOS
Ejemplo sencillo para pensar en clases: ….
Ej 1. Una nutricionista registro varias
variables, entre ellas la estatura de
los niños del barrio Felicidad
localizado en Salta.
95 88 84 87 86 86 85 97 100
Fig. 16. Registro de estatura
de un niño
Cuando la cantidad de datos es muy grande; es conveniente, organizar
los datos de manera de analizarlos por “parte” o “pedazos”, de la Serie
llamado clase.
2. SERIES DE FRECUENCIAS o SERIES DE DATOS
AGRUPADOS o DISTRIBUCIONES DE FREC.
Ejemplo sencillo para pensar en clases: …
Ej. 2. El 20 de diciembre
del 2021 se registraron los
diámetros de colonias de
bacterias expresadas en
mm, del laboratorio de
microbiología de la FCA
de la UNJu.
8,3 8,9 8,8 9,6 8,7 9,1 8,9 9,4 9,8 10,0 8,8
9,7 10,3 7,4 7,8 7,9 8,8 9,2 8,6 8,5 6,8 8,4
8,2 7,5 8,8 10,1 9,2 8,5 9,5 9,6 10,4 6,7 7,3
Fig. 17 Colonias de bacterias en cajas de Petri
Fig. 18 Detalle de colonias
El análisis estadístico exploratorio o descriptivo de un
conjunto de datos se pueden representar con medidas
de resumen llamados estadísticos muestrales, que tratan
de describir en forma resumida las características
(variables) más importantes de dichos datos a través de:
ANÁLISIS EXPLORATORIO O DESCRIPTIVO
* cuáles son los valores más representativos de la muestra,
* cómo es la variabilidad de los datos,
* qué datos pueden considerarse atípicos,
* o cómo es la simetría de la distribución, etc.
Puede describir determinados aspectos de la distribución,
como por ejemplo:
El análisis estadístico de grandes bases de datos esta en expansión
gracias a los algoritmos informáticos específicos con la bioinformática.
Estadísticos
Tablas
Gráficos
Las series de frecuencias o agrupados se agrupan en tablas para una mejor
representación de los datos en diferentes clases, que depende del numero
de datos.
ELABORACIÓN DE TABLAS DE FRECUENCIAS
p vacc
El conjunto de clases se llama serie de frecuencia
Se llama Clase al pedazo o el intervalo de clase.
R = Xmáx – Xmin
Pasos:
* Determinar el Rango ( R )
R = 10,7 mm – 6,7 mm = 3,7 mm
ELABORACIÓN DE TABLAS DE FRECUENCIAS p
vacc
** Determinar el N° de clases con la fórmula de Sturges,
siendo n el N° total de observaciones
K = 1 + 3,3 log n
K = 1 + 3,3 log 33 = 6,0
Para determinar el N° de clases pueden guiarse por la fórmula o
según la experiencia del investigador.
*** Definir los límites reales de las clases: con el cálculo de la
amplitud del intervalo “a” de cada clase.
a = R / K = 3,7 / 6 = 0,61
MC = (Xi ) = ( LS + LI ) / 2
*v Calcular las Marcas de clases ( MC o Xi ) es el promedio entre el LS
y el LI de cada clase.
MC = ( 7,32 + 6,70 ) / 2 = 7,01
Clase LI LS Xi
1 [ 6,70 7,32 ] 7,01
2 ( 7,32 7,93 ] 7,63
3 ( 7,93 8,55 ] 8,24
4 ( 8,55 9,17 ] 8,86
5 ( 9,17 9,78 ] 9,48
6 ( 9,78 10,40 ] 10,09
ELABORACIÓN DE TABLAS DE FRECUENCIAS
p vacc
Clase LI LS Xi Conteo fi
1 [ 6,70 7,32 ] 7,01 III 3
2 ( 7,32 7,93 ] 7,63 IIII 4
ELABORACIÓN DE TABLAS DE FRECUENCIAS
p vacc
v. Determinar las frecuencias absolutas (fi) de cada clase: realizando un
conteo de la cantidad de valores de la serie que le corresponden a cada clase.
8,3 8,9 8,8 9,6 8,7 9,1 8,9 9,4 9,8 10,0 8,8
9,7 10,3 7,4 7,8 7,9 8,8 9,2 8,6 8,5 6,8 8,4
8,2 7,5 8,8 10,1 9,2 8,5 9,5 9,6 10,4 6,7 7,3
Una tabla de frecuencias organiza los datos de manera tal que en una columna de
la tabla aparecen los valores de la variable, según el tipo de variable, y en sucesivas
columnas se muestran diferentes tipos de frecuencias asociadas a esos valores
(frecuencias absolutas, frecuencias relativas absolutas, frecuencias absolutas
acumuladas y frecuencias relativas acumuladas).
𝑓𝑟𝑖 =
𝑓𝑖
𝑛
𝑓𝑟𝑖 =
𝑓𝑖
𝑛
=
𝟒
33
= 𝟎, 𝟏𝟐
Cálculo p la 2da clase:
La frecuencia absoluta relativa ( fri) es la porción de veces que el valor xi
aparece en la muestra. Se calcula con el cociente entre la fi correspondiente y
el total de datos n. n= 33
fi = 4
La frecuencia absoluta ( fi ) indica la cantidad de datos que hay en cada
intervalo de clase de la variable continua, mientras que indica la cantidad de
las veces que se registró cada valor de la variable discreta
Clase LI LS Xi fi fri Fi Fri
1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09
2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21
3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36
ELABORACIÓN DE TABLAS DE FRECUENCIAS
p vacc
La frecuencia acumulada relativa (Fri) se calcula como una proporción
del total de las observaciones correspondientes a la Fi.
𝑭𝒓𝒊 =
𝑭𝒊
𝒏
Cálculo p la 2da clase:
Fi = 3 + 4 = 7
La frecuencia acumulada (Fi ), es la frecuencia absoluta correspondiente
a la clase en estudio mas la frecuencia acumulada anterior. Es la suma del
número de valores en la muestra menores o iguales que fi.
Clase LI LS Xi fi fri Fi Fri
1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09
2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21
3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36
𝑭𝒓𝒊 =
𝟕
𝟑𝟑
= 𝟎, 𝟐𝟏
ELABORACIÓN DE TABLAS DE FRECUENCIAS
p vacc
Clase LI LS Xi fi fri Fi Fri
1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09
2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21
3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36
4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64
5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85
6 ( 9,78 10,40 ] 10,09 5 0,15 33 1
33 1,0
ELABORACIÓN DE TABLAS DE FRECUENCIAS
p vacc
Cuadro 1. Frecuencias de los diámetros de las colonias del laboratorio de
microbiología de la FCA de la UNJu.
Valor Frecuencia Frecuencia Frecuencia Frecuencia Relativa
de X Absoluta Relativa Acumulada Acumulada
x1 f1 fr1 F1 Fr1
x2 f2 fr2 F2 Fr2
x3 f3 fr3 F3 Fr3
. . . . .
. . . . .
. . . . .
xi fi fri Fi Fri
n 1
TABLA DE FRECUENCIAS TEÓRICA
La tabla de frecuencias sintetiza la información de la distribución de los
valores de la variable estudiada en la muestra.
GRÁFICOS DE BARRAS - HISTOGRAMA
* Histograma p vacc: es una representación gráfica de una serie de
distribución de frecuencias de una variable continua, en la que representa los
valores de la variable y la fi o fri.
6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02
Diam col mm
0,00
0,07
0,14
0,21
0,29
frecuencia
relativa
En un histograma se observan
“clases” sucesivas. Cada barra se
levanta sobre un conjunto de
puntos del eje X (una clase o un
intervalo de clase). La altura de
la “barra” señala la frecuencia
relevada para la clase. Las barras
se dibujan pegadas, y no
separadas como en las variables
discretas, para indicar que la
variable continua puede asumir
cualquiera de los valores
comprendidos entre la primera y
la última clase.
6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02
Diam col mm
0,00
0,07
0,14
0,21
0,29
frecuencia
relativa
* Polígono de frecuencias p vacc: es un gráficos q surge de
unir con líneas los valores de cada clase.
GRÁFICOS
GRÁFICOS
* Ojiva p vacc: es un gráficos de los valores de la variable y la
Fi o Fri.
6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02
Diam col mm
0,00
0,25
0,50
0,75
1,00
frec.
rel.
acumulada
Uno de los principales problemas de las muestras son los datos
atípicos y valores extremos que son valores de la variable que se
diferencian mucho del resto de los valores en la muestra.
VALORES ATÍPICOS
Es muy importante detectar los datos atípicos antes de realizar
cualquier análisis de los datos, pues suelen distorsionar los
resultados.
Aparecen siempre en los extremos de la distribución, y pueden
detectarse con un diagrama de caja y bigotes.
El “bigote inferior” indica el menor valor observado que es mayor o igual a la
diferencia Q1-1,5 RI, donde RI es el recorrido intercuartílico. Dicho valor
observado coincide con el mínimo si no hay valores atípicos o extremos.
El “bigote superior” coincide con el mayor valor observado que es menor o igual
que Q3+1,5 RI (coincide con el máximo si no hay valores atípicos o extremos).
GRÁFICO de CAJAS
Este gráfico permite visualizar la forma de la distribución de frecuencias de la
variable analizada.
El gráfico representa la información acerca de la mediana, la media, los
cuantiles 0,25, 0,75 y la presencia, si los hubiere, de valores extremos.
Los valores atípicos inferiores están entre Q1-1,5 RI y Q1-3 RI y los superiores
entre Q3 + 1,5 RI y Q3 + 3 RI.
Los valores extremos aparecen por debajo de Q1-3RI y por encima de Q3 + 3RI.
GRÁFICO de CAJA
Se puede observar el promedio, la Mna, los cuartiles, la
variabilidad de los datos y en algunos casos los valores atípicos
y extremos.
6,51
7,53
8,55
9,57
10,59
Diam
col
mm
GRÁFICO de SECTORES
Comida favorita
Gráfico de sectores consiste en un círculo divido en porciones, uno por cada
valor o categoría o atributo de la variable. Cada porción se conoce como sector y
su ángulo o área es proporcional a la correspondiente frecuencia del valor o
categoría
En el gráfico de sectores resulta oportuno agregar el valor de n, es decir la
cantidad de casos que se analizaron para obtener los porcentajes o proporciones
que se muestran.
Ej. 3. Una maestra, el 13 de
octubre del 2021, preguntó la
cantidad de frutas que
consumieron los niños de 1er
grado del colegio San Jorge
durante una semana anterior al
relevamiento de la información en
la ciudad de Salta. Según los datos
decidieron que proveer a los niños
en la colación.
0 3 5 7 2 4 3 1 6 2 3
3 0 1 2 4 5 2 1 0 7 6
4 3 4 4 5 4 2 1 4 3 4
Fig. 19. Niños repartiendo frutas
Clase Xi fi fri Fi Fri
1 0 3 0,09 3 0,09
2 1 4 0,12 7 0,21
3 2 5 0,15 12 0,36
4 3 6 0,18 18 0,55
5 4 8 0,24 26 0,79
6 5 3 0,09 29 0,88
7 6 2 0,06 31 0,94
8 7 2 0,06 33 1,0
33 1,0
ELABORACIÓN DE TABLAS DE FRECUENCIAS
p vacd
GRÁFICOS
* Bastones p vacd: es un gráficos que representa en el eje X los valores de la
variable y en el eje Y, las frecuencias absolutas, fi o frec. Relativa absoluta.
0 1 2 3 4 5 6 7
Cant frutas consumidas/ semana
0
1
2
3
4
5
6
7
8
Frecuencia
absoluta
GRÁFICOS
* Escalones p vacd: es un gráficos de los valores de la variable
y las frecuencias acumuladas, Fi o Frec. acumulada relativa.
-1 1 4 6 8
Valores observados
0,00
0,25
0,50
0,75
1,00
Frec
relativa
acumulada
0
2
3
5
7
Cant
frutas/sem
GRÁFICO de CAJAS
bigote inferior
bigote inferior
Media
Q3
Q1
Q2 = Mna
RI
Diagrama de cajas y bigotes del peso de una muestra de bebes
recién nacidos, kg.
MEDIDAS DE RESUMEN
X
Mna
Mo
Q
S2
S
DM
As
CV
K
RI
R
P
D
De acuerdo al aspecto de las distribución que miden los datos,
existen diferentes tipos de estadísticos:
Para describir Los aspectos de la distribución muestral se utilizan
unas medidas resumen llamadas estadísticos muestrales.
ESTADÍSTICOS MUESTRALES
Medidas de tendencia central o Estadísticos de Posición:
Miden los valores en torno a los que se agrupan los datos o que
dividen la distribución en partes iguales.
Medidas de dispersión o Estadísticos de Dispersión: Miden la
heterogeneidad de los datos.
Medidas de forma o Estadísticos de Forma: Miden aspectos
de la forma que tiene la distribución de los datos, como la
simetría o el apuntamiento.
a. MEDIDAS DE TENDENCIA CENTRAL
* Estadísticos de Tendencia Central: Determinan valores alrededor
de los cuales se concentran los datos, habitualmente en el centro
de la distribución. Estas medidas suelen utilizarse como valores
representativos de la muestra. Las más importantes son:
Los estadísticos de posición pueden ser dos:
• Media aritmética
• Mediana
• Moda
** Estadísticos de Posición no centrales: Dividen la distribución en
partes con el mismo número de datos. Las más importantes son:
• Cuartiles
• Deciles
• Percentiles
También las medidas de tendencia central pueden clasificarse de la sig.
forma:
De posición central
De posición no central
* Media Aritmética Simple x (p serie simple): es la suma de las
observaciones dividida por el número de ellas. n: es el numero de datos.
a1. MEDIA ARITMÉTICA p serie simple
𝑋 =
95 + 88 + 84 + 87 + 86 + 86 + 85 + 97 + 100
9
=
808
9
= 𝟖𝟗, 𝟕𝟖
a1. MEDIA ARITMETICA p serie de frec. p vacc
Xi : es la marca de clase
fi : es la frecuencia absoluta correspondiente a la Marca de clase
Clase LI LS Xi fi fri Fi Fri
1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09
2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21
3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36
4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64
5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85
6 ( 9,78 10,40 ] 10,09 5 0,15 33 1
33 1,0
𝑋 =
7,01 , 3 + 7,63 . 4 + ⋯ + 10,09 . 5
33
=
289,3
33
= 𝟖, 𝟕𝟕
a1. MEDIA ARITMÉTICA p serie de frec. p vacc. ej. 2
PROPIEDADES DE LA MEDIA
1. Cada valor de la variable puede sustituirse por el valor de la
media aritmética, sin cambiar el total.
2. La suma de los desvíos de los valores de la variable con relación
a la media aritmética, es igual a cero.
PROPIEDADES DE LA MEDIA
3. La suma de los desvíos al cuadrado, es un mínimo.
4. La media aritmética, tiene las mismas unidades de la variable
5. La media aritmética del producto de una constante c por una
variable, es igual a dicha constante por la media aritmética de la
variable
c x = c x
6. La media aritmética de la suma de dos variables, es igual a la
suma de las medias aritméticas de cada una de ellas.
CONSIDERACIONES SOBRE LA MEDIA
• La media aritmética es una medida de centralización más utilizada.
• Por lo general es la medida de resumen que mejor representa a la serie de
datos porque en su cálculo considera a todos los datos.
• Es muy sensible a los datos extremos, éstos producen una distorsión en el
valor de la media.
• Si se suma una constante a todos los valores de la variable, la media
aritmética aumenta en el mismo valor.
VENTAJAS e INCONVENIENTES DE LA MEDIA
• Es fácil de calcular.
• Es una de las medidas más usadas.
• Es conocida por todos.
• Es muy sensible a los datos extremos.
Ventajas:
Desventajas:
Media Geométrica: Se calcula como la raíz enésima del
producto de las n observaciones de la muestra.
MEDIAS
Media Armónica: Se calcula como el número de observaciones
dividido por la suma de la inversa de las observaciones
MEDIAS
Media Cuadrática: Es la raíz cuadrada de la suma de las
observaciones de la muestra al cuadrado, dividido el número de
ellas.
MEDIAS
Es el valor de la variable que divide a la serie en dos partes iguales
a2. MEDIANA (Mna)
Mediana para Serie Simple: es el valor de la variable que divide a
la series de datos ordenado en dos partes iguales, quedando la
mitad de las observaciones quede por encima, y la otra mitad por
debajo.
La mediana para datos pares: es el valor de la variable que resulta
de la media aritmética de los dos valores centrales
Pasos:
1°. Ordenar los valores de la variable.
2°. Con datos impares, buscar la observación central
Con datos pares, calcular el promedio de los dos valores centrales.
MEDIANA
Fig. 20. Muestras de niños ordenados donde indican la mediana
* MEDIANA p SERIE SIMPLE
84 85 86 86 87 88 95 97 100
Ej 1. Una nutricionista registro varias variables, entre ellas la estatura de los
niños del barrio Felicidad localizado en Salta.
95 88 84 87 86 86 85 97 100
Mna =
87 cm
1°. Ordenar los valores de la variable.
2°. Datos impares, buscar el valor de la variable central.
Fig. 21. Muestra de niños ordenados donde indica la mediana
La Mediana es el valor de la variable que corresponde a la Frecuencia
acumulada (Fi ) inmediatamente superior a la mitad de las observaciones.
** MEDIANA P SERIE DE FRECUENCIAS:
variable DISCRETA
Suponga la Distribución de Frecuencias, del ej. 3 donde la variable aleatoria
corresponde al N° de frutas que consumen los niños por semana….
Clase Xi fi fri Fi Fri
1 0 3 0,09 3 0,09
2 1 4 0,12 7 0,21
3 2 5 0,15 12 0,36
4 3 6 0,18 18 0,55
5 4 8 0,24 26 0,79
6 5 3 0,09 29 0,88
7 6 2 0,06 31 0,94
8 7 2 0,06 33 1
33 1,0
𝑛
2
=
33
2
= 𝟏𝟔, 𝟓
𝒏
𝟐
=
Observe la
Frecuencia
Acumulada
inmediatamente
superior a la mitad
de las
observaciones (Fi )
Mna = 3 frutas
consumidas /
semana.
** MEDIANA P SERIE DE FRECUENCIAS:
variable DISCRETA GRÁFICAMENTE
En el gráfico de la Frecuencia Acumulada para variable aleatoria discreta y
con el valor de la mitad de las observaciones, se determina a qué valor de la
variable X corresponde, tomando el gráfico del ejemplo desde el valor 35 y
paralelamente al eje de las abscisas hasta encontrar la primera perpendicular
-1 1 4 6 8
Cant frutas consumidas/semana
0,00
0,25
0,50
0,75
1,00
Frecuencia
relativa
acumulada
*** MEDIANA P SERIE DE FRECUENCIAS:
variable CONTINUA
1° Identificar la clase donde se ubica la mediana: buscar la Frecuencia
Acumulada (Fi ) superior a la mitad de las observaciones.
Se realiza con los siguientes pasos
Clase LI LS Xi fi fri Fi Fri
1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09
2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21
3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36
4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64
5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85
6 ( 9,78 10,40 ] 10,09 5 0,15 33 1,0
33 1,0
𝑛
2
=
𝟑𝟑
2
= 𝟏𝟔, 𝟓
Clase LI LS Xi fi fri Fi Fri
1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09
2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21
3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36
4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64
5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85
6 ( 9,78 10,40 ] 10,09 5 0,15 33 1,0
33 1,0
*** MEDIANA P SERIE DE FRECUENCIAS:
variable CONTINUA
2° Determinar la mediana con la fórmula de interpolación.
𝑀𝑛𝑎 = 𝟖, 𝟓𝟓 +
33
2
+ 𝟏𝟐
𝟗
. 0,62 = 𝟖, 𝟖𝟔
*** MEDIANA P SERIE DE FRECUENCIAS:
variable CONTINUA GRÁFICAMENTE
6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02
Diam col mm
0,00
0,25
0,50
0,75
1,00
frec.
rel.
acumulada
La mas importante, esto es que la suma de los desvíos de las
observaciones con relación a la Mediana (en valor absoluto), es un
mínimo
PROPIEDADES DE LA MEDIANA
a3. MODA
Consideraciones sobre la moda:
La moda (Mo) de una variable X es el valor de la variable más
frecuente en la muestra.
Se denomina moda de una variable estadística X al valor de la variable que
tiene mayor frecuencia absoluta.
• Puede existir distribuciones que no tengan moda; esto ocurre cuando
las frecuencias de todos los datos son iguales.
• Es muy útil en variables cualitativas.
• En el cálculo no intervienen todos los valores de la variable.
• L a moda es una medida de centralización, pero a veces las modas
están situadas en los extremos (en distribuciones asimétricas).
a3. MODA
Muestra con una moda: cuando la variable X tiene un solo valor
que más se repite o más frecuente.
Muestra Bimodal: cuando la variable X tiene dos valores de igual
frecuencias máximas en la muestra.
Fig. 22. Muestras de niños ordenados donde indican la moda
Fig. 23. Muestras de niños ordenados donde indican las modas
* MODA p serie SIMPLE
Ej 1. Una nutricionista registro varias
variables, entre ellas la estatura de
los niños del barrio Felicidad
localizado en Salta.
95 88 84 87 86 86 85 97 100
Moda = 86 cm
1° Identificar la clase Modal, es decir, la que tiene mayor frecuencia absoluta.
** MODA p SERIE DE FRECUENCIA p vacc
Pasos para el cálculo de la Moda:
2° Determina el valor de la Moda, con una interpolación, dentro de la clase
Modal con la fórmula de cálculo.
MODA p SERIE DE FRECUENCIA p vacc ej.2
Clase LI LS Xi fi fri Fi Fri
1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09
2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21
3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36
4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64
5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85
6 ( 9,78 10,40 ] 10,09 5 0,15 33 1
33 1,0
𝑀𝑜 = 8,55 +
4
4 + 2
. 0,62 = 𝟖, 𝟗𝟔
Mo = 8,96 mm de diámetro de las colonias.
*** MODA P SERIE DE FRECUENCIAS:
variable CONTINUA GRÁFICAMENTE. Ej. 2
6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02
Diam col mm
0,00
0,07
0,14
0,21
0,29
frecuencia
relativa
Mo = 8,96 mm
***MODA p SERIE DE FRECUENCIA p vacd. Ej3
Clase Xi fi fri Fi Fri
1 0 3 0,09 3 0,09
2 1 4 0,12 7 0,21
3 2 5 0,15 12 0,36
4 3 6 0,18 18 0,55
5 4 8 0,24 26 0,79
6 5 3 0,09 29 0,88
7 6 2 0,06 31 0,94
8 7 2 0,06 33 1,0
33 1,0
1° Identificar la mayor frecuencia absoluta.
2° Identificar el valor de la variable q le corresponde a la mayor frecuencia
absoluta.
Mo = 4 frutas
*** MODA P SERIE DE FRECUENCIAS:
variable DISCRETA GRÁFICAMENTE. Ej 3
0 1 2 3 4 5 6 7
Cant frutas consumidas/ semana
0
1
2
3
4
5
6
7
8
Frecuencia
absoluta
Mo = 4 frutas
Asociados a la obtención de cuantiles, se suelen obtener los llamados cuartiles.
Los cuartiles son: cuartil 1: Q1 (0,25); cuartil 2: Q2 (0,50) y Cuartil 3: Q3 (0,75) .
a4. CUANTILES: CUARTIL1, CUARTIL2, CUARTIL3
Cuartiles: Son los tres valores ordenados de la variable que dividen a la
serie de datos en cuatro partes iguales.
Pasos para el cálculo de los cuartiles:
1° Ordenar los valores de la variable de menor a mayor.
𝑃𝑜𝑠 𝑄1 =
𝑛 + 1
4
𝑃𝑜𝑠 𝑄2 =
𝑛 + 1
2
𝑃𝑜𝑠 𝑄3 =
3𝑛 + 1
4
3° Calcular los valores de la variable que corresponde a los cuartiles con las
fórmulas.
* CUANTILES: CUARTIL1, CUARTIL2, CUARTIL3
Q1 Q2= Mna Q3
Deciles: son 9 valores ordenados de la variable que dividen a la serie de datos en
10 partes iguales. Existen 9 deciles: D1 (10% acumulado), D2 (20 %
acumulado),.…, D9 (90% acumulado).
a5. DECILES
a6. PERCENTILES
Percentiles son 99 valores ordenados de la variable que dividen a la serie
de datos en 100 partes iguales. Existen 99 percentiles: P1 ( 1% acumulado),
P2 (2 % acumulado), ….., P99 (99 % acumulado).
Representación GRÁFICA DE CUARTIL, DECIL,
PERCENTIL
Miden la heterogeneidad de los datos.
MEDIDAS DE DISPERSIÓN o ESTADÍSTICOS DE
DISPERSIÓN
RANGO ( R )
R = Xmáx – Xmin
Rango o recorrido: es la diferencia de los valores máximo y mínimo de la
variable y tiene la misma unidad de las observaciones.
El rango mide la máxima variabilidad de los valores de la serie de datos de
la muestra. Es muy sensible a los valores atípicos.
R = 10,7 mm – 6,7 mm = 3,7 mm
Cálculo del Rango del ej. 1
Rango intercuartílico muestral de una variable X es la diferencia entre el
tercer cuartil y el primer cuartil (Q3 – Q1) de la muestra.
Es una medida robusta de dispersión que no es afectada por valores extremos
(los menores al cuantil 0,25 y los mayores al cuantil 0,75).
RANGO INTERCUARTILICO ( RI )
RI = Q3 – Q1
El rango intercuartílico mide la dispersión del 50% de los datos
centrales.
RI
DESVIO MEDIO ( DM )
Desvío medio es el valor de la variable que corresponde a la media
aritmética de los desvíos de cada observación con relación a la
media tomados en valor absoluto.
Desviación de la media: es medir la distancia de cada valor de la variable
respecto el promedio.
Cuando esas desviaciones son grandes, la media no será tan representativa.
Cuando las desviaciones son pequeñas la media será representativa.
DESVIO MEDIO ( DM )
Desvío medio para series simples:
Desvío medio para series de datos agrupados:
Ventajas: Considera todas las observaciones de la muestra.
DESVIO MEDIO ( DM )
La DM alrededor de la Mna es un mínimo.
Desventaja: Se usa poco, pues es de menos utilidad práctica
que otras medidas de dispersión
VARIANCIA o VARIANZA (σ2 , S2 )
Variancia poblacional σ2
Variancia muestral S2
La varianza de una variable X se define como el promedio del
cuadrado de los desvíos de los valores de la muestra respecto de
la media.
Variancia para serie simple
La variancia es poca utilizada, porque ofrece valores en unidades
cuadráticas, ej. m2 , kg2.
VARIANCIA o VARIANZA (σ2 , S2 )
Variancia para serie de frecuencias:
Desviación Estándar o Típica: Es el valor de la variable que resultante
de la raíz cuadrada positiva de la variancia.
DESVIACIÓN TÍPICA o DESVÍO ESTANDAR (σ, S)
Cuando las varianzas o la desviaciones típicas son pequeñas, los datos de la
muestra están concentrados en torno a la media, y la media es una buena
medida de representatividad. De lo contrario, cuando la varianza o la
desviaciones típicas son grandes, los datos de la muestra están alejados de la
media, y la media ya no representa tan bien a los datos.
La desviación estándar es comúnmente utilizada para identificar valores
extremos o para establecer valores que se consideran extremos. Datos que
se encuentran muy por encima o por debajo de la Media + 4 * DE o la
Media – 4 * DE son considerados como valores extremos o “outliers”, para
cualquier tipo de distribución.
COEFICIENTE DE VARIANCIÓN (CV)
El Coeficiente de variación o de variabilidad (CV) es el cociente
entre su desviación típica muestral y el valor de su media muestral. Se
suele presentar en porcentaje.
El CV es una medida que también permite estudiar la dispersión de los datos.
Si bien la desviación estándar es muy útil para comparar la dispersión de dos o
más distribuciones, el problema se presenta cuando se desea comparar
distribuciones de variables medidas en diferentes magnitudes.
El CV es una medida adimensional de la dispersión relativa a la media.
El menor coeficiente de variación, indica comportamiento más homogéneo.
El CV también es útil en el caso de comparar conjuntos de datos de iguales
magnitudes pero medidas en diferentes unidades
MEDIDAS DE FORMA
Forma de distribución de los datos.
COEFICIENTE DE ASIMETRIA
El coeficiente de asimetría (As) ofrece una forma numérica de
describir la curva que representa a la serie de datos.
Se calcula de las siguientes maneras:
Distribución
Asimetría negativa: As < 0
Simétrica: As = 0
Asimetría positiva: As > 0
COEFICIENTE DE ASIMETRIA
Distribución simétrica, los valores de la media, la mediana y la moda son iguales.
As = 0, indica que hay el mismo número de valores por encima y por debajo de
la media e igualmente alejados de ella.
COEFICIENTE DE ASIMETRIA
As < 0 (D. asimetría a la izquierda) indica que la mayoría de los valores son
mayores que la media, pero los valores menores están más alejados de ella.
COEFICIENTE DE ASIMETRIA
As > 0 (D. asimetría positiva) indica que la mayoría de los valores son menores
que la media, pero los valores mayores están más alejados de ella (asimetría a la
derecha).
COEFICIENTE DE ASIMETRIA
Media < Mna < Mo Mo = Media = Mna Mo < Mna < Media
Sesgada a la izquierda
D. Asimetría negativa
As < 0
Insesgada o Simétrica
D. Simétrica (As = cero)
As = 0
Sesgada a la derecha
D. Asimetría positiva
As > 0
Una distribución será simétrica o asimétrica, según su representación gráfica. Será
asimétrica hacia la derecha (asimetría positiva), o a la izquierda (asimetría
negativa), si su representación gráfica está más estirada hacia la derecha o
izquierda. Cuando no existe asimetría la distribución es simétrica.
Una distribución de datos está sesgada si no es simétrica y se extiende más
hacia un lado que hacia el otro. (Una distribución de datos es simétrica si la
mitad izquierda de su histograma es aproximadamente una imagen en espejo
de su mitad derecha).
Una comparación de la media, la mediana y la moda puede revelar
información acerca de las características de sesgo.
SESGO
Curtosis: se define como una medida de agudeza de la curva que
grafica la serie de datos.
Por medio del coeficiente de curtosis podemos identificar las
concentraciones de los valores tipos de distribución
CURTOSIS
El Coeficiente de Curtosis o coeficiente de apuntamiento (K) de una variable
X es el promedio de las desviaciones de los valores de la muestra respecto de
la media muestral, elevada a la cuarta, dividido por la desviación típica a la
cuarta y al resultado se le resta 3.
K
El Coeficiente de Curtosis o coeficiente de apuntamiento mide la
concentración de valores en torno a la media y la longitud de las colas de la
distribución.
COEFICIENTE DE CURTOSIS (K)
K = 0 indica que la distribución tiene un apuntamiento normal, es decir, la
concentración de valores en torno a la media es similar a una campana de
Gauss, se llama Distribución mesocúrtica.
D. mesocúrtica: posee una concentración moderada de valores
alrededor de la media.
COEFICIENTE DE CURTOSIS
K < 0 indica que la distribución tiene menos apuntamiento de lo normal, es
decir, la concentración de valores en torno a la media es menor que en una
campana de Gauss, se llama Distribución platicúrtica.
D. platicúrtica: está distribución tiene una forma más ancha,
aplanada porque los valores tienden a estar más dispersos
COEFICIENTE DE CURTOSIS
K > 0 indica que la distribución tiene más apuntamiento de lo normal, es
decir, la concentración de valores en torno a la media es mayor que en una
campana de Gauss, se llama Distribución leptocúrtica.
D. Leptocúrtica: los valores están muy agrupados alrededor de la
media, por lo que la distribución se presenta bastante apuntada y
esbelta
DIFERENTES TIPOS DE CURTOSIS
Gráfico N° Tipos de curtosis. Fuente: F. Zapata
Resumen
Azar (mejorar)
“El azar es de todas las cosas la mas entremetida” (Hacking, 1991).
El azar siempre está presente y es una componente más a
considerar en cualquier problema que involucre variables
aleatorias.
Así, el azar ya no era la esencia de la falta de ley sino que estaba
en el centro de todas las leyes de la naturaleza y de toda inferencia
inductiva racional. Reducir el mundo a una cuestión de
probabilidades, es sin duda, una posición extrema, tanto como
pensar que todo está dado y determinado. No obstante la
domesticación del azar abrió caminos para que las probabilidades
y las leyes estadísticas entraran a nuestro mundo.
BALZARINI, Mónica y otros. 2008. Estadística y Biometría. Editorial Brujas.
QUINTEROS, H. 0. 2001. Bioestadística. Editorial UNJu.
TRIOLA Mario F. Estadística. Décima edición. 2009. Editorial Pearson
Addison Wesley. México.
https://aprendeconalf.es/docencia/estadistica
Bibliografía
Gracias por su atención

Más contenido relacionado

Similar a Teoria 1 y 2 Introducción Estadistica descriptiva Broma 2023.pptx

Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5 Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5 DanielCeronMelendez2
 
Conceptos de programacion y estadistica 11 5 (2)
Conceptos de programacion y estadistica 11 5  (2)Conceptos de programacion y estadistica 11 5  (2)
Conceptos de programacion y estadistica 11 5 (2)NataliaGarcia721165
 
Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos DanielCeronMelendez2
 
1 Que es estadística.docx
1 Que es estadística.docx1 Que es estadística.docx
1 Que es estadística.docxAstridJimnez7
 
Estadística Descriptiva MÓDULO 1.1.pptx
Estadística Descriptiva  MÓDULO 1.1.pptxEstadística Descriptiva  MÓDULO 1.1.pptx
Estadística Descriptiva MÓDULO 1.1.pptxDaleylaDeLaEspada
 
Introducción a la Estadística Descriptiva
Introducción a la Estadística DescriptivaIntroducción a la Estadística Descriptiva
Introducción a la Estadística Descriptivaug-dipa
 
Importancia de la estadística.docx
Importancia de la estadística.docxImportancia de la estadística.docx
Importancia de la estadística.docxdamaris urbaez
 
Estadistica conceptos basicos
Estadistica conceptos basicosEstadistica conceptos basicos
Estadistica conceptos basicosMaría González
 
Procesamiento de la información estadística-RENE BAZALDUA
Procesamiento de la información estadística-RENE BAZALDUAProcesamiento de la información estadística-RENE BAZALDUA
Procesamiento de la información estadística-RENE BAZALDUARene Bazaldua
 
Métodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxMétodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxLaalpacaARoxhzeeraFl
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadísticaJenny HB
 

Similar a Teoria 1 y 2 Introducción Estadistica descriptiva Broma 2023.pptx (20)

Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5 Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5
 
Conceptos de programacion y estadistica 11 5 (2)
Conceptos de programacion y estadistica 11 5  (2)Conceptos de programacion y estadistica 11 5  (2)
Conceptos de programacion y estadistica 11 5 (2)
 
Grupo n 1 de estadistica
Grupo n 1 de estadisticaGrupo n 1 de estadistica
Grupo n 1 de estadistica
 
Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos
 
1 Que es estadística.docx
1 Que es estadística.docx1 Que es estadística.docx
1 Que es estadística.docx
 
Stadistik01
Stadistik01Stadistik01
Stadistik01
 
Estadística Descriptiva MÓDULO 1.1.pptx
Estadística Descriptiva  MÓDULO 1.1.pptxEstadística Descriptiva  MÓDULO 1.1.pptx
Estadística Descriptiva MÓDULO 1.1.pptx
 
Introducción a la Estadística Descriptiva
Introducción a la Estadística DescriptivaIntroducción a la Estadística Descriptiva
Introducción a la Estadística Descriptiva
 
Importancia de la estadística.docx
Importancia de la estadística.docxImportancia de la estadística.docx
Importancia de la estadística.docx
 
Estadistica2
Estadistica2Estadistica2
Estadistica2
 
Estadistica conceptos basicos
Estadistica conceptos basicosEstadistica conceptos basicos
Estadistica conceptos basicos
 
Tarea de tecnologia
Tarea de tecnologiaTarea de tecnologia
Tarea de tecnologia
 
Tarea de tecnologia
Tarea de tecnologiaTarea de tecnologia
Tarea de tecnologia
 
Procesamiento de la información estadística-RENE BAZALDUA
Procesamiento de la información estadística-RENE BAZALDUAProcesamiento de la información estadística-RENE BAZALDUA
Procesamiento de la información estadística-RENE BAZALDUA
 
Métodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxMétodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptx
 
La estadistica
La estadistica La estadistica
La estadistica
 
Tarea de tecnologia (1)
Tarea de tecnologia (1)Tarea de tecnologia (1)
Tarea de tecnologia (1)
 
Tarea de tecnologia (1)
Tarea de tecnologia (1)Tarea de tecnologia (1)
Tarea de tecnologia (1)
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadística
 
Estadistica trabajo 1 carlos marcano
Estadistica trabajo 1 carlos marcanoEstadistica trabajo 1 carlos marcano
Estadistica trabajo 1 carlos marcano
 

Último

tecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptxtecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptxJESUSDANIELYONGOLIVE
 
01. Introducción y sistemas biologicos.pdf
01. Introducción y sistemas biologicos.pdf01. Introducción y sistemas biologicos.pdf
01. Introducción y sistemas biologicos.pdfssuser92d9c0
 
López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...
López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...
López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...frank0071
 
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPIONHISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPIONAleMena14
 
ECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALES
ECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALESECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALES
ECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALEScarlasanchez99166
 
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdfHolland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdffrank0071
 
registro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracionregistro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracionMarcoAntonioJimenez14
 
Procedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdfProcedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdfCarlaLSarita1
 
Fowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdfFowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdffrank0071
 
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdfFritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdffrank0071
 
Exploracion de la boca Propedéutica de la Clínica
Exploracion de la boca Propedéutica de la ClínicaExploracion de la boca Propedéutica de la Clínica
Exploracion de la boca Propedéutica de la Clínicacriscris80000
 
EXPOSICION NORMA TECNICA DE SALUD 2024 -
EXPOSICION NORMA TECNICA DE SALUD 2024 -EXPOSICION NORMA TECNICA DE SALUD 2024 -
EXPOSICION NORMA TECNICA DE SALUD 2024 -FridaDesiredMenesesF
 
Informe Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena ParadasInforme Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena ParadasRevista Saber Mas
 
Límites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptxLímites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptxErichManriqueCastill
 
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundariaDiapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundariaAgustin535878
 
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIALOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIALozadaAcuaMonserratt
 
DIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptx
DIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptxDIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptx
DIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptxprofesionalscontable
 
LEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdf
LEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdfLEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdf
LEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdfrvillegasp16001
 
Sucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimentoSucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimentoFriasMartnezAlanZuri
 
Generalidades de Morfología y del aparato musculoesquelético.pdf
Generalidades de Morfología y del aparato musculoesquelético.pdfGeneralidades de Morfología y del aparato musculoesquelético.pdf
Generalidades de Morfología y del aparato musculoesquelético.pdfJosefinaRojas27
 

Último (20)

tecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptxtecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptx
 
01. Introducción y sistemas biologicos.pdf
01. Introducción y sistemas biologicos.pdf01. Introducción y sistemas biologicos.pdf
01. Introducción y sistemas biologicos.pdf
 
López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...
López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...
López, L. - Destierro y memoria. Trayectorias de familias judías piemontesas ...
 
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPIONHISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
 
ECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALES
ECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALESECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALES
ECOGRAFIA RENAL Y SUS VARIANTES ANATOMICAS NORMALES
 
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdfHolland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
 
registro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracionregistro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracion
 
Procedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdfProcedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdf
 
Fowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdfFowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdf
 
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdfFritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
 
Exploracion de la boca Propedéutica de la Clínica
Exploracion de la boca Propedéutica de la ClínicaExploracion de la boca Propedéutica de la Clínica
Exploracion de la boca Propedéutica de la Clínica
 
EXPOSICION NORMA TECNICA DE SALUD 2024 -
EXPOSICION NORMA TECNICA DE SALUD 2024 -EXPOSICION NORMA TECNICA DE SALUD 2024 -
EXPOSICION NORMA TECNICA DE SALUD 2024 -
 
Informe Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena ParadasInforme Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena Paradas
 
Límites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptxLímites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptx
 
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundariaDiapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
 
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIALOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
 
DIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptx
DIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptxDIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptx
DIAPOSITIVASDEPRIMERACATEGORIAIIPARTE (1).pptx
 
LEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdf
LEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdfLEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdf
LEY FEDERAL DE TRABAJO IPN MEDICINA OCUPACIONAL.pdf
 
Sucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimentoSucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimento
 
Generalidades de Morfología y del aparato musculoesquelético.pdf
Generalidades de Morfología y del aparato musculoesquelético.pdfGeneralidades de Morfología y del aparato musculoesquelético.pdf
Generalidades de Morfología y del aparato musculoesquelético.pdf
 

Teoria 1 y 2 Introducción Estadistica descriptiva Broma 2023.pptx

  • 1. ESTADÍSTICA Cátedra de Bioestadística y Diseño Experimental Licenciatura Bromatología Ing. Agr. Marta C. Leaño Año 2023
  • 2. Objetivos de la asignatura Estadística: • Adquirir capacidades para realizar relevamiento de información estadística. • Adquirir pensamiento crítico, reflexivo y habilidades de redacción con términos estadísticos. • Fomentar y practicar el aprendizaje en grupo y cooperativo. • Realizar el análisis de datos estadísticos univariados y bivariados (análisis descriptivo e inferencias estadísticas paramétrica). • Realizar algunos análisis de datos de estadística no paramétrica.
  • 6. • Identificar y definir poblaciones y muestras. • Definir unidad de observación y unidad de análisis. • Identificar los distintos tipos de variables y sus escalas de mediciones. • Reconocer tipos de datos. • Realizar e interpretar las tablas de frecuencias. • Realizar e interpretar gráficos exploratorios e indicar los estadísticos. • Aprender a definir, calcular y realizar las interpretaciones de medidas de resumen de series simples y series de datos agrupados. OBJETIVOS: UNIDAD 1
  • 7. ¿Qué ES LA ESTADÍSTICA? La estadística es una rama de las matemáticas que permite recopilar, organizar y analizar datos según la necesidad, por ejemplo para describir los datos, obtener un resultado, comparar información, tomar mejores decisiones, entre muchas cosas más. DEFINICIÓN DE ESTADÍSTICA Estadística es un conjunto de métodos para planear estudios y experimentos, obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos (Triola 2009). La estadística es una materia rica e interesante, con aplicaciones extensas, reales y significativas en diversas áreas. La asistencia a clases y la dedicación constantes en estudio, ustedes tendrán éxito al dominar los conceptos básicos de la estadística en este curso.
  • 8. ESTADÍSTICA Estadística descriptiva Distribuciones de probabilidades Inferencia estadística Modelización y Predicción ESTADÍSTICA
  • 9. TIPOS DE ESTADÍSTICA Hay dos tipos de Estadísticas:  Estadística descriptiva: ayuda a organizar y presentar una gran cantidad de datos a través de estadísticos, tablas y gráficos permitiendo presentar los resultados en forma ordenada.  Estadística inferencial: se encarga de realizar deducciones y conclusiones a partir de una muestra de datos. Es útil para tomar decisiones o establecer cuál es la tendencia de un grupo de información.
  • 11.  Detallada  Simple  Gráfica  Esquemática  Clara Una planificación estadística debe definir una seria de aspectos, de manera que la misma puede ser manipulada por todas las personas que forman el eventual equipo de investigación. La planificación estadística debe ser: PLANIFICACIÓN ESTADISTICA
  • 12. Una planificación estadística (PE) se realiza con el objeto de ordenar el trabajo de obtención y reunión de datos u observaciones, para factibilizar la aplicación de los métodos estadísticos. PLANIFICACIÓN ESTADISTICA (PE) La buena planificación estadística ayuda al científico a organizar las tareas necesarias para la investigación.
  • 13. PRESENTACIÓN DE LA INFORMACIÓN ESTADÍSTICA RELEVADA La forma de presentarlos datos es importante porque: * El análisis de los datos es más fácil. * Permite poner la información a disposición de otras personas La forma de presentar la información es la siguiente (M. L. Dodino, 2012): 1. Tabular 2. Gráfica 3. Numérica 4. Textual Depende del tipo de variable
  • 14. PRESENTACIÓN TABULAR o tabulación de datos Ordenamiento sistemático de los datos en filas y columnas, de acuerdo a criterios de clasificación que interesen, utilizando números de tal forma que: • Los números puedan ser interpretados • Se puedan extraer conclusiones y hacer comparaciones N° U Variable 1 2 3 4 5 6 . . . n El relevamiento de los datos se realiza en papel donde se crea una tabla para ese fin donde se anota los valores observados de la variable de respuesta o en una planilla Excel, en una Tablet o en el celular, etc. La tabla se puede realizar de la siguiente manera:
  • 15. PRESENTACIÓN DE LOS DATOS: Tablas o cuadros: Tabla o cuadro: es un ordenamiento de filas y columnas de la información estadística. Contiene: • Título • Número de tabla • Encabezado • Columna matriz • Cuerpo o contenido
  • 16. * Título de Tabla Debe dar una idea de la información que contiene la tabla. Debe ser claro y llamativo Un título bien confeccionada debe decir: 1. Qué son los datos presentados? 2. Dónde se recogieron los datos (lugar físico)? 3. Cuándo ocurrió el fenómeno?
  • 17. ** Encabezado Aparece en la primer fila. Indican otras clasificaciones de los datos *** Columna matriz Es lo que aparece en la primer columna e indican otras clasificaciones de los datos
  • 18. *v. Cuerpo o contenido de la tabla Son los números que aparecen en las celdas de la tabla que están ordenados y distribuidos según las características predeterminadas. v*. Notas y fuente Es una aclaración, observación, una advertencia o un comentario. La fuente es el lugar donde se extrajo los datos.
  • 19. 1. Qué son los datos presentados? 2. Dónde se recogieron los datos (lugar físico)? 3. Cuándo ocurrió el fenómeno (fecha)? 4. Cómo y bajo que criterios de clasificación? Una buena tabla permite responder las siguientes preguntas:
  • 20. Ejemplo de un cuadro
  • 21. Extraído del Boletín epidemiológico de la provincia de Jujuy, N° 24 – 2022.
  • 22. Extraído del Boletín epidemiológico de la provincia de Jujuy, N° 13 – 2022.
  • 23. POBLACIÓN ( N ) Una población es un conjunto de elementos acotados en un tiempo y en un espacio determinado, con alguna característica común observable o medible. Si la población es finita o contable, diremos que el tamaño poblacional es el número de elementos de la misma o número de unidades potenciales de análisis y lo denotaremos con N. POBLACIÓN Finita Infinita Población es el conjunto completo de todos los elementos (puntuaciones, personas, medidas, etcétera) que se va estudiar. El conjunto es completo porque incluye a todos los sujetos que se estudiarán Triola 2009.
  • 24. Censo: en este caso la población es el conjunto de datos de cada uno de los miembros de la población. DEFINICIONES Parámetro es una medición numérica que describe algunas características de una población. Esta medición esta basado en la población. Estadístico es una medición numérica que describe algunas características de una muestra. Esta medición esta basado en la muestra.
  • 25. MUESTRA ( n ) Muestra es todo subconjunto de elementos de la población. Tamaño muestral es el número de elementos de la población que conforman la muestra y se denota con la letra n. Muestra es un subconjunto de miembros seleccionados de una población. Los datos muestrales deben reunirse de una forma adecuada, como a través de un proceso de selección aleatoria. Un elemento muestral es la entidad de la muestra. En una muestra aleatoria los miembros de la población se seleccionan de forma que cada miembro individual tenga la misma posibilidad de ser elegido.
  • 27. DATOS Datos son las observaciones recolectadas (como mediciones, géneros, respuestas de encuestas, etc.) en una población o en una muestra. Los datos discretos resultan cuando el número de valores posibles es un número finito o un número entero que “puede contarse”. Ej. cantidad de cerezas que consumieron, en dic 2022, los 15 alumnos de estadística de la carrera de Lic. Bromatología de la FCA de la UNJu. Los datos continuos (numéricos) resultan de un infinito de posibles valores que corresponden a alguna escala continua que cubre un rango de valores sin huecos, interrupciones o saltos. Pueden asumir valores decimales. Ej. Peso de cada una de las paltas de la muestra de la Finca Las Palmeras de Monterrico. Fig. 1 Fig. 2
  • 28. UNIDAD DE OBSERVACIÓN UNIDAD DE ANÁLISIS La unidad de observación es la unidad descripta por los datos que uno analiza. Ej. podría ser un individuo si analizo el peso de las personas. Un estudio puede tener una unidad de observación y una unidad de análisis diferente. por ejemplo, en la investigación barrial, el diseño de la investigación puede recopilar datos a nivel individual de observación, pero el nivel de análisis puede ser a nivel de barrios, extrayendo conclusiones sobre las características de los barrios a partir de datos recogidos de particulares (la unidad de observación serían los vecinos y la unidad de análisis serían los barrios). La unidad de análisis es la entidad principal que se está analizando en un estudio. Es a "quién" se está estudiando. La UO es la unidad física que nos interesa estudiar u observar con fines de investigación. Ej. un paciente, un hogar, un cajón de manzanas.
  • 29. VARIABLE Variable es una característica que puede asumir distintos valores sobre las distintas unidades de estudio, de allí se generan los datos para el análisis estadístico. Variable es toda característica sujeta a medición o cuenta, y que varía para cada elemento de la población o muestra Una variable es una característica, propiedad o atributo, con respecto a la cual los elementos de una población o muestra difieren de alguna forma.
  • 30. Variable respuesta o variable de interés es una característica que puede asumir distintos valores sobre las distintas unidades de estudio, la cual se analiza, representa e interpreta. Variables Aleatorias es aquella variable que para cada valor que asume le corresponde una probabilidad. VARIABLE Constante, es una característica que asume siempre el mismo valor para todos los casos o unidades de estudio.
  • 31. ESCALA DE MEDICIÓN DE VARIABLES Las escalas de medición de las variables puede ser: 1. Nominal: corresponde a un atributo que se le asigna a la variable, como características se consideran que los atributos son mutuamente excluyentes entre sí, es decir, no pueden pertenecer a dos o más a tributos simultáneamente; no existe relación de jerarquía y únicamente pueden asignarse en categorías. 2. Ordinal: son aquellas que establecen un orden de 2 o + niveles que puede estar dado de forma creciente o decreciente. En ellas se establece una jerarquía mediante un valor numérico, sin que exista un intervalo numérico definido uniformemente 3. Intervalo: entre sus propiedad se considera que establecen un orden y jerarquía, pero a diferencia que las variables ordinales, en estas si existe un intervalo de magnitud igual en la medición. En las variables de intervalo el cero no significa la ausencia de valor, si no un punto asignado en la escala de medición. La difer. entre valores tiene un tamaño constante. Se aplica a vacc. 4. Razón: presenta características similares que las variables de intervalo, excepto que el cero es un valor absoluto. En este caso el cero representa la ausencia de la propiedad observada. El cero es el punto de partida, las diferencias y los cocientes (proporciones) tienen significado.
  • 32. ESCALA DE MEDICIÓN DE VARIABLES
  • 33. Variable aleatoria 1.Cuantitativa 2.Cualitativa 1. 1. Discreta: Toma valores enteros, provienen de contar. N° cajas de Petri por laboratorio en San Pedro… 2.1. Ordinal: tiene un orden, jerarquía predeterminado. Categorías de ocupación en empresas…. 1. 2. Continua: puede tomar cualquier valor en un intervalo dado, vienen de medición. Peso de las pipetas…. TIPOS DE VARIABLES 2.2. Nominal: clasificar, no tiene un orden predeterminado. Sexo de alumnos que estudian bromatología….
  • 34. Fig. N° 3 Peso de los quesos elaborados con leche de vaca durante el ultimo fin de semana de noviembre del 2021 en el Valle de Catamarca. Variable aleatoria cuantitativa continua: si los valores que puede asumir la variable corresponden potencialmente a cualquier número real, por supuesto en el rango de variación de la misma; se pueden medir en decimales Las variables continuas surgen a partir de procesos de medición como pueden ser pesadas o determinaciones de longitudes, tiempos, áreas y volúmenes. TIPOS DE VARIABLES
  • 35. Fig. N° 4 Cantidad de microorganismos presentes en cada inflorescencia de brócoli registrados el 20 de noviembre del 2022, en el comercio Fru-Ver de Ciudad Perico. Variable aleatoria cuantitativa discreta: si los valores posibles de una variable cuantitativa son números enteros y provienen de un proceso de conteo. Son números indivisibles. TIPOS DE VARIABLES
  • 36. Las variables aleatorias cualitativas Ordinales son aquellas que el valor será una categoría que requiere un orden, puede ser creciente o decreciente. Fig. N° 5 Distintas clases sociales de Argentina.Fuente Consultora w. (www. Infobae.com 8 de Agosto del 2022. Clases sociales: Alta Media alta Media baja Baja superior Baja. TIPOS DE VARIABLES
  • 37. Ej. Sancor Serenísima Ramolac Ricrem …. Fig. N° 6 Nombres de las marcas de quesos en las heladeras mostrador de los supermercados de la Ciudad de Rosario registrados la primera quincena de enero de 2022. Las variables aleatorias cualitativas Nominales son aquellas que representa una cualidad, atributo o categoría que no tiene ningún sentido ordenar. Las categorías representan a diferentes clases o nombres de la variable y no requiere un orden. Cuando tienen dos categorías, también son llamadas binarias o dicotómicas. TIPOS DE VARIABLES Atributo que se le asigna a la variable, como características se consideran que los atributos son mutuamente excluyentes entre sí.
  • 38. Fig. N° 8 Nombre de los productos alimenticios de la mesa de una familia de Cafayate, Salta, observados el 24 de diciembre del 2022. Fig. N° 7 Nombre de las frutas del plato que contienen vitamina C EJEMPLO DE VARIABLES
  • 39. EJEMPLOS DE VARIABLES Fig. 9 Fig. 10 Fig. 11 Fig. 12
  • 40. * Estudios observacionales: las variables respuestas pueden ser obtenidas desde unidades de análisis que se encuentran bajo condiciones en las que no hubo ningún tipo de intervención por parte del investigador y por tanto se registran u observan los valores de la variable tal cual se dan en la realidad. DATOS Observacionales Manera de obtener información estadística Por lo general obtenemos datos de dos tipos o fuentes distintas : los estudios observacionales y los experimentales. Fig. 13
  • 41. Manera de obtener información estadística ** Estudios experimentales: las variables respuestas pueden ser obtenidas desde unidades de análisis que se encuentran bajo condiciones a las que fueron expuestas intencionalmente por el investigador. El investigador modifica las condiciones y decide bajo qué valores de éstas desea registrar la respuesta. DATOS Experimentales Fig. 14 Fig. 15
  • 42. Esquema 2. Estudios estadísticos para obtener datos estadísticos
  • 43. SERIES Serie simple o S. Datos No Agrupados Serie de Frecuencias o S. Datos Agrupados la cantidad de valores o datos es muy grande; por lo que se hace conveniente, organizar los datos de manera de analizarlos por “parte” o “pedazos”, de la Serie. formada por pocos datos, fácil de analizar. SERIES DE DATOS
  • 44. Una Serie Simple está formada por pocos datos que se pueden estudiar y analizar rápidamente, es fácil organizarlos. No es necesario agrupar los datos o valores para su análisis. 1. SERIE SIMPLE O S. DE DATOS NO AGRUPADOS Ejemplo sencillo para pensar en clases: …. Ej 1. Una nutricionista registro varias variables, entre ellas la estatura de los niños del barrio Felicidad localizado en Salta. 95 88 84 87 86 86 85 97 100 Fig. 16. Registro de estatura de un niño
  • 45. Cuando la cantidad de datos es muy grande; es conveniente, organizar los datos de manera de analizarlos por “parte” o “pedazos”, de la Serie llamado clase. 2. SERIES DE FRECUENCIAS o SERIES DE DATOS AGRUPADOS o DISTRIBUCIONES DE FREC. Ejemplo sencillo para pensar en clases: …
  • 46. Ej. 2. El 20 de diciembre del 2021 se registraron los diámetros de colonias de bacterias expresadas en mm, del laboratorio de microbiología de la FCA de la UNJu. 8,3 8,9 8,8 9,6 8,7 9,1 8,9 9,4 9,8 10,0 8,8 9,7 10,3 7,4 7,8 7,9 8,8 9,2 8,6 8,5 6,8 8,4 8,2 7,5 8,8 10,1 9,2 8,5 9,5 9,6 10,4 6,7 7,3 Fig. 17 Colonias de bacterias en cajas de Petri Fig. 18 Detalle de colonias
  • 47. El análisis estadístico exploratorio o descriptivo de un conjunto de datos se pueden representar con medidas de resumen llamados estadísticos muestrales, que tratan de describir en forma resumida las características (variables) más importantes de dichos datos a través de: ANÁLISIS EXPLORATORIO O DESCRIPTIVO * cuáles son los valores más representativos de la muestra, * cómo es la variabilidad de los datos, * qué datos pueden considerarse atípicos, * o cómo es la simetría de la distribución, etc. Puede describir determinados aspectos de la distribución, como por ejemplo: El análisis estadístico de grandes bases de datos esta en expansión gracias a los algoritmos informáticos específicos con la bioinformática. Estadísticos Tablas Gráficos
  • 48. Las series de frecuencias o agrupados se agrupan en tablas para una mejor representación de los datos en diferentes clases, que depende del numero de datos. ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacc El conjunto de clases se llama serie de frecuencia Se llama Clase al pedazo o el intervalo de clase. R = Xmáx – Xmin Pasos: * Determinar el Rango ( R ) R = 10,7 mm – 6,7 mm = 3,7 mm
  • 49. ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacc ** Determinar el N° de clases con la fórmula de Sturges, siendo n el N° total de observaciones K = 1 + 3,3 log n K = 1 + 3,3 log 33 = 6,0 Para determinar el N° de clases pueden guiarse por la fórmula o según la experiencia del investigador. *** Definir los límites reales de las clases: con el cálculo de la amplitud del intervalo “a” de cada clase. a = R / K = 3,7 / 6 = 0,61
  • 50. MC = (Xi ) = ( LS + LI ) / 2 *v Calcular las Marcas de clases ( MC o Xi ) es el promedio entre el LS y el LI de cada clase. MC = ( 7,32 + 6,70 ) / 2 = 7,01 Clase LI LS Xi 1 [ 6,70 7,32 ] 7,01 2 ( 7,32 7,93 ] 7,63 3 ( 7,93 8,55 ] 8,24 4 ( 8,55 9,17 ] 8,86 5 ( 9,17 9,78 ] 9,48 6 ( 9,78 10,40 ] 10,09 ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacc
  • 51. Clase LI LS Xi Conteo fi 1 [ 6,70 7,32 ] 7,01 III 3 2 ( 7,32 7,93 ] 7,63 IIII 4 ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacc v. Determinar las frecuencias absolutas (fi) de cada clase: realizando un conteo de la cantidad de valores de la serie que le corresponden a cada clase. 8,3 8,9 8,8 9,6 8,7 9,1 8,9 9,4 9,8 10,0 8,8 9,7 10,3 7,4 7,8 7,9 8,8 9,2 8,6 8,5 6,8 8,4 8,2 7,5 8,8 10,1 9,2 8,5 9,5 9,6 10,4 6,7 7,3 Una tabla de frecuencias organiza los datos de manera tal que en una columna de la tabla aparecen los valores de la variable, según el tipo de variable, y en sucesivas columnas se muestran diferentes tipos de frecuencias asociadas a esos valores (frecuencias absolutas, frecuencias relativas absolutas, frecuencias absolutas acumuladas y frecuencias relativas acumuladas).
  • 52. 𝑓𝑟𝑖 = 𝑓𝑖 𝑛 𝑓𝑟𝑖 = 𝑓𝑖 𝑛 = 𝟒 33 = 𝟎, 𝟏𝟐 Cálculo p la 2da clase: La frecuencia absoluta relativa ( fri) es la porción de veces que el valor xi aparece en la muestra. Se calcula con el cociente entre la fi correspondiente y el total de datos n. n= 33 fi = 4 La frecuencia absoluta ( fi ) indica la cantidad de datos que hay en cada intervalo de clase de la variable continua, mientras que indica la cantidad de las veces que se registró cada valor de la variable discreta Clase LI LS Xi fi fri Fi Fri 1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09 2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21 3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36 ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacc
  • 53. La frecuencia acumulada relativa (Fri) se calcula como una proporción del total de las observaciones correspondientes a la Fi. 𝑭𝒓𝒊 = 𝑭𝒊 𝒏 Cálculo p la 2da clase: Fi = 3 + 4 = 7 La frecuencia acumulada (Fi ), es la frecuencia absoluta correspondiente a la clase en estudio mas la frecuencia acumulada anterior. Es la suma del número de valores en la muestra menores o iguales que fi. Clase LI LS Xi fi fri Fi Fri 1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09 2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21 3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36 𝑭𝒓𝒊 = 𝟕 𝟑𝟑 = 𝟎, 𝟐𝟏 ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacc
  • 54. Clase LI LS Xi fi fri Fi Fri 1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09 2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21 3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36 4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64 5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85 6 ( 9,78 10,40 ] 10,09 5 0,15 33 1 33 1,0 ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacc Cuadro 1. Frecuencias de los diámetros de las colonias del laboratorio de microbiología de la FCA de la UNJu.
  • 55. Valor Frecuencia Frecuencia Frecuencia Frecuencia Relativa de X Absoluta Relativa Acumulada Acumulada x1 f1 fr1 F1 Fr1 x2 f2 fr2 F2 Fr2 x3 f3 fr3 F3 Fr3 . . . . . . . . . . . . . . . xi fi fri Fi Fri n 1 TABLA DE FRECUENCIAS TEÓRICA La tabla de frecuencias sintetiza la información de la distribución de los valores de la variable estudiada en la muestra.
  • 56. GRÁFICOS DE BARRAS - HISTOGRAMA * Histograma p vacc: es una representación gráfica de una serie de distribución de frecuencias de una variable continua, en la que representa los valores de la variable y la fi o fri. 6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02 Diam col mm 0,00 0,07 0,14 0,21 0,29 frecuencia relativa En un histograma se observan “clases” sucesivas. Cada barra se levanta sobre un conjunto de puntos del eje X (una clase o un intervalo de clase). La altura de la “barra” señala la frecuencia relevada para la clase. Las barras se dibujan pegadas, y no separadas como en las variables discretas, para indicar que la variable continua puede asumir cualquiera de los valores comprendidos entre la primera y la última clase.
  • 57. 6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02 Diam col mm 0,00 0,07 0,14 0,21 0,29 frecuencia relativa * Polígono de frecuencias p vacc: es un gráficos q surge de unir con líneas los valores de cada clase. GRÁFICOS
  • 58. GRÁFICOS * Ojiva p vacc: es un gráficos de los valores de la variable y la Fi o Fri. 6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02 Diam col mm 0,00 0,25 0,50 0,75 1,00 frec. rel. acumulada
  • 59. Uno de los principales problemas de las muestras son los datos atípicos y valores extremos que son valores de la variable que se diferencian mucho del resto de los valores en la muestra. VALORES ATÍPICOS Es muy importante detectar los datos atípicos antes de realizar cualquier análisis de los datos, pues suelen distorsionar los resultados. Aparecen siempre en los extremos de la distribución, y pueden detectarse con un diagrama de caja y bigotes.
  • 60. El “bigote inferior” indica el menor valor observado que es mayor o igual a la diferencia Q1-1,5 RI, donde RI es el recorrido intercuartílico. Dicho valor observado coincide con el mínimo si no hay valores atípicos o extremos. El “bigote superior” coincide con el mayor valor observado que es menor o igual que Q3+1,5 RI (coincide con el máximo si no hay valores atípicos o extremos). GRÁFICO de CAJAS Este gráfico permite visualizar la forma de la distribución de frecuencias de la variable analizada. El gráfico representa la información acerca de la mediana, la media, los cuantiles 0,25, 0,75 y la presencia, si los hubiere, de valores extremos. Los valores atípicos inferiores están entre Q1-1,5 RI y Q1-3 RI y los superiores entre Q3 + 1,5 RI y Q3 + 3 RI. Los valores extremos aparecen por debajo de Q1-3RI y por encima de Q3 + 3RI.
  • 61. GRÁFICO de CAJA Se puede observar el promedio, la Mna, los cuartiles, la variabilidad de los datos y en algunos casos los valores atípicos y extremos. 6,51 7,53 8,55 9,57 10,59 Diam col mm
  • 62. GRÁFICO de SECTORES Comida favorita Gráfico de sectores consiste en un círculo divido en porciones, uno por cada valor o categoría o atributo de la variable. Cada porción se conoce como sector y su ángulo o área es proporcional a la correspondiente frecuencia del valor o categoría En el gráfico de sectores resulta oportuno agregar el valor de n, es decir la cantidad de casos que se analizaron para obtener los porcentajes o proporciones que se muestran.
  • 63. Ej. 3. Una maestra, el 13 de octubre del 2021, preguntó la cantidad de frutas que consumieron los niños de 1er grado del colegio San Jorge durante una semana anterior al relevamiento de la información en la ciudad de Salta. Según los datos decidieron que proveer a los niños en la colación. 0 3 5 7 2 4 3 1 6 2 3 3 0 1 2 4 5 2 1 0 7 6 4 3 4 4 5 4 2 1 4 3 4 Fig. 19. Niños repartiendo frutas
  • 64. Clase Xi fi fri Fi Fri 1 0 3 0,09 3 0,09 2 1 4 0,12 7 0,21 3 2 5 0,15 12 0,36 4 3 6 0,18 18 0,55 5 4 8 0,24 26 0,79 6 5 3 0,09 29 0,88 7 6 2 0,06 31 0,94 8 7 2 0,06 33 1,0 33 1,0 ELABORACIÓN DE TABLAS DE FRECUENCIAS p vacd
  • 65. GRÁFICOS * Bastones p vacd: es un gráficos que representa en el eje X los valores de la variable y en el eje Y, las frecuencias absolutas, fi o frec. Relativa absoluta. 0 1 2 3 4 5 6 7 Cant frutas consumidas/ semana 0 1 2 3 4 5 6 7 8 Frecuencia absoluta
  • 66. GRÁFICOS * Escalones p vacd: es un gráficos de los valores de la variable y las frecuencias acumuladas, Fi o Frec. acumulada relativa. -1 1 4 6 8 Valores observados 0,00 0,25 0,50 0,75 1,00 Frec relativa acumulada
  • 67. 0 2 3 5 7 Cant frutas/sem GRÁFICO de CAJAS bigote inferior bigote inferior Media Q3 Q1 Q2 = Mna RI
  • 68. Diagrama de cajas y bigotes del peso de una muestra de bebes recién nacidos, kg.
  • 70. De acuerdo al aspecto de las distribución que miden los datos, existen diferentes tipos de estadísticos: Para describir Los aspectos de la distribución muestral se utilizan unas medidas resumen llamadas estadísticos muestrales. ESTADÍSTICOS MUESTRALES Medidas de tendencia central o Estadísticos de Posición: Miden los valores en torno a los que se agrupan los datos o que dividen la distribución en partes iguales. Medidas de dispersión o Estadísticos de Dispersión: Miden la heterogeneidad de los datos. Medidas de forma o Estadísticos de Forma: Miden aspectos de la forma que tiene la distribución de los datos, como la simetría o el apuntamiento.
  • 71. a. MEDIDAS DE TENDENCIA CENTRAL * Estadísticos de Tendencia Central: Determinan valores alrededor de los cuales se concentran los datos, habitualmente en el centro de la distribución. Estas medidas suelen utilizarse como valores representativos de la muestra. Las más importantes son: Los estadísticos de posición pueden ser dos: • Media aritmética • Mediana • Moda ** Estadísticos de Posición no centrales: Dividen la distribución en partes con el mismo número de datos. Las más importantes son: • Cuartiles • Deciles • Percentiles
  • 72. También las medidas de tendencia central pueden clasificarse de la sig. forma: De posición central De posición no central
  • 73. * Media Aritmética Simple x (p serie simple): es la suma de las observaciones dividida por el número de ellas. n: es el numero de datos. a1. MEDIA ARITMÉTICA p serie simple 𝑋 = 95 + 88 + 84 + 87 + 86 + 86 + 85 + 97 + 100 9 = 808 9 = 𝟖𝟗, 𝟕𝟖
  • 74. a1. MEDIA ARITMETICA p serie de frec. p vacc Xi : es la marca de clase fi : es la frecuencia absoluta correspondiente a la Marca de clase
  • 75. Clase LI LS Xi fi fri Fi Fri 1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09 2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21 3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36 4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64 5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85 6 ( 9,78 10,40 ] 10,09 5 0,15 33 1 33 1,0 𝑋 = 7,01 , 3 + 7,63 . 4 + ⋯ + 10,09 . 5 33 = 289,3 33 = 𝟖, 𝟕𝟕 a1. MEDIA ARITMÉTICA p serie de frec. p vacc. ej. 2
  • 76. PROPIEDADES DE LA MEDIA 1. Cada valor de la variable puede sustituirse por el valor de la media aritmética, sin cambiar el total. 2. La suma de los desvíos de los valores de la variable con relación a la media aritmética, es igual a cero.
  • 77. PROPIEDADES DE LA MEDIA 3. La suma de los desvíos al cuadrado, es un mínimo. 4. La media aritmética, tiene las mismas unidades de la variable 5. La media aritmética del producto de una constante c por una variable, es igual a dicha constante por la media aritmética de la variable c x = c x 6. La media aritmética de la suma de dos variables, es igual a la suma de las medias aritméticas de cada una de ellas.
  • 78. CONSIDERACIONES SOBRE LA MEDIA • La media aritmética es una medida de centralización más utilizada. • Por lo general es la medida de resumen que mejor representa a la serie de datos porque en su cálculo considera a todos los datos. • Es muy sensible a los datos extremos, éstos producen una distorsión en el valor de la media. • Si se suma una constante a todos los valores de la variable, la media aritmética aumenta en el mismo valor.
  • 79. VENTAJAS e INCONVENIENTES DE LA MEDIA • Es fácil de calcular. • Es una de las medidas más usadas. • Es conocida por todos. • Es muy sensible a los datos extremos. Ventajas: Desventajas:
  • 80. Media Geométrica: Se calcula como la raíz enésima del producto de las n observaciones de la muestra. MEDIAS
  • 81. Media Armónica: Se calcula como el número de observaciones dividido por la suma de la inversa de las observaciones MEDIAS
  • 82. Media Cuadrática: Es la raíz cuadrada de la suma de las observaciones de la muestra al cuadrado, dividido el número de ellas. MEDIAS
  • 83. Es el valor de la variable que divide a la serie en dos partes iguales a2. MEDIANA (Mna) Mediana para Serie Simple: es el valor de la variable que divide a la series de datos ordenado en dos partes iguales, quedando la mitad de las observaciones quede por encima, y la otra mitad por debajo. La mediana para datos pares: es el valor de la variable que resulta de la media aritmética de los dos valores centrales Pasos: 1°. Ordenar los valores de la variable. 2°. Con datos impares, buscar la observación central Con datos pares, calcular el promedio de los dos valores centrales.
  • 84. MEDIANA Fig. 20. Muestras de niños ordenados donde indican la mediana
  • 85. * MEDIANA p SERIE SIMPLE 84 85 86 86 87 88 95 97 100 Ej 1. Una nutricionista registro varias variables, entre ellas la estatura de los niños del barrio Felicidad localizado en Salta. 95 88 84 87 86 86 85 97 100 Mna = 87 cm 1°. Ordenar los valores de la variable. 2°. Datos impares, buscar el valor de la variable central. Fig. 21. Muestra de niños ordenados donde indica la mediana
  • 86. La Mediana es el valor de la variable que corresponde a la Frecuencia acumulada (Fi ) inmediatamente superior a la mitad de las observaciones. ** MEDIANA P SERIE DE FRECUENCIAS: variable DISCRETA Suponga la Distribución de Frecuencias, del ej. 3 donde la variable aleatoria corresponde al N° de frutas que consumen los niños por semana…. Clase Xi fi fri Fi Fri 1 0 3 0,09 3 0,09 2 1 4 0,12 7 0,21 3 2 5 0,15 12 0,36 4 3 6 0,18 18 0,55 5 4 8 0,24 26 0,79 6 5 3 0,09 29 0,88 7 6 2 0,06 31 0,94 8 7 2 0,06 33 1 33 1,0 𝑛 2 = 33 2 = 𝟏𝟔, 𝟓 𝒏 𝟐 = Observe la Frecuencia Acumulada inmediatamente superior a la mitad de las observaciones (Fi ) Mna = 3 frutas consumidas / semana.
  • 87. ** MEDIANA P SERIE DE FRECUENCIAS: variable DISCRETA GRÁFICAMENTE En el gráfico de la Frecuencia Acumulada para variable aleatoria discreta y con el valor de la mitad de las observaciones, se determina a qué valor de la variable X corresponde, tomando el gráfico del ejemplo desde el valor 35 y paralelamente al eje de las abscisas hasta encontrar la primera perpendicular -1 1 4 6 8 Cant frutas consumidas/semana 0,00 0,25 0,50 0,75 1,00 Frecuencia relativa acumulada
  • 88. *** MEDIANA P SERIE DE FRECUENCIAS: variable CONTINUA 1° Identificar la clase donde se ubica la mediana: buscar la Frecuencia Acumulada (Fi ) superior a la mitad de las observaciones. Se realiza con los siguientes pasos Clase LI LS Xi fi fri Fi Fri 1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09 2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21 3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36 4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64 5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85 6 ( 9,78 10,40 ] 10,09 5 0,15 33 1,0 33 1,0 𝑛 2 = 𝟑𝟑 2 = 𝟏𝟔, 𝟓
  • 89. Clase LI LS Xi fi fri Fi Fri 1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09 2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21 3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36 4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64 5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85 6 ( 9,78 10,40 ] 10,09 5 0,15 33 1,0 33 1,0 *** MEDIANA P SERIE DE FRECUENCIAS: variable CONTINUA 2° Determinar la mediana con la fórmula de interpolación. 𝑀𝑛𝑎 = 𝟖, 𝟓𝟓 + 33 2 + 𝟏𝟐 𝟗 . 0,62 = 𝟖, 𝟖𝟔
  • 90. *** MEDIANA P SERIE DE FRECUENCIAS: variable CONTINUA GRÁFICAMENTE 6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02 Diam col mm 0,00 0,25 0,50 0,75 1,00 frec. rel. acumulada
  • 91. La mas importante, esto es que la suma de los desvíos de las observaciones con relación a la Mediana (en valor absoluto), es un mínimo PROPIEDADES DE LA MEDIANA
  • 92. a3. MODA Consideraciones sobre la moda: La moda (Mo) de una variable X es el valor de la variable más frecuente en la muestra. Se denomina moda de una variable estadística X al valor de la variable que tiene mayor frecuencia absoluta. • Puede existir distribuciones que no tengan moda; esto ocurre cuando las frecuencias de todos los datos son iguales. • Es muy útil en variables cualitativas. • En el cálculo no intervienen todos los valores de la variable. • L a moda es una medida de centralización, pero a veces las modas están situadas en los extremos (en distribuciones asimétricas).
  • 93. a3. MODA Muestra con una moda: cuando la variable X tiene un solo valor que más se repite o más frecuente. Muestra Bimodal: cuando la variable X tiene dos valores de igual frecuencias máximas en la muestra. Fig. 22. Muestras de niños ordenados donde indican la moda Fig. 23. Muestras de niños ordenados donde indican las modas
  • 94. * MODA p serie SIMPLE Ej 1. Una nutricionista registro varias variables, entre ellas la estatura de los niños del barrio Felicidad localizado en Salta. 95 88 84 87 86 86 85 97 100 Moda = 86 cm
  • 95. 1° Identificar la clase Modal, es decir, la que tiene mayor frecuencia absoluta. ** MODA p SERIE DE FRECUENCIA p vacc Pasos para el cálculo de la Moda: 2° Determina el valor de la Moda, con una interpolación, dentro de la clase Modal con la fórmula de cálculo.
  • 96. MODA p SERIE DE FRECUENCIA p vacc ej.2 Clase LI LS Xi fi fri Fi Fri 1 [ 6,70 7,32 ] 7,01 3 0,09 3 0,09 2 ( 7,32 7,93 ] 7,63 4 0,12 7 0,21 3 ( 7,93 8,55 ] 8,24 5 0,15 12 0,36 4 ( 8,55 9,17 ] 8,86 9 0,27 21 0,64 5 ( 9,17 9,78 ] 9,48 7 0,21 28 0,85 6 ( 9,78 10,40 ] 10,09 5 0,15 33 1 33 1,0 𝑀𝑜 = 8,55 + 4 4 + 2 . 0,62 = 𝟖, 𝟗𝟔 Mo = 8,96 mm de diámetro de las colonias.
  • 97. *** MODA P SERIE DE FRECUENCIAS: variable CONTINUA GRÁFICAMENTE. Ej. 2 6,08 6,70 7,32 7,93 8,55 9,17 9,78 10,40 11,02 Diam col mm 0,00 0,07 0,14 0,21 0,29 frecuencia relativa Mo = 8,96 mm
  • 98. ***MODA p SERIE DE FRECUENCIA p vacd. Ej3 Clase Xi fi fri Fi Fri 1 0 3 0,09 3 0,09 2 1 4 0,12 7 0,21 3 2 5 0,15 12 0,36 4 3 6 0,18 18 0,55 5 4 8 0,24 26 0,79 6 5 3 0,09 29 0,88 7 6 2 0,06 31 0,94 8 7 2 0,06 33 1,0 33 1,0 1° Identificar la mayor frecuencia absoluta. 2° Identificar el valor de la variable q le corresponde a la mayor frecuencia absoluta. Mo = 4 frutas
  • 99. *** MODA P SERIE DE FRECUENCIAS: variable DISCRETA GRÁFICAMENTE. Ej 3 0 1 2 3 4 5 6 7 Cant frutas consumidas/ semana 0 1 2 3 4 5 6 7 8 Frecuencia absoluta Mo = 4 frutas
  • 100. Asociados a la obtención de cuantiles, se suelen obtener los llamados cuartiles. Los cuartiles son: cuartil 1: Q1 (0,25); cuartil 2: Q2 (0,50) y Cuartil 3: Q3 (0,75) . a4. CUANTILES: CUARTIL1, CUARTIL2, CUARTIL3 Cuartiles: Son los tres valores ordenados de la variable que dividen a la serie de datos en cuatro partes iguales. Pasos para el cálculo de los cuartiles: 1° Ordenar los valores de la variable de menor a mayor. 𝑃𝑜𝑠 𝑄1 = 𝑛 + 1 4 𝑃𝑜𝑠 𝑄2 = 𝑛 + 1 2 𝑃𝑜𝑠 𝑄3 = 3𝑛 + 1 4
  • 101. 3° Calcular los valores de la variable que corresponde a los cuartiles con las fórmulas. * CUANTILES: CUARTIL1, CUARTIL2, CUARTIL3 Q1 Q2= Mna Q3
  • 102. Deciles: son 9 valores ordenados de la variable que dividen a la serie de datos en 10 partes iguales. Existen 9 deciles: D1 (10% acumulado), D2 (20 % acumulado),.…, D9 (90% acumulado). a5. DECILES
  • 103. a6. PERCENTILES Percentiles son 99 valores ordenados de la variable que dividen a la serie de datos en 100 partes iguales. Existen 99 percentiles: P1 ( 1% acumulado), P2 (2 % acumulado), ….., P99 (99 % acumulado).
  • 104. Representación GRÁFICA DE CUARTIL, DECIL, PERCENTIL
  • 105. Miden la heterogeneidad de los datos. MEDIDAS DE DISPERSIÓN o ESTADÍSTICOS DE DISPERSIÓN
  • 106. RANGO ( R ) R = Xmáx – Xmin Rango o recorrido: es la diferencia de los valores máximo y mínimo de la variable y tiene la misma unidad de las observaciones. El rango mide la máxima variabilidad de los valores de la serie de datos de la muestra. Es muy sensible a los valores atípicos. R = 10,7 mm – 6,7 mm = 3,7 mm Cálculo del Rango del ej. 1
  • 107. Rango intercuartílico muestral de una variable X es la diferencia entre el tercer cuartil y el primer cuartil (Q3 – Q1) de la muestra. Es una medida robusta de dispersión que no es afectada por valores extremos (los menores al cuantil 0,25 y los mayores al cuantil 0,75). RANGO INTERCUARTILICO ( RI ) RI = Q3 – Q1 El rango intercuartílico mide la dispersión del 50% de los datos centrales.
  • 108. RI
  • 109. DESVIO MEDIO ( DM ) Desvío medio es el valor de la variable que corresponde a la media aritmética de los desvíos de cada observación con relación a la media tomados en valor absoluto. Desviación de la media: es medir la distancia de cada valor de la variable respecto el promedio. Cuando esas desviaciones son grandes, la media no será tan representativa. Cuando las desviaciones son pequeñas la media será representativa.
  • 110. DESVIO MEDIO ( DM ) Desvío medio para series simples: Desvío medio para series de datos agrupados:
  • 111. Ventajas: Considera todas las observaciones de la muestra. DESVIO MEDIO ( DM ) La DM alrededor de la Mna es un mínimo. Desventaja: Se usa poco, pues es de menos utilidad práctica que otras medidas de dispersión
  • 112. VARIANCIA o VARIANZA (σ2 , S2 ) Variancia poblacional σ2 Variancia muestral S2 La varianza de una variable X se define como el promedio del cuadrado de los desvíos de los valores de la muestra respecto de la media. Variancia para serie simple La variancia es poca utilizada, porque ofrece valores en unidades cuadráticas, ej. m2 , kg2.
  • 113. VARIANCIA o VARIANZA (σ2 , S2 ) Variancia para serie de frecuencias:
  • 114. Desviación Estándar o Típica: Es el valor de la variable que resultante de la raíz cuadrada positiva de la variancia. DESVIACIÓN TÍPICA o DESVÍO ESTANDAR (σ, S) Cuando las varianzas o la desviaciones típicas son pequeñas, los datos de la muestra están concentrados en torno a la media, y la media es una buena medida de representatividad. De lo contrario, cuando la varianza o la desviaciones típicas son grandes, los datos de la muestra están alejados de la media, y la media ya no representa tan bien a los datos. La desviación estándar es comúnmente utilizada para identificar valores extremos o para establecer valores que se consideran extremos. Datos que se encuentran muy por encima o por debajo de la Media + 4 * DE o la Media – 4 * DE son considerados como valores extremos o “outliers”, para cualquier tipo de distribución.
  • 115. COEFICIENTE DE VARIANCIÓN (CV) El Coeficiente de variación o de variabilidad (CV) es el cociente entre su desviación típica muestral y el valor de su media muestral. Se suele presentar en porcentaje. El CV es una medida que también permite estudiar la dispersión de los datos. Si bien la desviación estándar es muy útil para comparar la dispersión de dos o más distribuciones, el problema se presenta cuando se desea comparar distribuciones de variables medidas en diferentes magnitudes. El CV es una medida adimensional de la dispersión relativa a la media. El menor coeficiente de variación, indica comportamiento más homogéneo. El CV también es útil en el caso de comparar conjuntos de datos de iguales magnitudes pero medidas en diferentes unidades
  • 116. MEDIDAS DE FORMA Forma de distribución de los datos.
  • 117. COEFICIENTE DE ASIMETRIA El coeficiente de asimetría (As) ofrece una forma numérica de describir la curva que representa a la serie de datos. Se calcula de las siguientes maneras: Distribución Asimetría negativa: As < 0 Simétrica: As = 0 Asimetría positiva: As > 0
  • 118. COEFICIENTE DE ASIMETRIA Distribución simétrica, los valores de la media, la mediana y la moda son iguales. As = 0, indica que hay el mismo número de valores por encima y por debajo de la media e igualmente alejados de ella.
  • 119. COEFICIENTE DE ASIMETRIA As < 0 (D. asimetría a la izquierda) indica que la mayoría de los valores son mayores que la media, pero los valores menores están más alejados de ella.
  • 120. COEFICIENTE DE ASIMETRIA As > 0 (D. asimetría positiva) indica que la mayoría de los valores son menores que la media, pero los valores mayores están más alejados de ella (asimetría a la derecha).
  • 121. COEFICIENTE DE ASIMETRIA Media < Mna < Mo Mo = Media = Mna Mo < Mna < Media Sesgada a la izquierda D. Asimetría negativa As < 0 Insesgada o Simétrica D. Simétrica (As = cero) As = 0 Sesgada a la derecha D. Asimetría positiva As > 0 Una distribución será simétrica o asimétrica, según su representación gráfica. Será asimétrica hacia la derecha (asimetría positiva), o a la izquierda (asimetría negativa), si su representación gráfica está más estirada hacia la derecha o izquierda. Cuando no existe asimetría la distribución es simétrica.
  • 122. Una distribución de datos está sesgada si no es simétrica y se extiende más hacia un lado que hacia el otro. (Una distribución de datos es simétrica si la mitad izquierda de su histograma es aproximadamente una imagen en espejo de su mitad derecha). Una comparación de la media, la mediana y la moda puede revelar información acerca de las características de sesgo. SESGO
  • 123. Curtosis: se define como una medida de agudeza de la curva que grafica la serie de datos. Por medio del coeficiente de curtosis podemos identificar las concentraciones de los valores tipos de distribución CURTOSIS El Coeficiente de Curtosis o coeficiente de apuntamiento (K) de una variable X es el promedio de las desviaciones de los valores de la muestra respecto de la media muestral, elevada a la cuarta, dividido por la desviación típica a la cuarta y al resultado se le resta 3. K El Coeficiente de Curtosis o coeficiente de apuntamiento mide la concentración de valores en torno a la media y la longitud de las colas de la distribución.
  • 124. COEFICIENTE DE CURTOSIS (K) K = 0 indica que la distribución tiene un apuntamiento normal, es decir, la concentración de valores en torno a la media es similar a una campana de Gauss, se llama Distribución mesocúrtica. D. mesocúrtica: posee una concentración moderada de valores alrededor de la media.
  • 125. COEFICIENTE DE CURTOSIS K < 0 indica que la distribución tiene menos apuntamiento de lo normal, es decir, la concentración de valores en torno a la media es menor que en una campana de Gauss, se llama Distribución platicúrtica. D. platicúrtica: está distribución tiene una forma más ancha, aplanada porque los valores tienden a estar más dispersos
  • 126. COEFICIENTE DE CURTOSIS K > 0 indica que la distribución tiene más apuntamiento de lo normal, es decir, la concentración de valores en torno a la media es mayor que en una campana de Gauss, se llama Distribución leptocúrtica. D. Leptocúrtica: los valores están muy agrupados alrededor de la media, por lo que la distribución se presenta bastante apuntada y esbelta
  • 127. DIFERENTES TIPOS DE CURTOSIS Gráfico N° Tipos de curtosis. Fuente: F. Zapata
  • 129. Azar (mejorar) “El azar es de todas las cosas la mas entremetida” (Hacking, 1991). El azar siempre está presente y es una componente más a considerar en cualquier problema que involucre variables aleatorias. Así, el azar ya no era la esencia de la falta de ley sino que estaba en el centro de todas las leyes de la naturaleza y de toda inferencia inductiva racional. Reducir el mundo a una cuestión de probabilidades, es sin duda, una posición extrema, tanto como pensar que todo está dado y determinado. No obstante la domesticación del azar abrió caminos para que las probabilidades y las leyes estadísticas entraran a nuestro mundo.
  • 130. BALZARINI, Mónica y otros. 2008. Estadística y Biometría. Editorial Brujas. QUINTEROS, H. 0. 2001. Bioestadística. Editorial UNJu. TRIOLA Mario F. Estadística. Décima edición. 2009. Editorial Pearson Addison Wesley. México. https://aprendeconalf.es/docencia/estadistica Bibliografía
  • 131. Gracias por su atención