2. ⦿Se utiliza para describir condiciones actuales
(investigaciones descriptivas), investigar relaciones
(investigación correlacionar) y estudiar fenómenos
de causa y efecto(investigaciones causales
comparativas e investigaciones experimentales).
⦿ Recolección de datos: Los atributos o
características (variables) de fenómenos, objetos,
animales, personas, organizaciones y colectividades
son medidos y ubicados numéricamente.
⦿Análisis de tales datos, numéricos o no, en términos
de su variación y/o dependencia.
⦿La esencia del análisis implica comparar grupos o
relacionar factores sobre tales atributos mediante
técnicas estadísticas.
2
Lic. Cintia Amor
3. ⦿La Estadística se utiliza como tecnología al
3
Lic. Cintia Amor
servicio de las ciencias donde la variabilidad
y la incertidumbre forman parte de su
naturaleza
⦿La Ciencia se desarrolla observando hechos,
formulando leyes que los explican y
realizando experimentos para validar o
rechazar dichas leyes
⦿“La Estadística estudia métodos científicos
para recoger, organizar, resumir y analizar
datos, así como para sacar conclusiones
válidas y tomar decisiones razonables
basadas en tal análisis”
Murray R. Spiegel
4. ⦿Para conocer las características de una
población en estudio, ya sea a través de la
totalidad de los datos de la población o de
un subconjunto de esa totalidad de datos,
recopilados a partir de una muestra
⦿Intentar descubrir
relaciones entre datos
4
Lic. Cintia Amor
5. ⦿ El estudio estadístico no otorga certeza
⦿Se busca lograr la mejor investigación con la
menor cantidad de errores y el mayor grado de
aplicación de los resultados.
◾ Se realizan observaciones aleatorias, o sea, al azar,
de un fenómeno que no se puede predecir con
anterioridad. Por ej.: la intención de voto previa a
elecciones
◾ Se realiza un muestreo (se selecciona una muestra
representativa de la población).
◾ Se recolectan datos de cada elemento muestreado
(por ejemplo a través de un cuestionario), y se
presentan en forma de tablas y/o gráficos
5
Lic. Cintia Amor
6. ⦿o Deductiva: estudia los métodos para
organizar, resumir y describir un conjunto de
datos para que sus características se vuelvan
evidentes. Se divide en:
6
Lic. Cintia Amor
◾Técnicas Gráficas
◾Técnicas Numéricas.
7. ⦿o Inductiva: sirve para extrapolar los resultados
obtenidos en el análisis de los datos provistos por la
Estadística Descriptiva y a partir de ello predecir
acerca de la población, con un margen de confianza
conocido. Se apoya fuertemente en el cálculo de
probabilidades a partir de modelos probabilísticos
teóricos.
⦿El objetivo final de la estadística inferencial es
concluir algo sobre alguna característica de la
población en la que se realiza el estudio.
⦿Se apoya en los datos brindados por la estadística
descriptiva
7
Lic. Cintia Amor
9. ⦿ Lo más importante no está en lo que la
muestra nos dice sobre sus miembros
específicos, sino en cómo hacer inferencias
sobre los miembros de la población que no
fueron incluidos en la muestra.
9
Lic. Cintia Amor
10. ⦿ Parámetro Poblacional: es un valor numérico que
caracteriza cierta población.
⦿ Estadístico Muestral: es un valor numérico que
caracteriza cierta muestra.
En Estadística se busca estimar el verdadero
valor del parámetro a través de un estadístico.
10
Lic. Cintia Amor
11. ⦿Los elementos son las personas o cosas que
forman parte de una población o muestra
⦿Cada elemento tiene una serie de
características que pueden ser objeto de
estudio estadístico. Estas son las VARIABLES
⦿Como lo indica su nombre, la variable es una
característica que puede adquirir, como
mínimo, dos respuestas.
11
Lic. Cintia Amor
12. ⦿ Cualitativas:
12
Lic. Cintia Amor
◾ Arrojan respuesta categóricas.
◾ Miden cualidades
◾ Se les puede asignar después un valor numérico
(codificarlas)
⦿ Cuantitativas:
◾ Producen respuestas numéricas.
◾ Miden cantidades
◾ Podemos tratar un dato cuantitativo como
cualitativo (categorizando)
13. ⦿ Discretos:
◾ Si el número de posibles valores que puede
tomar es contable (número naturales).
◾ Generalmente resultan de un proceso de
conteo
13
Lic. Cintia Amor
14. ⦿ Continuos:
◾ Si sus posibles valores están en el continuo
(números reales).
◾ Generalmente resultan de un proceso de
medición
14
Lic. Cintia Amor
15. ⦿ Los datos recopilados en la muestra se
pueden organizar en Tablas de
Frecuencias.
⦿ Estas tablas muestran:
15
Lic. Cintia Amor
◾ las clases o categorías de respuesta de
donde se obtuvieron los datos (o los
intervalos de clase si los datos son
cuantitativos)
◾ El número o proporción de veces que la
clase se encontró en los datos recopilados.
17. ⦿ Graficamos el contenido de la tabla de frecuencia.
⦿ Las más importantes gráficas:
◾ Pie
◾ Barras
◾ Pictograma
◾ Histograma
◾ Polígono de frecuencias
17
Lic. Cintia Amor
18. ⦿ Calculamos valores que “resumen” las
características de los datos en la muestra:
◾ Medidas de Tendencia Central
◾ Medidas de Posición
◾ Medidas de Dispersión
◾ Medidas de Forma
18
Lic. Cintia Amor
19. ◾ Indican valores con respecto a los que los datos
parecen agruparse.
⦿ Las principales medidas son:
◾ Media Aritmética
◾ Mediana
◾ Moda
19
Lic. Cintia Amor
20. ⦿Es la suma de todos los valores de una
variable dividida por el número total de
observaciones de la muestra.
20
Lic. Cintia Amor
n
Xi
X = i1
N
⦿Es lo que acostumbramos a llamar
«promedio»
21. ⦿La media es muy sensible a valores extremos
1 2 3 4 5
=
1+2+3+4+10
= 4
5
=
1+2+3+4+5
= 3
5
1 2 3 4 5 6 7 8 9 10
21
Lic. Cintia Amor
22. ⦿ Se define como el valor central de la
variable.
⦿ El valor que deja tras de sí y por delante
de sí al 50% de los datos .
1 2 3 4 5 6 7 8 9 10
6 Md 6
22
Lic. Cintia Amor
23. ⦿ Es el valor más frecuente, el que se
observa mayor número de veces
⦿ Pueden existir varios o ningún valor de
moda para un solo conjunto de datos, la
distribución puede ser:
23
Lic. Cintia Amor
Amodal cuando ningún valor se repite
Unimodal cuando un solo valor es el más
frecuente
Bimodal cuando dos valores son los más
frecuentes
trimodal,...., polimodal
24. ⦿ Dividen un conjunto ordenado de datos en
grupos con la misma cantidad de individuos.
⦿ Las medidas de posición son:
◾ Cuartiles: Son tres y delimitan al 25%, 50% y
75% de los datos acumulados.
◾ Deciles: Son nueve y delimitan al 10%, 20%,
... , 90% de los datos acumulados.
◾ Percentiles: Son noventa y nueve y
delimitan al 1%, 2%, ... , 99% de los datos
acumulados.
⦿ La Mediana también es una medida de posición
24
Lic. Cintia Amor
25. ◾ Indican la mayor o menor concentración de los
datos con respecto a las medidas de tendencia
central
25
Lic. Cintia Amor
⦿ Las principales medidas son:
◾ Amplitud o Rango = x máx – x mín
◾ Varianza
◾ Desviación Estándar
26. ⦿Se usa muy a menudo porque gran cantidad
de variables tienden a concentrar sus
valores en torno de la media y mientras
que los valores extremos tienen mucha
menor frecuencia.
26
Lic. Cintia Amor
27. ⦿ Estas variables pueden ser:
27
Lic. Cintia Amor
◾ Caracteres morfológicos de individuos (personas,
animales, plantas), por ejemplo: estatura, peso,
perímetro, etc.
◾ Caracteres fisiológicos: efecto de una misma dosis de un
fármaco, o de una misma cantidad de abono, cantidad de
glóbulos rojos, nivel de colesterol, etc.
◾ Caracteres sociológicos: consumo de cierto producto por
un mismo grupo de individuos, puntuaciones de examen,
etc.
◾ Caracteres psicológicos: cociente intelectual, grado de
adaptación a un medio, nivel de atención, etc.
◾ Errores cometidos al medir ciertas magnitudes
◾ Valores estadísticos muestrales como la media, varianza y
moda
28. ⦿Es un modelo probabilístico teórico
⦿Depende de dos parámetros: µ y σ
⦿El área bajo la curva representa
probabilidades
⦿Es simétrica respecto del eje que pasa por la
media
⦿Modo, media y mediana coinciden
⦿Se acerca asintóticamente al eje de las x
⦿Por lo tanto, en teoría, adquiere valores
desde -∞ a +∞
28
Lic. Cintia Amor
30. ⦿Z se la denomina variable tipificada de X, y a
la curva se la conoce como la curva normal
estándar.
⦿Es una distribución normal con µ = 0 y σ = 1.
⦿T
odas las variables normalmente distribuidas
se pueden transformar a la distribución
normal estándar utilizando la fórmula para
calcular el valor Z correspondiente.
⦿No depende de ningún parámetro.
⦿Tiene dos puntos de inflexión en z=1 y z=-1
30
Lic. Cintia Amor
31. ⦿Es continua, tiene forma de campana y es
simétrica respecto al cero como la
distribución z.
⦿Existe una familia de distribuciones t que
comparten una media de cero pero con
desviaciones estándar diferentes.
31
Lic. Cintia Amor
⦿La distribución t está más dispersa y es más
plana en el centro que la distribución z,
pero se acerca a ella cuando el tamaño de
la muestra crece.
⦿Coincide con la z cuando N = infinito
32. ⦿Número de observaciones que están libres
de variar después que la media de la
muestra ha sido calculada.
⦿Ejemplo: tenemos 3 números: x1 = 7, x2 = 8 y
x3 no lo conocemos
32
Lic. Cintia Amor
⦿Suponga que la media de los 3 números es 8
⦿SI la media es 8.0, luego x3 debe ser 9 (x3 no
puede variar libremente)
⦿ n = 3; grados de libertad = n –1 = 3 –1 = 2(2 valores
pueden ser cualquiera, pero el tercero no puede
tomar cualquier valor)
34. ⦿La Inferencia Estadística comprende los métodos
que son usados para obtener conclusiones
acerca de la población en base a una muestra
tomada de ella.
⦿Utiliza estadísticas muestrales
Lic. Cintia Amor 34
35. ⦿Usa la teoría de probabilidades para
generalizar las características de una
población a partir de las características de una
muestra representativa
⦿Involucra:
◾Estimación de parámetros
◾Test de Hipótesis
⦿Propósito: T
omar decisiones relacionadas a las
características de la Población
35
Lic. Cintia Amor
36. ⦿Variables Aleatorias utilizadas para estimar
un Parámetro de Población. Por ejemplo:
◾Media Muestral, Proporción de Población,
Mediana
⦿La base teórica son las Distribuciones
Muestrales
36
Lic. Cintia Amor
37. ⦿Es una Distribución de Probabilidad Teórica
⦿Surge de extraer TODAS las muestras posibles de
tamaño fijo de una población
⦿La variable aleatoria (que va en el eje
horizontal) es el Estadístico de la Muestra. Por
ej.: ya no tengo x sino la media de x
37
Lic. Cintia Amor
38. ⦿No importa la forma de la distribución
de la variable en la población, la
distribución muestral será
aproximadamente una distribución
normal, si las muestras son
suficientemente grandes.
⦿El equivalente a la desviación estándar
será el Error Estándar = σ/ √ N
⦿Se lo llama Error Estándar por que es el
error que se comete al trabajar con
muestras
38
Lic. Cintia Amor
39. ⦿No importa la forma de la distribución de la
variable, siempre se cumple que:
39
Lic. Cintia Amor
40. ⦿A partir de la media aritmética muestral se puede
inferir la media aritmética poblacional
⦿La estimación intervalar consiste en inferir dentro
de qué intervalo de valores estará el parámetro
con un determinado nivel de confianza.
⦿Ej.: inferir que la población debe tener una media
aritmética entre 75 y 83, con un nivel de
confianza de 0.95 (esto es, hay un 95% de
probabilidades de que el parámetro poblacional se
encuentre entre 75 y 83) o, si se quiere, con un
nivel de riesgo de 0.05 (esto es, hay un 5% de
probabilidades de que el parámetro no se
encuentre entre esos valores).
40
Lic. Cintia Amor
41. ⦿Un intervalo de confianza provee información
adicional acerca de la variabilidad.
⦿Una estimación de intervalo describe un
intervalo de valores dentro del cual es
posible que esté el parámetro de la
población.
41
Lic. Cintia Amor
42. ⦿Si la desviación estándar σ de la
población es desconocida, se la puede
substituir por la desviación estándar de la
muestra, S
⦿Esto introduce una incertidumbre
adicional, ya que S varía de muestra a
muestra.
⦿Se debe usar la usar la distribución “t” de
Student en lugar de la distribución normal
42
Lic. Cintia Amor
43. ⦿Enunciado acerca de una población
elaborada con el propósito de ponerse a
prueba. Por lo general, se refiere a los
parámetros de la población acerca de la
cual se realiza tal afirmación: media,
varianza, proporción
⦿Ejemplos de hipótesis acerca de un
parámetro de población son:
◾la media mensual de ingresos para analistas de
sistemas es $3625,
◾el 20% de los delincuentes juveniles son capturados
y sentenciados a prisión
43
Lic. Cintia Amor
44. ⦿Cuando, frente a un problema tenemos una o
más soluciones, buscamos elegir la mejor.
Esto implica formular una o más hipótesis de
trabajo. Si nuestro propósito es comprobar
una teoría, esta será nuestra hipótesis de
investigación y deberemos comprobar la
veracidad o no de la misma, en base a los
datos de una muestra
44
Lic. Cintia Amor
46. ⦿ Establece un supuesto a ser probado
46
Lic. Cintia Amor
Ej.: el número promedio de TV en las casas de esta
ciudad, es igual a 2,8
⦿Es siempre acerca de un parámetro poblacional
jamás sobre un estadístico muestral: π, µ, σ
⦿Formulamos una hipótesis con el propósito de
refutarla
◾ Queremos decidir si una moneda está trucada.
Formulamos la Ho de que la moneda es buena, o sea, que
la P(cara) = P(cruz) = 0,5
◾ Queremos ver si un procedimiento es mejor que otro.
Formulamos la Ho de que no hay diferencia entre ellos
47. ⦿Empieza con el supuesto que la hipótesis
nula es verdadera
⦿Similar a inocente mientras no se pruebe
lo contrario
⦿Se refiere al mantenimiento del status
quo
⦿No innovar
⦿Siempre contiene los signos “=” , “≤” o
“≥”
⦿Puede o no ser rechazada
47
Lic. Cintia Amor
48. ⦿Toda hipótesis que difiere de una dada, se
llamará hipótesis alternativa. También suele
ser la hipótesis de investigación.
⦿Es una afirmación que se aceptará si los datos
muestrales proporcionan evidencia de que la
hipótesis nula es falsa.
48
Lic. Cintia Amor
◾Ej., El promedio del numero de TV en ésta ciudad
es distinto de 2,8 ( H1: μ ≠ 2,8 )
⦿Plantea cambios en el status quo
⦿Nunca contiene los signos “=” , “≤” o “≥”
⦿Puede o no ser probada
49. ⦿Procedimiento basado en la evidencia
muestral y en la teoría de probabilidad que
se emplea para determinar si la hipótesis
nula es un enunciado razonable y no debe
rechazarse o si no es razonable y debe ser
rechazado.
49
Lic. Cintia Amor
50. ⦿Define los valores no probables de la
muestra, si la Ho es verdadera
⦿Define la región de rechazo de la Ho
⦿Los valores más comunes son 0,05 y 0,01.
Para pruebas muy rigurosas, se llega a 0,001
⦿Si adopto 0,05 o 5%, significa que hay 5
posibilidades entre 100 de rechazar la Ho
cuando no debía hacerlo. Tenemos un 95%
de confianza de que hemos adoptado la
decisión correcta
⦿Se determina antes de iniciar la
investigación
50
Lic. Cintia Amor
51. ⦿ Valores „improbables‟ si se cumple Ho
⦿Es conocida antes de realizar el experimento:
resultados experimentales que refutarían Ho
51
Lic. Cintia Amor
52. ⦿El análisis de correlación es un grupo de técnicas
estadísticas usadas para medir la fuerza de la
asociación entre dos variables.
⦿Un diagrama de dispersión es una gráfica que
representa la relación entre dos variables.
⦿La variable dependiente (Y) es la variable que se
predice o calcula.
⦿La variable independiente (X) proporciona las bases
para el cálculo. Es la variable de predicción.
⦿Un análisis de regresión permite predecir valores de
una variable dependiente basados en una variable
independiente
52
Lic. Cintia Amor
53. ⦿Propósito: determinar la ecuación de
regresión; se usa para predecir el valor de
la variable dependiente (Y) basado en la
variable independiente (X).
⦿Procedimiento: seleccionar una muestra
de la población y enumerar los datos por
pares para cada observación; dibujar un
diagrama de dispersión para visualizar la
relación; determinar la ecuación de
regresión.
53
Lic. Cintia Amor
54. ⦿Se usa un grupo de técnicas estadísticas para medir
la fuerza de la relación (correlación) entre dos
variables.
54
Lic. Cintia Amor
⦿El coeficiente de correlación (r) es una medida de
la intensidad de la relación lineal entre dos
variables
◾ Puede tomar cualquier valor de -1.00 a 1.00.
◾ Los valores de -1.00 o 1.00 indican la correlación perfecta y
fuerte.
◾ Los valores cerca de 0.0 indican la correlación débil.
◾ Los valores negativos indican una relación inversa y los
valores positivos indican una relación directa.
55. ⦿Solamente una variable independiente, X
⦿ Relación entre X e Y
, se describe por una función lineal
⦿ Los cambios en Y
, se suponen que son causados por
cambios en X
⦿La predicción es válida dentro del rango de datos
0
-1.00 1.00
Sin Correlación
Correlación Correlación Correlación Correlación Correlación Correlación
negativa negativa negativa positiva positiva positiva
intensa moderada débil débil moderada intensa
-0.50
Correlación negativa
0.50
Correlación positiva
55
Lic. Cintia Amor