SlideShare una empresa de Scribd logo
1 de 39
Prof. Navarro Maria Laura
Estadística

Introducción
¿Qué es la estadística?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los últimos años.
¿En qué áreas se aplica la estadística?
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas,
entre otras.
Ejemplos de su aplicación son:
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto
antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.

1
Estadística

Introducción
Ejemplos de su aplicación son:
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una
votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado
de salud de la población.
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.

2
Estadística

Introducción
Etapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado
método científico cuyas etapas son:
1)

Planteamiento del problema: consiste en definir el objetivo de la investigación y
precisar el universo o población.

2)

Recogida de la información: consiste en recolectar los datos necesarios
relacionados al problema de investigación.

3)

Análisis descriptivo: consiste en resumir los datos disponibles para extraer la
información relevante en el estudio.

4)

Inferencia estadística: consiste en suponer un modelo para toda la población
partiendo de los datos analizados para obtener conclusiones generales.

5)

Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la población

3
Estadística

Introducción
Esquema de las etapas de un estudio estadístico

AREA DE INTERES

Tema de Investigación

DATOS

ORGANIZAR Y
RESUMIR

(Tablas,
Gráficos, Medidas
Descriptivas, etc.)

-Antecedentes Previos
-Objetivos
-Preguntas de Investigación
-Posibles Hipótesis

ESTADÍSTICA DESCRIPTIVA

INTERPRETACIÓN
¿Población o Muestra?

Muestra

-Unidad de Análisis
-Población

Población

-Variables

INFERENCIA ESTADÍSTICA

CONCLUSIONES
INFORMACIÓN

Probabilidad
4
Estadística

Introducción
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de
la persona empleada.
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones
económicas y sociales en diferentes comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a
vestuario, alimentación, ocio y vivienda.
4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de
distintas empresas del país.
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una
Universidad, y si éste tiene alguna relación con su edad u otras características.

5
Estadística
Resumen de algunos conceptos planteados en la Introducción

• VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS.
• ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una
Población o una Muestra
• POBLACIÓN : Es el total de unidades de análisis que son tema de estudio.
• MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.

Población:
“Las personas que
trabajan en empresas de
comunicación”

Muestra

Muestra: 60 trabajadores de empresas de comunicación
Unidad de análisis: Trabajador de empresa de comunicación
Variables: sexo, edad, salario, Nº de horas de trabajo, etc.

6
Estadística
Variable: corresponde a la característica de la Unidad de Análisis
TIPOS DE VARIABLES
Variables Cuantitativas
CONTINUA

DISCRETA

Variables Cualitativas
NOMINAL

ORDINAL

Intervalo

Toma valores enteros
Ejemplos: Número de Hijos, Número de
empleados de una empresa, Número de
asignaturas aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc.

Característica o cualidad
cuyas categorías no tienen
un orden preestablecido.
Ejemplos: Sexo, Deporte
Favorito, etc.
Característica o cualidad cuyas
categorías tienen un orden
preestablecido.
Ejemplos: Calificación (S, N, A);
Grado de Interés por un tema, etc.

Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
Medida:

7
Estadística

Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se
presenta una característica.
Variable
Cuantitativa

CONTINUA
DISCRETA

Variable
Cualitativa

Variable
Cualitativa

NOMINAL

NOMINAL
ORDINAL

Variable
Cuantitativa

CONTINUA

ORDINAL

Frecuencia Absoluta (F)

DISCRETA

Frecuencia Relativa (f)
TIPO FRECUENCIA

Frecuencia Absoluta
Acumulada (FAA)

Frecuencia Relativa
Acumulada (fra)

8
Estadística

EJEMPLO

Problema de Investigación: Se quiere establecer el perfil de las industrias
de conserva en función de algunas características.
Unidad de Análisis: Industria de Conserva
Población: Industrias de Conservas del país

Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- Nº de Empleados: se refiere al número de empleados en las líneas de producción. ( cuantitativa
discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de
producción. (cuantitativa continua)
- Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos
estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)
Datos
Industria nº
1
2
.
.
.
299
300

Tipo
A
B
.
.
.
D
C

Nº Empleados
100
150
.
.
.
250
300

Superficie
1000,6
1200,4
.
.
.
800,3
4000,2

Calificación
Muy Bien
Bien
.
.
.
Mal
Regular

9
Estadística
Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en
Investigación:
función de algunas características.

EJEMPLO

Unidad de Análisis: Industria de Conserva
Análisis:

TABLAS DE
FRECUENCIA
Tipo de
Industria
A
B
C
D
Total

(1)

Frecuencia
Absoluta (Fj)

Población: Industrias de Conservas del país
Población:
Frecuencia
Relativa (fj)

300
Numero de
Empleados
<100
[100-150[
.
.
[950-1000]
Total

Porcentaje
(%)

1
Frec.
Absoluta (F j)

100
Frec.Relativa
(fj) o %

Calificación
Muy Bien
Bien
Regular
Mal
Total

Frec. Absol.
Acum. (FAAj)

Frec.
Absoluta (Fj)

Frec.Relativa
(fj) o %

Frec. Relat.
Acum. (fraj) o %

300
300

Frec. Absol.
Acum. (FAAj)

1 (o 100)

(2)

1 (o 100)

Frec. Relat.
Acum. (fraj) o %

(3)
300
300

1 (o 100%)

(4)

Superficie
(mt2)
<200
[200-400[
.
.
[50000-5200]
Total

1 (o 100%)
Frec.
Absoluta (F j)

1 (o 100%)

Frec. Absol.
Acum. (FAAj)

Frec. Relat.
Acum. (fraj) o %

300
300

Frec.Relativa
(fj) o %

1 (o 100%)

10
Estadística

Elementos de una tabla de frecuencia cuando la variable es continua (x)

[LI1 ; LS1 [

Intervalo

Centro
de clase Amplitud

I1

c1

I2
.
.

c2

Ik

ck

ak

FAA fra

a2

[LIk ; LSk]

f

a1

[LI2 ; LS2 [

F

Total

cj = (LIj) + LSj )/2

n
n

1

1

aj = (LSj – LIj))

11
Estadística
Ejercicio: confección de una tabla de frecuencia para una variable continua
Los datos corresponden a la edad de los
hijos de los trabajadores de una empresa
10,5
12,0
10,7
10,4
11,7
13,9
7,3

10,7
10,3
11,5
7,5
10,3
10,6
8,0

9,5
13,5
11,1
10,2
10,6
10,0
8,5

10,5
12,3
10,6
8,7
10,5
10,8
12,5

11,8
10,6
9,3
10,9
11,9
10,6
9,7

11,2
9,8
12,9
9,9
11,0
-

Realice la siguiente actividad
1)

Construya un Diagrama de Tallo y Hoja

2)

¿Cuál es la variable?; ¿Cuál es la Unidad de
análisis?; ¿Cuánto vale n?; ¿Cuál es el rango
de la variable?.

3)

Sobre una Tabla de frecuencia: ¿Cuántos
frecuencia:
intervalos podría construir?; ¿Cuál es la
amplitud de cada intervalo?; ¿Cuántas
medidas de frecuencia puede obtener para
cada intervalo?.

4)

Construir tabla de frecuencia para la
variable: Intervalos, centro de clase,
variable:
amplitud, frecuencias.

Datos ordenados de menor a mayor
7,3
7,5
8,0
8,5
8,7
9,3
9,5

9,7
9,8
9,9
10,0
10,2
10,3
10,3

10,4
10,5
10,5
10,5
10,6
10,6
10,6

10,6
10,6
10,7
10,7
10,8
10,9
11,0

11,1
11,2
11,5
11,7
11,8
11,9
12,0

12,3
12,5
12,9
13,5
13,9
-

Diagrama de Tallo y Hoja: permite organizar los
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automáticas para ordenar
los datos.

12
Estadística
TIPOS DE GRÁFICOS

1. Gráfico de Sectores Circulares (de Torta)

Distribución de las unidades de análisis de
acuerdo a variable 1

D
10%

Distribución de las unidades de
análisis de acuerdo a variable 1
D
10%
C
40%

A
20%

A
20%

B
30%

Distribución de las unidades de
análisis de acuerdo a variable 1
C
40%

B
30%
D
10%
C
40%

A
20%

B
30%

13
Estadística
TIPOS DE GRÁFICOS

2. Gráfico de Barras

Numero de unidades de análisis
de acuerdo a variable 1

Proporción de unidad de análisis de acuerdo a
variable 1
D
variable 1

500

300
200

C
B
A

100
0
A

B

C

D

variable 1

0

0,2

0,4

0,6

0,8

1

Proporción de unidad de análisis

-Este tipo de gráfico se utiliza generalmente para
representar la frecuencia de las categorías de una
variable cualitativa.

Porcentaje de unidad de análisis de acuerdo a
variable 1

-Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
transformada en categorías.

D
variable 1

Nº

400

C
B
A
0

20

40

60

% unidad de análisis

80

100

-Hay distintas versiones de estos gráficos (por ejemplo
en Excel), y en algunos casos son muy útiles para
describir el comportamiento de una variable en distintos
grupos.
14
Estadística
TIPOS DE GRÁFICOS

3. Histograma
Histograma

Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad

Frecuencia
Nº

15

10

Histograma
- Permite la representación de
la frecuencia de una variable
Cuantitativa.
- El eje x se refiere a la
variable.

5

0
7

8

9

10

11

12

13

edad
edad

Ejemplo
En el gráfico se puede observar el número de
hijos , de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría de
hijos de los trabajadores están entre los 10 y 12
años.

14

- El eje y se refiere a la
frecuencia (Nº , %).
- Cada barra representa la
frecuencia de la variable en la
población en estudio (o la
muestra).
-El histograma se puede
construir desde los datos de la
tabla de frecuencia de la
variable en estudio.

15
Estadística
TIPOS DE GRÁFICOS

5. Polígono de Frecuencia

Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad

Frecuencia
Nº

15

-Esta representación se basa en
el Histograma.
-Sólo es útil para variables
cuantitativas.

10

edad

-El eje x se refiere a la
variable.

5

0
7

8

9

10

11

edad

12

13

14

- El eje y se refiere a la
frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).
16
Estadística
TIPOS DE GRÁFICOS

5. Diagrama de Caja

Edad de las personas que se realizaron
angioplastía entre 1980 y 2000
100
90
80
70

- Permite identificar gráficamente
mediana, los cuartiles 1 y
(percentiles 25 y 75), mínimo
máximo de una variable.

Edad

60
50
40

- Sólo es útil
cuantitativas.

30
20

variables

-El eje x permite identificar la
poblacion en estudio.

10
0
N=

para

la
3
y

584

1473

Mujeres

Hombres

- El eje y representa los valores de la
variable en estudio.
17
Estadística
TIPOS DE GRÁFICOS

6. Otros
Número de alumnos matriculados en la
Carrera B según año de ingreso
Nº de alumnos

100
80
60
40
20
0
1998

1999

2000

2001

2002

100
80
60
40
20
0

2003

1998

1999

año de ingreso

2000

2001

2002

2003

año de ingreso
Número de alumnos matriculados en las Carreras
según año de ingreso

año de ingreso
1998
1999
2000
2001
2002
2003

Nº de alumnos
Carrera A
Carrera B
60
80
55
70
80
50
40
60
68
50
70
75

Nº de alumnos

Nº de alumnos

Número de alumnos matriculados en la
Carrera A según año de ingreso

200
150
100
50
0
1998

Carrera B
Carrera A

1999

2000

2001

2002

2003

año ingreso

18
Estadística

NOTACION
Variables Cuantitativas

x = variable xi = valor de la variable en el individuo i
OBSERVACIONES
y = variable y = valor de la variable en el individuo i i = 1,..., n
i
* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.
* El Gráfico debe contener un a, b, c :General y la identificación de cada eje
Título constantes
n

(variable en estudio y frecuencia).

+  + c = nc
∑ c =*c En ocasiones
i =1
n

frecuencia.

n

n

n

i =1

i =1

i =1

resulta cxi = ilustrativo cx n = c ∑ xi que unaxitabla1 de + x n
∑ más cx1 +  + un gráfico
∑ =x +
2

2

2

n
n
* Al igual que las tablas, los gráficos deben ser auto-explicativos.
2

∑ (axi + b) =(ax1 + b) +  + (axn + b) = a ∑ xi + b
i =1

i =1

(∑ xi ) = ( x1 +  + x n ) 2
i =1

n

∑ ( xi + yi ) = ( x1 + y1 ) +  + ( x n + y n )
i =1

n

∑ ( xi yi ) = ( x1 y1 ) +  + ( xn y n )
i =1

19
Estadística
-Media Aritmética (Promedio)
MEDIDAS DE TENDENCIA CENTRAL

-Mediana
-Moda

Datos Cuantitativos

x
x1
x2

xn

Datos Cuantitativos ordenados de menor a mayor

Media Aritmética o Promedio
n

x=

∑ xi
i =1

n

Datos
Cualitativos y Cuantitativos

x
x(1)

Mediana

M E = x( k )

x( 2)

ME =


x(n )

Si n es impar

x( k ) + x( k +1) Si n es par
2

x( k ) = dato del centro

Moda

M o =" el dato que más se repite"
20
Estadística
-Percentil (ejemplo: 25, 50, 75)
Percentiles, Deciles o Cuartiles

-Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los
n datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.

21
Estadística
-Rango
-Varianza

MEDIDAS DE DISPERSIÓN

-Desviación Estándar
Datos Cuantitativos

x
x1
x2

xn

Varianza

1 n
∑ ( xi − x ) ∑ x − n (∑ xi ) 2 1 n 2 2
i =1
R = max( xi ) − min( xi ) s 2 = i =1
= i =1
= ∑ xi − x
n
n
n i =1
Rango

n

2

n

2
i

Desviación Típica o Estándar

s = s2
Comparación entre Variables

Se refiere al comportamiento de las variables cuantitativas en
un grupo. Por ejemplo: Si se tiene un conjunto de personas a las
que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál
presenta mayor variación?

Coeficiente de Variación

cv =

s
x

22
Estadística

-Asimetría

Otras medidas o Coeficientes

-Kurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.

n

Coeficiente de Asimetría CA =

∑ (x
i =1

i

− x)3

n ⋅ s3
n

Coeficiente de Apuntamiento CAp =

Si CA=0 si la distribución es simétrica alrededor de la media.
Si CA<0 si la distribución es asimétrica a la izquierda
Si CA>0 si la distribución es asimétrica a la derecha

∑ ( xi − x ) 4
i =1

n ⋅ s4

- Si CAp=0 la distribución se dice normal (similar
a la distribución normal de Gauss) y recibe el
nombre de mesocúrtica.
- Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.

23
Estadística

Otras medidas o Coeficientes

-Asimetría
-Kurtosis o Apuntamiento

Ejemplos Histogramas con distinta asimetría y apuntamiento

14

6

30

12

5

10

4

20
8

3
6
2

10
4
Desv. típ. = 1,67

1,0

2,0

3,0

4,0

V2

5,0

6,0

7,0

N = 30,00

1

Desv. típ. = 2,42

Media = 0,0

N = 30,00

0

Desv. típ. = ,64

Media = 3,9

2

0
-1,0

0,0

1,0

V4

2,0

Media = 5,2
N = 28,00

0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0

V5

24
Estadística

Otras medidas o Coeficientes

-Asimetría
-Kurtosis o Apuntamiento
Ejemplos

Datos
1

4

4

1

4
4

5

2

4

5

2

4

6

2

4

Histograma

Medidas descriptivas
Media

4

1

16

6

14

3,9

Mediana

4

12

Moda

4

10

Desviación estándar

1,67

Varianza de la muestra

2,78

8

kurtosis

-0,43

6

Coeficiente de asimetría

-0,02

Rango

6

Mínimo

1

Máximo

7

Cuenta

30

2

4

6

3

4

6

4

3

4

7

2

4

4

7

0

Desv. típ. = 1,77
Media = 5,4
N = 66,00
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0

V1

25
Estadística

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento
para datos Agrupados (tabla de frecuencias)
Tabla de frecuencia (para variable cuantitativa)
Intervalo

Centro
de clase Amplitud

F

f

f1
f2

I1

c1

a1

I2
.
.

c2

a2

n1
n2







ck

ak

nk

fk

n

1

k



Ik

FAA fra

2) La Desviación típica para datos
agrupados esta dada por:

Total

sc =
n

1

Sea cj la marca de clase (o centro de clase) y fj la
frecuencia relativa de la clase j, donde j=1, 2,…, k.

1) La Media para datos agrupados es igual a
la suma de los productos de las marcas de
clase por sus frecuencias relativas, de la forma:

j =1

j =1

− xc ) 2 f j

j

3) El Coeficiente de Asimetría para
datos agrupados esta dado por:
k

CAc =

∑ (c
j =1

− xc ) 3 f j

j

3
sc

4) El Coeficiente de apuntamiento para
datos agrupados esta dada por:
k

k

Media c = x c = ∑ c j f j

∑ (c

CAp c =

∑ (c
j =1

j

− xc ) 4 f j
s c4
26
Estadística
Descripción de 2 variables cualitativas
Distribución conjunta

Problema
Interesa estudiar cual es el
principal medio de transporte
preferido por un grupo de
personas a la hora de dirigirse
al centro comercial.

Tabla 1

Actividad

Transporte

Pensionado

Trabaja

Autobus

5

7

0

Bicicleta

3

3

2

Caminar

2

5

2

Coche

5

4

5

Metro

Para esto se consultó a cada
persona sobre la actividad a
la que se dedicaba y el medio
de transporte preferido.

Estudia

6

7

4

Transporte

Nº

%

Autobus

12

20,0

Actividad

Bicicleta

8

13,3

Estudia

21

35,0

Caminar

9

15,0

Pensionado

26

43,3

Coche

14

23,3

Trabaja

13

21,7

Metro

17

28,3

TOTAL

60

100

TOTAL

60

100

Nº

%

27
Estadística
Descripción de 2 variables cualitativas
Distribución conjunta
Nº de personas
Tabla 2

Actividad

Transporte

Estudia

Pensionado

Trabaja

TOTAL

Autobus

5

7

0

12

Bicicleta

3

3

2

8

Caminar

2

5

2

9

Coche

5

4

5

14

Metro

6

7

4

17

TOTAL

21

26

13

60

Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

28
Estadística
Descripción de 2 variables cualitativas
Distribución conjunta
Nº de personas y % respecto de tipo de Transporte
Tabla 3
Transporte

Actividad

Estudia

Pensionado

Trabaja

TOTAL

5

7

0

12

41,7

58,3

0

100

3

3

2

8

37,5

37,5

25

100

2

5

2

9

22,2

55,6

22,2

100

5

4

5

14

35,7

28,6

35,7

100

6

7

4

17

35,3

41,2

23,5

100

TOTAL

21

26

13

60

%

35

43,3

21,7

100

Autobus
%
Bicicleta
%
Caminar
%
Coche
%
Metro
%

29
Estadística
Descripción de 2 variables cualitativas
Distribución conjunta
Nº de personas y % respecto de tipo de Actividad
Tabla 4
Transporte

Actividad

Estudia

Pensionado

Trabaja

TOTAL

5

7

0

12

23,8

26,9

0

20

3

3

2

8

14,3

11,5

15,4

13,3

2

5

2

9

9,5

19,2

15,4

15

5

4

5

14

23,8

15,4

38,5

23,3

6

7

4

17

28,6

26,9

30,8

28,3

TOTAL

21

26

13

60

%

100

100

100

100

Autobus
%
Bicicleta
%
Caminar
%
Coche
%
Metro
%

30
Estadística

MEDIDAS DE ASOCIACIÓN LINEAL

x
x1
x2

xn

- Covarianza

Datos

- Correlación

Cuantitativos

Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
(Varianza y Desviación Estándar) para una
Variable Cuantitativa (x).

Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)
(x
(x

x
x(1)

y( 1 )

1 n
cov( x , y ) = ∑ ( xi − x )( yi − y )
n i =1

x( 2)

y( 2 )

Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional,
es decir que cuando x aumenta y también aumenta; y viceversa.


x(n )



Si Cov(x,y) es negativa: la asociación entre x e y
es inversamente
proporcional, es decir que cuando x aumenta y disminuye; y viceversa.

y

y( n )

Si Cov(x,y) es cero: no existe asociación entre x e y.

31
Estadística

MEDIDAS DE ASOCIACIÓN LINEAL

- Covarianza

Datos

- Correlación

Cuantitativos

Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal
entre dos variables Cuantitativas
y

x
x(1)

y( 1 )

x( 2)

y( 2 )


x(n )


y( n )

r=

cov( x , y )
sx s y

n

∑ xi yi − nx y

r = i =1
( n − 1 )s x s y

−1 ≤ r ≤ 1

Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.
32
Estadística

EJEMPLO : Representación gráfica de las variables x e y

r=1

r=-1

33
Estadística

Datos Cuantitativos

REGRESION LINEAL SIMPLE
Objetivo 1
Determinar si dos variables están
asociadas y en qué sentido se da
la asociación.

Determinar si existe relación
entre las variables x e y:
Coeficiente de Correlación

y

x
x(1)

y( 1 )

x( 2)

y( 2 )


x(n )

Objetivo 2
Estudiar si los valores de una
variable pueden ser utilizados para
predecir el valor de la otra


y( n )

Estudiar la dependencia de una
variable respecto de la otra:

Modelo de Regresión

Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)

34
Estadística

Datos Cuantitativos

REGRESION LINEAL SIMPLE
y

x
x(1)

y( 1 )

Notación

x( 2)

y( 2 )


x(n )



Variable Respuesta: y
Variable Explicativa: x

y( n )

Modelo de Regresión Lineal Simple: yi=α+βxi+ei
Intercepto: α
Pendiente: β
Error: e

Modelo Estimado
(recta de regresión)

Método de Estimación: Mínimos Cuadrados

a = y − bx

ˆ
y = a + bx

n

b=

n

n

Residuos o Errores

i =1

i =1

i =1

ˆ
ei = y i − y i

n∑ xy − ∑ xi ∑ y i
 n 
n ∑ x −  ∑ xi 
i =1
 i =1 
n

2

2

35
Estadística

REGRESION LINEAL SIMPLE
MODELO DE REGRESIÓN LINEAL SIMPLE

yi=α+βxi+ei
DATOS

MODELO ESTIMADO

ˆ
y = a + bx

y

x
x(1)

y( 1 )

x( 2)

y( 2 )


x(n )



ESTIMADORES

a = y − bx

y( n )

ERRORES

ˆ
ei = y i − y i

n

b=

n

n

i =1

i =1

i =1

n∑ xy − ∑ xi ∑ y i


n ∑ x 2 −  ∑ xi 
i =1
 i =1 
n

n

2

36
Estadística

REGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14

edad (meses) talla (cm)
xi
yi
3
55
6
68
5
64
5
66
3
62
4
65
9
74
8
75
9
73
7
69
6
73
5
68
8
73
6
71

y=talla / x=edad / n=14
14

y i 956
∑=
i=
1

14

xi 84
∑=
i=
1

y = ,3 s y =,6
68
5
x=
6

sx =
2

cov( x, y ) =,07 rxy =,88
9
0
14

xi y
∑i
i=
1

=
5863

14

xi2 556
∑=
i=
1

37
Estadística

REGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

Modelo Estimado
ˆ a bx
y =+
b =44 a = ,64
2,
53
ˆ 53
y = ,64 +44 x
2,
Interpretación de los resultados
- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
38
Estadística

REGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14

edad (meses) talla (cm) Talla estimada
xi
3
6
5
5
3
4
9
8
9
7
6
5
8
6

yi
55
68
64
66
62
65
74
75
73
69
73
68
73
71

error

ˆ
yi

ei

61,0
68,3
65,8
65,8
61,0
63,4
75,6
73,2
75,6
70,7
68,3
65,8
73,2
68,3

-6,0
-0,3
-1,8
0,2
1,0
1,6
-1,6
1,8
-2,6
-1,7
4,7
2,2
-0,2
2,7

14

(y y
402
∑ i − i ) 2 = ,86
i=
1

14

14

i=
1

i=
1

(y y
∑ i −ˆ i ) 2 = ei2 = ,7
∑ 92

Bondad de Ajuste del Modelo
R2 = 0,77

De acuerdo al coeficiente de
determinación, el modelo ajustado
a los datos es adecuado (R2
cercano a 1)
39

Más contenido relacionado

La actualidad más candente

La actualidad más candente (18)

Estad Descriptiva
Estad DescriptivaEstad Descriptiva
Estad Descriptiva
 
Stadistik01
Stadistik01Stadistik01
Stadistik01
 
Estadistica 2009
Estadistica 2009Estadistica 2009
Estadistica 2009
 
2011 - II : Clase Nº 01 Estadística Descriptiva I
2011 - II : Clase Nº 01 Estadística Descriptiva I2011 - II : Clase Nº 01 Estadística Descriptiva I
2011 - II : Clase Nº 01 Estadística Descriptiva I
 
Tutoria 1.
Tutoria 1.Tutoria 1.
Tutoria 1.
 
Unidad 1 Estadistica Basica
Unidad 1 Estadistica BasicaUnidad 1 Estadistica Basica
Unidad 1 Estadistica Basica
 
Conceptos de estadística
Conceptos de estadísticaConceptos de estadística
Conceptos de estadística
 
Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...
 
Estadística para 2 y 3 eso
Estadística para 2 y 3 esoEstadística para 2 y 3 eso
Estadística para 2 y 3 eso
 
1. la estadística y conceptos básicos
1. la estadística y conceptos básicos1. la estadística y conceptos básicos
1. la estadística y conceptos básicos
 
Estad Gener I
Estad Gener IEstad Gener I
Estad Gener I
 
Conceptos básicos estadisticos clase 1
Conceptos básicos estadisticos  clase 1Conceptos básicos estadisticos  clase 1
Conceptos básicos estadisticos clase 1
 
Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologia
 
Estadistica I 01
Estadistica  I 01Estadistica  I 01
Estadistica I 01
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
Expo De Estadistica
Expo De EstadisticaExpo De Estadistica
Expo De Estadistica
 
TEMA Nº 01: ESTADISTICA DESCRIPTIVA I
TEMA Nº 01: ESTADISTICA DESCRIPTIVA ITEMA Nº 01: ESTADISTICA DESCRIPTIVA I
TEMA Nº 01: ESTADISTICA DESCRIPTIVA I
 
Estadistica r
Estadistica rEstadistica r
Estadistica r
 

Similar a Presentación estadística

Teoria Estadística Descriptiva.ppt
Teoria Estadística Descriptiva.pptTeoria Estadística Descriptiva.ppt
Teoria Estadística Descriptiva.pptVILELAJARAREYVIDANIE
 
Probabilidad y Estadistica (primera parte).ppt
Probabilidad y Estadistica (primera parte).pptProbabilidad y Estadistica (primera parte).ppt
Probabilidad y Estadistica (primera parte).pptDaniel Val-Arreola
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadisticarylthon
 
Geoestadistica descriptiva
Geoestadistica descriptiva Geoestadistica descriptiva
Geoestadistica descriptiva kevinfof
 
Presentacion conceptos basicos
Presentacion conceptos basicosPresentacion conceptos basicos
Presentacion conceptos basicosLuz Alfonso
 
TIPOS DE ESTILOS
TIPOS DE ESTILOSTIPOS DE ESTILOS
TIPOS DE ESTILOSBDanielV10
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivawillypi
 
Presentación estadística parte 1
Presentación estadística parte 1Presentación estadística parte 1
Presentación estadística parte 1Ing Antolin Robles
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidadRuby Longa
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidadAndres Montoya
 
Clase 5 Datos e información.pptx
Clase 5 Datos e información.pptxClase 5 Datos e información.pptx
Clase 5 Datos e información.pptxHaroldOyarvide
 
Estadística y probabilidades
Estadística y probabilidadesEstadística y probabilidades
Estadística y probabilidadesCristian Quintero
 
Conceptos.. salud
Conceptos.. salud Conceptos.. salud
Conceptos.. salud Ayd Quizmex
 

Similar a Presentación estadística (20)

Teoria Estadística Descriptiva.ppt
Teoria Estadística Descriptiva.pptTeoria Estadística Descriptiva.ppt
Teoria Estadística Descriptiva.ppt
 
Probabilidad y Estadistica (primera parte).ppt
Probabilidad y Estadistica (primera parte).pptProbabilidad y Estadistica (primera parte).ppt
Probabilidad y Estadistica (primera parte).ppt
 
MODULO DE ESTADISTICA.pdf
MODULO DE ESTADISTICA.pdfMODULO DE ESTADISTICA.pdf
MODULO DE ESTADISTICA.pdf
 
Bioclase i
Bioclase iBioclase i
Bioclase i
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadistica
 
Presentación estadística
Presentación estadísticaPresentación estadística
Presentación estadística
 
Geoestadistica descriptiva
Geoestadistica descriptiva Geoestadistica descriptiva
Geoestadistica descriptiva
 
TRABAJO DE SLIDE
TRABAJO DE SLIDETRABAJO DE SLIDE
TRABAJO DE SLIDE
 
Presentacion conceptos basicos
Presentacion conceptos basicosPresentacion conceptos basicos
Presentacion conceptos basicos
 
TIPOS DE ESTILOS
TIPOS DE ESTILOSTIPOS DE ESTILOS
TIPOS DE ESTILOS
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Presentación estadística parte 1
Presentación estadística parte 1Presentación estadística parte 1
Presentación estadística parte 1
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
Clase 5 Datos e información.pptx
Clase 5 Datos e información.pptxClase 5 Datos e información.pptx
Clase 5 Datos e información.pptx
 
Lupita camarena
Lupita camarenaLupita camarena
Lupita camarena
 
Estadística y probabilidades
Estadística y probabilidadesEstadística y probabilidades
Estadística y probabilidades
 
Conceptos.. salud
Conceptos.. salud Conceptos.. salud
Conceptos.. salud
 

Presentación estadística

  • 1. Prof. Navarro Maria Laura Estadística Introducción ¿Qué es la estadística? Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha experimentado un gran desarrollo a lo largo de los últimos años. ¿En qué áreas se aplica la estadística? Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras. Ejemplos de su aplicación son: 1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo. 2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares. 1
  • 2. Estadística Introducción Ejemplos de su aplicación son: 3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos. 4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad. 5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa). 6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población. En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas. 2
  • 3. Estadística Introducción Etapas de un estudio estadístico Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son: 1) Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población. 2) Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación. 3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio. 4) Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos analizados para obtener conclusiones generales. 5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población 3
  • 4. Estadística Introducción Esquema de las etapas de un estudio estadístico AREA DE INTERES Tema de Investigación DATOS ORGANIZAR Y RESUMIR (Tablas, Gráficos, Medidas Descriptivas, etc.) -Antecedentes Previos -Objetivos -Preguntas de Investigación -Posibles Hipótesis ESTADÍSTICA DESCRIPTIVA INTERPRETACIÓN ¿Población o Muestra? Muestra -Unidad de Análisis -Población Población -Variables INFERENCIA ESTADÍSTICA CONCLUSIONES INFORMACIÓN Probabilidad 4
  • 5. Estadística Introducción Ejemplos de algunos problemas a estudiar 1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada. 2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades. 3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda. 4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas. 5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país. 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad. 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características. 5
  • 6. Estadística Resumen de algunos conceptos planteados en la Introducción • VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS. • ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra • POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. • MUESTRA: Es un conjunto de unidades de análisis provenientes de una población. Población: “Las personas que trabajan en empresas de comunicación” Muestra Muestra: 60 trabajadores de empresas de comunicación Unidad de análisis: Trabajador de empresa de comunicación Variables: sexo, edad, salario, Nº de horas de trabajo, etc. 6
  • 7. Estadística Variable: corresponde a la característica de la Unidad de Análisis TIPOS DE VARIABLES Variables Cuantitativas CONTINUA DISCRETA Variables Cualitativas NOMINAL ORDINAL Intervalo Toma valores enteros Ejemplos: Número de Hijos, Número de empleados de una empresa, Número de asignaturas aprobadas en un semestre, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso; Estatura; Temperatura, etc. Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Sexo, Deporte Favorito, etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Calificación (S, N, A); Grado de Interés por un tema, etc. Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura Medida: 7
  • 8. Estadística Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica. Variable Cuantitativa CONTINUA DISCRETA Variable Cualitativa Variable Cualitativa NOMINAL NOMINAL ORDINAL Variable Cuantitativa CONTINUA ORDINAL Frecuencia Absoluta (F) DISCRETA Frecuencia Relativa (f) TIPO FRECUENCIA Frecuencia Absoluta Acumulada (FAA) Frecuencia Relativa Acumulada (fra) 8
  • 9. Estadística EJEMPLO Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país Variables - Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal) - Nº de Empleados: se refiere al número de empleados en las líneas de producción. ( cuantitativa discreta) - Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de producción. (cuantitativa continua) - Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal) Datos Industria nº 1 2 . . . 299 300 Tipo A B . . . D C Nº Empleados 100 150 . . . 250 300 Superficie 1000,6 1200,4 . . . 800,3 4000,2 Calificación Muy Bien Bien . . . Mal Regular 9
  • 10. Estadística Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en Investigación: función de algunas características. EJEMPLO Unidad de Análisis: Industria de Conserva Análisis: TABLAS DE FRECUENCIA Tipo de Industria A B C D Total (1) Frecuencia Absoluta (Fj) Población: Industrias de Conservas del país Población: Frecuencia Relativa (fj) 300 Numero de Empleados <100 [100-150[ . . [950-1000] Total Porcentaje (%) 1 Frec. Absoluta (F j) 100 Frec.Relativa (fj) o % Calificación Muy Bien Bien Regular Mal Total Frec. Absol. Acum. (FAAj) Frec. Absoluta (Fj) Frec.Relativa (fj) o % Frec. Relat. Acum. (fraj) o % 300 300 Frec. Absol. Acum. (FAAj) 1 (o 100) (2) 1 (o 100) Frec. Relat. Acum. (fraj) o % (3) 300 300 1 (o 100%) (4) Superficie (mt2) <200 [200-400[ . . [50000-5200] Total 1 (o 100%) Frec. Absoluta (F j) 1 (o 100%) Frec. Absol. Acum. (FAAj) Frec. Relat. Acum. (fraj) o % 300 300 Frec.Relativa (fj) o % 1 (o 100%) 10
  • 11. Estadística Elementos de una tabla de frecuencia cuando la variable es continua (x) [LI1 ; LS1 [ Intervalo Centro de clase Amplitud I1 c1 I2 . . c2 Ik ck ak FAA fra a2 [LIk ; LSk] f a1 [LI2 ; LS2 [ F Total cj = (LIj) + LSj )/2 n n 1 1 aj = (LSj – LIj)) 11
  • 12. Estadística Ejercicio: confección de una tabla de frecuencia para una variable continua Los datos corresponden a la edad de los hijos de los trabajadores de una empresa 10,5 12,0 10,7 10,4 11,7 13,9 7,3 10,7 10,3 11,5 7,5 10,3 10,6 8,0 9,5 13,5 11,1 10,2 10,6 10,0 8,5 10,5 12,3 10,6 8,7 10,5 10,8 12,5 11,8 10,6 9,3 10,9 11,9 10,6 9,7 11,2 9,8 12,9 9,9 11,0 - Realice la siguiente actividad 1) Construya un Diagrama de Tallo y Hoja 2) ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. 3) Sobre una Tabla de frecuencia: ¿Cuántos frecuencia: intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para cada intervalo?. 4) Construir tabla de frecuencia para la variable: Intervalos, centro de clase, variable: amplitud, frecuencias. Datos ordenados de menor a mayor 7,3 7,5 8,0 8,5 8,7 9,3 9,5 9,7 9,8 9,9 10,0 10,2 10,3 10,3 10,4 10,5 10,5 10,5 10,6 10,6 10,6 10,6 10,6 10,7 10,7 10,8 10,9 11,0 11,1 11,2 11,5 11,7 11,8 11,9 12,0 12,3 12,5 12,9 13,5 13,9 - Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos. 12
  • 13. Estadística TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta) Distribución de las unidades de análisis de acuerdo a variable 1 D 10% Distribución de las unidades de análisis de acuerdo a variable 1 D 10% C 40% A 20% A 20% B 30% Distribución de las unidades de análisis de acuerdo a variable 1 C 40% B 30% D 10% C 40% A 20% B 30% 13
  • 14. Estadística TIPOS DE GRÁFICOS 2. Gráfico de Barras Numero de unidades de análisis de acuerdo a variable 1 Proporción de unidad de análisis de acuerdo a variable 1 D variable 1 500 300 200 C B A 100 0 A B C D variable 1 0 0,2 0,4 0,6 0,8 1 Proporción de unidad de análisis -Este tipo de gráfico se utiliza generalmente para representar la frecuencia de las categorías de una variable cualitativa. Porcentaje de unidad de análisis de acuerdo a variable 1 -Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha transformada en categorías. D variable 1 Nº 400 C B A 0 20 40 60 % unidad de análisis 80 100 -Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos grupos. 14
  • 15. Estadística TIPOS DE GRÁFICOS 3. Histograma Histograma Distribución de los hijos de trabajadores de la empresa de acuerdo a edad Frecuencia Nº 15 10 Histograma - Permite la representación de la frecuencia de una variable Cuantitativa. - El eje x se refiere a la variable. 5 0 7 8 9 10 11 12 13 edad edad Ejemplo En el gráfico se puede observar el número de hijos , de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 años. 14 - El eje y se refiere a la frecuencia (Nº , %). - Cada barra representa la frecuencia de la variable en la población en estudio (o la muestra). -El histograma se puede construir desde los datos de la tabla de frecuencia de la variable en estudio. 15
  • 16. Estadística TIPOS DE GRÁFICOS 5. Polígono de Frecuencia Distribución de los hijos de trabajadores de la empresa de acuerdo a edad Frecuencia Nº 15 -Esta representación se basa en el Histograma. -Sólo es útil para variables cuantitativas. 10 edad -El eje x se refiere a la variable. 5 0 7 8 9 10 11 edad 12 13 14 - El eje y se refiere a la frecuencia (Nº , %). -Los puntos que permiten la unión de las líneas representa el centro de clase (o marca de clase). 16
  • 17. Estadística TIPOS DE GRÁFICOS 5. Diagrama de Caja Edad de las personas que se realizaron angioplastía entre 1980 y 2000 100 90 80 70 - Permite identificar gráficamente mediana, los cuartiles 1 y (percentiles 25 y 75), mínimo máximo de una variable. Edad 60 50 40 - Sólo es útil cuantitativas. 30 20 variables -El eje x permite identificar la poblacion en estudio. 10 0 N= para la 3 y 584 1473 Mujeres Hombres - El eje y representa los valores de la variable en estudio. 17
  • 18. Estadística TIPOS DE GRÁFICOS 6. Otros Número de alumnos matriculados en la Carrera B según año de ingreso Nº de alumnos 100 80 60 40 20 0 1998 1999 2000 2001 2002 100 80 60 40 20 0 2003 1998 1999 año de ingreso 2000 2001 2002 2003 año de ingreso Número de alumnos matriculados en las Carreras según año de ingreso año de ingreso 1998 1999 2000 2001 2002 2003 Nº de alumnos Carrera A Carrera B 60 80 55 70 80 50 40 60 68 50 70 75 Nº de alumnos Nº de alumnos Número de alumnos matriculados en la Carrera A según año de ingreso 200 150 100 50 0 1998 Carrera B Carrera A 1999 2000 2001 2002 2003 año ingreso 18
  • 19. Estadística NOTACION Variables Cuantitativas x = variable xi = valor de la variable en el individuo i OBSERVACIONES y = variable y = valor de la variable en el individuo i i = 1,..., n i * El Tipo de Gráfico seleccionado va a depender de la variable en estudio. * El Gráfico debe contener un a, b, c :General y la identificación de cada eje Título constantes n (variable en estudio y frecuencia). +  + c = nc ∑ c =*c En ocasiones i =1 n frecuencia. n n n i =1 i =1 i =1 resulta cxi = ilustrativo cx n = c ∑ xi que unaxitabla1 de + x n ∑ más cx1 +  + un gráfico ∑ =x + 2 2 2 n n * Al igual que las tablas, los gráficos deben ser auto-explicativos. 2 ∑ (axi + b) =(ax1 + b) +  + (axn + b) = a ∑ xi + b i =1 i =1 (∑ xi ) = ( x1 +  + x n ) 2 i =1 n ∑ ( xi + yi ) = ( x1 + y1 ) +  + ( x n + y n ) i =1 n ∑ ( xi yi ) = ( x1 y1 ) +  + ( xn y n ) i =1 19
  • 20. Estadística -Media Aritmética (Promedio) MEDIDAS DE TENDENCIA CENTRAL -Mediana -Moda Datos Cuantitativos x x1 x2  xn Datos Cuantitativos ordenados de menor a mayor Media Aritmética o Promedio n x= ∑ xi i =1 n Datos Cualitativos y Cuantitativos x x(1) Mediana M E = x( k ) x( 2) ME =  x(n ) Si n es impar x( k ) + x( k +1) Si n es par 2 x( k ) = dato del centro Moda M o =" el dato que más se repite" 20
  • 21. Estadística -Percentil (ejemplo: 25, 50, 75) Percentiles, Deciles o Cuartiles -Decil (ejemplo: 4, 5, 8) -Cuartil (ejemplo: 1, 2, 3) Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos están ordenados de Menor a Mayor El Percentil va de 1 a 100 El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. El Decil va de 1 a 10 El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. El Cuartil va de 1 a 4 El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 21
  • 22. Estadística -Rango -Varianza MEDIDAS DE DISPERSIÓN -Desviación Estándar Datos Cuantitativos x x1 x2  xn Varianza 1 n ∑ ( xi − x ) ∑ x − n (∑ xi ) 2 1 n 2 2 i =1 R = max( xi ) − min( xi ) s 2 = i =1 = i =1 = ∑ xi − x n n n i =1 Rango n 2 n 2 i Desviación Típica o Estándar s = s2 Comparación entre Variables Se refiere al comportamiento de las variables cuantitativas en un grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta mayor variación? Coeficiente de Variación cv = s x 22
  • 23. Estadística -Asimetría Otras medidas o Coeficientes -Kurtosis o Apuntamiento Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis. n Coeficiente de Asimetría CA = ∑ (x i =1 i − x)3 n ⋅ s3 n Coeficiente de Apuntamiento CAp = Si CA=0 si la distribución es simétrica alrededor de la media. Si CA<0 si la distribución es asimétrica a la izquierda Si CA>0 si la distribución es asimétrica a la derecha ∑ ( xi − x ) 4 i =1 n ⋅ s4 - Si CAp=0 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. - Si CAp>0, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media). - Si CAp<0 la distribución es más plana y se llama platicúrtica. 23
  • 24. Estadística Otras medidas o Coeficientes -Asimetría -Kurtosis o Apuntamiento Ejemplos Histogramas con distinta asimetría y apuntamiento 14 6 30 12 5 10 4 20 8 3 6 2 10 4 Desv. típ. = 1,67 1,0 2,0 3,0 4,0 V2 5,0 6,0 7,0 N = 30,00 1 Desv. típ. = 2,42 Media = 0,0 N = 30,00 0 Desv. típ. = ,64 Media = 3,9 2 0 -1,0 0,0 1,0 V4 2,0 Media = 5,2 N = 28,00 0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 V5 24
  • 25. Estadística Otras medidas o Coeficientes -Asimetría -Kurtosis o Apuntamiento Ejemplos Datos 1 4 4 1 4 4 5 2 4 5 2 4 6 2 4 Histograma Medidas descriptivas Media 4 1 16 6 14 3,9 Mediana 4 12 Moda 4 10 Desviación estándar 1,67 Varianza de la muestra 2,78 8 kurtosis -0,43 6 Coeficiente de asimetría -0,02 Rango 6 Mínimo 1 Máximo 7 Cuenta 30 2 4 6 3 4 6 4 3 4 7 2 4 4 7 0 Desv. típ. = 1,77 Media = 5,4 N = 66,00 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 V1 25
  • 26. Estadística Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias) Tabla de frecuencia (para variable cuantitativa) Intervalo Centro de clase Amplitud F f f1 f2 I1 c1 a1 I2 . . c2 a2 n1 n2    ck ak nk fk n 1 k  Ik FAA fra 2) La Desviación típica para datos agrupados esta dada por: Total sc = n 1 Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k. 1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma: j =1 j =1 − xc ) 2 f j j 3) El Coeficiente de Asimetría para datos agrupados esta dado por: k CAc = ∑ (c j =1 − xc ) 3 f j j 3 sc 4) El Coeficiente de apuntamiento para datos agrupados esta dada por: k k Media c = x c = ∑ c j f j ∑ (c CAp c = ∑ (c j =1 j − xc ) 4 f j s c4 26
  • 27. Estadística Descripción de 2 variables cualitativas Distribución conjunta Problema Interesa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial. Tabla 1 Actividad Transporte Pensionado Trabaja Autobus 5 7 0 Bicicleta 3 3 2 Caminar 2 5 2 Coche 5 4 5 Metro Para esto se consultó a cada persona sobre la actividad a la que se dedicaba y el medio de transporte preferido. Estudia 6 7 4 Transporte Nº % Autobus 12 20,0 Actividad Bicicleta 8 13,3 Estudia 21 35,0 Caminar 9 15,0 Pensionado 26 43,3 Coche 14 23,3 Trabaja 13 21,7 Metro 17 28,3 TOTAL 60 100 TOTAL 60 100 Nº % 27
  • 28. Estadística Descripción de 2 variables cualitativas Distribución conjunta Nº de personas Tabla 2 Actividad Transporte Estudia Pensionado Trabaja TOTAL Autobus 5 7 0 12 Bicicleta 3 3 2 8 Caminar 2 5 2 9 Coche 5 4 5 14 Metro 6 7 4 17 TOTAL 21 26 13 60 Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60) 28
  • 29. Estadística Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Transporte Tabla 3 Transporte Actividad Estudia Pensionado Trabaja TOTAL 5 7 0 12 41,7 58,3 0 100 3 3 2 8 37,5 37,5 25 100 2 5 2 9 22,2 55,6 22,2 100 5 4 5 14 35,7 28,6 35,7 100 6 7 4 17 35,3 41,2 23,5 100 TOTAL 21 26 13 60 % 35 43,3 21,7 100 Autobus % Bicicleta % Caminar % Coche % Metro % 29
  • 30. Estadística Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Actividad Tabla 4 Transporte Actividad Estudia Pensionado Trabaja TOTAL 5 7 0 12 23,8 26,9 0 20 3 3 2 8 14,3 11,5 15,4 13,3 2 5 2 9 9,5 19,2 15,4 15 5 4 5 14 23,8 15,4 38,5 23,3 6 7 4 17 28,6 26,9 30,8 28,3 TOTAL 21 26 13 60 % 100 100 100 100 Autobus % Bicicleta % Caminar % Coche % Metro % 30
  • 31. Estadística MEDIDAS DE ASOCIACIÓN LINEAL x x1 x2  xn - Covarianza Datos - Correlación Cuantitativos Recordemos que: Hasta ahora hemos estudiado las medidas tendencia central (Media, Mediana, Moda) y dispersión (Varianza y Desviación Estándar) para una Variable Cuantitativa (x). Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y) (x (x x x(1) y( 1 ) 1 n cov( x , y ) = ∑ ( xi − x )( yi − y ) n i =1 x( 2) y( 2 ) Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional, es decir que cuando x aumenta y también aumenta; y viceversa.  x(n )  Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional, es decir que cuando x aumenta y disminuye; y viceversa. y y( n ) Si Cov(x,y) es cero: no existe asociación entre x e y. 31
  • 32. Estadística MEDIDAS DE ASOCIACIÓN LINEAL - Covarianza Datos - Correlación Cuantitativos Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y) Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal entre dos variables Cuantitativas y x x(1) y( 1 ) x( 2) y( 2 )  x(n )  y( n ) r= cov( x , y ) sx s y n ∑ xi yi − nx y r = i =1 ( n − 1 )s x s y −1 ≤ r ≤ 1 Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es perfecta. Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es perfecta. Si r es cero: no existe asociación entre x e y. 32
  • 33. Estadística EJEMPLO : Representación gráfica de las variables x e y r=1 r=-1 33
  • 34. Estadística Datos Cuantitativos REGRESION LINEAL SIMPLE Objetivo 1 Determinar si dos variables están asociadas y en qué sentido se da la asociación. Determinar si existe relación entre las variables x e y: Coeficiente de Correlación y x x(1) y( 1 ) x( 2) y( 2 )  x(n ) Objetivo 2 Estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra  y( n ) Estudiar la dependencia de una variable respecto de la otra: Modelo de Regresión Términos Variable Respuesta (=variable dependiente) Variable Explicativa (=variable Independiente) Relación Lineal (modelo lineal) Parámetros (intercepto y pendiente) Intercepto (respuesta media) Pendiente (efecto de la variable explicativa sobre la respuesta) Error (residuo) 34
  • 35. Estadística Datos Cuantitativos REGRESION LINEAL SIMPLE y x x(1) y( 1 ) Notación x( 2) y( 2 )  x(n )  Variable Respuesta: y Variable Explicativa: x y( n ) Modelo de Regresión Lineal Simple: yi=α+βxi+ei Intercepto: α Pendiente: β Error: e Modelo Estimado (recta de regresión) Método de Estimación: Mínimos Cuadrados a = y − bx ˆ y = a + bx n b= n n Residuos o Errores i =1 i =1 i =1 ˆ ei = y i − y i n∑ xy − ∑ xi ∑ y i  n  n ∑ x −  ∑ xi  i =1  i =1  n 2 2 35
  • 36. Estadística REGRESION LINEAL SIMPLE MODELO DE REGRESIÓN LINEAL SIMPLE yi=α+βxi+ei DATOS MODELO ESTIMADO ˆ y = a + bx y x x(1) y( 1 ) x( 2) y( 2 )  x(n )  ESTIMADORES a = y − bx y( n ) ERRORES ˆ ei = y i − y i n b= n n i =1 i =1 i =1 n∑ xy − ∑ xi ∑ y i   n ∑ x 2 −  ∑ xi  i =1  i =1  n n 2 36
  • 37. Estadística REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. niño i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 edad (meses) talla (cm) xi yi 3 55 6 68 5 64 5 66 3 62 4 65 9 74 8 75 9 73 7 69 6 73 5 68 8 73 6 71 y=talla / x=edad / n=14 14 y i 956 ∑= i= 1 14 xi 84 ∑= i= 1 y = ,3 s y =,6 68 5 x= 6 sx = 2 cov( x, y ) =,07 rxy =,88 9 0 14 xi y ∑i i= 1 = 5863 14 xi2 556 ∑= i= 1 37
  • 38. Estadística REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. Modelo Estimado ˆ a bx y =+ b =44 a = ,64 2, 53 ˆ 53 y = ,64 +44 x 2, Interpretación de los resultados - Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta. - Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm. 38
  • 39. Estadística REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. niño i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 edad (meses) talla (cm) Talla estimada xi 3 6 5 5 3 4 9 8 9 7 6 5 8 6 yi 55 68 64 66 62 65 74 75 73 69 73 68 73 71 error ˆ yi ei 61,0 68,3 65,8 65,8 61,0 63,4 75,6 73,2 75,6 70,7 68,3 65,8 73,2 68,3 -6,0 -0,3 -1,8 0,2 1,0 1,6 -1,6 1,8 -2,6 -1,7 4,7 2,2 -0,2 2,7 14 (y y 402 ∑ i − i ) 2 = ,86 i= 1 14 14 i= 1 i= 1 (y y ∑ i −ˆ i ) 2 = ei2 = ,7 ∑ 92 Bondad de Ajuste del Modelo R2 = 0,77 De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R2 cercano a 1) 39