1 
Estadística 
Introducción 
¿Qué es la estadística? 
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha 
experimentado un gran desarrollo a lo largo de los últimos años. 
¿En qué áreas se aplica la estadística? 
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, 
Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, 
entre otras. 
Ejemplos de su aplicación son: 
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto 
antes de comercializarlo. 
2) En Economía: para medir la evolución de los precios mediante números índice o para 
estudiar los hábitos de los consumidores a través de encuestas de presupuestos 
familiares.
2 
Estadística 
Introducción 
Ejemplos de su aplicación son: 
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una 
votación mediante sondeos y así orientar las estrategias de los candidatos. 
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de 
actualidad. 
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del 
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un 
cargo en una empresa). 
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado 
de salud de la población. 
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones 
entre variables y hacer predicciones sobre ellas.
3 
Estadística 
Introducción 
Etapas de un estudio estadístico 
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado 
método científico cuyas etapas son: 
1) Planteamiento del problema: consiste en definir el objetivo de la investigación y 
precisar el universo o población. 
2) Recogida de la información: consiste en recolectar los datos necesarios 
relacionados al problema de investigación. 
3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la 
información relevante en el estudio. 
4) Inferencia estadística: consiste en suponer un modelo para toda la población 
partiendo de los datos analizados para obtener conclusiones generales. 
5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos 
han permitido interpretar los datos y llegar a conclusiones sobre la población
4 
Estadística 
Introducción 
Esquema de las etapas de un estudio estadístico 
AREA DE INTERES DDAATTOOSS 
TTeemmaa ddee IInnvveessttiiggaacciióónn 
-AAnntteecceeddeenntteess PPrreevviiooss 
-OObbjjeettiivvooss 
-PPrreegguunnttaass ddee IInnvveessttiiggaacciióónn 
-PPoossiibblleess HHiippóótteessiiss 
-UUnniiddaadd ddee AAnnáálliissiiss 
-PPoobbllaacciióónn 
-VVaarriiaabblleess 
OORRGGAANNIIZZAARR YY 
RREESSUUMMIIRR 
EESSTTAADDÍÍSSTTIICCAA DDEESSCCRRIIPPTTIIVVAA 
(Tablas, 
Gráficos, Medidas 
Descriptivas, etc.) 
INTERPRETACIÓN 
IINNFFEERREENNCCIIAA EESSTTAADDÍÍSSTTIICCAA 
¿PPoobbllaacciióónn oo MMuueessttrraa?? 
PPoobbllaacciióónn 
CONCLUSIONES 
MMuueessttrraa 
PPrroobbaabbiilliiddaadd 
INFORMACIÓN
5 
Estadística 
Introducción 
Ejemplos de algunos problemas a estudiar 
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de 
la persona empleada. 
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones 
económicas y sociales en diferentes comunidades. 
3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a 
vestuario, alimentación, ocio y vivienda. 
4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas. 
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de 
distintas empresas del país. 
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad. 
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una 
Universidad, y si éste tiene alguna relación con su edad u otras características.
Resumen de algunos conceptos planteados en la Introducción 
• VVAARRIIAABBLLEE:: eess lloo qquuee ssee vvaa aa mmeeddiirr yy rreepprreesseennttaa uunnaa ccaarraacctteerrííssttiiccaa ddee llaa UUNNIIDDAADD DDEE AANNÁÁLLIISSIISS.. 
• ¿QQUUIIÉÉNNEESS VVAANN AA SSEERR MMEEDDIIDDOOSS??:: LLooss ssuujjeettooss uu oobbjjeettooss oo UUnniiddaaddeess ddee AAnnáálliissiiss ddee uunnaa 
PPoobbllaacciióónn oo uunnaa MMuueessttrraa 
• PPOOBBLLAACCIIÓÓNN :: EEss eell ttoottaall ddee uunniiddaaddeess ddee aannáálliissiiss qquuee ssoonn tteemmaa ddee eessttuuddiioo.. 
6 
Muestra: 60 trabajadores de empresas de comunicación 
Unidad de análisis: Trabajador de empresa de comunicación 
Variables: sexo, edad, salario, Nº de horas de trabajo, etc. 
PPoobbllaacciióónn:: 
““LLaass ppeerrssoonnaass qquuee 
ttrraabbaajjaann eenn eemmpprreessaass ddee 
ccoommuunniiccaacciióónn”” 
Estadística 
• MMUUEESSTTRRAA:: EEss uunn ccoonnjjuunnttoo ddee uunniiddaaddeess ddee aannáálliissiiss pprroovveenniieenntteess ddee uunnaa ppoobbllaacciióónn.. 
MMuueessttrraa
NNOOMMIINNAALL OORRDDIINNAALL 
FFaavvoorriittoo,, eettcc.. 
CCaarraacctteerrííssttiiccaa oo ccuuaalliiddaadd ccuuyyaass 
ccaatteeggoorrííaass ttiieenneenn uunn oorrddeenn 
7 
VVaarriiaabbllee:: ccoorrrreessppoonnddee aa llaa ccaarraacctteerrííssttiiccaa ddee llaa UUnniiddaadd ddee AAnnáálliissiiss 
TTIIPPOOSS DDEE VVAARRIIAABBLLEESS 
VVaarriiaabblleess CCuuaannttiittaattiivvaass 
IInntteerrvvaalloo 
DDIISSCCRREETTAA 
VVaarriiaabblleess CCuuaalliittaattiivvaass 
CCOONNTTIINNUUAA 
TToommaa vvaalloorreess eenntteerrooss 
EEjjeemmppllooss:: NNúúmmeerroo ddee HHiijjooss,, NNúúmmeerroo ddee 
eemmpplleeaaddooss ddee uunnaa eemmpprreessaa,, NNúúmmeerroo ddee 
aassiiggnnaattuurraass aapprroobbaaddaass eenn uunn sseemmeessttrree,, eettcc.. 
TToommaa ccuuaallqquuiieerr vvaalloorr ddeennttrroo ddee uunn iinntteerrvvaalloo 
EEjjeemmppllooss:: PPeessoo;; EEssttaattuurraa;; TTeemmppeerraattuurraa,, eettcc.. 
CCaarraacctteerrííssttiiccaa oo ccuuaalliiddaadd 
ccuuyyaass ccaatteeggoorrííaass nnoo ttiieenneenn 
uunn oorrddeenn pprreeeessttaabblleecciiddoo.. 
EEjjeemmppllooss:: SSeexxoo,, DDeeppoorrttee 
UUnniiddaadd ddee MMeeddiiddaa:: GGrraammooss oo KKiillooss ppaarraa llaa vvaarriiaabbllee PPeessoo;; GGrraaddooss CC oo FF ppaarraa TTeemmppeerraattuurraa 
pprreeeessttaabblleecciiddoo.. 
EEjjeemmppllooss:: CCaalliiffiiccaacciióónn ((SS,, NN,, AA));; 
GGrraaddoo ddee IInntteerrééss ppoorr uunn tteemmaa,, eettcc.. 
Estadística
FFrreeccuueenncciiaa:: ddeessddee uunn ccoonnjjuunnttoo ddee uunniiddaaddeess,, ccoorrrreessppoonnddee aall NNúúmmeerroo oo PPoorrcceennttaajjee ddee vveecceess qquuee ssee 
NNOOMMIINNAALL CCOONNTTIINNUUAA 
DDIISSCCRREETTAA 
OORRDDIINNAALL 
FFrreeccuueenncciiaa AAbbssoolluuttaa ((FF)) FFrreeccuueenncciiaa RReellaattiivvaa ((ff)) 
FFrreeccuueenncciiaa AAbbssoolluuttaa 
AAccuummuullaaddaa ((FFAAAA)) 
8 
pprreesseennttaa uunnaa ccaarraacctteerrííssttiiccaa.. 
CCOONNTTIINNUUAA 
DDIISSCCRREETTAA 
NNOOMMIINNAALL 
OORRDDIINNAALL 
TTIIPPOO FFRREECCUUEENNCCIIAA 
FFrreeccuueenncciiaa RReellaattiivvaa 
AAccuummuullaaddaa ((ffrraa)) 
VVaarriiaabbllee 
CCuuaannttiittaattiivvaa 
VVaarriiaabbllee 
CCuuaalliittaattiivvaa 
VVaarriiaabbllee 
CCuuaannttiittaattiivvaa 
VVaarriiaabbllee 
CCuuaalliittaattiivvaa 
Estadística
9 
PPrroobblleemmaa ddee IInnvveessttiiggaacciióónn:: SSee qquuiieerree eessttaabblleecceerr eell ppeerrffiill ddee llaass iinndduussttrriiaass 
ddee ccoonnsseerrvvaa eenn ffuunncciióónn ddee aallgguunnaass ccaarraacctteerrííssttiiccaass.. 
UUnniiddaadd ddee AAnnáálliissiiss:: IInndduussttrriiaa ddee CCoonnsseerrvvaa 
PPoobbllaacciióónn:: IInndduussttrriiaass ddee CCoonnsseerrvvaass ddeell ppaaííss 
VVaarriiaabblleess 
-- TTiippoo ddee IInndduussttrriiaa:: ssee ccllaassiiffiiccaa eenn iinndduussttrriiaa ttiippoo AA,, BB,, CC oo DD.. ((ccuuaalliittaattiivvaa nnoommiinnaall)) 
-- NNº ddee EEmmpplleeaaddooss:: ssee rreeffiieerree aall nnúúmmeerroo ddee eemmpplleeaaddooss eenn llaass llíínneeaass ddee pprroodduucccciióónn.. ((ccuuaannttiittaattiivvaa 
ddiissccrreettaa)) 
-- SSuuppeerrffiicciiee:: ssee rreeffiieerree aa llooss mmeettrrooss ccuuaaddrraaddooss ((uunniiddaadd ddee mmeeddiiddaa)) ddiissppoonniibblleess ppaarraa llaass áárreeaass ddee 
pprroodduucccciióónn.. ((ccuuaannttiittaattiivvaa ccoonnttiinnuuaa)) 
-- CCaalliiffiiccaacciióónn:: ccaalliiffiiccaacciióónn rreeaalliizzaaddaa ppoorr uunnaa iinnssttiittuucciióónn ppúúbblliiccaa ssoobbrree ccuummpplliimmiieennttoo ddee cciieerrttooss 
eessttáánnddaarreess ((MMuuyy BBiieenn,, BBiieenn,, RReegguullaarr,, MMaall)).. ((ccuuaalliittaattiivvaa oorrddiinnaall)) 
DDaattooss 
Industria nº Tipo Nº Empleados Superficie Calificación 
1 A 100 1000,6 Muy Bien 
2 B 150 1200,4 Bien 
... 
... 
... 
... 
... 
299 D 250 800,3 Mal 
300 C 300 4000,2 Regular 
EEJJEEMMPPLLOO 
Estadística
Estadística 
PPrroobblleemmaa ddee IInnvveessttiiggaacciióónn:: SSee qquuiieerree eessttaabblleecceerr eell ppeerrffiill ddee llaass iinndduussttrriiaass ddee ccoonnsseerrvvaa eenn 
10 
EEJJEEMMPPLLOO 
TTAABBLLAASS DDEE 
FFRREECCUUEENNCCIIAA 
Tipo de 
Industria 
Frecuencia 
Absoluta (Fj) 
Frecuencia 
Relativa (fj) 
Porcentaje 
(%) 
A 
B 
C 
D 
Total 300 1 100 
Calificación 
Frec. 
Absoluta (Fj) 
Frec.Relativa 
(fj) o % 
Frec. Absol. 
Acum. (FAAj) 
Frec. Relat. 
Acum. (fraj) o % 
Muy Bien 
Bien 
Regular 
Mal 300 1 (o 100) 
Total 300 1 (o 100) 
Numero de 
Empleados 
Frec. 
Absoluta (Fj) 
Frec.Relativa 
(fj) o % 
Frec. Absol. 
Acum. (FAAj) 
Frec. Relat. 
Acum. (fraj) o % 
<100 
[100-150[ 
.. 
[950-1000] 300 1 (o 100%) 
Total 300 1 (o 100%) Superficie 
(mt2) 
Frec. 
Absoluta (Fj) 
Frec.Relativa 
(fj) o % 
Frec. Absol. 
Acum. (FAAj) 
Frec. Relat. 
Acum. (fraj) o % 
<200 
[200-400[ 
.. 
[50000-5200] 300 1 (o 100%) 
Total 300 1 (o 100%) 
((11)) 
((22)) 
((33)) 
((44)) 
ffuunncciióónn ddee aallgguunnaass ccaarraacctteerrííssttiiccaass.. 
UUnniiddaadd ddee AAnnáálliissiiss:: IInndduussttrriiaa ddee CCoonnsseerrvvaa 
PPoobbllaacciióónn:: IInndduussttrriiaass ddee CCoonnsseerrvvaass ddeell ppaaííss
11 
Estadística 
Elementos de una tabla de frecuencia ccuuaannddoo llaa vvaarriiaabbllee eess ccoonnttiinnuuaa ((xx)) 
Intervalo 
Centro 
de clase Amplitud F f FAA fra 
I1 c1 a1 
I2 c2 a2 
. 
. 
Ik ck ak n 1 
Total n 1 
[LI1 ; LS1 [ 
[LI2 ; LS2 [ 
[LIk ; LSk] 
aj = (LSj – LIj)c ) j = (LIj) + LSj )/2
Estadística 
Ejercicio: confección de una tabla de frecuencia para uunnaa vvaarriiaabbllee ccoonnttiinnuuaa 
12 
LLooss ddaattooss ccoorrrreessppoonnddeenn aa llaa eeddaadd ddee llooss 
hhiijjooss ddee llooss ttrraabbaajjaaddoorreess ddee uunnaa eemmpprreessaa 
10,5 10,7 9,5 10,5 11,8 11,2 
12,0 10,3 13,5 12,3 10,6 9,8 
10,7 11,5 11,1 10,6 9,3 12,9 
10,4 7,5 10,2 8,7 10,9 9,9 
11,7 10,3 10,6 10,5 11,9 11,0 
13,9 10,6 10,0 10,8 10,6 - 
7,3 8,0 8,5 12,5 9,7 - 
DDaattooss oorrddeennaaddooss ddee mmeennoorr aa mmaayyoorr 
7,3 9,7 10,4 10,6 11,1 12,3 
7,5 9,8 10,5 10,6 11,2 12,5 
8,0 9,9 10,5 10,7 11,5 12,9 
8,5 10,0 10,5 10,7 11,7 13,5 
8,7 10,2 10,6 10,8 11,8 13,9 
9,3 10,3 10,6 10,9 11,9 - 
9,5 10,3 10,6 11,0 12,0 - 
RReeaalliiccee llaa ssiigguuiieennttee aaccttiivviiddaadd 
11)) CCoonnssttrruuyyaa uunn DDiiaaggrraammaa ddee TTaalllloo yy HHoojjaa 
22)) ¿CCuuááll eess llaa vvaarriiaabbllee??;; ¿CCuuááll eess llaa UUnniiddaadd ddee 
aannáálliissiiss??;; ¿CCuuáánnttoo vvaallee nn??;; ¿CCuuááll eess eell rraannggoo 
ddee llaa vvaarriiaabbllee??.. 
33)) SSoobbrree uunnaa TTaabbllaa ddee ffrreeccuueenncciiaa:: ¿CCuuáánnttooss 
iinntteerrvvaallooss ppooddrrííaa ccoonnssttrruuiirr??;; ¿CCuuááll eess llaa 
aammpplliittuudd ddee ccaaddaa iinntteerrvvaalloo??;; ¿CCuuáánnttaass 
mmeeddiiddaass ddee ffrreeccuueenncciiaa ppuueeddee oobbtteenneerr ppaarraa 
ccaaddaa iinntteerrvvaalloo??.. 
44)) CCoonnssttrruuiirr ttaabbllaa ddee ffrreeccuueenncciiaa ppaarraa llaa 
vvaarriiaabbllee:: IInntteerrvvaallooss,, cceennttrroo ddee ccllaassee,, 
aammpplliittuudd,, ffrreeccuueenncciiaass.. 
Diagrama de Tallo y Hoja: permite organizar los 
datos de una variable medida sobre un conjunto de 
individuos. Su utilidad viene dada cuando no 
contamos con herramientas automáticas para ordenar 
los datos.
13 
TTIIPPOOSS DDEE GGRRÁÁFFIICCOOSS 11.. GGrrááffiiccoo ddee SSeeccttoorreess CCiirrccuullaarreess ((ddee TToorrttaa)) 
Distribución de las unidades de análisis de 
acuerdo a variable 1 
A 
20% 
D 
10% 
C 
40% 
B 
30% 
Distribución de las unidades de 
análisis de acuerdo a variable 1 
B 
30% 
C 
40% 
D 
10% A 
20% 
Distribución de las unidades de 
análisis de acuerdo a variable 1 
B 
30% 
C 
40% 
D 
10% 
A 
20% 
Estadística
14 
Estadística 
TTIIPPOOSS DDEE GGRRÁÁFFIICCOOSS 22.. GGrrááffiiccoo ddee BBaarrrraass 
Numero de unidades de análisis 
de acuerdo a variable 1 
500 
400 
300 
200 
100 
0 
A B C D 
variable 1 
Nº 
Porcentaje de unidad de análisis de acuerdo a 
variable 1 
0 20 40 60 80 100 
D 
C 
B 
A 
variable 1 
% unidad de análisis 
Proporción de unidad de análisis de acuerdo a 
variable 1 
0 0,2 0,4 0,6 0,8 1 
D 
C 
B 
A 
variable 1 
Proporción de unidad de análisis 
-EEssttee ttiippoo ddee ggrrááffiiccoo ssee uuttiilliizzaa ggeenneerraallmmeennttee ppaarraa 
rreepprreesseennttaarr llaa ffrreeccuueenncciiaa ddee llaass ccaatteeggoorrííaass ddee uunnaa 
vvaarriiaabbllee ccuuaalliittaattiivvaa.. 
-CCuuaannddoo uunnaa vvaarriiaabbllee eess ccuuaannttiittaattiivvaa ssee ppuueeddee uuttiilliizzaarr 
eessttee ttiippoo ddee ggrrááffiiccoo ssóólloo ssii llaa vvaarriiaabbllee ssee hhaa 
ttrraannssffoorrmmaaddaa eenn ccaatteeggoorrííaass.. 
-HHaayy ddiissttiinnttaass vveerrssiioonneess ddee eessttooss ggrrááffiiccooss ((ppoorr eejjeemmpplloo 
eenn EExxcceell)),, yy eenn aallgguunnooss ccaassooss ssoonn mmuuyy úúttiilleess ppaarraa 
ddeessccrriibbiirr eell ccoommppoorrttaammiieennttoo ddee uunnaa vvaarriiaabbllee eenn ddiissttiinnttooss 
ggrruuppooss..
15 
HHiissttooggrraammaa 
-- PPeerrmmiittee llaa rreepprreesseennttaacciióónn ddee 
llaa ffrreeccuueenncciiaa ddee uunnaa vvaarriiaabbllee 
CCuuaannttiittaattiivvaa.. 
- EEll eejjee xx ssee rreeffiieerree aa llaa 
vvaarriiaabbllee.. 
- EEll eejjee yy ssee rreeffiieerree aa llaa 
ffrreeccuueenncciiaa ((NNº ,, %%)).. 
- CCaaddaa bbaarrrraa rreepprreesseennttaa llaa 
ffrreeccuueenncciiaa ddee llaa vvaarriiaabbllee eenn llaa 
ppoobbllaacciióónn eenn eessttuuddiioo ((oo llaa 
mmuueessttrraa)).. 
-EEll hhiissttooggrraammaa ssee ppuueeddee 
ccoonnssttrruuiirr ddeessddee llooss ddaattooss ddee llaa 
ttaabbllaa ddee ffrreeccuueenncciiaa ddee llaa 
vvaarriiaabbllee eenn eessttuuddiioo.. 
TTIIPPOOSS DDEE GGRRÁÁFFIICCOOSS 33.. HHiissttooggrraammaa 
HHiissttooggrraammaa 
DDiissttrriibbuucciióónn ddee llooss hhiijjooss ddee ttrraabbaajjaaddoorreess 
ddee llaa eemmpprreessaa ddee aaccuueerrddoo aa eeddaadd 
7 8 9 10 11 12 13 14 
15 
10 
5 
0 
edad 
FrecuNNenºcia 
eeddaadd 
EEjjeemmpplloo 
EEnn eell ggrrááffiiccoo ssee ppuueeddee oobbsseerrvvaarr eell nnúúmmeerroo ddee 
hhiijjooss ,, ddee mmeennoorr eeddaadd ((77--88 aaññooss)),, llaass ddee mmaayyoorr 
eeddaadd ((113--114 aaññooss));; yy aaddeemmááss qquuee llaa mmaayyoorrííaa ddee 
hhiijjooss ddee llooss ttrraabbaajjaaddoorreess eessttáánn eennttrree llooss 1100 yy 1122 
aaññooss.. 
Estadística
16 
TTIIPPOOSS DDEE GGRRÁÁFFIICCOOSS 55.. PPoollííggoonnoo ddee FFrreeccuueenncciiaa 
eeddaadd 
7 8 9 10 11 12 13 14 
15 
10 
5 
0 
edad 
FrecNNuºencia 
DDiissttrriibbuucciióónn ddee llooss hhiijjooss ddee ttrraabbaajjaaddoorreess 
ddee llaa eemmpprreessaa ddee aaccuueerrddoo aa eeddaadd -EEssttaa rreepprreesseennttaacciióónn ssee bbaassaa eenn 
eell HHiissttooggrraammaa.. 
-SSóólloo eess úúttiill ppaarraa vvaarriiaabblleess 
ccuuaannttiittaattiivvaass.. 
-EEll eejjee xx ssee rreeffiieerree aa llaa 
vvaarriiaabbllee.. 
- EEll eejjee yy ssee rreeffiieerree aa llaa 
ffrreeccuueenncciiaa ((NNº ,, %%)).. 
-LLooss ppuunnttooss qquuee ppeerrmmiitteenn llaa 
uunniióónn ddee llaass llíínneeaass rreepprreesseennttaa 
eell cceennttrroo ddee ccllaassee ((oo mmaarrccaa ddee 
ccllaassee)).. 
Estadística
17 
Estadística 
TTIIPPOOSS DDEE GGRRÁÁFFIICCOOSS 55.. DDiiaaggrraammaa ddee CCaajjaa 
- PPeerrmmiittee iiddeennttiiffiiccaarr ggrrááffiiccaammeennttee llaa 
mmeeddiiaannaa,, llooss ccuuaarrttiilleess 11 yy 3 
((ppeerrcceennttiilleess 2255 yy 7755)),, mmíínniimmoo yy 
mmááxxiimmoo ddee uunnaa vvaarriiaabbllee.. 
- SSóólloo eess úúttiill ppaarraa vvaarriiaabblleess 
ccuuaannttiittaattiivvaass.. 
-EEll eejjee xx ppeerrmmiittee iiddeennttiiffiiccaarr llaa 
ppoobbllaacciioonn eenn eessttuuddiioo.. 
- EEll eejjee yy rreepprreesseennttaa llooss vvaalloorreess ddee llaa 
vvaarriiaabbllee eenn eessttuuddiioo.. 
N = 584 1473 
Mujeres Hombres 
Edad 
100 
90 
80 
70 
60 
50 
40 
30 
20 
10 
0 
EEddaadd ddee llaass ppeerrssoonnaass qquuee ssee rreeaalliizzaarroonn 
aannggiiooppllaassttííaa eennttrree 1199880 yy 22000
18 
TTIIPPOOSS DDEE GGRRÁÁFFIICCOOSS 66.. OOttrrooss 
Número de alumnos matriculados en la 
Carrera A según año de ingreso 
100 
80 
60 
40 
20 
0 
1998 1999 2000 2001 2002 2003 
año de ingreso 
Nº de alumnos 
Número de alumnos matriculados en la 
Carrera B según año de ingreso 
100 
80 
60 
40 
20 
0 
1998 1999 2000 2001 2002 2003 
año de ingreso 
Nº de alumnos 
Número de alumnos matriculados en las Carreras 
según año de ingreso 
200 
150 
100 
50 
0 
1998 1999 2000 2001 2002 2003 
año ingreso 
Nº de alumnos 
Carrera B 
Carrera A 
Nº de alumnos 
año de ingreso Carrera A Carrera B 
1998 60 80 
1999 55 70 
2000 80 50 
2001 40 60 
2002 68 50 
2003 70 75 
Estadística
Estadística 
NNOOTTAACCIIOONN 
y = variable = valor de la variable en el individuo i i y 
i x x x + + = å= 
19 
Variables Cuantitativas 
x = variable = valor de la variable en el individuo i i x 
OOBBSSEERRVVAACCIIOONNEESS 
i = 1,...,n 
** EEll TTiippoo ddee GGrrááffiiccoo sseelleecccciioonnaaddoo vvaa aa ddeeppeennddeerr ddee llaa vvaarriiaabbllee eenn eessttuuddiioo.. 
** EEll GGrrááffiiccoo ddeebbee ccoonntteenneerr uunn TTííttuulloo GGeenneerraall yy llaa iiddeennttiiffiiccaacciióónn ddee ccaaddaa eejjee 
((vvaarriiaabbllee eenn eessttuuddiioo yy ffrreeccuueenncciiaa)).. 
** EEnn ooccaassiioonneess rreessuullttaa mmááss iilluussttrraattiivvoo uunn ggrrááffiiccoo qquuee uunnaa ttaabbllaa ddee 
ffrreeccuueenncciiaa.. 
** AAll iigguuaall qquuee llaass ttaabbllaass,, llooss ggrrááffiiccooss ddeebbeenn sseerr aauuttoo--eexxpplliiccaattiivvooss.. 
= + + = å= 
c c c nc 
n 
i 
 
1 
a,b,c : constantes 
å = + + = 
å 
= = 
n 
n i 
i 
n 
i 
i cx cx cx c x 
1 
1 
1 
 
n 
i å + = + + + + = å + 
= =1 
ax b ax b ax b a x b 
n i 
i 
n 
i 
1 
1 
( ) ( )  ( ) 
2 2 
1 
1 
2 
n 
n 
i 
 
2 
n 
i x x x + + = å= 
( ) ( ) 1 
n 
2 
1 
i 
 
i i y x y x y x + + + + = + å= 
( ) ( ) ( ) 1 1 
n n 
1 
n 
i 
 
i i y x y x y x + + = å= 
( ) ( ) ( ) 1 1 
n n 
1 
n 
i 

20 
D MEDIDAS DEE TTEENNDDEENNCCIIAA CCEENNTTRRAALL 
-MMeeddiiaa AArriittmmééttiiccaa ((PPrroommeeddiioo)) 
-MMeeddiiaannaa 
-MMooddaa 
DDaattooss CCuuaannttiittaattiivvooss 
MMeeddiiaa AArriittmmééttiiccaa oo PPrroommeeddiioo 
x 
i = å= 1 
n 
x 
n 
i 
DDaattooss CCuuaannttiittaattiivvooss oorrddeennaaddooss ddee mmeennoorr aa mmaayyoorr 
MMeeddiiaannaa 
E ( ) M k = x 
SSii nn eess iimmppaarr 
= k k x x 
M ( ) ( 1) 
2 
E 
+ + 
x 
1 x 
2 x 
 
n x 
x 
(1) x 
(2) x 
 
(n) x 
SSii nn eess ppaarr 
dato del centro ( ) = k x 
DDaattooss MMooddaa 
M "el dato que más se repite" o = 
CCuuaalliittaattiivvooss yy CCuuaannttiittaattiivvooss 
Estadística
21 
Estadística 
PPeerrcceennttiilleess,, DDeecciilleess oo CCuuaarrttiilleess 
-PPeerrcceennttiill ((eejjeemmpplloo:: 2255,, 5500,, 7755)) 
-DDeecciill ((eejjeemmpplloo:: 44,, 55,, 88)) 
-CCuuaarrttiill ((eejjeemmpplloo:: 11,, 22,, 33)) 
PPeerrcceennttiill,, DDeecciill oo CCuuaarrttiill:: ccoorrrreessppoonnddee aall vvaalloorr qquuee ttoommaa llaa vvaarriiaabbllee ((ccuuaannttiittaattiivvaa)),, ccuuaannddoo llooss 
nn ddaattooss eessttáánn oorrddeennaaddooss ddee MMeennoorr aa MMaayyoorr 
EEll PPeerrcceennttiill vvaa ddee 11 aa 110000 
EEll ppeerrcceennttiill 2255 ((2255//110000)):: eess eell vvaalloorr ddee llaa vvaarriiaabbllee qquuee rreeúúnnee aall mmeennooss eell 2255%% ddee llooss ddaattooss 
EEjjeemmpplloo:: SSii NN==8800,, eell 2255%% ddee 8800 eess 2200;; ppoorr lloo ttaannttoo,, ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 2200.. 
SSii NN==8855,, eell 2255%% ddee 8855 eess 2211,,2255;; ppoorr lloo ttaannttoo ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 2222.. 
EEll DDeecciill vvaa ddee 11 aa 1100 
EEll DDeecciill 44 ((44//1100)):: eess eell vvaalloorr ddee llaa vvaarriiaabbllee qquuee rreeúúnnee aall mmeennooss eell 4400%% ddee llooss ddaattooss 
EEjjeemmpplloo:: SSii NN==8800,, eell 4400%% ddee 8800 eess 3322;; ppoorr lloo ttaannttoo,, ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 3322.. 
SSii NN==8855,, eell 4400%% ddee 8855 eess 3344;; ppoorr lloo ttaannttoo ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 3344.. 
EEll CCuuaarrttiill vvaa ddee 11 aa 44 
EEll CCuuaarrttiill 33 ((33//44)):: eess eell vvaalloorr ddee llaa vvaarriiaabbllee qquuee rreeúúnnee aall mmeennooss eell 7755%% ddee llooss ddaattooss 
EEjjeemmpplloo:: SSii NN==8800,, eell 7755%% ddee 8800 eess 6600;; ppoorr lloo ttaannttoo,, ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 6600.. 
SSii NN==8855,, eell 7755%% ddee 8855 eess 6633,,7755;; ppoorr lloo ttaannttoo ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 6644..
( ) 1 ( x 
) 
å å å 
i i 
n 
1 1 2 
22 
MMEEDDIIDDAASS DDEE DDIISSPPEERRSSIIÓÓNN 
-RRaannggoo 
-VVaarriiaannzzaa 
-DDeessvviiaacciióónn EEssttáánnddaarr 
RRaannggoo 
VVaarriiaannzzaa 
DDaattooss CCuuaannttiittaattiivvooss 
x 
1 x 
2 x 
 
n x 
max( ) min( ) i i R = x - x 
x x 
CCooeeffiicciieennttee ddee VVaarriiaacciióónn Comparación entre Variables 
SSee rreeffiieerree aall ccoommppoorrttaammiieennttoo ddee llaass vvaarriiaabblleess ccuuaannttiittaattiivvaass eenn 
uunn ggrruuppoo.. PPoorr eejjeemmpplloo:: SSii ssee ttiieennee uunn ccoonnjjuunnttoo ddee ppeerrssoonnaass aa llaass 
qquuee ssee lleess mmiiddee EEssttaattuurraa,, PPeessoo,, EEddaadd:: EEnnttrree eessttaass vvaarriiaabblleess ¿ccuuááll 
pprreesseennttaa mmaayyoorr vvaarriiaacciióónn?? 
DDeessvviiaacciióónn TTííppiiccaa oo EEssttáánnddaarr 
2 
1 
2 2 
1 
2 
2 1 
x x 
n n 
x 
n 
s 
n 
i 
i 
n 
i 
n 
i 
n 
i 
i 
= - 
- 
= 
- 
= å 
= 
= = = 
s = s2 
cv = s 
x 
Estadística
23 
Estadística 
OOttrraass mmeeddiiddaass oo CCooeeffiicciieenntteess 
-AAssiimmeettrrííaa 
-KKuurrttoossiiss oo AAppuunnttaammiieennttoo 
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias 
es la simetría y el apuntamiento o kurtosis. 
n 
å= 
1 
( x x 
)3 
n s 
CA 
i 
i 
× 
- 
= 
Coeficiente de Asimetría 3 
Si CA=0 si la distribución es simétrica alrededor de la media. 
Si CA<0 si la distribución es asimétrica a la izquierda 
Si CA>0 si la distribución es asimétrica a la derecha 
n 
å= 
1 
( x x 
)4 
n s 
CAp 
i 
i 
× 
- 
= 
Coeficiente de Apuntamiento 4 
- Si CAp=0 la distribución se dice normal (similar 
a la distribución normal de Gauss) y recibe el 
nombre de mesocúrtica. 
- Si CAp>0, la distribución es más puntiaguda que 
la anterior y se llama leptocúrtica, (mayor 
concentración de los datos en torno a la media). 
- Si CAp<0 la distribución es más plana y se 
llama platicúrtica.
24 
Estadística 
OOttrraass mmeeddiiddaass oo CCooeeffiicciieenntteess 
-AAssiimmeettrrííaa 
-KKuurrttoossiiss oo AAppuunnttaammiieennttoo 
Ejemplos Histogramas con distinta asimetría y apuntamiento 
1,0 2,0 3,0 4,0 5,0 6,0 7,0 
V2 
14 
12 
10 
8 
6 
4 
2 
0 
Desv. típ. = 1,67 
Media = 3,9 
N = 30,00 
-1,0 0,0 1,0 2,0 
V4 
30 
20 
10 
0 
Desv. típ. = ,64 
Media = 0,0 
N = 30,00 
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 
V5 
6 
5 
4 
3 
2 
1 
0 
Desv. típ. = 2,42 
Media = 5,2 
N = 28,00
25 
Estadística 
OOttrraass mmeeddiiddaass oo CCooeeffiicciieenntteess 
-AAssiimmeettrrííaa 
-KKuurrttoossiiss oo AAppuunnttaammiieennttoo 
Ejemplos 
Datos Histograma Medidas descriptivas 
Media 3,9 
Mediana 4 
Moda 4 
Desviación estándar 1,67 
Varianza de la muestra 2,78 
kurtosis -0,43 
Coeficiente de asimetría -0,02 
Rango 6 
Mínimo 1 
Máximo 7 
Cuenta 30 
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 
V1 
16 
14 
12 
10 
8 
6 
4 
2 
0 
Desv. típ. = 1,77 
Media = 5,4 
N = 66,00 
1 4 4 
1 4 4 
1 4 5 
2 4 5 
2 4 6 
2 4 6 
2 4 6 
3 4 6 
3 4 7 
4 4 7
26 
Estadística 
Media, Desviación típica, Coeficientes ddee AAssiimmeettrrííaa yy AAppuunnttaammiieennttoo 
ppaarraa ddaattooss AAggrruuppaaddooss ((ttaabbllaa ddee ffrreeccuueenncciiaass)) 
TTaabbllaa ddee ffrreeccuueenncciiaa ((ppaarraa vvaarriiaabbllee ccuuaannttiittaattiivvaa)) 
Intervalo 
Centro 
de clase Amplitud F f FAA fra 
f1 
f2 
I1 c1 a1 
I2 c2 a2 
. 
. 
    
Ik ck ak fk 
n 1 
Total n 1 
n1 
n2 
nk 
Sea cj la marca de clase (o centro de clase) y fj la 
frecuencia relativa de la clase j, donde j=1, 2,…, k. 
1) La Media para datos agrupados es igual a 
la suma de los productos de las marcas de 
clase por sus frecuencias relativas, de la forma: 
å= 
Media = x = 
c f 
c c j j k 
j 
1 
2) LLaa DDeessvviiaacciióónn ttííppiiccaa ppaarraa ddaattooss 
aaggrruuppaaddooss eessttaa ddaaddaa ppoorr:: 
k 
å= 
s = c - 
x f 
c j c j j 
1 
( )2 
3) EEll CCooeeffiicciieennttee ddee AAssiimmeettrrííaa ppaarraa 
ddaattooss aaggrruuppaaddooss eessttaa ddaaddoo ppoorr:: 
c - 
x f 
3 
å= 
1 
( )3 
c 
k 
j 
j c j 
CA 
= 
c s 
4) EEll CCooeeffiicciieennttee ddee aappuunnttaammiieennttoo ppaarraa 
ddaattooss aaggrruuppaaddooss eessttaa ddaaddaa ppoorr:: 
c x f 
4 
1 
( )4 
c 
k 
j 
j c j 
c s 
CAp 
å= 
- 
=
27 
Estadística 
Descripción ddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass 
DDiissttrriibbuucciióónn ccoonnjjuunnttaa 
Tabla 1 Actividad 
Transporte Estudia Pensionado Trabaja 
Autobus 5 7 0 
Bicicleta 3 3 2 
Caminar 2 5 2 
Coche 5 4 5 
Metro 6 7 4 
Transporte Nº % 
Autobus 12 20,0 
Bicicleta 8 13,3 
Caminar 9 15,0 
Coche 14 23,3 
Metro 17 28,3 
TOTAL 60 100 
Actividad Nº % 
Estudia 21 35,0 
Pensionado 26 43,3 
Trabaja 13 21,7 
TOTAL 60 100 
Problema 
Interesa estudiar cual es el 
principal medio de transporte 
preferido por un grupo de 
personas a la hora de dirigirse 
al centro comercial. 
PPaarraa eessttoo ssee ccoonnssuullttóó aa ccaaddaa 
ppeerrssoonnaa ssoobbrree llaa aaccttiivviiddaadd aa 
llaa qquuee ssee ddeeddiiccaabbaa yy eell mmeeddiioo 
ddee ttrraannssppoorrttee pprreeffeerriiddoo..
28 
Estadística 
Descripción ddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass 
DDiissttrriibbuucciióónn ccoonnjjuunnttaa 
NNº ddee ppeerrssoonnaass 
Tabla 2 Actividad 
Transporte Estudia Pensionado Trabaja TOTAL 
Autobus 5 7 0 12 
Bicicleta 3 3 2 8 
Caminar 2 5 2 9 
Coche 5 4 5 14 
Metro 6 7 4 17 
TOTAL 21 26 13 60 
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
29 
Estadística 
Descripción ddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass 
DDiissttrriibbuucciióónn ccoonnjjuunnttaa 
NNº ddee ppeerrssoonnaass yy %% rreessppeeccttoo ddee ttiippoo ddee TTrraannssppoorrttee 
Tabla 3 Actividad 
Transporte Estudia Pensionado Trabaja TOTAL 
Autobus 5 7 0 12 
% 41,7 58,3 0 100 
Bicicleta 3 3 2 8 
% 37,5 37,5 25 100 
Caminar 2 5 2 9 
% 22,2 55,6 22,2 100 
Coche 5 4 5 14 
% 35,7 28,6 35,7 100 
Metro 6 7 4 17 
% 35,3 41,2 23,5 100 
TOTAL 21 26 13 60 
% 35 43,3 21,7 100
30 
Estadística 
Descripción ddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass 
DDiissttrriibbuucciióónn ccoonnjjuunnttaa 
NNº ddee ppeerrssoonnaass yy %% rreessppeeccttoo ddee ttiippoo ddee AAccttiivviiddaadd 
Tabla 4 Actividad 
Transporte Estudia Pensionado Trabaja TOTAL 
Autobus 5 7 0 12 
% 23,8 26,9 0 20 
Bicicleta 3 3 2 8 
% 14,3 11,5 15,4 13,3 
Caminar 2 5 2 9 
% 9,5 19,2 15,4 15 
Coche 5 4 5 14 
% 23,8 15,4 38,5 23,3 
Metro 6 7 4 17 
% 28,6 26,9 30,8 28,3 
TOTAL 21 26 13 60 
% 100 100 100 100
31 
Estadística 
MEDIDAS DDEE AASSOOCCIIAACCIIÓÓNN LLIINNEEAALL 
- CCoovvaarriiaannzzaa 
- CCoorrrreellaacciióónn 
x 
1 x 
2 x 
 
n x 
DDaattooss 
CCuuaannttiittaattiivvooss 
CCoovvaarriiaannzzaa:: 
RReeccoorrddeemmooss qquuee:: HHaassttaa aahhoorraa hheemmooss eessttuuddiiaaddoo llaass mmeeddiiddaass tteennddeenncciiaa 
cceennttrraall ((MMeeddiiaa,, MMeeddiiaannaa,, MMooddaa)) yy ddiissppeerrssiióónn 
((VVaarriiaannzzaa yy DDeessvviiaacciióónn EEssttáánnddaarr)) ppaarraa uunnaa 
VVaarriiaabbllee CCuuaannttiittaattiivvaa ((xx)).. 
EEss uunnaa mmeeddiiddaa ddee VVaarriiaabbiilliiddaadd CCoonnjjuunnttaa eennttrree ddooss vvaarriiaabblleess ((xx11 ,, xx22)) oo bbiieenn ((xx ,, yy)) 
x y 
(1) x y(1) 
(2) x y( 2 ) 
  
(n) x y( n ) 
n 
å= 
( xi x )( yi y ) 
1 
= - - 
i 
n 
cov( x, y ) 
1 
SSii CCoovv((xx,,yy)) eess ppoossiittiivvaa:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess ddiirreeccttaammeennttee pprrooppoorrcciioonnaall,, 
eess ddeecciirr qquuee ccuuaannddoo xx aauummeennttaa yy ttaammbbiiéénn aauummeennttaa;; yy vviicceevveerrssaa.. 
SSii CCoovv((xx,,yy)) eess nneeggaattiivvaa:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess iinnvveerrssaammeennttee 
pprrooppoorrcciioonnaall,, eess ddeecciirr qquuee ccuuaannddoo xx aauummeennttaa yy ddiissmmiinnuuyyee;; yy vviicceevveerrssaa.. 
SSii CCoovv((xx,,yy)) eess cceerroo:: nnoo eexxiissttee aassoocciiaacciióónn eennttrree xx ee yy..
32 
Estadística 
MEDIDAS DDEE AASSOOCCIIAACCIIÓÓNN LLIINNEEAALL 
- CCoovvaarriiaannzzaa 
- CCoorrrreellaacciióónn 
DDaattooss 
CCuuaannttiittaattiivvooss 
SSee rreeffiieerree aall ggrraaddoo ddee aassoocciiaacciióónn eennttrree ddooss vvaarriiaabblleess ((xx11 ,, xx22)) oo bbiieenn ((xx ,, yy)) 
CCooeeffiicciieennttee ddee CCoorrrreellaacciióónn ddee PPeeaarrssoonn ((rr)):: MMiiddee eell ggrraaddoo ddee AAssoocciiaacciióónn LLiinneeaall 
eennttrree ddooss vvaarriiaabblleess CCuuaannttiittaattiivvaass 
x y 
(1) x y(1) 
(2) x y( 2 ) 
  
(n) x y( n ) 
r = cov( x, y ) 
x y nxy 
SSii rr eess ppoossiittiivvoo:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess ddiirreeccttaammeennttee pprrooppoorrcciioonnaall,, eess ddeecciirr qquuee 
ccuuaannddoo xx aauummeennttaa yy ttaammbbiiéénn aauummeennttaa;; yy vviicceevveerrssaa.. SSii rr==11:: llaa aassoocciiaacciióónn lliinneeaall eess 
ppeerrffeeccttaa.. 
SSii rr eess nneeggaattiivvoo:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess iinnvveerrssaammeennttee pprrooppoorrcciioonnaall,, eess ddeecciirr 
qquuee ccuuaannddoo xx aauummeennttaa yy ddiissmmiinnuuyyee;; yy vviicceevveerrssaa.. SSii rr==--11:: llaa aassoocciiaacciióónn lliinneeaall eess 
ppeerrffeeccttaa.. 
SSii rr eess cceerroo:: nnoo eexxiissttee aassoocciiaacciióónn eennttrree xx ee yy.. 
CCoorrrreellaacciióónn:: 
-1£ r £1 
sxsy 
x y 
n 
i 
i i 
( n )s s 
r 
1 
1 
- 
- 
= 
å=
33 
Estadística 
EJEMPLO : Representación ggrrááffiiccaa ddee llaass vvaarriiaabblleess xx ee yy 
r=1 r=-1
34 
Estadística 
RREEGGRREESSIIOONN LLIINNEEAALL SSIIMMPPLLEE 
Objetivo 2 
Estudiar si los valores de una 
variable pueden ser utilizados para 
predecir el valor de la otra 
DDaattooss CCuuaannttiittaattiivvooss 
Objetivo 1 
DDeetteerrmmiinnaarr ssii ddooss vvaarriiaabblleess eessttáánn 
aassoocciiaaddaass yy eenn qquuéé sseennttiiddoo ssee ddaa 
llaa aassoocciiaacciióónn.. 
Determinar si existe relación 
entre las variables x e y: 
Coeficiente de Correlación 
Estudiar la dependencia de una 
variable respecto de la otra: 
MMooddeelloo ddee RReeggrreessiióónn 
x y 
(1) x y(1) 
(2) x y( 2 ) 
  
(n) x y( n ) 
Términos 
Variable Respuesta (=variable dependiente) 
Variable Explicativa (=variable Independiente) 
Relación Lineal (modelo lineal) 
Parámetros (intercepto y pendiente) 
Intercepto (respuesta media) 
Pendiente (efecto de la variable explicativa sobre la respuesta) 
Error (residuo)
35 
RREEGGRREESSIIOONN LLIINNEEAALL SSIIMMPPLLEE 
DDaattooss CCuuaannttiittaattiivvooss 
Notación 
Variable Respuesta: y 
Variable Explicativa: x 
Modelo de Regresión Lineal Simple: yi=a+bxi+ei 
Intercepto: a 
Pendiente: b 
Error: e 
x y 
(1) x y(1) 
(2) x y( 2 ) 
  
(n) x y( n ) 
Modelo Estimado 
(recta de regresión) 
yˆ = a + bx 
Método de Estimación: MMíínniimmooss CCuuaaddrraaddooss 
a = y - bx 
n xy x y 
2 
å - 
å å 
= 
å å 
= = = 
1 1 1 
2 
n 
ö i 
çè 
1 1 
÷ø 
- æ 
= = 
i 
n 
i 
n 
i 
i 
n 
i 
i 
n 
i 
n x x 
b 
Residuos o Errores 
i i i e = y - yˆ 
Estadística
36 
RREEGGRREESSIIOONN LLIINNEEAALL SSIIMMPPLLEE 
DDAATTOOSS 
MODELO DE REGRESIÓN LINEAL SIMPLE 
yi=a+bxi+ei 
x y 
(1) x y(1) 
(2) x y( 2 ) 
  
(n) x y( n ) 
MODELO ESTIMADO 
yˆ = a + bx 
a = y - bx 
n xy x y 
2 
å - 
å å 
= 
å å 
= = = 
1 1 1 
2 
n 
ö i 
çè 
1 1 
÷ø 
- æ 
= = 
i 
n 
i 
n 
i 
i 
n 
i 
i 
n 
i 
n x x 
b 
ESTIMADORES 
ERRORES 
i i i e = y - yˆ 
Estadística
37 
RREEGGRREESSIIOONN LLIINNEEAALL SSIIMMPPLLEE 
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple 
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos 
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. 
niño edad (meses) talla (cm) 
i xi yi 
1 3 55 
2 6 68 
3 5 64 
4 5 66 
5 3 62 
6 4 65 
7 9 74 
8 8 75 
9 9 73 
10 7 69 
11 6 73 
12 5 68 
13 8 73 
14 6 71 
y=talla / x=edad / n=14 
956 
14 
= i 
1 
= 
åi y y=68,3 =5,6 y s 
= å= 
i 
84 
14 
1 
i x x=6 =2 x s 
cov(x, y)=9,07 =0,88 xy r 
= å= 
i 
5863 
14 
1 
14 
2 = å= 
i 
i i x y 556 
1 
i x 
Estadística
38 
Estadística 
RREEGGRREESSIIOONN LLIINNEEAALL SSIIMMPPLLEE 
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple 
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos 
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. 
Modelo Estimado 
yˆ=a+bx 
b=2,44 a=53,64 
yˆ=53,64+2,44x 
Interpretación de los resultados 
- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a 
medida que la edad aumenta la talla aumenta. 
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla 
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en 
una unidad la talla se incrementa en 2,44 cm.
2 = - å= 
i 
14 
å 2 å 
= = 
Bondad de Ajuste del Modelo 
39 
RREEGGRREESSIIOONN LLIINNEEAALL SSIIMMPPLLEE 
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple 
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos 
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. 
R2 = 0,77 
De acuerdo al coeficiente de 
determinación, el modelo ajustado 
a los datos es adecuado (R2 
cercano a 1) 
niño edad (meses) talla (cm) Talla estimada error 
i xi yi i yˆ i e 
1 3 55 61,0 -6,0 
2 6 68 68,3 -0,3 
3 5 64 65,8 -1,8 
4 5 66 65,8 0,2 
5 3 62 61,0 1,0 
6 4 65 63,4 1,6 
7 9 74 75,6 -1,6 
8 8 75 73,2 1,8 
9 9 73 75,6 -2,6 
10 7 69 70,7 -1,7 
11 6 73 68,3 4,7 
12 5 68 65,8 2,2 
13 8 73 73,2 -0,2 
14 6 71 68,3 2,7 
( ) 402,86 
14 
1 
i i y y 
( ˆ ) 92,7 
1 
2 
14 
1 
- = = 
i 
i 
i 
i i y y e 
Estadística

Presentación estadística

  • 1.
    1 Estadística Introducción ¿Qué es la estadística? Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha experimentado un gran desarrollo a lo largo de los últimos años. ¿En qué áreas se aplica la estadística? Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras. Ejemplos de su aplicación son: 1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo. 2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.
  • 2.
    2 Estadística Introducción Ejemplos de su aplicación son: 3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos. 4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad. 5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa). 6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población. En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.
  • 3.
    3 Estadística Introducción Etapas de un estudio estadístico Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son: 1) Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población. 2) Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación. 3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio. 4) Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos analizados para obtener conclusiones generales. 5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población
  • 4.
    4 Estadística Introducción Esquema de las etapas de un estudio estadístico AREA DE INTERES DDAATTOOSS TTeemmaa ddee IInnvveessttiiggaacciióónn -AAnntteecceeddeenntteess PPrreevviiooss -OObbjjeettiivvooss -PPrreegguunnttaass ddee IInnvveessttiiggaacciióónn -PPoossiibblleess HHiippóótteessiiss -UUnniiddaadd ddee AAnnáálliissiiss -PPoobbllaacciióónn -VVaarriiaabblleess OORRGGAANNIIZZAARR YY RREESSUUMMIIRR EESSTTAADDÍÍSSTTIICCAA DDEESSCCRRIIPPTTIIVVAA (Tablas, Gráficos, Medidas Descriptivas, etc.) INTERPRETACIÓN IINNFFEERREENNCCIIAA EESSTTAADDÍÍSSTTIICCAA ¿PPoobbllaacciióónn oo MMuueessttrraa?? PPoobbllaacciióónn CONCLUSIONES MMuueessttrraa PPrroobbaabbiilliiddaadd INFORMACIÓN
  • 5.
    5 Estadística Introducción Ejemplos de algunos problemas a estudiar 1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada. 2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades. 3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda. 4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas. 5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país. 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad. 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.
  • 6.
    Resumen de algunosconceptos planteados en la Introducción • VVAARRIIAABBLLEE:: eess lloo qquuee ssee vvaa aa mmeeddiirr yy rreepprreesseennttaa uunnaa ccaarraacctteerrííssttiiccaa ddee llaa UUNNIIDDAADD DDEE AANNÁÁLLIISSIISS.. • ¿QQUUIIÉÉNNEESS VVAANN AA SSEERR MMEEDDIIDDOOSS??:: LLooss ssuujjeettooss uu oobbjjeettooss oo UUnniiddaaddeess ddee AAnnáálliissiiss ddee uunnaa PPoobbllaacciióónn oo uunnaa MMuueessttrraa • PPOOBBLLAACCIIÓÓNN :: EEss eell ttoottaall ddee uunniiddaaddeess ddee aannáálliissiiss qquuee ssoonn tteemmaa ddee eessttuuddiioo.. 6 Muestra: 60 trabajadores de empresas de comunicación Unidad de análisis: Trabajador de empresa de comunicación Variables: sexo, edad, salario, Nº de horas de trabajo, etc. PPoobbllaacciióónn:: ““LLaass ppeerrssoonnaass qquuee ttrraabbaajjaann eenn eemmpprreessaass ddee ccoommuunniiccaacciióónn”” Estadística • MMUUEESSTTRRAA:: EEss uunn ccoonnjjuunnttoo ddee uunniiddaaddeess ddee aannáálliissiiss pprroovveenniieenntteess ddee uunnaa ppoobbllaacciióónn.. MMuueessttrraa
  • 7.
    NNOOMMIINNAALL OORRDDIINNAALL FFaavvoorriittoo,,eettcc.. CCaarraacctteerrííssttiiccaa oo ccuuaalliiddaadd ccuuyyaass ccaatteeggoorrííaass ttiieenneenn uunn oorrddeenn 7 VVaarriiaabbllee:: ccoorrrreessppoonnddee aa llaa ccaarraacctteerrííssttiiccaa ddee llaa UUnniiddaadd ddee AAnnáálliissiiss TTIIPPOOSS DDEE VVAARRIIAABBLLEESS VVaarriiaabblleess CCuuaannttiittaattiivvaass IInntteerrvvaalloo DDIISSCCRREETTAA VVaarriiaabblleess CCuuaalliittaattiivvaass CCOONNTTIINNUUAA TToommaa vvaalloorreess eenntteerrooss EEjjeemmppllooss:: NNúúmmeerroo ddee HHiijjooss,, NNúúmmeerroo ddee eemmpplleeaaddooss ddee uunnaa eemmpprreessaa,, NNúúmmeerroo ddee aassiiggnnaattuurraass aapprroobbaaddaass eenn uunn sseemmeessttrree,, eettcc.. TToommaa ccuuaallqquuiieerr vvaalloorr ddeennttrroo ddee uunn iinntteerrvvaalloo EEjjeemmppllooss:: PPeessoo;; EEssttaattuurraa;; TTeemmppeerraattuurraa,, eettcc.. CCaarraacctteerrííssttiiccaa oo ccuuaalliiddaadd ccuuyyaass ccaatteeggoorrííaass nnoo ttiieenneenn uunn oorrddeenn pprreeeessttaabblleecciiddoo.. EEjjeemmppllooss:: SSeexxoo,, DDeeppoorrttee UUnniiddaadd ddee MMeeddiiddaa:: GGrraammooss oo KKiillooss ppaarraa llaa vvaarriiaabbllee PPeessoo;; GGrraaddooss CC oo FF ppaarraa TTeemmppeerraattuurraa pprreeeessttaabblleecciiddoo.. EEjjeemmppllooss:: CCaalliiffiiccaacciióónn ((SS,, NN,, AA));; GGrraaddoo ddee IInntteerrééss ppoorr uunn tteemmaa,, eettcc.. Estadística
  • 8.
    FFrreeccuueenncciiaa:: ddeessddee uunnccoonnjjuunnttoo ddee uunniiddaaddeess,, ccoorrrreessppoonnddee aall NNúúmmeerroo oo PPoorrcceennttaajjee ddee vveecceess qquuee ssee NNOOMMIINNAALL CCOONNTTIINNUUAA DDIISSCCRREETTAA OORRDDIINNAALL FFrreeccuueenncciiaa AAbbssoolluuttaa ((FF)) FFrreeccuueenncciiaa RReellaattiivvaa ((ff)) FFrreeccuueenncciiaa AAbbssoolluuttaa AAccuummuullaaddaa ((FFAAAA)) 8 pprreesseennttaa uunnaa ccaarraacctteerrííssttiiccaa.. CCOONNTTIINNUUAA DDIISSCCRREETTAA NNOOMMIINNAALL OORRDDIINNAALL TTIIPPOO FFRREECCUUEENNCCIIAA FFrreeccuueenncciiaa RReellaattiivvaa AAccuummuullaaddaa ((ffrraa)) VVaarriiaabbllee CCuuaannttiittaattiivvaa VVaarriiaabbllee CCuuaalliittaattiivvaa VVaarriiaabbllee CCuuaannttiittaattiivvaa VVaarriiaabbllee CCuuaalliittaattiivvaa Estadística
  • 9.
    9 PPrroobblleemmaa ddeeIInnvveessttiiggaacciióónn:: SSee qquuiieerree eessttaabblleecceerr eell ppeerrffiill ddee llaass iinndduussttrriiaass ddee ccoonnsseerrvvaa eenn ffuunncciióónn ddee aallgguunnaass ccaarraacctteerrííssttiiccaass.. UUnniiddaadd ddee AAnnáálliissiiss:: IInndduussttrriiaa ddee CCoonnsseerrvvaa PPoobbllaacciióónn:: IInndduussttrriiaass ddee CCoonnsseerrvvaass ddeell ppaaííss VVaarriiaabblleess -- TTiippoo ddee IInndduussttrriiaa:: ssee ccllaassiiffiiccaa eenn iinndduussttrriiaa ttiippoo AA,, BB,, CC oo DD.. ((ccuuaalliittaattiivvaa nnoommiinnaall)) -- NNº ddee EEmmpplleeaaddooss:: ssee rreeffiieerree aall nnúúmmeerroo ddee eemmpplleeaaddooss eenn llaass llíínneeaass ddee pprroodduucccciióónn.. ((ccuuaannttiittaattiivvaa ddiissccrreettaa)) -- SSuuppeerrffiicciiee:: ssee rreeffiieerree aa llooss mmeettrrooss ccuuaaddrraaddooss ((uunniiddaadd ddee mmeeddiiddaa)) ddiissppoonniibblleess ppaarraa llaass áárreeaass ddee pprroodduucccciióónn.. ((ccuuaannttiittaattiivvaa ccoonnttiinnuuaa)) -- CCaalliiffiiccaacciióónn:: ccaalliiffiiccaacciióónn rreeaalliizzaaddaa ppoorr uunnaa iinnssttiittuucciióónn ppúúbblliiccaa ssoobbrree ccuummpplliimmiieennttoo ddee cciieerrttooss eessttáánnddaarreess ((MMuuyy BBiieenn,, BBiieenn,, RReegguullaarr,, MMaall)).. ((ccuuaalliittaattiivvaa oorrddiinnaall)) DDaattooss Industria nº Tipo Nº Empleados Superficie Calificación 1 A 100 1000,6 Muy Bien 2 B 150 1200,4 Bien ... ... ... ... ... 299 D 250 800,3 Mal 300 C 300 4000,2 Regular EEJJEEMMPPLLOO Estadística
  • 10.
    Estadística PPrroobblleemmaa ddeeIInnvveessttiiggaacciióónn:: SSee qquuiieerree eessttaabblleecceerr eell ppeerrffiill ddee llaass iinndduussttrriiaass ddee ccoonnsseerrvvaa eenn 10 EEJJEEMMPPLLOO TTAABBLLAASS DDEE FFRREECCUUEENNCCIIAA Tipo de Industria Frecuencia Absoluta (Fj) Frecuencia Relativa (fj) Porcentaje (%) A B C D Total 300 1 100 Calificación Frec. Absoluta (Fj) Frec.Relativa (fj) o % Frec. Absol. Acum. (FAAj) Frec. Relat. Acum. (fraj) o % Muy Bien Bien Regular Mal 300 1 (o 100) Total 300 1 (o 100) Numero de Empleados Frec. Absoluta (Fj) Frec.Relativa (fj) o % Frec. Absol. Acum. (FAAj) Frec. Relat. Acum. (fraj) o % <100 [100-150[ .. [950-1000] 300 1 (o 100%) Total 300 1 (o 100%) Superficie (mt2) Frec. Absoluta (Fj) Frec.Relativa (fj) o % Frec. Absol. Acum. (FAAj) Frec. Relat. Acum. (fraj) o % <200 [200-400[ .. [50000-5200] 300 1 (o 100%) Total 300 1 (o 100%) ((11)) ((22)) ((33)) ((44)) ffuunncciióónn ddee aallgguunnaass ccaarraacctteerrííssttiiccaass.. UUnniiddaadd ddee AAnnáálliissiiss:: IInndduussttrriiaa ddee CCoonnsseerrvvaa PPoobbllaacciióónn:: IInndduussttrriiaass ddee CCoonnsseerrvvaass ddeell ppaaííss
  • 11.
    11 Estadística Elementosde una tabla de frecuencia ccuuaannddoo llaa vvaarriiaabbllee eess ccoonnttiinnuuaa ((xx)) Intervalo Centro de clase Amplitud F f FAA fra I1 c1 a1 I2 c2 a2 . . Ik ck ak n 1 Total n 1 [LI1 ; LS1 [ [LI2 ; LS2 [ [LIk ; LSk] aj = (LSj – LIj)c ) j = (LIj) + LSj )/2
  • 12.
    Estadística Ejercicio: confecciónde una tabla de frecuencia para uunnaa vvaarriiaabbllee ccoonnttiinnuuaa 12 LLooss ddaattooss ccoorrrreessppoonnddeenn aa llaa eeddaadd ddee llooss hhiijjooss ddee llooss ttrraabbaajjaaddoorreess ddee uunnaa eemmpprreessaa 10,5 10,7 9,5 10,5 11,8 11,2 12,0 10,3 13,5 12,3 10,6 9,8 10,7 11,5 11,1 10,6 9,3 12,9 10,4 7,5 10,2 8,7 10,9 9,9 11,7 10,3 10,6 10,5 11,9 11,0 13,9 10,6 10,0 10,8 10,6 - 7,3 8,0 8,5 12,5 9,7 - DDaattooss oorrddeennaaddooss ddee mmeennoorr aa mmaayyoorr 7,3 9,7 10,4 10,6 11,1 12,3 7,5 9,8 10,5 10,6 11,2 12,5 8,0 9,9 10,5 10,7 11,5 12,9 8,5 10,0 10,5 10,7 11,7 13,5 8,7 10,2 10,6 10,8 11,8 13,9 9,3 10,3 10,6 10,9 11,9 - 9,5 10,3 10,6 11,0 12,0 - RReeaalliiccee llaa ssiigguuiieennttee aaccttiivviiddaadd 11)) CCoonnssttrruuyyaa uunn DDiiaaggrraammaa ddee TTaalllloo yy HHoojjaa 22)) ¿CCuuááll eess llaa vvaarriiaabbllee??;; ¿CCuuááll eess llaa UUnniiddaadd ddee aannáálliissiiss??;; ¿CCuuáánnttoo vvaallee nn??;; ¿CCuuááll eess eell rraannggoo ddee llaa vvaarriiaabbllee??.. 33)) SSoobbrree uunnaa TTaabbllaa ddee ffrreeccuueenncciiaa:: ¿CCuuáánnttooss iinntteerrvvaallooss ppooddrrííaa ccoonnssttrruuiirr??;; ¿CCuuááll eess llaa aammpplliittuudd ddee ccaaddaa iinntteerrvvaalloo??;; ¿CCuuáánnttaass mmeeddiiddaass ddee ffrreeccuueenncciiaa ppuueeddee oobbtteenneerr ppaarraa ccaaddaa iinntteerrvvaalloo??.. 44)) CCoonnssttrruuiirr ttaabbllaa ddee ffrreeccuueenncciiaa ppaarraa llaa vvaarriiaabbllee:: IInntteerrvvaallooss,, cceennttrroo ddee ccllaassee,, aammpplliittuudd,, ffrreeccuueenncciiaass.. Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos.
  • 13.
    13 TTIIPPOOSS DDEEGGRRÁÁFFIICCOOSS 11.. GGrrááffiiccoo ddee SSeeccttoorreess CCiirrccuullaarreess ((ddee TToorrttaa)) Distribución de las unidades de análisis de acuerdo a variable 1 A 20% D 10% C 40% B 30% Distribución de las unidades de análisis de acuerdo a variable 1 B 30% C 40% D 10% A 20% Distribución de las unidades de análisis de acuerdo a variable 1 B 30% C 40% D 10% A 20% Estadística
  • 14.
    14 Estadística TTIIPPOOSSDDEE GGRRÁÁFFIICCOOSS 22.. GGrrááffiiccoo ddee BBaarrrraass Numero de unidades de análisis de acuerdo a variable 1 500 400 300 200 100 0 A B C D variable 1 Nº Porcentaje de unidad de análisis de acuerdo a variable 1 0 20 40 60 80 100 D C B A variable 1 % unidad de análisis Proporción de unidad de análisis de acuerdo a variable 1 0 0,2 0,4 0,6 0,8 1 D C B A variable 1 Proporción de unidad de análisis -EEssttee ttiippoo ddee ggrrááffiiccoo ssee uuttiilliizzaa ggeenneerraallmmeennttee ppaarraa rreepprreesseennttaarr llaa ffrreeccuueenncciiaa ddee llaass ccaatteeggoorrííaass ddee uunnaa vvaarriiaabbllee ccuuaalliittaattiivvaa.. -CCuuaannddoo uunnaa vvaarriiaabbllee eess ccuuaannttiittaattiivvaa ssee ppuueeddee uuttiilliizzaarr eessttee ttiippoo ddee ggrrááffiiccoo ssóólloo ssii llaa vvaarriiaabbllee ssee hhaa ttrraannssffoorrmmaaddaa eenn ccaatteeggoorrííaass.. -HHaayy ddiissttiinnttaass vveerrssiioonneess ddee eessttooss ggrrááffiiccooss ((ppoorr eejjeemmpplloo eenn EExxcceell)),, yy eenn aallgguunnooss ccaassooss ssoonn mmuuyy úúttiilleess ppaarraa ddeessccrriibbiirr eell ccoommppoorrttaammiieennttoo ddee uunnaa vvaarriiaabbllee eenn ddiissttiinnttooss ggrruuppooss..
  • 15.
    15 HHiissttooggrraammaa --PPeerrmmiittee llaa rreepprreesseennttaacciióónn ddee llaa ffrreeccuueenncciiaa ddee uunnaa vvaarriiaabbllee CCuuaannttiittaattiivvaa.. - EEll eejjee xx ssee rreeffiieerree aa llaa vvaarriiaabbllee.. - EEll eejjee yy ssee rreeffiieerree aa llaa ffrreeccuueenncciiaa ((NNº ,, %%)).. - CCaaddaa bbaarrrraa rreepprreesseennttaa llaa ffrreeccuueenncciiaa ddee llaa vvaarriiaabbllee eenn llaa ppoobbllaacciióónn eenn eessttuuddiioo ((oo llaa mmuueessttrraa)).. -EEll hhiissttooggrraammaa ssee ppuueeddee ccoonnssttrruuiirr ddeessddee llooss ddaattooss ddee llaa ttaabbllaa ddee ffrreeccuueenncciiaa ddee llaa vvaarriiaabbllee eenn eessttuuddiioo.. TTIIPPOOSS DDEE GGRRÁÁFFIICCOOSS 33.. HHiissttooggrraammaa HHiissttooggrraammaa DDiissttrriibbuucciióónn ddee llooss hhiijjooss ddee ttrraabbaajjaaddoorreess ddee llaa eemmpprreessaa ddee aaccuueerrddoo aa eeddaadd 7 8 9 10 11 12 13 14 15 10 5 0 edad FrecuNNenºcia eeddaadd EEjjeemmpplloo EEnn eell ggrrááffiiccoo ssee ppuueeddee oobbsseerrvvaarr eell nnúúmmeerroo ddee hhiijjooss ,, ddee mmeennoorr eeddaadd ((77--88 aaññooss)),, llaass ddee mmaayyoorr eeddaadd ((113--114 aaññooss));; yy aaddeemmááss qquuee llaa mmaayyoorrííaa ddee hhiijjooss ddee llooss ttrraabbaajjaaddoorreess eessttáánn eennttrree llooss 1100 yy 1122 aaññooss.. Estadística
  • 16.
    16 TTIIPPOOSS DDEEGGRRÁÁFFIICCOOSS 55.. PPoollííggoonnoo ddee FFrreeccuueenncciiaa eeddaadd 7 8 9 10 11 12 13 14 15 10 5 0 edad FrecNNuºencia DDiissttrriibbuucciióónn ddee llooss hhiijjooss ddee ttrraabbaajjaaddoorreess ddee llaa eemmpprreessaa ddee aaccuueerrddoo aa eeddaadd -EEssttaa rreepprreesseennttaacciióónn ssee bbaassaa eenn eell HHiissttooggrraammaa.. -SSóólloo eess úúttiill ppaarraa vvaarriiaabblleess ccuuaannttiittaattiivvaass.. -EEll eejjee xx ssee rreeffiieerree aa llaa vvaarriiaabbllee.. - EEll eejjee yy ssee rreeffiieerree aa llaa ffrreeccuueenncciiaa ((NNº ,, %%)).. -LLooss ppuunnttooss qquuee ppeerrmmiitteenn llaa uunniióónn ddee llaass llíínneeaass rreepprreesseennttaa eell cceennttrroo ddee ccllaassee ((oo mmaarrccaa ddee ccllaassee)).. Estadística
  • 17.
    17 Estadística TTIIPPOOSSDDEE GGRRÁÁFFIICCOOSS 55.. DDiiaaggrraammaa ddee CCaajjaa - PPeerrmmiittee iiddeennttiiffiiccaarr ggrrááffiiccaammeennttee llaa mmeeddiiaannaa,, llooss ccuuaarrttiilleess 11 yy 3 ((ppeerrcceennttiilleess 2255 yy 7755)),, mmíínniimmoo yy mmááxxiimmoo ddee uunnaa vvaarriiaabbllee.. - SSóólloo eess úúttiill ppaarraa vvaarriiaabblleess ccuuaannttiittaattiivvaass.. -EEll eejjee xx ppeerrmmiittee iiddeennttiiffiiccaarr llaa ppoobbllaacciioonn eenn eessttuuddiioo.. - EEll eejjee yy rreepprreesseennttaa llooss vvaalloorreess ddee llaa vvaarriiaabbllee eenn eessttuuddiioo.. N = 584 1473 Mujeres Hombres Edad 100 90 80 70 60 50 40 30 20 10 0 EEddaadd ddee llaass ppeerrssoonnaass qquuee ssee rreeaalliizzaarroonn aannggiiooppllaassttííaa eennttrree 1199880 yy 22000
  • 18.
    18 TTIIPPOOSS DDEEGGRRÁÁFFIICCOOSS 66.. OOttrrooss Número de alumnos matriculados en la Carrera A según año de ingreso 100 80 60 40 20 0 1998 1999 2000 2001 2002 2003 año de ingreso Nº de alumnos Número de alumnos matriculados en la Carrera B según año de ingreso 100 80 60 40 20 0 1998 1999 2000 2001 2002 2003 año de ingreso Nº de alumnos Número de alumnos matriculados en las Carreras según año de ingreso 200 150 100 50 0 1998 1999 2000 2001 2002 2003 año ingreso Nº de alumnos Carrera B Carrera A Nº de alumnos año de ingreso Carrera A Carrera B 1998 60 80 1999 55 70 2000 80 50 2001 40 60 2002 68 50 2003 70 75 Estadística
  • 19.
    Estadística NNOOTTAACCIIOONN y= variable = valor de la variable en el individuo i i y i x x x + + = å= 19 Variables Cuantitativas x = variable = valor de la variable en el individuo i i x OOBBSSEERRVVAACCIIOONNEESS i = 1,...,n ** EEll TTiippoo ddee GGrrááffiiccoo sseelleecccciioonnaaddoo vvaa aa ddeeppeennddeerr ddee llaa vvaarriiaabbllee eenn eessttuuddiioo.. ** EEll GGrrááffiiccoo ddeebbee ccoonntteenneerr uunn TTííttuulloo GGeenneerraall yy llaa iiddeennttiiffiiccaacciióónn ddee ccaaddaa eejjee ((vvaarriiaabbllee eenn eessttuuddiioo yy ffrreeccuueenncciiaa)).. ** EEnn ooccaassiioonneess rreessuullttaa mmááss iilluussttrraattiivvoo uunn ggrrááffiiccoo qquuee uunnaa ttaabbllaa ddee ffrreeccuueenncciiaa.. ** AAll iigguuaall qquuee llaass ttaabbllaass,, llooss ggrrááffiiccooss ddeebbeenn sseerr aauuttoo--eexxpplliiccaattiivvooss.. = + + = å= c c c nc n i  1 a,b,c : constantes å = + + = å = = n n i i n i i cx cx cx c x 1 1 1  n i å + = + + + + = å + = =1 ax b ax b ax b a x b n i i n i 1 1 ( ) ( )  ( ) 2 2 1 1 2 n n i  2 n i x x x + + = å= ( ) ( ) 1 n 2 1 i  i i y x y x y x + + + + = + å= ( ) ( ) ( ) 1 1 n n 1 n i  i i y x y x y x + + = å= ( ) ( ) ( ) 1 1 n n 1 n i 
  • 20.
    20 D MEDIDASDEE TTEENNDDEENNCCIIAA CCEENNTTRRAALL -MMeeddiiaa AArriittmmééttiiccaa ((PPrroommeeddiioo)) -MMeeddiiaannaa -MMooddaa DDaattooss CCuuaannttiittaattiivvooss MMeeddiiaa AArriittmmééttiiccaa oo PPrroommeeddiioo x i = å= 1 n x n i DDaattooss CCuuaannttiittaattiivvooss oorrddeennaaddooss ddee mmeennoorr aa mmaayyoorr MMeeddiiaannaa E ( ) M k = x SSii nn eess iimmppaarr = k k x x M ( ) ( 1) 2 E + + x 1 x 2 x  n x x (1) x (2) x  (n) x SSii nn eess ppaarr dato del centro ( ) = k x DDaattooss MMooddaa M "el dato que más se repite" o = CCuuaalliittaattiivvooss yy CCuuaannttiittaattiivvooss Estadística
  • 21.
    21 Estadística PPeerrcceennttiilleess,,DDeecciilleess oo CCuuaarrttiilleess -PPeerrcceennttiill ((eejjeemmpplloo:: 2255,, 5500,, 7755)) -DDeecciill ((eejjeemmpplloo:: 44,, 55,, 88)) -CCuuaarrttiill ((eejjeemmpplloo:: 11,, 22,, 33)) PPeerrcceennttiill,, DDeecciill oo CCuuaarrttiill:: ccoorrrreessppoonnddee aall vvaalloorr qquuee ttoommaa llaa vvaarriiaabbllee ((ccuuaannttiittaattiivvaa)),, ccuuaannddoo llooss nn ddaattooss eessttáánn oorrddeennaaddooss ddee MMeennoorr aa MMaayyoorr EEll PPeerrcceennttiill vvaa ddee 11 aa 110000 EEll ppeerrcceennttiill 2255 ((2255//110000)):: eess eell vvaalloorr ddee llaa vvaarriiaabbllee qquuee rreeúúnnee aall mmeennooss eell 2255%% ddee llooss ddaattooss EEjjeemmpplloo:: SSii NN==8800,, eell 2255%% ddee 8800 eess 2200;; ppoorr lloo ttaannttoo,, ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 2200.. SSii NN==8855,, eell 2255%% ddee 8855 eess 2211,,2255;; ppoorr lloo ttaannttoo ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 2222.. EEll DDeecciill vvaa ddee 11 aa 1100 EEll DDeecciill 44 ((44//1100)):: eess eell vvaalloorr ddee llaa vvaarriiaabbllee qquuee rreeúúnnee aall mmeennooss eell 4400%% ddee llooss ddaattooss EEjjeemmpplloo:: SSii NN==8800,, eell 4400%% ddee 8800 eess 3322;; ppoorr lloo ttaannttoo,, ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 3322.. SSii NN==8855,, eell 4400%% ddee 8855 eess 3344;; ppoorr lloo ttaannttoo ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 3344.. EEll CCuuaarrttiill vvaa ddee 11 aa 44 EEll CCuuaarrttiill 33 ((33//44)):: eess eell vvaalloorr ddee llaa vvaarriiaabbllee qquuee rreeúúnnee aall mmeennooss eell 7755%% ddee llooss ddaattooss EEjjeemmpplloo:: SSii NN==8800,, eell 7755%% ddee 8800 eess 6600;; ppoorr lloo ttaannttoo,, ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 6600.. SSii NN==8855,, eell 7755%% ddee 8855 eess 6633,,7755;; ppoorr lloo ttaannttoo ssee bbuussccaa eell ddaattoo qquuee eessttee eenn llaa ppoossiicciióónn 6644..
  • 22.
    ( ) 1( x ) å å å i i n 1 1 2 22 MMEEDDIIDDAASS DDEE DDIISSPPEERRSSIIÓÓNN -RRaannggoo -VVaarriiaannzzaa -DDeessvviiaacciióónn EEssttáánnddaarr RRaannggoo VVaarriiaannzzaa DDaattooss CCuuaannttiittaattiivvooss x 1 x 2 x  n x max( ) min( ) i i R = x - x x x CCooeeffiicciieennttee ddee VVaarriiaacciióónn Comparación entre Variables SSee rreeffiieerree aall ccoommppoorrttaammiieennttoo ddee llaass vvaarriiaabblleess ccuuaannttiittaattiivvaass eenn uunn ggrruuppoo.. PPoorr eejjeemmpplloo:: SSii ssee ttiieennee uunn ccoonnjjuunnttoo ddee ppeerrssoonnaass aa llaass qquuee ssee lleess mmiiddee EEssttaattuurraa,, PPeessoo,, EEddaadd:: EEnnttrree eessttaass vvaarriiaabblleess ¿ccuuááll pprreesseennttaa mmaayyoorr vvaarriiaacciióónn?? DDeessvviiaacciióónn TTííppiiccaa oo EEssttáánnddaarr 2 1 2 2 1 2 2 1 x x n n x n s n i i n i n i n i i = - - = - = å = = = = s = s2 cv = s x Estadística
  • 23.
    23 Estadística OOttrraassmmeeddiiddaass oo CCooeeffiicciieenntteess -AAssiimmeettrrííaa -KKuurrttoossiiss oo AAppuunnttaammiieennttoo Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis. n å= 1 ( x x )3 n s CA i i × - = Coeficiente de Asimetría 3 Si CA=0 si la distribución es simétrica alrededor de la media. Si CA<0 si la distribución es asimétrica a la izquierda Si CA>0 si la distribución es asimétrica a la derecha n å= 1 ( x x )4 n s CAp i i × - = Coeficiente de Apuntamiento 4 - Si CAp=0 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. - Si CAp>0, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media). - Si CAp<0 la distribución es más plana y se llama platicúrtica.
  • 24.
    24 Estadística OOttrraassmmeeddiiddaass oo CCooeeffiicciieenntteess -AAssiimmeettrrííaa -KKuurrttoossiiss oo AAppuunnttaammiieennttoo Ejemplos Histogramas con distinta asimetría y apuntamiento 1,0 2,0 3,0 4,0 5,0 6,0 7,0 V2 14 12 10 8 6 4 2 0 Desv. típ. = 1,67 Media = 3,9 N = 30,00 -1,0 0,0 1,0 2,0 V4 30 20 10 0 Desv. típ. = ,64 Media = 0,0 N = 30,00 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 V5 6 5 4 3 2 1 0 Desv. típ. = 2,42 Media = 5,2 N = 28,00
  • 25.
    25 Estadística OOttrraassmmeeddiiddaass oo CCooeeffiicciieenntteess -AAssiimmeettrrííaa -KKuurrttoossiiss oo AAppuunnttaammiieennttoo Ejemplos Datos Histograma Medidas descriptivas Media 3,9 Mediana 4 Moda 4 Desviación estándar 1,67 Varianza de la muestra 2,78 kurtosis -0,43 Coeficiente de asimetría -0,02 Rango 6 Mínimo 1 Máximo 7 Cuenta 30 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 V1 16 14 12 10 8 6 4 2 0 Desv. típ. = 1,77 Media = 5,4 N = 66,00 1 4 4 1 4 4 1 4 5 2 4 5 2 4 6 2 4 6 2 4 6 3 4 6 3 4 7 4 4 7
  • 26.
    26 Estadística Media,Desviación típica, Coeficientes ddee AAssiimmeettrrííaa yy AAppuunnttaammiieennttoo ppaarraa ddaattooss AAggrruuppaaddooss ((ttaabbllaa ddee ffrreeccuueenncciiaass)) TTaabbllaa ddee ffrreeccuueenncciiaa ((ppaarraa vvaarriiaabbllee ccuuaannttiittaattiivvaa)) Intervalo Centro de clase Amplitud F f FAA fra f1 f2 I1 c1 a1 I2 c2 a2 . .     Ik ck ak fk n 1 Total n 1 n1 n2 nk Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k. 1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma: å= Media = x = c f c c j j k j 1 2) LLaa DDeessvviiaacciióónn ttííppiiccaa ppaarraa ddaattooss aaggrruuppaaddooss eessttaa ddaaddaa ppoorr:: k å= s = c - x f c j c j j 1 ( )2 3) EEll CCooeeffiicciieennttee ddee AAssiimmeettrrííaa ppaarraa ddaattooss aaggrruuppaaddooss eessttaa ddaaddoo ppoorr:: c - x f 3 å= 1 ( )3 c k j j c j CA = c s 4) EEll CCooeeffiicciieennttee ddee aappuunnttaammiieennttoo ppaarraa ddaattooss aaggrruuppaaddooss eessttaa ddaaddaa ppoorr:: c x f 4 1 ( )4 c k j j c j c s CAp å= - =
  • 27.
    27 Estadística Descripciónddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass DDiissttrriibbuucciióónn ccoonnjjuunnttaa Tabla 1 Actividad Transporte Estudia Pensionado Trabaja Autobus 5 7 0 Bicicleta 3 3 2 Caminar 2 5 2 Coche 5 4 5 Metro 6 7 4 Transporte Nº % Autobus 12 20,0 Bicicleta 8 13,3 Caminar 9 15,0 Coche 14 23,3 Metro 17 28,3 TOTAL 60 100 Actividad Nº % Estudia 21 35,0 Pensionado 26 43,3 Trabaja 13 21,7 TOTAL 60 100 Problema Interesa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial. PPaarraa eessttoo ssee ccoonnssuullttóó aa ccaaddaa ppeerrssoonnaa ssoobbrree llaa aaccttiivviiddaadd aa llaa qquuee ssee ddeeddiiccaabbaa yy eell mmeeddiioo ddee ttrraannssppoorrttee pprreeffeerriiddoo..
  • 28.
    28 Estadística Descripciónddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass DDiissttrriibbuucciióónn ccoonnjjuunnttaa NNº ddee ppeerrssoonnaass Tabla 2 Actividad Transporte Estudia Pensionado Trabaja TOTAL Autobus 5 7 0 12 Bicicleta 3 3 2 8 Caminar 2 5 2 9 Coche 5 4 5 14 Metro 6 7 4 17 TOTAL 21 26 13 60 Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
  • 29.
    29 Estadística Descripciónddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass DDiissttrriibbuucciióónn ccoonnjjuunnttaa NNº ddee ppeerrssoonnaass yy %% rreessppeeccttoo ddee ttiippoo ddee TTrraannssppoorrttee Tabla 3 Actividad Transporte Estudia Pensionado Trabaja TOTAL Autobus 5 7 0 12 % 41,7 58,3 0 100 Bicicleta 3 3 2 8 % 37,5 37,5 25 100 Caminar 2 5 2 9 % 22,2 55,6 22,2 100 Coche 5 4 5 14 % 35,7 28,6 35,7 100 Metro 6 7 4 17 % 35,3 41,2 23,5 100 TOTAL 21 26 13 60 % 35 43,3 21,7 100
  • 30.
    30 Estadística Descripciónddee 22 vvaarriiaabblleess ccuuaalliittaattiivvaass DDiissttrriibbuucciióónn ccoonnjjuunnttaa NNº ddee ppeerrssoonnaass yy %% rreessppeeccttoo ddee ttiippoo ddee AAccttiivviiddaadd Tabla 4 Actividad Transporte Estudia Pensionado Trabaja TOTAL Autobus 5 7 0 12 % 23,8 26,9 0 20 Bicicleta 3 3 2 8 % 14,3 11,5 15,4 13,3 Caminar 2 5 2 9 % 9,5 19,2 15,4 15 Coche 5 4 5 14 % 23,8 15,4 38,5 23,3 Metro 6 7 4 17 % 28,6 26,9 30,8 28,3 TOTAL 21 26 13 60 % 100 100 100 100
  • 31.
    31 Estadística MEDIDASDDEE AASSOOCCIIAACCIIÓÓNN LLIINNEEAALL - CCoovvaarriiaannzzaa - CCoorrrreellaacciióónn x 1 x 2 x  n x DDaattooss CCuuaannttiittaattiivvooss CCoovvaarriiaannzzaa:: RReeccoorrddeemmooss qquuee:: HHaassttaa aahhoorraa hheemmooss eessttuuddiiaaddoo llaass mmeeddiiddaass tteennddeenncciiaa cceennttrraall ((MMeeddiiaa,, MMeeddiiaannaa,, MMooddaa)) yy ddiissppeerrssiióónn ((VVaarriiaannzzaa yy DDeessvviiaacciióónn EEssttáánnddaarr)) ppaarraa uunnaa VVaarriiaabbllee CCuuaannttiittaattiivvaa ((xx)).. EEss uunnaa mmeeddiiddaa ddee VVaarriiaabbiilliiddaadd CCoonnjjuunnttaa eennttrree ddooss vvaarriiaabblleess ((xx11 ,, xx22)) oo bbiieenn ((xx ,, yy)) x y (1) x y(1) (2) x y( 2 )   (n) x y( n ) n å= ( xi x )( yi y ) 1 = - - i n cov( x, y ) 1 SSii CCoovv((xx,,yy)) eess ppoossiittiivvaa:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess ddiirreeccttaammeennttee pprrooppoorrcciioonnaall,, eess ddeecciirr qquuee ccuuaannddoo xx aauummeennttaa yy ttaammbbiiéénn aauummeennttaa;; yy vviicceevveerrssaa.. SSii CCoovv((xx,,yy)) eess nneeggaattiivvaa:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess iinnvveerrssaammeennttee pprrooppoorrcciioonnaall,, eess ddeecciirr qquuee ccuuaannddoo xx aauummeennttaa yy ddiissmmiinnuuyyee;; yy vviicceevveerrssaa.. SSii CCoovv((xx,,yy)) eess cceerroo:: nnoo eexxiissttee aassoocciiaacciióónn eennttrree xx ee yy..
  • 32.
    32 Estadística MEDIDASDDEE AASSOOCCIIAACCIIÓÓNN LLIINNEEAALL - CCoovvaarriiaannzzaa - CCoorrrreellaacciióónn DDaattooss CCuuaannttiittaattiivvooss SSee rreeffiieerree aall ggrraaddoo ddee aassoocciiaacciióónn eennttrree ddooss vvaarriiaabblleess ((xx11 ,, xx22)) oo bbiieenn ((xx ,, yy)) CCooeeffiicciieennttee ddee CCoorrrreellaacciióónn ddee PPeeaarrssoonn ((rr)):: MMiiddee eell ggrraaddoo ddee AAssoocciiaacciióónn LLiinneeaall eennttrree ddooss vvaarriiaabblleess CCuuaannttiittaattiivvaass x y (1) x y(1) (2) x y( 2 )   (n) x y( n ) r = cov( x, y ) x y nxy SSii rr eess ppoossiittiivvoo:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess ddiirreeccttaammeennttee pprrooppoorrcciioonnaall,, eess ddeecciirr qquuee ccuuaannddoo xx aauummeennttaa yy ttaammbbiiéénn aauummeennttaa;; yy vviicceevveerrssaa.. SSii rr==11:: llaa aassoocciiaacciióónn lliinneeaall eess ppeerrffeeccttaa.. SSii rr eess nneeggaattiivvoo:: llaa aassoocciiaacciióónn eennttrree xx ee yy eess iinnvveerrssaammeennttee pprrooppoorrcciioonnaall,, eess ddeecciirr qquuee ccuuaannddoo xx aauummeennttaa yy ddiissmmiinnuuyyee;; yy vviicceevveerrssaa.. SSii rr==--11:: llaa aassoocciiaacciióónn lliinneeaall eess ppeerrffeeccttaa.. SSii rr eess cceerroo:: nnoo eexxiissttee aassoocciiaacciióónn eennttrree xx ee yy.. CCoorrrreellaacciióónn:: -1£ r £1 sxsy x y n i i i ( n )s s r 1 1 - - = å=
  • 33.
    33 Estadística EJEMPLO: Representación ggrrááffiiccaa ddee llaass vvaarriiaabblleess xx ee yy r=1 r=-1
  • 34.
    34 Estadística RREEGGRREESSIIOONNLLIINNEEAALL SSIIMMPPLLEE Objetivo 2 Estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra DDaattooss CCuuaannttiittaattiivvooss Objetivo 1 DDeetteerrmmiinnaarr ssii ddooss vvaarriiaabblleess eessttáánn aassoocciiaaddaass yy eenn qquuéé sseennttiiddoo ssee ddaa llaa aassoocciiaacciióónn.. Determinar si existe relación entre las variables x e y: Coeficiente de Correlación Estudiar la dependencia de una variable respecto de la otra: MMooddeelloo ddee RReeggrreessiióónn x y (1) x y(1) (2) x y( 2 )   (n) x y( n ) Términos Variable Respuesta (=variable dependiente) Variable Explicativa (=variable Independiente) Relación Lineal (modelo lineal) Parámetros (intercepto y pendiente) Intercepto (respuesta media) Pendiente (efecto de la variable explicativa sobre la respuesta) Error (residuo)
  • 35.
    35 RREEGGRREESSIIOONN LLIINNEEAALLSSIIMMPPLLEE DDaattooss CCuuaannttiittaattiivvooss Notación Variable Respuesta: y Variable Explicativa: x Modelo de Regresión Lineal Simple: yi=a+bxi+ei Intercepto: a Pendiente: b Error: e x y (1) x y(1) (2) x y( 2 )   (n) x y( n ) Modelo Estimado (recta de regresión) yˆ = a + bx Método de Estimación: MMíínniimmooss CCuuaaddrraaddooss a = y - bx n xy x y 2 å - å å = å å = = = 1 1 1 2 n ö i çè 1 1 ÷ø - æ = = i n i n i i n i i n i n x x b Residuos o Errores i i i e = y - yˆ Estadística
  • 36.
    36 RREEGGRREESSIIOONN LLIINNEEAALLSSIIMMPPLLEE DDAATTOOSS MODELO DE REGRESIÓN LINEAL SIMPLE yi=a+bxi+ei x y (1) x y(1) (2) x y( 2 )   (n) x y( n ) MODELO ESTIMADO yˆ = a + bx a = y - bx n xy x y 2 å - å å = å å = = = 1 1 1 2 n ö i çè 1 1 ÷ø - æ = = i n i n i i n i i n i n x x b ESTIMADORES ERRORES i i i e = y - yˆ Estadística
  • 37.
    37 RREEGGRREESSIIOONN LLIINNEEAALLSSIIMMPPLLEE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. niño edad (meses) talla (cm) i xi yi 1 3 55 2 6 68 3 5 64 4 5 66 5 3 62 6 4 65 7 9 74 8 8 75 9 9 73 10 7 69 11 6 73 12 5 68 13 8 73 14 6 71 y=talla / x=edad / n=14 956 14 = i 1 = åi y y=68,3 =5,6 y s = å= i 84 14 1 i x x=6 =2 x s cov(x, y)=9,07 =0,88 xy r = å= i 5863 14 1 14 2 = å= i i i x y 556 1 i x Estadística
  • 38.
    38 Estadística RREEGGRREESSIIOONNLLIINNEEAALL SSIIMMPPLLEE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. Modelo Estimado yˆ=a+bx b=2,44 a=53,64 yˆ=53,64+2,44x Interpretación de los resultados - Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta. - Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm.
  • 39.
    2 = -å= i 14 å 2 å = = Bondad de Ajuste del Modelo 39 RREEGGRREESSIIOONN LLIINNEEAALL SSIIMMPPLLEE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. R2 = 0,77 De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R2 cercano a 1) niño edad (meses) talla (cm) Talla estimada error i xi yi i yˆ i e 1 3 55 61,0 -6,0 2 6 68 68,3 -0,3 3 5 64 65,8 -1,8 4 5 66 65,8 0,2 5 3 62 61,0 1,0 6 4 65 63,4 1,6 7 9 74 75,6 -1,6 8 8 75 73,2 1,8 9 9 73 75,6 -2,6 10 7 69 70,7 -1,7 11 6 73 68,3 4,7 12 5 68 65,8 2,2 13 8 73 73,2 -0,2 14 6 71 68,3 2,7 ( ) 402,86 14 1 i i y y ( ˆ ) 92,7 1 2 14 1 - = = i i i i i y y e Estadística