Krizat ekonomike teorite ligj.3 myrvete badivuku-pantina
Analiza e thjeshte e regresionit
1. Analiza Statistikore
Ligjërata e 10
Regresioni linear i thjeshtë II
Qëllimet e mësimit
Në këtë ligjëratë ju do të mësoni:
Si të përdorni analizën e regresioninit për të parashikuar
vlerën e e variablës së varur bazuar në variablën e pavarur.
Kuptimin e koefiecentëve të regresionit b0 dhe b1
Të konkludoni rreth koeficientit të pjerrësisë dhe
koeficientit të korrelacionit
Se si t’i lexoni dhe interpretoni rezultatet e nxjerra përmes
Excel-it.
2. Korrelacioni dhe Regresioni
• Skater diagrami mund të përdoret për të
përshkruar raportet në mes të dy variablave
• Analiza e regresionit përdoret për të përshkruar
raportet në mes të dy variablave
• Analiza e korrelacionit përdoret për të matur
fortësinë e lidhjeve në mes të dy variablave.
– Korrelacioni ka të bëjë vetëm me fortësinë e lidhjeve
në mes të dy variablave
– Nuk tregon shkaqet e lidhjes në mes të variablave
– Skater diagrami është mësuar në vitin e parë
– Korrelacioni gjithashtu është mësuar në vitin e parë.
Hyrje në analizën e regresionit
• Analiza e regresionit përdoret për të :
– Parashikuar vlerën e variablës së varur të bazuar në vlerën e
së paku një variable të pavarur.
– Shpjegon efektet e ndryshimit të variablës së pavarur në
variablën e varur.
Variabla e varur (Y) : variabla që dëshirojmë ta
vlerësojmë ose ta shpjegojmë.
Variabla e pavarur (X): variabla e përdorur për të
shpjeguar variablën e varur.
3. Modeli i regresionit të thjeshtë linear
Vetëm një variabël e pavarur X
Marëdhëniet në mes të X dhe Y përshkruhen
përmes funksionit linear.
Ndryshimet në Y supozohet se shkaktohen nga
ndryshimet në X
Llojet e raporteve
Raporte lineare Raporte jolineare
Y Y
X X
Y Y
X X
4. Llojet e raporteve
(vazhdim
Lidhje të forta Lidhje të dobëta
Y Y
X X
Y Y
X X
Llojet e raporteve
(vazhdim)
Nuk ka lidhje fare
Y
X
Y
X
5. Modeli i regresionit të thjeshtë
linear ( në populacion)
Koeficienti i
Ndërprerja në Variabla e Gabimi i
pjerrësisë së
boshtin Y, në pavarur rastësishëm
populacionit
Variabla e populacion
varur
Yi β0 β1Xi εi
Komponenta lineare Komponenta e
gabimit të rastësishëm
Modeli i regresioni të thjeshtë linear
(vazhdim)
Y Yi β0 β1Xi εi
Vlerat e
vrojtuara të Y
për Xi
εi Pjerrësia = β1
Vlerat e
projektuara të Y Gabimi i
për Xi rastësishëm për
këtë vlerë të Xi
Ndërprerja = β0
Xi X
6. Ekuacioni i Regresionit të thjesht linear
(Vija e parashikuar-vlerësuar)
Ekuacioni i regresionit të thjeshtë linear siguron
vlerësimin e vijës së regresionit të popullimit
Vlera e
vlerësuar (ose Vlerësimi i Vlerësimi i
e parashikuar ) prerjes së pjerrësisë së
e Y për regresionit regresionit
vrojtimin i
Vlera e X për
ˆ
Yi b0 b1Xi
vrojtimin i
Gabimi i rastësishëm individual ei ka mesatare zero
Metoda e katrorëve më të vegjël
• b0 dhe b1 sigurohen përmes së gjetjeve të vlerave
b0 dhe b1 që minimizojnë shumën e devijimeve të
ˆ
ngritura në katrorë në mes të Y dhe Y
min (Yi Yi )2 min (Yi (b0 b1Xi ))2
ˆ
7. Gjetja e parametrave përmes
ekuacionit të katrorëve më të vegjël.
• Koeficientët b0 dhe b1 , dhe rezultatet e tjera
të regresionit në këtë ligjëratë do të gjinden
përmes përdorimit të Excel-it
Formulat janë të prezantuara në ligjeratën e
regresionit në vitin e parë të studimeve dhe mund
të gjinden edhe në libër të Statistikës (Viti i Parë).
Interpretimi i pjerrësisë dhe
ndërprerjes(……
ˆ
Yi b0 b1Xi
• b0 është vlera mesatare e vlerësuar e Y kur
vlera e X është zero
• b1 është ndryshimi mesatar i vlerësuar i
vlerës së Y si rezultat i ndryshimit të një
njësie të X-it ( është koeficienti i pjerrësisë së
vijës së regresionit, mund të jetë pozitiv dhe
negativ)
8. Shembull i regresionit të thjeshtë
linear
• Një kompani që merret me shitjen e patundshmërive dëshiron
të vlerësojë raportet në mes të çmimit të shitjes së shtëpive dhe
madhësisë së tyre ( të shprehura në meter katror)
• Një mostër e rastësishme prej 10 shtëpive është marrë:
– Variabla e varur (Y) = Çmimi i shtëpive në $1000
– Variabla e pavarur (X) = madhësia e shtëpive (
shprehur në meter katror - m 2 )
Të dhënat e mostrës për modelin
e çmimeve të shtëpive
Çmimi i shtëpive në
Sipërfaqja ne m2
$1000
(X)
(Y)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
9. Prezantimi grafik-
• Modeli i çmimeve të shtëpive : diagrami shpërndarës
Regresioni - Përdorimi i Excel-it
• Data/ Data Analysis / Regression
10. Rezultati i Excel-it
Regression Statistics
Multiple R 0.76211
Ekuacioni i regresionit është:
R Square 0.58082
Adjusted R Square 0.52842 Çmimi i shtepive 98.24833 0.10977 (meter katror)
Standard Error 41.33032
Observations 10 ˆ
Yi b0 b1Xi
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept b0 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Meter katror b1 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Prezantimi grafik
• Modeli i çmimit të shtëpive: diagrami
shpërndarës dhe vija e regresionit
Pjerrësia
= 0.10977
Prerja
= 98.248
Çmimi i shtepive 98.24833 0.10977 (meter katror)
11. Interpretimi i prerjes, koeficientit b0
Çmimi i shtepive 98.24833 0.10977 (meter katror)
• b0 është vlera mesatare e vlerësuar e Y kur X
është zero (Nëse X = 0 është në vargun e
vlerave të vrojtuara të X )
– Këtu nuk ka shtëpi me 0 meter katror, kështu që
b0 = 98.24833 ,tregon se shtëpitë në vargun e
vrojtuar të madhësive, $98,248.33 është pjesa
e çmimit të shtëpive që nuk mund të spjegohen
me sipërfaqen në meter katror.
Interpretimi i koeficientit të
pjerrësisë, b1
Çmimi i shtepive 98.24833 0.10977 (meter katror)
• b1 mat ndryshimin e vlerësuar në mesatare
të Y si rezultat i ndryshimit të një njësie të X
– Këtu b1 = 0.10977 na tregon se në mesatare
çmimi i shtëpive rritet për 0.10977($1000) =
$109.77, për çdo meter shtesë të madhësisë së
shtëpisë.
12. Parashikimi përmes analizës së
regresionit
Parashikoni çmimin e shtëpisë me
2000 metra katror.
Çmimi i shtepive 98.25 0.1098 (m2 )
98.25 0.1098(2000)
317.85
Çmimi i parashikuar për shtëpinë me 2000
m2 është 317.85 ($1,000) = $317,850
Interpolimi kundrejt
ekstrapolimit
• Kur përdoret modeli i regresionit për parashikim, parashikoni
vetëm në kuadër të vargut të vlerave të vrojtuara
Vargu relevant per
interpolim
Mos provoni të
parashikoni përtej
vargut të vlerave
të vrojtuara të X
13. Masat e variacionit
• Variacioni total përbëhet nga dy pjesë:
SST SSR SSE
Shuma totale e Shuma e katrorëve Shuma e katrorëve të
katroreve të regresionit gabimit
SST ( Yi Y)2 SSR ( Yi Y)2
ˆ SSE ( Yi Yi )2
ˆ
Ku:
Y = Vlera mesatare e variablës së varur
Yi = Vlerat e vrojtuara të variablës së varur
ˆ
Yi = Vlera e parashikuar e Y për vlerën e dhënë të Xi
Masat e variacionit
(vazhdim)
• SST = Shuma totale e katrorëve
– Masë e variacioneve të vlerës së Yi rreth vlerës
mesatare të tyre
• SSR = Shuma e katrorëve të regresionit
– Variacionet e spjegueshme të lidhura me raportet në
mes të X dhe Y
• SSE = Shuma e katrorëve të gabimit
• Variacionet e lidhura më shumë me faktorë të
tjerë se sa me raportet në mes të X dhe Y
(Variacionet e pashpjegueshme)
14. Masat e variacionit
(vazhdim)
Y
Yi
SSE = (Yi - Yi )2 Y
_
SST = (Yi - Y)2
Y _
_ SSR = (Yi - Y)2 _
Y Y
Xi X
Koefiecienti i determinacionit, r2
• Koeficienti i determinacionit është pjesa e
variacioneve totale në variablën e varur e cila
spjegohet me variacionet në variablën e pavarur
• Koeficienti i determinacionit gjithashtu quhet r në
katror dhe shënohet si r2
SSR Shuma e katrorevete regresionit
r2
SST Shuma totale e katroreve
Vereni : 0 r2 1
15. Rezultati i Excel-it
SSR 18934.9348
Regression Statistics
r2 0.58082
Multiple R 0.76211 SST 32600.5000
R Square 0.58082
Adjusted R Square 0.52842 58.08% e variacioneve në
Standard Error 41.33032 çmimin e shtëpive spjegohet
Observations 10
përmes variacioneve në
sipërafqen me meter katror.
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Gabimi standard i vlerësimit (Devijimi
standard i vlerësimit)
• Devijimi standard i variacioneve të vrojtimeve
rreth vijës së regresionit vlerësohet përmes
formulës vijuese:
n
SSE (Y Y )
ˆ
i i
2
S YX i1
n2 n2
Ku:
SSE = shuma e katrorëve të gabimit të rastësishëm
n = madhësia e mostrës
16. Rezultati i Excel-it
Regression Statistics
Multiple R 0.76211 SYX 41.33032
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Konkluzioni rreth koeficientit të
pjerrësisë së popullimit
• Gabimi standard i koeficientit të pjerrësisë
(b1) vlerësohet me formulën vijuese
S YX S YX
Sb1
SSX (X X) i
2
ku:
Sb1 = Vlerësimi i gabimit standard të koeficientit të pjerrësisë
SSE = Gabimi standard i vlerësimit
S YX
n2
17. Rezultati i Excel-it
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error
Observations
41.33032
10
Sb1 0.03297
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Konkluzioni rreth pjerrësisë:
Testi t
• Testi t për pjerrësinë e populacionit
– A ekziston lidhje lineare në mes të X dhe Y në
populacion me nivel të signifikancës α= 0,05?
• Hipoteza zero dhe alternative
H0: β1 = 0 (Nuk ka lidhje lineare)
H1: β1 0 (Lidhja lineare egziston)
• Testi statistikor
b β
ku:
t 1 1 b1 = koeficienti i pjerrësisë së
Sb1 regresionit
β1 = Pjerrësia e supozuar
Sb1= Gabimi standard i
sh.l. n 2 pjerrësisë
18. Konkluzioni rreth pjerrësisë:
Testi t
(vazhdim)
Çmimi i
Ekuacioni I regresionit të thjeshtë linear:
Siperfaqja
shtëpive
(meter katror)
$1000
(y)
(x) Çmimi i shtepive 98.25 0.1098 (meter katror)
245 1400
312 1600
279 1700 Pjerrësia e këtij modeli është
308 1875
0.1098
199 1100
219 1550 A thua sipërfaqja në meter katror
405 2350 ka ndikim në çmimin e shitjes?
324 2450
319 1425
255 1700
Konkluzioni rreth pjerrësisë:
Testi t- Shembull
b1 Sb1
H0: β1 = 0 Nga rezultatet e Excel-it:
H1: β1 0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Meter katror 0.10977 0.03297 3.32938 0.01039
b1 β1 0.10977 0
t t 3.32938
Sb1 0.03297
19. Konkluzioni rreth pjerrësisë:
Testi t- Shembull
(vazhdim
Testi statistikor t = 3.329
b1 Sb1 t
H0: β1 = 0 Nga rezultati i Excel-it:
H1: β1 0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Meter katror 0.10977 0.03297 3.32938 0.01039
sh.l. = 10-2 = 8
Vendimi:
a/2=.025 a/2=.025 Refuzo H0
Konkluzion:
Ka mjaft të dhëna se sipërfaqja
Refuzo H0 Mos e prano H0 Refuzo H0
-tα/2 tα/2 në meter katror ka ndikim në
0
-2.3060 2.3060 3.329 çmimin e shitjes së shtëpive.
Konkluzioni rreth pjerrësisë:
Testi t- Shembull
(vazhdim)
Vlera e P = 0.01039
Vlera e P-
H0: β1 = 0 Nga rezultati i Excel-it:
H1: β1 0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
Testi është dyanësor, Vendimi: Vlera e P < α kështu që
kështu që vlera e p është: : Refuzo H0
P(t > 3.329)+P(t < -3.329)
= 0.01039 Konkluzion:
(per 8 sh.l.) Ka mjaft të dhëna se sipërfaqja në
meter katror ka ndikim në çmimin
e shitjes së shtëpive.
20. Intervali i besimit për vlerësimin e
koeficientit të Pjerrësisë
Intervali I besimit për vlerësimin e pjerrësisë:
b1 t n2Sb1 sh.l. = n - 2
Rezultatet e Excel-it për çmimin e shtëpive:
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Ne nivel te besueshmerise 95%, intervali i
besueshmerisë për pjerrësinë është: (0.0337, 0.1858)
Intervali i besimit për vlerësimin e
Pjerrësisë
(vazhdim)
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Meter katror 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Meqenëse vlera e shitjeve se shtëpive është e
shprehur në $1000, ne jemi 95% konfident se efekti
mesatar në cmimin e shitjes është në mes të
$33.70 dhe $185.80 për meter katror të shtuar për
një njësi.
21. Testi t për Koeficientin e
Korrelacionit
• Hipotezat:
H0: ρ = 0 (Nuk ka korrelacion në mes të X dhe Y)
HA: ρ ≠ 0 (Ka korrelacion në mes të X dhe Y)
• Testi Statistikor (me n – 2 shkallë të lirisë)
r-ρ
t ku
1 r2 r r 2 nese b1 0
n2 r r 2 nese b1 0
ρ korrelacioni ne populacion
Shembull: Çmimet e shtëpive
A ka evidencë për raporte lineare në mes të
sipërfaqes së shtëpive dhe Çmimit të shitjes
së tyre në nivel të signifikancës 0.05?
H0: ρ = 0 (Nuk ka korrelacion)
H1: ρ ≠ 0 (Korrelacioni ekziston)
a =0.05 , sh.l. = 10 - 2 = 8
r ρ 0.762 0
t 3.329
1 r2 1 0.7622
n2 10 2
22. Shembull: Zgjedhja përmes testit
r ρ .762 0 Vendimi:
t 3.329
1 r 2 1 .7622 Refuzo H0
n2 10 2 Konkluzion:
Ka evidencë se
Sh.l. = 10-2 = 8
ekziston lidhje
lineare në
a/2=0.025 a/2=0.025
nivelin 5% të
signifikancës.
Refuzo H0 Mos e refuzo H0 Refuzo H0
-tα/2 tα/2
0
-2.3060 2.3060
3.329
Përfundime
Hyrje në analizën e regresionit
Rishikim i supozimeve të analizës së regresionit
Ekuacioni i regresionit të thjeshtë linear
Përshkrimi i masave të variacionit
Prurja e konkluzioneve rreth pjerrësisë së
koeficientit të regresionit
Analizimi i korrelacionit-matja e fortësisë së
lidhjeve, etj