Statistik 1 3 dispersi

Pengukuran Dispersi
1
Menjelaskan Data

Buku Teks
2
Lind, Marchal and Wathen, 2005, Statistical
Techniques in Business & Economics, 12th Ed.,
McGraw Hill, Irwin.

Pengukuran Dispersi
3
Mengapa perlu mempelajari Dispersi?
Pengukuran Range, Deviasi Rata-rata, Varians dan
Standar Deviasi, dan Koefisien Variasi
Pengukuran Kemencengan (Skewness)
Pengukuran Kurtosis (Peakedness)
Pengukuran Kuartil, Desil, dan Persentil

Mengapa perlu mempelajari Dispersi?
4
Pengukuran nilai sentral (e.g. mean, modus, median)
hanya menjelaskan pusat data, tidak menjelaskan sebaran
data.
Dispersi dapat dipergunakan untuk membandingkan
sebaran pada dua distribusi data atau lebih.

Pengukuran Range (Rentang/ Jangkauan)
5
Range (Rentang/ Jangkauan) adalah perbedaan antara
terbesar dan nilai terkecil.
Range = H - L
Hanya dua nilai yang digunakan dalam perhitungan.
Sangat dipengaruhi oleh nilai ekstrem.
Mudah untuk dihitung dan dimengerti.

Deviasi Rata-rata (Mean Deviation)
Deviasi Rata-Rata (Mean Deviation) adalah rata-rata
arimatik/hitung dari nilai absolut deviasi terhadap nilai
rata-rata aritmatik/hitung.
Semua nilai yang digunakan dalam perhitungan.
Tidak terlalu banyak dipengaruhi oleh nilai-nilai yang
besar atau kecil.
Nilai absolut sulit untuk dimanipulasi.
Σ X- X
n
MD=
Mean deviation juga disebut Mean Absolute Deviation (MAD).

Contoh 1
7
Berat sampel peti-peti berisi buku untuk toko buku
(dalam Kg) adalah:
103, 97, 101, 106, 103
Tentukan rentang dan deviasi rata-rata-nya.
Range = 106 – 97 = 9

Contoh 1
8
Langkah pertama adalah menentukan rata-rata berat
kotak tsb:
510
5 = 102
ΣX
n =
X=
Deviasi rata-rata-nya adalah:
Σ X - X 12 MD= = = 2.4
n 5
x |x-xbar|
103 1
97 5
101 1
106 4
103 1
510 12

Varians & Standar Deviasi
9
Varians adalah rata-rata aritmatik/hitung dari kuadrat
deviasi rata-rata.
Standar Deviasi adalah akar kuadrat dari Varians.

Varians Populasi
10
Varians populasi adalah rata-rata aritmetik/hitung dari
kuadrat deviasi terhadap rata-rata populasi.
Semua nilai yang digunakan dalam perhitungan.
Lebih cenderung dipengaruhi oleh nilai-nilai ekstrim
dibandingkan dengan deviasi rata-rata.

Varians
11
Rumus untuk Varians Populasi adalah:
σ = Σ(X- μ)
N
2
2
Rumus untuk Varians Sampel adalah:
Σ(X- X)
n -1
s =
2
2
Catatan dalam rumus varians sampel jumlah deviasi dibagi oleh (n-1)
bukan n. Walaupun secara logis seharusnya menggunakan n bukan (n-1),
pembagian dengan (n-1) menghasilkan estimator yang tidak bias terhadap
varians populasi, sedangkan pembagian menggunakan n menghasilkan
estimator yang bias.

Untuk memudahkan hitungan manual:
12
( ) ( )
( )
å å
- = å -
å
( )
2
2 2
2
2
2
å å
2
2
-
1
1
X
X X X
n
X X
s
n
X
X
s n
n
=
-
-
=
-

Contoh 2
13
Usia masing-masing anggota keluarga Pak Arman adalah
sbb:
2, 18, 34, 42
Berapa varians populasi-nya?
96
4 = 24
ΣX
n =
μ =
2
σ2 = Σ(X- μ) = 944 = 236
N 4
x x- μ (x- μ)2
2 -22 484
18 -6 36
34 -10 100
42 18 324
Σ=96 Σ=944

Standar Deviasi Populasi
14
Standar Deviasi populasi (σ) adalah akar kuadrat dari
varians populasi.
Untuk Contoh 2, Standar Deviasi populasi-nya adalah
15.36, diperoleh dari:
σ = σ2 = 236 = 15.36

Contoh 3  Untuk data Sampel
15
Upah per jam yang diperoleh dari sampel lima pekerja
adalah:
$7, $5, $11, $8, $6.
Hitunglah varians dari data tsb.
37
5 = 7.40
ΣX
n =
X=
x x- x bar (x- x bar)2
7 -0.4 0.16
5 -2.4 5.76
11 3.6 12.96
8 0.6 0.36
6 -1.4 1.96
Σ=37 Σ=21.2
( )2
2 Σ X- X 21.2 s = = = 5.30
n-1 5-1

Standar Deviasi Sample
16
Standar deviasi sampel adalah akar kuadrat dari varians
sampel.
In Contoh 3, standar deviasi sample adalah 2.30
s = s2 = 5.29 = 2.30

Variance
 Ungrouped Data
• Population
• Sample
 Grouped Data
• Population
Sample
( )
2
m
( )
2
2
2
2
X
N
X
X
N
N
s
s
-
=
-
=
å
å å
( X X
)
=
å å
( )
1
-
1
2
2
2
2
2
-
-
=
-
å
n
X
n
X
s
n
s
( )
2
m
( )
2
2
2
2
f X
N
fX
fX
N
N
s
s
-
=
-
=
å
å å
( )
f X -
X
=
å å
( )
1
1
2
2
2
2
2
-
-
=
-
å
n
fX
n
fX
s
n
s

Standard Deviation
 Ungrouped Data
• Population
• Sample
 Grouped Data
• Population
Sample
( )
2
m
( ) ( )
2
2
X
N
X
X
N
N
s
s
-
=
-
=
å
å å
( )
2
i f X
m
( ) ( )
2
2
N
fX
fX
N
N
s
s
-
=
-
=
å
å å
( )
X -
X
( )
s =
å å
( ) ( )
1
1
2
2
2
-
-
=
-
å
n
X
n
X
s
n
f X -
X
=
å å
( ) ( )
1
1
2
2
2
-
-
=
-
å
n
fX
n
fX
s
n
s

 Sebuah sampel yang
terdiri dari sepuluh
bioskop di Surabaya
dihitung jumlah film
yang diputar minggu lalu.
Hitunglah varian dan
standar deviasinya.
Jumlah
film yang
diputar
frequency
f
1 up to 3 1
3 up to 5 2
5 up to 7 3
7 up to 9 1
9 up to 11 3
Total 10

Movies
showing
f class
midpoint
x
(f .x) x-xbar
f*(x-xbar)^2
1 up t o 3 1 2 2 -4.6 21.16
3 up t o 5 2 4 8 -2.6 13.52
5 up t o 7 3 6 18 -0.6 1.08
7 up t o 9 1 8 8 1.4 1.96
9 up to 11 3 10 30 3.4 34.68
Total 10 66 72.40
( )2
f X X
2 72.40 8.04
1 10 1
s
n
-
= = =
- -
å
s = s2 = 8.04 = 2.83

Interpretasi dan Penggunaan Standar
Deviasi
21
Teorema Chebyshev : untuk setiap kelompok
pengamatan (baik sampel maupun populasi), proporsi
minimum nilai-nilai yang terletak dalam standar deviasi
rata-rata k sekurang-kurangnya adalah:
1- 1
k2
dimana k2 adalah konstanta yang lebih besar dari 1.

Contoh:
Rata-rata hitung harga sepatu Nike adalah $51.54 dengan standar
deviasi $7.51. Setidaknya berapa persen harga yang berada antara
plus 3.5 standar deviasi dan minus 3.5 standar deviasi dari rata-rata?
Sekitar 92%
1 0.92
1- 1 1- 1
= = = 2 2
(3.5) 12.25
k

Teorema Chebyshev
Teorema Chebyshev: Untuk semua jenis pengamatan, proposi
minimum nilai yang terletak dalam kisaran standar deviasi rata-rata
k sekurang-kurangnya adalah 1- 1/k2
K Coverage
1 0%
2 75.00%
3 88.89%
4 93.75%
5 96.00%
6 97.22%
Ingat: semakin kecil standar deviasi, menunjukkan bahwa pengamatan berada
didekat rata-rata, vice versa.

Interpretasi dan Penggunaan Standar
Deviasi
24
Aturan Empiris: Untuk setiap distribusi yang simetris &
berbentuk lonceng (bell-shaped) :
Sekitar 68% observasi akan berada pada plus dan minus 1 standar
deviasi rata-rata,
Sekitar 95% observasi akan berada pada plus dan minus 2 standar
deviasi rata-rata,
Dalam prakteknya, hampir semua observasi berada dalam plus
dan minus 3 standar deviasi rata-rata.
Aturan Empiris juga disebut sebagai Aturan normal.

Kurva Berbentuk Lonceng menunukkan hubungan antara σ dan μ
25
m-3s m-2s m-1s m m+1s m+2s m+ 3s

Mengapa perlu memperhatikan dispersi?
26
Dispersi dipergunakan sebagai salah satu ukuran risiko.
Bandingkan dua aset dengan rata-rata expected return
yang sama:
-2%, 0%,+2%
-4%, 0%,+4%
Dispersi return aset kedua lebih besar dibandingkan
yang pertama. Dengan demikian, aset kedua yang lebih
berisiko.
Hal ini menunjukkan bahwa dispersi sangat penting
untuk keputusan investasi, disamping informasi rata-rata
expected return .

Dispersi Relatif
Koefisien Variasi adalah rasio dari standar deviasi terhadap rata-rata
aritmatik, dinyatakan dalam persentase:
CV=
CV: coefficient of variation
s: standar deviasi
x-bar: rata-rata
s
(100%)
X
Berguna untuk membandingkan dua atau lebih distribusi yang:
Datanya memiliki satuan /unit yang berbeda (misalnya: hari dan Rupiah)
Datanya memiliki satuan / unit yang sama, tetapi rata-ratanya sangat jauh
berbeda (misal: gaji direktur dengan gaji buruh kasar)

Contoh
28
Sebuah studi tentang bonus dan lama bekerja menghasilkan informasi statistik
sebagai berikut:
Rata-rata bonus: $200, standar deviasi bonus: $40
Rata-rata lama bekerja: 20 tahun, standar deviasi: 2 tahun
Bandingkan kedua distribusi tersebut (ingat masing-masing memiliki satuan yang
berbeda)
Digunakan koefisien variasi:
CV= s (100%) = (100%) = 20%
40
200
Untuk Bonus:
X
Untuk lama bekerja
 Dispersi untuk bonus lebih besar dibanding rata-ratanya.
CV= s (100%) = (100%) = 10%
2
20
X

Skewness (Kemencengan/ asimetris) 
a3
Skewness (Kemencengan/ asimetris) adalah pengukuran dari
kurangnya simetri pada distribusi.
Koefisien skewness (kemencengan) dapat berkisar dari -3,00
(asimetris negatif) sampai 3,00 (asimetris positif).
Nilai 0 menunjukkan distribusi yang simetris.
Koefisien Kemencengan ini dihitung sebagai berikut:
Pearson:
Software:
3(x -median)
S
sk =
ù
ú ú
û
é
ê ê
ë
ö
÷ ÷ø
æ - å
ç çè
3
x x
s
sk = n
(n -1)(n - 2)

Skewness
Sk = 0 (symmetric)
Sk = + (positively skewed)
Sk = - (negatively skewed)
Croxton & Cowden -3 £ Sk £ 3

Cont..
Bowley :
( ) ( )
( 3 2 ) ( 2 1 )
S = Q - Q - Q -
Q kB - + -
3 2 2 1
Q Q Q Q
SkB = 0  symmetric (Q2-Q1 = Q3-Q2)
SkB = +  positively skewed
(Q2-Q1 < Q3-Q2)
SkB = -  negatively skewed
(Q2-Q1 > Q3-Q2)
SkB = ± 0,1 (not significantly skewed)
SkB > ± 0,3 (significantly skewed)

Cont..
Relative skewness :
Ungrouped data :
Grouped data :
nåX -X
nåf X -X
Karl Pearson : a3 ³ ± 0,5
Kenny & Keeping :
 -2 £ a3 £ 2 (moderately skewed)
a3 ³ ± 2 (significantly skewed)
( )
3
3
3
1
s
a =
( )
3
3
3
1
s
a =

Skewness for Grouped Data
Penjualan f Xi f (Xi - X ) ^3
20-30 4 25 -101,648.74
30-40 7 35 -51,109.69
40-50 8 45 -6,644.67
50-60 12 55 2.59
60-70 9 65 10,719.14
70-80 8 75 69,934.53
80-90 2 85 57,305.23
Total 50 -21,441.60
( )
0,10
-
50 21.441,60
16,18
1
a =
3 3 =-

Kurtosis (Peakedness)
Kurtosis
Ukuran ketinggian distribusi frekuensi
Platykurtic (relatif datar dan menyebar)
Mesokurtic (normal)
Leptokurtic (tinggi dan tipis)

Kurtosis (1)
- 3 . 5 - 2 . 7 - 1 . 9 - 1 . 1 - 0 . 3 0 . 5 1 . 3 2 . 1 2 . 9 3 . 7
7 0 0
6 0 0
5 0 0
4 0 0
3 0 0
2 0 0
1 0 0
0
X
F re q ue n c y
Platykurtic - flat distribution

Kurtosis (2)
- 4 - 3 - 2 - 1 0 1 2 3 4
5 0 0
4 0 0
3 0 0
2 0 0
1 0 0
0
X
F re q ue n c y
Mesokurtic – tidak terlalu datar tidak terlalu tinggi (normal)

Kurtosis (3)
Leptokurtic – distribusi yang tinggi
- 1 0 0 1 0
2 0 0 0
1 0 0 0
0
Y
F re q ue n c y

Kurtosis (Peakedness)
Formula :
Ungrouped data :
Grouped data :
nåX -X
Nåf X -X
Note :
a4 = 3  normal/mesokurtic
a4 = 3  leptokurtic
a4 = 3  platykurtic
( )
4
4
4
1
s
a =
( )
4
4
4
1
s
a =

Peakedness for Grouped Data
Penjualan f Xi f . Xi f (Xi - X ) ^4
20-30 4 25 100.00 2,988,472.84
30-40 7 35 245.00 991,527.95
40-50 8 45 360.00 62,459.92
50-60 12 55 660.00 1.56
60-70 9 65 585.00 113,622.93
70-80 8 75 600.00 1,440,651.28
80-90 2 85 170.00 1,753,540.10
Total 50 2,720.00 7,350,276.56
( )
2,15
50 7.350.276,56
16,18
1
4 4 a = =

Kuartil, Desil, dan Persentil
42
Fraktil adalah nilai-nilai data yang membagi seperangkat data yang telah
terurut menjadi beberapa bagian yang sama.
Kuartil: membagi sekelompok observasi/ pengamatan yang
telah diurutkan dari kecil ke besar menjadi 4 bagian yang
sama.
(Q1: 25%, Q2: 50%, Q3: 75%)
Desil: membagi sekelompok observasi/ pengamatan yang
sama.
Persentil: membagi sekelompok observasi/ pengamatan yang
sama.

Lokasi Persentil
43
Lokasi persentil dapat ditentukan dengan rumus sbb:
L = (n 1) P p +
100
Lp : Lokasi persentil yang dicari
n : jumlah pengamatan
P: Persentil yang dicari

Contoh 5
44
Quality Control pabrik selai kacang DK mencatat data
berat 9 botol selai yang diproduksi dalam satu jam
terakhir:
7,69 7,72 7,8 7,86 7,90 7,94 7,97 8,06 8,09
Tentukan Kuartil pertama.
Tentukan Persentil ke-67.

Contoh 5 continued
45
7,69 7,72 7,8 7,86 7,90 7,94 7,97 8,06 8,09
 Kuartil pertama:
2.5
L = (9 1) 25 25 + =
100
Kuartil pertama berada pada urutan ke-2.5 (antara data ke-2 dan ke-3):
7,72 + [(7,8-7,72)*0.5)= 7,72 + 0.04 = 7.76
 Persentil ke-67:
L = (9 1) 67 6.70
67 + =
100
Persentil ke-67 berada pada urutan ke-6.70 (antara ke-6 ke-7):
7,94 + [(7.97-7,94)*0.7]= 7.94 + 0.02 = 7.96

Untuk data yang dikelompokkan, urutan:
1. Susun Distribusi Frekuensi Kumulatif
2. Tentukan Lokasi Persentil:
Lokasi Persentil  Lp = n . P .
100
3. Gunakan formula sbb:
Persentil : P = L + ( n. P/100 - CF) . i
fp
Pi = Persentil ke-i.
L = Batas bawah kelas persentil
n = Jumlah frekuensi.
CF = Frekuensi kumulatif sebelum kelas Persentil
f = Frekuensi kelas persentil
i = Interval kelas

Contoh
Tentukan Kuartil pertama (P25) dari data berikut:
Lokasi Persentil: 10*25/100= 2.5  kelas 3-5
P25 = 3 + [(2.5 – 1)/2] * 2
= 4.5
Jumlah film
yg diputar
Frekuensi Frekuensi
Kumulat if
1 up to 3 1 1
3 up to 5 2 3
5 up to 7 3 6
7 up to 9 1 7
9 up to 11 3 10

Jangkauan (Rentang) Interkuartil
48
Rentang interkuartil adalah jarak antara kuartil ketiga
Q3 dan kuartil pertama Q1.
Rentang ini akan mencakup nilai tengah 50 persen dari
pengamatan.
Rentang Interkuartil= Q3 - Q1

Contoh 6
49
Untuk sekelompok observasi, Q3 adalah 24 dan Q1
adalah 10. Berapa rentang kuartilnya?
Rentang interkuartil: 24 - 10 = 14. Lima puluh persen
dari observasi berada antara 10 dan 24.

Others Dispersion
Quartile Deviation :
d = -
Coefficient of Quartile Variation :
3 1 Q Q
2
Q
( Q Q
)
V 2 3 1 -
d
=
Q M
V = Q -
Q Q +
3 1
Q Q
3 1

Data ekstrim (outliers)
51
Data ekstrim: nilai yang tidak konsisten dengan keseluruhan
data. Yakni data yang lebih besar dari 1,5 jangkauan
interkuartil (Q3-Q1) dan lebih kecil dari Q1 atau lebih besar
dari Q3.
Outlier (Ekstrim) kecil:
x Q1 – 1.5 (Q3-Q1)
Outlier (Ekstrim) besar:
x Q3 + 1.5 (Q3-Q1)

Contoh
Berikut ini data total pengeluaran mahasiswa selama 1 bulan (dalam ribuan):
Q1= 175, Q2= 350, Q3= 930, min: 0, Max: 1750
apakah ada outlier dalam data ini?
Outlier (Ekstrim) kecil:
x 175 – 1.5 (930-175)
x - 957.5
Outlier (Ekstrim) besar:
x 930 + 1.5 (930-175)
x 2062.5
Oleh karena data min: 0 max: 1750, maka tidak ada data outlier.

Box Plots
53
Box plot adalah tampilan grafis, yang didasarkan pada
kuartil, yang membantu untuk menggambarkan satu set
data.
Ada 5 data yang diperlukan untuk menyusun sebuah
box plot:
1. Nilai Minimum,
2. Kuartil Pertama,
3. Median,
4. Kuartil Ketiga,
5. Nilai Maksimum.

Contoh 7
54
Berdasarkan sampel dari 20 pengiriman, Buddy's Pizza
memperoleh informasi berikut. Waktu pengiriman
minimum adalah 13 menit dan maksimal 30 menit.
Kuartil pertama adalah 15 menit, median 18 menit, dan
kuartil ketiga 22 menit. Susun box plot untuk
pengiriman tersebut.

Contoh 7 continued
55
median
Q1 Q3
min max
12 14 16 18 20 22 24 26 28 30 32

Statistik 1 3 dispersi

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (13)

Similar to Statistik 1 3 dispersi

Similar to Statistik 1 3 dispersi (20)

Recently uploaded

Recently uploaded (20)

Statistik 1 3 dispersi

Editor's Notes