2. Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, merangkum, menyederhanakan,
menyajikan, menginterpretasikan, menganalisa dan
mensintesa data (numerik atau nonnumerik) untuk
menghasilkan informasi dan/atau kesimpulan, yang
membantu dalam penyelesaian masalah dan/atau
pengambilan keputusan.
2
4. Statistika Inferensia
Statistika inferensia adalah cabang statistika yang
menganalisa atau mensintesa data untuk
menggeneralisasi sampel terhadap populasi,
mengestimasi parameter, menguji hipotesa, menilai
relasi, dan membuat prediksi untuk menghasilkan
informasi dan/atau kesimpulan.
Terdapat banyak alat bantu statistika (statistical tools)
yang dapat dipergunakan untuk menginferensi
populasi atau sistem yang menjadi sumber asal data
sampel
4
5. Statistika Inferensia
5
Tujuan studi terhadap populasi Observasi atau eksperimen pada sampel
SAMPLING
INFERENSI
Parameter :
N (banyaknya anggota populasi),
μ (rata-rata populasi),
σ (simpangan baku populasi),
π (proporsi populasi)
Statistik :
n (banyaknya anggota sampel),
ẋ (rata-rata sampel),
s (simpangan baku sampel),
p (proporsi sampel)
6. Tipe Data
Data Nominal, data yang hanya berupa simbol (meski berupa
angka) untuk membedakan nilainya tanpa menunjukkan tingkatan
Data Ordinal, data yang mempunyai nilai untuk menunjukkan
tingkatan, namun tanpa skala yang baku dan jelas antar tingkatan.
Data Interval, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala tertentu sesuai intervalnya. Nilai nol hanya
untuk menunjukkan titik acuan (baseline).
Data Rasio, data yang mempunyai nilai untuk menunjukkan
tingkatan dengan skala indikasi rasio perbandingan. Nilai nol
menunjukkan titik asal (origin) yang bernilai kosong (null).
6
7. Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free)
7
8. Tipe Data
Data Diskrit, data hasil pencacahan atau
penghitungan, sehingga biasanya dalam angka
bilangan bulat.
Data Kontinyu, data hasil pengukuran yang
memungkinkan dalam angka bilangan nyata
(meskipun dapat pula dibulatkan)
8
9. Statistika Alat Bantu Problem Solving
9
Penting memperhatikan
cara memperoleh
data yang akan diolah
Demikian pula
cara mengolah data
juga penting diperhatikan
10. Statistika Alat Bantu Problem Solving
10
Metode statistika bukan
ramuan sihir
Alat statistika bukan
tongkat sihir
12. Akurasi dan Presisi
Akurasi (accuracy), kesesuaian hasil pengukuran
terhadap nilai obyek sesungguhnya (bias kecil)
Presisi (precision), tingkat skala ketelitian
pengukuran dari alat pengukur, atau ketersebaran
yang relatif mengumpul (variansi atau deviasi kecil)
12
13. Akurat dan Presisi
Tidak presisi, akibat pola sebaran sampel
lebih melebar daripada pola sebaran
populasi menyebabkan deviasi yang besar.
Tidak akurat, akibat pergeseran
pemusatan sampel menjauh dari
pemusatan populasi menyebabkan bias
yang besar.
Akurat dan presisi, bias dan deviasi kecil,
membutuhkan sampel sedikit.
13
14. Kesalahan Pengambilan Kesimpulan
Galat tipe 1 () : kesalahan menyimpulkan karena
menolak hipotesa yang semestinya diterima
Galat tipe 2 () : kesalahan menyimpulkan karena
menerima hipotesa yang semestinya ditolak
14
15. Kesalahan Pengambilan Kesimpulan
15
The true state of nature
Decision H0 is true H0 is false
Reject H0 Type I error Exact decision
Fail to reject H0 Exact decision Type II error
The true state of nature
Decision H0 is true H0 is false
Reject H0 1 –
Fail to reject H0 1 –
16. Ukuran Ketelitian Pendugaan
Tingkat keberartian (significance level, ), probabilitas
penolakan data observasi, karena menyimpang signifikan terhadap
sasaran.
Tingkat kepercayaan (confidence coefficient,1-), persentase
data observasi yang diyakini tidak berbeda signifikan dengan target.
Kuasa statistik (power,1-), persentase data observasi yang
diyakini berbeda signifikan dengan target.
Derajat kebebasan (degree of freedom, df=n-k), besaran
yang menunjukkan bebas terhadap bias dari n data observasi.
16
17. Kekeliruan pada Analisa Regresi
Tidak ada logika penalaran atau alasan logis yang mendasari hipotesa
variabel bebas mempengaruhi variabel terikat.
Deskripsi dari variabel bebas tidak mempunyai hubungan kausal
dengan deskripsi dari variabel terikat.
Pengukuran atau pengumpulan data dilakukan oleh/dari pihak yang
mempunyai konflik kepentingan atau yang tidak punya kewenangan
atas data.
Variabel bebas dan/atau variabel terikat diukur pada hanya satu obyek
yang bernilai tunggal atau statis.
Rentang data sampel sangat sempit, namun dipergunakan untuk
menginduksi rentang populasi yang sangat lebar dengan ekstrapolasi.
17
18. Kekeliruan pada Analisa Regresi
Variabel bebas (x) = tinggi badan anak-anak di desa A (pertumbuhan tiap tahunnya);
Variabel terikat (y) = harga emas (kenaikan tiap tahunnya). Meskipun jika dihitung,
menunjukkan pertumbuhan tinggi badan anak-anak di desa A mempunyai korelasi
kuat dengan kenaikan harga emas.
Variabel bebas (x) = motivasi kerja; Variabel terikat (y) = kinerja. Deskripsi “motivasi
kerja” adalah mendapatkan pengakuan dari keluarga besar karena menjadi karyawan
pabrik.Deskripsi “kinerja” adalah waktu penyelesaian pekerjaan lebih cepat daripada
batas waktu yang ditargetkan.
Data yang diukur : Banyaknya pelanggaran yang dilakukan. Ditanyakan pada pelaku
pelanggaran, atau pada pihak yang tidak pernah melihat pelaku pelanggaran.
Data yang diukur : Aturan pengupahan dari satu perusahaan di satu waktu.
Rentang data sampel pada 10 < x < 50, namun dipergunakan untuk menduga nilai Y
jika x=200.
18
41. Estimasi Parameter Regresi Polinomial
y = β0 + β1.x + … + βm.xm
1. Hitung x, x2, … , x2m, y , xy , … , xmy
2. Taksiran nilai β0 , β1 , … , βm dari
41
y
x
x
x
x
x
xy
x
x
x
x
y
x
x
x
n
m
m
m
m
m
m
m
m
m
m
2
2
2
1
1
0
1
3
2
2
1
0
2
2
1
0
49. Model Umum Regresi Nonlinier
49
No Model Fungsi Non Linier Fungsi Linier
1. Exponential model y = a0.ea1.x Ln(y) = Ln(a0) + a1.x
2. Power model y = a0.xa1 Ln(y) = Ln(a0) + a1.Ln(x)
3. Logistic model y = ea0+a1.x Ln(y) = a0 + a1.x
4. Saturation growth y = (a0.x) / (a1 + x) 1/y = 1/a0 + a1/a0.x
Algoritma :
1. Transformasi data dari fungsi non linier ke dalam bentuk fungsi linier
2. Lakukan analisa regresi linier
50. Example 3
50
)
,
(
,
...
),
,
(
),
,
( 2
2
1
1 n
n y
x
y
x
y
x
Given best fit
bx
ae
y to the data.
Figure. Exponential model of nonlinear regression for y vs. x data
bx
ae
y
)
,
(
n
n
y
x
)
,
( 1
1
y
x
)
,
(
2
2
y
x
)
,
(
i
i
y
x
i
bx
i ae
y
51. Example 3
51
Finding Parameter of Exponential Model
To find the parameters of many nonlinear models, it results in solving
simultaneous nonlinear equations. For mathematical convenience,
some of the data for such models can be transformed. For example,
the data for an exponential model can be transformed.
As shown in the previous example, many chemical and physical processes
are governed by the equation,
bx
ae
y
Taking the natural log of both sides yields,
bx
a
y
ln
ln
Let y
z ln
and a
a ln
0
(implying) o
a
e
a with b
a
1
We now have a linear regression model where x
a
a
z 1
0
52. Example 3
52
Finding Parameter of Exponential Model
Using linear model regression methods,
_
1
_
0
1
2
1
2
1
1 1
1
x
a
z
a
x
x
n
z
x
z
x
n
a
n
i
n
i
i
i
n
i
i
n
i
n
i
i
i
i
Once 1
,a
ao are found, the original constants of the model are found as
0
1
a
e
a
a
b
53. Example 3
53
Finding Parameter of Exponential Model
Substituting a back into the previous equation
0
1
2
1
2
1
1
n
i
bx
i
n
i
bx
bx
n
i
i
bx
i
n
i
i
i
i
i
i e
x
e
e
y
e
x
y
The constant b can be found through numerical methods
such as bisection method.
n
i
bx
n
i
bx
i
i
i
e
e
y
a
1
2
1
Solving the first equation for a yields
54. Example 3
54
x (t, hours) 0 1 3 5 7 9
y (γ) 1.000 0.891 0.708 0.562 0.447 0.355
Many patients get concerned when a test involves injection of a
radioactive material. For example for scanning a gallbladder, a
few drops of Technetium-99m isotope is used. Half of the
Technetium-99m would be gone in about 6 hours. It, however,
takes about 24 hours for the radiation levels to reach what we
are exposed to in day-to-day activities. Below is given the
relative intensity of radiation as a function of time.
Table. Relative intensity of radiation as a function of time.
55. Example 3
55
Find:
a) The value of the regression parameters A and λ
b) The half-life of Technetium-99m
c) Radiation intensity after 24 hours
The relative intensity is related to time by the equation
x
a
t
e
a
y
Ae .
1
0
• Variabel independen/bebas : t
• Variabel dependen/terikat : γ
• Konstanta : A, λ
Transform into linear form
t
A
ln
ln
Assuming
ln
z ,
A
ao ln
and
1
a we obtain
t
a
a
z
1
0
This is a linear relationship between z and t
58. Example 3
58
Using the linear relationship, we can calculate 1
0 ,a
a
n
i
n
i
i
n
i
i
n
i
n
i
i
i
i
t
t
n
z
t
z
t
n
a
1
2
1
2
1
1
1 1
1
and
t
a
z
a 1
0
where
1
a
0
a
e
A
59. Example 3
59
Calculating 1
0 ,a
a
2
1
25
00
.
165
6
8778
.
2
25
990
.
18
6
a 11505
.
0
6
25
11505
.
0
6
8778
.
2
0
a
4
10
6150
.
2
Since
A
a ln
0
0
a
e
A
4
10
6150
.
2
e 99974
.
0
11505
.
0
1
a
also
The regression formula is then
t
e 11505
.
0
99974
.
0
60. Example 3
60
Resulting model is
t
e 11505
.
0
99974
.
0
0
0.5
1
0 5 10
Time, t (hrs)
Relative
Intensity
of
Radiation,
t
e 11505
.
0
99974
.
0
Figure. Relative intensity of radiation as a function of
temperature using transformation of data model.
61. Example 3
61
b) Half life of Technetium-99m is when
0
2
1
t
hours
.
t
.
t
.
.
e
e
.
e
.
t
.
.
t
.
0248
6
5
0
ln
11505
0
5
0
99974
0
2
1
99974
0
11508
0
0
11505
0
11505
0
62. Example 3
62
c) The relative intensity of radiation after 24 hours is then
24
11505
.
0
99974
.
0
e
063200
.
0
This implies that only %
3216
.
6
100
99983
.
0
10
3200
.
6 2
of the radioactive
material is left after 24 hours.
Statistika dapat menjadi alat bantu dalam menyelesaikan masalah. Mulai dari saat mengumpulkan data, mengolah, menginterpresikan, menganalisa dan mensitesanya. Namun saat keliru menetapkan populasi atau keliru memilih sampel, serta keliru mendeskripsikan variabel yang akan diambil datanya, melalaikan tujuan penelitian, maka hasil pengolahannyapun akan menjadi sampah. Demikian pula meskipun data yang diambil benar dan representatif, namun metode dan alat pengolahannya pun keliru yang dipilih atau keliru cara mempergunakannya, maka hasilnya pun akan menjadi sampah. Sehingga perlu kita pahami bahwa statistika cuma alat berbasis model matematis, ada angka dimasukkan akan mengeluarkan hasil, entah itu benar atau sampah.
Alat statistika bukan tongkat sihir, apapun dan bagaimanapun keadaan datanya dengan tongkat sihir ajaib bisa mengubahnya menjadi hasil yang sesuai dengan tujuan penelitian. Metode statistika pun bukan ramuan sihir, apapun dan bagaimanapun keadaan datanya diolah dalam ramuan sihir ajaib bisa mewujudkan hasil yang sesuai dengan tujuan penelitian.