SlideShare una empresa de Scribd logo
1 de 4
TUGAS DATA MNING
Khairul Sani
Syamsul Mujahidin
1. Why knowledge about your data is useful for data mining?
Data mining merupakan peroses mengolah data dalam ukuran yang sangat besar dengan
tujuan untuk mendapatkan informasi atau pola dari data yang diolah. Pada data mining
merupakan rangkaian dari proses pencarian pengetahuan database yaitu knowledge
discovery in database dengan teknik integrasi dan penemuan ilmiah, interpretasi dan
visualisasi dari pola-pola sejumlah kumpulan data. Dalam proses pengolahan data
tersebut terkadang diperoleh hasil yang tidak sesuai yang diharapkan seperti pola yang
tidak tepat serta tidak sesuai dengan kebutuhan. Untuk itu dibutuhkan pengetahuan
tentang data yang akan digunakan dalam data mining, dengan pengetahuan tentang data
yang akan diolah tersebut, kita bisa menentukan mulai dari input yang diperlukan untuk
pengolahan data, output yang bisa kita peroleh dari proses data mining, perlu atau
tidaknya melakukan preprocessing terhadap data yang kita miliki. Sehingga data bisa
disusun atau disajikan dengan baik dan meminimalisir data-data yang tidak perlu
digunakan serta hasil dari proses data mining bisa memberikan informasi sesuai yang
diharapkan.
2. What are the realizations of knowledge about your data?
Dengan adanya pengetahuan tentang data, data bisa disajikan dengan cara yang tepat,
mulai dari preprocessing data, data mining, hingga post processing. Tahapan yang
dilakukan seperti pendefinisan attribute yang sesuai dengan tipe datanya, pemilihan
metode yang tepat dan algoritma- algoritma yang sesuai untuk digunakan dalam
menangani dataset. Pada tahap post processing data yaitu melakukan interpretasi
terhadap pola pola yang ditemukan selama proses data mining sehingga dependensi dari
data bisa utuh serta dan perlakuan terhadap missing values bisa tepat sehingga sesuai
yang diharapkan dan tujuan dari dilakukannya data mining.
3. What can you do to know/understand your data?
Untuk memperoleh data yang bagus, diperlukan pemahaman tentang jenis data yang
digunakan sebagai inputan maupun output yang diinginkan. Dalam hal ini cara yang
biasa digunakan adalah melihat distribusi nilai dari attribut nominal maupun numeric.
Selain itu perlu adanya literature yang seusai sebagai referensi serta melakukan
konsultasi dengan pakar tentang keabsahan dan jenis data yang digunakan.
4. Study kasus yang digunakan adalah dataset soyabine.arff.
 Data set yang digunakan adalah soybean format excel. File tersebut diubah menjadi
extensi .csv dengan melakukan pendefinisian untuk atributnya sesuai dengan tipe
datanya, kemudian diubah dengan forman .arff baru kemudian diolah menggunakan
weka. Dataset yang dibunakan sebanyak 307 instance dan 36 atribut.
 Metode yang digunakan dalam hal ini adalah decision-tree J48 karena metode tersebut
sangat cocok dengan kasus missing values. Dengan menggunakan metode ini, jika sebuah
instance memiliki missing values maka, instance tersebut akan dipecah menjadi potongan-
potangan, dimana satu potongan untuk masing-masing cabang. Potongan tersebut akan
berkontribusi dalam mengambil keputusan pada node paling bawah. Selain itu tingkat presisi
dari metode ini cukup tinggi yakni 0.985 dan tingkat incorrect clasifikasinya hanya 3.333%.
 Tampilan AwalWEKA
 Ubah ke format ARFF dan pastikan dapat dibuka menggunakan WEKA
 Berikut hasil output classifier
 Gambar dibawah ini yaitu menampilkan evaluation on training set yang mempunyai
nilai corrently casssified instances 96.6667% dan incorrently yaitu 3.3333%.
 Berikut tampilan classifier tree visualizer
 Kesimpulan :
Dari hasil melakukan percobaan, maka dapat disimpulkan bahwa klasifikasi dengan
menggunakan J48 dapat menghasilkan nilai akurasi yang baik dari pada menggunakan cluster
Nives bayes berdasarkan perhitungan dari WEKA. Hal ini dapat dicoba melalui hasil nilai
precision yang lebih baik yaitu mencapai 0.985, dan nilai corrently casssified instances
96.6667% sedangkan naïve bayes hanya 80%. Maka dapat disimpulkan akurasi
menggunakan classifier J48 menghasilkan nilai akurasi yang lebih baik dari Nives bayes.

Más contenido relacionado

La actualidad más candente

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
 
KOMPUTERISASI SISTEM PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK
KOMPUTERISASI SISTEM  PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK  KOMPUTERISASI SISTEM  PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK
KOMPUTERISASI SISTEM PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK Seto Elkahfi
 
Dw 7-intelijensi buatan
Dw 7-intelijensi buatanDw 7-intelijensi buatan
Dw 7-intelijensi buatanDian Sari
 
Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...
Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...
Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...Gede Surya Mahendra
 
Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012aiiniR
 
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803Alvian yudha Prawira
 
Jurnal biaya pasien rawat inap penyakit jantung
Jurnal biaya pasien rawat inap penyakit jantungJurnal biaya pasien rawat inap penyakit jantung
Jurnal biaya pasien rawat inap penyakit jantungAndy Murtanto
 
Ppt singkat Pengantar Statistika kelompok 4
Ppt singkat Pengantar Statistika kelompok 4Ppt singkat Pengantar Statistika kelompok 4
Ppt singkat Pengantar Statistika kelompok 4Maysy Maysy
 

La actualidad más candente (12)

Data mining
Data miningData mining
Data mining
 
Ifc modul 5 (searching)
Ifc   modul 5 (searching)Ifc   modul 5 (searching)
Ifc modul 5 (searching)
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
KOMPUTERISASI SISTEM PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK
KOMPUTERISASI SISTEM  PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK  KOMPUTERISASI SISTEM  PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK
KOMPUTERISASI SISTEM PENGOLAHAN DATA PASIEN PADA NATURA HEALTH CENTER DEPOK
 
Dw 7-intelijensi buatan
Dw 7-intelijensi buatanDw 7-intelijensi buatan
Dw 7-intelijensi buatan
 
Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...
Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...
Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...
 
Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012
 
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
 
10
1010
10
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
Jurnal biaya pasien rawat inap penyakit jantung
Jurnal biaya pasien rawat inap penyakit jantungJurnal biaya pasien rawat inap penyakit jantung
Jurnal biaya pasien rawat inap penyakit jantung
 
Ppt singkat Pengantar Statistika kelompok 4
Ppt singkat Pengantar Statistika kelompok 4Ppt singkat Pengantar Statistika kelompok 4
Ppt singkat Pengantar Statistika kelompok 4
 

Destacado

Tapio Saavalainen - The story of a Finnish classic, the A class - HSS Classic
Tapio Saavalainen - The story of a Finnish classic, the A class - HSS ClassicTapio Saavalainen - The story of a Finnish classic, the A class - HSS Classic
Tapio Saavalainen - The story of a Finnish classic, the A class - HSS ClassicSail in Finland
 
Timo Telkola - America's Cup as a development platform for sails - HSS Classic
Timo Telkola - America's Cup as a development platform for sails - HSS ClassicTimo Telkola - America's Cup as a development platform for sails - HSS Classic
Timo Telkola - America's Cup as a development platform for sails - HSS ClassicSail in Finland
 
Tibet presentation
Tibet presentationTibet presentation
Tibet presentationBrianLindMN
 
Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...
Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...
Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...Sail in Finland
 
Education is the key to success
Education is the key to successEducation is the key to success
Education is the key to successThomas Sprow III
 
Antti Etelämäki - The past and the future of 6mR Renata - HSS Classic
Antti Etelämäki - The past and the future of 6mR Renata - HSS ClassicAntti Etelämäki - The past and the future of 6mR Renata - HSS Classic
Antti Etelämäki - The past and the future of 6mR Renata - HSS ClassicSail in Finland
 
Data mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannyaData mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannyaUniversitas Gadjah Mada
 
fringe benefit
fringe benefit fringe benefit
fringe benefit kareena23
 
Hanki tuloja omalla veneellä - jakamistalous ja veneily -
Hanki tuloja omalla veneellä - jakamistalous ja veneily - Hanki tuloja omalla veneellä - jakamistalous ja veneily -
Hanki tuloja omalla veneellä - jakamistalous ja veneily - Sail in Finland
 
fringe benefit
fringe benefit fringe benefit
fringe benefit kareena23
 
BizAdvize Services SB Profile NEW
BizAdvize Services SB Profile NEWBizAdvize Services SB Profile NEW
BizAdvize Services SB Profile NEWAmbrose Nathan
 

Destacado (18)

Tapio Saavalainen - The story of a Finnish classic, the A class - HSS Classic
Tapio Saavalainen - The story of a Finnish classic, the A class - HSS ClassicTapio Saavalainen - The story of a Finnish classic, the A class - HSS Classic
Tapio Saavalainen - The story of a Finnish classic, the A class - HSS Classic
 
Timo Telkola - America's Cup as a development platform for sails - HSS Classic
Timo Telkola - America's Cup as a development platform for sails - HSS ClassicTimo Telkola - America's Cup as a development platform for sails - HSS Classic
Timo Telkola - America's Cup as a development platform for sails - HSS Classic
 
Jaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDUJaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDU
 
Tibet presentation
Tibet presentationTibet presentation
Tibet presentation
 
Los Animales
Los AnimalesLos Animales
Los Animales
 
Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...
Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...
Jussi Gullichsen - Development of the 5.5 racing yacht and a personal racing ...
 
Ekis
EkisEkis
Ekis
 
Education is the key to success
Education is the key to successEducation is the key to success
Education is the key to success
 
Audit fraud and corruption
Audit   fraud and corruptionAudit   fraud and corruption
Audit fraud and corruption
 
Perkembangan Piranti Multimedia
Perkembangan Piranti MultimediaPerkembangan Piranti Multimedia
Perkembangan Piranti Multimedia
 
Antti Etelämäki - The past and the future of 6mR Renata - HSS Classic
Antti Etelämäki - The past and the future of 6mR Renata - HSS ClassicAntti Etelämäki - The past and the future of 6mR Renata - HSS Classic
Antti Etelämäki - The past and the future of 6mR Renata - HSS Classic
 
Information system in bussines today
Information system in bussines todayInformation system in bussines today
Information system in bussines today
 
Data mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannyaData mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannya
 
fringe benefit
fringe benefit fringe benefit
fringe benefit
 
Tugas switching khairul sani
Tugas switching khairul saniTugas switching khairul sani
Tugas switching khairul sani
 
Hanki tuloja omalla veneellä - jakamistalous ja veneily -
Hanki tuloja omalla veneellä - jakamistalous ja veneily - Hanki tuloja omalla veneellä - jakamistalous ja veneily -
Hanki tuloja omalla veneellä - jakamistalous ja veneily -
 
fringe benefit
fringe benefit fringe benefit
fringe benefit
 
BizAdvize Services SB Profile NEW
BizAdvize Services SB Profile NEWBizAdvize Services SB Profile NEW
BizAdvize Services SB Profile NEW
 

Similar a Tugas 1 data mining publish

ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptxRahmaNatasyah
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MININGNanzalXIV
 
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian dataKacung Abdullah
 
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...ferisulianta.com
 
BERPIKIR KOMPUTESIONAL 3.ppt
BERPIKIR KOMPUTESIONAL 3.pptBERPIKIR KOMPUTESIONAL 3.ppt
BERPIKIR KOMPUTESIONAL 3.pptAgusPurwadi20
 
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...ym.ygrex@comp
 
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724ssuser82ed8e
 
data mining
data miningdata mining
data miningdewi2093
 
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESSISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESHaris Pramudia
 
9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarmaArdianDwiPraba
 
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerEpul Logariasmoú
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfRinnaRachmatika2
 
Minggu7 - Expert System (Baru).pdf
Minggu7 - Expert System (Baru).pdfMinggu7 - Expert System (Baru).pdf
Minggu7 - Expert System (Baru).pdfWiliantoGan1
 

Similar a Tugas 1 data mining publish (20)

ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptx
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
 
Tugas sistem pakar
Tugas sistem pakarTugas sistem pakar
Tugas sistem pakar
 
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
 
Pertemuan 4.pdf
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
 
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...
 
BERPIKIR KOMPUTESIONAL 3.ppt
BERPIKIR KOMPUTESIONAL 3.pptBERPIKIR KOMPUTESIONAL 3.ppt
BERPIKIR KOMPUTESIONAL 3.ppt
 
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
 
BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
 
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
 
data mining
data miningdata mining
data mining
 
15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining
 
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESSISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
 
Klasifikasi Data.pptx
Klasifikasi Data.pptxKlasifikasi Data.pptx
Klasifikasi Data.pptx
 
9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma
 
Validasi data
Validasi dataValidasi data
Validasi data
 
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
 
DATA MINING
DATA MININGDATA MINING
DATA MINING
 
Minggu7 - Expert System (Baru).pdf
Minggu7 - Expert System (Baru).pdfMinggu7 - Expert System (Baru).pdf
Minggu7 - Expert System (Baru).pdf
 

Último

MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++FujiAdam
 
10.-Programable-Logic-Controller (1).ppt
10.-Programable-Logic-Controller (1).ppt10.-Programable-Logic-Controller (1).ppt
10.-Programable-Logic-Controller (1).ppttaniaalda710
 
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdfTEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdfYogiCahyoPurnomo
 
Metode numerik Bidang Teknik Sipil perencanaan.pdf
Metode numerik Bidang Teknik Sipil perencanaan.pdfMetode numerik Bidang Teknik Sipil perencanaan.pdf
Metode numerik Bidang Teknik Sipil perencanaan.pdfArvinThamsir1
 
Manual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptxManual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptxRemigius1984
 
MODUL AJAR PENGANTAR SURVEY PEMETAAN.pdf
MODUL AJAR PENGANTAR SURVEY PEMETAAN.pdfMODUL AJAR PENGANTAR SURVEY PEMETAAN.pdf
MODUL AJAR PENGANTAR SURVEY PEMETAAN.pdfihsan386426
 
4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdf
4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdf4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdf
4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdfAnonymous6yIobha8QY
 
Strategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaStrategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaRenaYunita2
 

Último (8)

MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++MAteri:Penggunaan fungsi pada pemrograman c++
MAteri:Penggunaan fungsi pada pemrograman c++
 
10.-Programable-Logic-Controller (1).ppt
10.-Programable-Logic-Controller (1).ppt10.-Programable-Logic-Controller (1).ppt
10.-Programable-Logic-Controller (1).ppt
 
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdfTEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
TEKNIS TES TULIS REKRUTMEN PAMSIMAS 2024.pdf
 
Metode numerik Bidang Teknik Sipil perencanaan.pdf
Metode numerik Bidang Teknik Sipil perencanaan.pdfMetode numerik Bidang Teknik Sipil perencanaan.pdf
Metode numerik Bidang Teknik Sipil perencanaan.pdf
 
Manual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptxManual Desain Perkerasan jalan 2017 FINAL.pptx
Manual Desain Perkerasan jalan 2017 FINAL.pptx
 
MODUL AJAR PENGANTAR SURVEY PEMETAAN.pdf
MODUL AJAR PENGANTAR SURVEY PEMETAAN.pdfMODUL AJAR PENGANTAR SURVEY PEMETAAN.pdf
MODUL AJAR PENGANTAR SURVEY PEMETAAN.pdf
 
4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdf
4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdf4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdf
4. GWTJWRYJJJJJJJJJJJJJJJJJJWJSNJYSRR.pdf
 
Strategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di IndonesiaStrategi Pengembangan Agribisnis di Indonesia
Strategi Pengembangan Agribisnis di Indonesia
 

Tugas 1 data mining publish

  • 1. TUGAS DATA MNING Khairul Sani Syamsul Mujahidin 1. Why knowledge about your data is useful for data mining? Data mining merupakan peroses mengolah data dalam ukuran yang sangat besar dengan tujuan untuk mendapatkan informasi atau pola dari data yang diolah. Pada data mining merupakan rangkaian dari proses pencarian pengetahuan database yaitu knowledge discovery in database dengan teknik integrasi dan penemuan ilmiah, interpretasi dan visualisasi dari pola-pola sejumlah kumpulan data. Dalam proses pengolahan data tersebut terkadang diperoleh hasil yang tidak sesuai yang diharapkan seperti pola yang tidak tepat serta tidak sesuai dengan kebutuhan. Untuk itu dibutuhkan pengetahuan tentang data yang akan digunakan dalam data mining, dengan pengetahuan tentang data yang akan diolah tersebut, kita bisa menentukan mulai dari input yang diperlukan untuk pengolahan data, output yang bisa kita peroleh dari proses data mining, perlu atau tidaknya melakukan preprocessing terhadap data yang kita miliki. Sehingga data bisa disusun atau disajikan dengan baik dan meminimalisir data-data yang tidak perlu digunakan serta hasil dari proses data mining bisa memberikan informasi sesuai yang diharapkan. 2. What are the realizations of knowledge about your data? Dengan adanya pengetahuan tentang data, data bisa disajikan dengan cara yang tepat, mulai dari preprocessing data, data mining, hingga post processing. Tahapan yang dilakukan seperti pendefinisan attribute yang sesuai dengan tipe datanya, pemilihan metode yang tepat dan algoritma- algoritma yang sesuai untuk digunakan dalam menangani dataset. Pada tahap post processing data yaitu melakukan interpretasi terhadap pola pola yang ditemukan selama proses data mining sehingga dependensi dari data bisa utuh serta dan perlakuan terhadap missing values bisa tepat sehingga sesuai yang diharapkan dan tujuan dari dilakukannya data mining. 3. What can you do to know/understand your data?
  • 2. Untuk memperoleh data yang bagus, diperlukan pemahaman tentang jenis data yang digunakan sebagai inputan maupun output yang diinginkan. Dalam hal ini cara yang biasa digunakan adalah melihat distribusi nilai dari attribut nominal maupun numeric. Selain itu perlu adanya literature yang seusai sebagai referensi serta melakukan konsultasi dengan pakar tentang keabsahan dan jenis data yang digunakan. 4. Study kasus yang digunakan adalah dataset soyabine.arff.  Data set yang digunakan adalah soybean format excel. File tersebut diubah menjadi extensi .csv dengan melakukan pendefinisian untuk atributnya sesuai dengan tipe datanya, kemudian diubah dengan forman .arff baru kemudian diolah menggunakan weka. Dataset yang dibunakan sebanyak 307 instance dan 36 atribut.  Metode yang digunakan dalam hal ini adalah decision-tree J48 karena metode tersebut sangat cocok dengan kasus missing values. Dengan menggunakan metode ini, jika sebuah instance memiliki missing values maka, instance tersebut akan dipecah menjadi potongan- potangan, dimana satu potongan untuk masing-masing cabang. Potongan tersebut akan berkontribusi dalam mengambil keputusan pada node paling bawah. Selain itu tingkat presisi dari metode ini cukup tinggi yakni 0.985 dan tingkat incorrect clasifikasinya hanya 3.333%.  Tampilan AwalWEKA  Ubah ke format ARFF dan pastikan dapat dibuka menggunakan WEKA
  • 3.  Berikut hasil output classifier
  • 4.  Gambar dibawah ini yaitu menampilkan evaluation on training set yang mempunyai nilai corrently casssified instances 96.6667% dan incorrently yaitu 3.3333%.  Berikut tampilan classifier tree visualizer  Kesimpulan : Dari hasil melakukan percobaan, maka dapat disimpulkan bahwa klasifikasi dengan menggunakan J48 dapat menghasilkan nilai akurasi yang baik dari pada menggunakan cluster Nives bayes berdasarkan perhitungan dari WEKA. Hal ini dapat dicoba melalui hasil nilai precision yang lebih baik yaitu mencapai 0.985, dan nilai corrently casssified instances 96.6667% sedangkan naïve bayes hanya 80%. Maka dapat disimpulkan akurasi menggunakan classifier J48 menghasilkan nilai akurasi yang lebih baik dari Nives bayes.