2. VERİ BİLİMİ NEDİR?
Veri olarak tanımlanabilen her türden varlığın
içerisinde; mevcut durumu tanımlayan, bilgi
odaklı keşifler yapan, kategorize edici,
sınıflandırıcı ve mevcut durum üzerinden
gelecek ile ilgili tahminler yapılabilen bilgi
odaklı çalışma sürecinin tamamına veri bilimi
adı verilir.
Büyük veri tabanları içerisinde daha önceden
bilinmeyen, nitelikli bilgilerin(knowledge)
ortaya çıkarılabilmesi için kullanılan İstatistik
(Statistic), Makine Öğrenmesi (Machine
Learning), Yapay Zeka(Artificial Intelligence),
Veritabanı Yönetimi(Database
Management) ve Veri Görselleştirme (Data
Visualization)vd. yöntemleri içeren teknikler
bütünüdür. 2
3. VERİ BİLİMİ BİLEŞENLERİ
• Makine Öğrenimi & Yapay Zeka
• İstatistik
• Veri Tabanları
• Bilgisayar Bilimleri
• Uzman Sistemler
• Veri Görselleştirme
3
4. İSTATİSTİK
Modern Veri Bilimi, dünyanın
istatistiksel modellenmesi
üzerine
kurulmuştur. İstatistiksel
Öğrenme Teorisi olarak
adlandırılan disiplin, çözmek
istediğimiz problemleri birer
istatistiksel model halinde ifade
ederek optimum parametreler
üzerinden problemlerin
çözümüne ulaşmayı hedefler.
4
5. MAKİNE ÖĞRENMESİ
Bilgisayarların açık ve doğrudan bir şekilde
programlanmadan bir görevi yapmayı
öğrenmelerini amaçlayan disiplindir.
Makine Öğrenmesi “öğrenme” işini veriye
bakarak yapıyor. Yani Makine
Öğrenmesi dediğimiz alan veriyi girdi olarak
alan ve bir görevi model olarak temsil edebilen
algoritmaların bütününden ibaret.
Görev dediğimiz ise bir metni
kategorilendirmek, bir fotoğraftaki insanları
tanımak, dolar kurunun bir gün sonraki değerini
tahmin etmek gibi amaçladığımız işler.
5
6. BİLGİSAYAR BİLİMLERİ
Veri Bilimi elbette sadece istatistik biliminden yararlanmamaktadır..
İstatistik kadar önemli bir bileşen de programlama.
PROGRAMLAMA DİLLERİNİ KULLANMA AMAÇLARI
1. Veri’yi depolardan, veri tabanlarından ya da dosyalardan çekmek.
2. Veri manipülasyonu, temizlemesi ve üretimi yapmak.
3. Veriyi görselleştirmek.
4. Veri üzerinden matematiksel işlemler yaparak, tanımlayıcı istatistikler
çıkarmak.
5. Makine Öğrenmesi metodlarını bilgisayarların anlayacağı kodlara
dökmek.
6. Modellerimizi veri ile eğitmek
7. Modellerimizi dış dünyaya hizmet vermek için üretim sistemlerine
aktarmak ve modellerimizi üretim ortamında sürekli canlı tutmak 6
7. VERİ MADENCİLİĞİ NEDİR?
Veri Madenciliği, çok büyük
boyuttaki veri setlerinde açık
olmayan, önceden bilinmeyen
ve yararlı olan örüntülerin ya
da ilişkilerin belirlenip karar
destek amaçlı yararlı bilgiye
dönüştürülmesi sürecidir.
7
8. VERİ MADENCİLİĞİ
VERİ MADENCİLİĞİ SÜREÇLERİ
1. Veri Temizleme
2. Veri Bütünleştirme
3. Veri Seçme(İndirgeme)
4. Veri Dönüştürme
5. Veri Madenciliği Algoritmaları Uygulaması
6. Örüntüler(Desenler)
7. Sunum ve Değerlendirme
8
9. VERİ MADENCİLİĞİ SÜREÇLERİ
Veri Temizleme,
Veri Bütünleştirme,
Veri Seçme (İndirgeme),
Veri Dönüştürme,
Veri Madenciliği Algoritmaları Uygulanması,
Örüntüler (Desenler)
Sunum ve Değerlendirme
9