SlideShare una empresa de Scribd logo
1 de 16
Büyük Veri (Big data)
Hakkımda
 İstanbul Ünv . Bilgisayar Müh
 8+ Java , Java EE
 3+ Hadoop,Spark,Pig,Hive,Oozie
 Big Data Developer (Comodo)
İçerik
• Büyük Verilerin Özellikleri
• Büyük Verilerin saklanma yöntemleri
• Hadoop Nedir ve Temel Bileşenleri (HDFS , MapReduce)?
• Apache Spark , Apache Kafka , MongoDB
• Kullanım Senaryoları
• Uzmanlaşmak için tavsiyeler
Büyük Verilerin Özellikleri
Veri Miktarı (Volume)
◦ Boeing 737 uçağı tek bir uçuşta 240 terabyte veri üretmektedir
Veri hızı (Velocity)
◦ Bir dakika içerisinde 204 milyon e-mail , 1.8 milyon Facebook like , 278000 tweet işlemi yapılmaktadır
Veri çeşitliliği (Variety)
◦ Klasik veritabanı sistemleri küçük boyutta düzenli yapıdaki veriler için tasarlanmıştır . Oysa gerçek
hayatta resim , ses , konum , log , mekan verileri sıkça karşımıza çıkmaktadır
Verinin değerli olması (Value)
◦ Amazon firması tavsiye sistemi ile satış oranlarını %29 artırmıştır
Büyük verilerin saklanma yöntemleri
Verilerin karakteristiği ve işlenme yöntemine göre bir saklama sistemi kullanılır
Wide Column Stores/Column Family database
◦ HBase , Cassandra
◦ Buradaki yapı klasik veritabanına benzer bir şekilde tablo , kolon ve satır yapısı vardır.
Document Store
◦ ElasticSearch , MongoDB
◦ Veriler belirli bir şema yapısına sahip olmadan kaydedilir . JSON gibi
Key Value Store
◦ Redis , MemcacheDB
Hadoop Nedir ?
Hadoop , büyük veri kümeleri ile birden fazla makinada paralel olarak işlem yapmamızı sağlayan
Java ile yazılmış açık kaynak kodlu kütüphanedir
Hadoop Hdfs Nedir ?
Hadoop içerisinde büyük verileri sakladığımız bileşene HDFS (Hadoop Distributed File System)
denir
Hadoop MapReduce Nedir?
Hadoop içerisinde büyük verileri paralel olarak işleyebileceğimiz bileşene MapReduce denir .
Apache Spark
Spark büyük verileri işlemek için kullanılan bir kütüphanedir
Apache Kafka ile mesajlasma sistemleri
Apache Kafka büyük veri akışını düşük bir gecikme zamanı ile sağlayan açık kaynak kodlu bir
kütüphanedir
MongoDB
Mongo DB verileri JSON tabanlı kaydeden açık kaynak kodlu ilişkisel olmayan bir veritabanıdır
Kullanım Senaryoları
Örnek Analizler
 Son bir saat içerisinde 50 den fazla reklama tıklayan kullanıcılar
 Referer_url bilgisinden arama yapılan anahtar kelimelerin bulunması
 Tavsiye motoru (Müzik siteleri , sinema siteleri , alışveriş siteleri)
 Network üzerinde anormal durumlar ( fraud , anomaly detection )
 Reklam gösterimleri (Ad-network)
Big Data Job Trends
Uzmanlaşmak için tavsiyeler
•Büyük verilerin temel özellikleri
•Temel linux
•Temel programlama bilgisi (java , scala ..)
•Apache Hadoop
•Apache Spark
•Örnek bir mesajlaşma kütüphanesi (Apache Kafka)
•Örnek bir NoSQL kütüphanesi (MongoDB , ElasticSearch ..)
Teşekkürler
Güncel yazıları www.buyukveri.co
sitesinden takip edebilirsiniz

Más contenido relacionado

La actualidad más candente

Pig ve Hive ile Hadoop üzerinde Veri Analizi
Pig ve Hive ile Hadoop üzerinde Veri AnaliziPig ve Hive ile Hadoop üzerinde Veri Analizi
Pig ve Hive ile Hadoop üzerinde Veri AnaliziHakan Ilter
 
Big Data PPT by Rohit Dubey
Big Data PPT by Rohit DubeyBig Data PPT by Rohit Dubey
Big Data PPT by Rohit DubeyRohit Dubey
 
MongoDB - NoSQL Overview
MongoDB - NoSQL OverviewMongoDB - NoSQL Overview
MongoDB - NoSQL OverviewCihan Özhan
 
Hadoop & Cloudera Workshop
Hadoop & Cloudera WorkshopHadoop & Cloudera Workshop
Hadoop & Cloudera WorkshopSerkan Sakınmaz
 
Streamline Data Governance with Egeria: The Industry's First Open Metadata St...
Streamline Data Governance with Egeria: The Industry's First Open Metadata St...Streamline Data Governance with Egeria: The Industry's First Open Metadata St...
Streamline Data Governance with Egeria: The Industry's First Open Metadata St...DataWorks Summit
 
Databricks on AWS.pptx
Databricks on AWS.pptxDatabricks on AWS.pptx
Databricks on AWS.pptxWasm1953
 
Introduction to NoSQL Databases
Introduction to NoSQL DatabasesIntroduction to NoSQL Databases
Introduction to NoSQL DatabasesDerek Stainer
 
Slides: Success Stories for Data-to-Cloud
Slides: Success Stories for Data-to-CloudSlides: Success Stories for Data-to-Cloud
Slides: Success Stories for Data-to-CloudDATAVERSITY
 
전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수Devgear
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop QuébecMathieu Dumoulin
 
Big data-cheat-sheet
Big data-cheat-sheetBig data-cheat-sheet
Big data-cheat-sheetmasoodkhh
 
An Introduction to NOSQL, Graph Databases and Neo4j
An Introduction to NOSQL, Graph Databases and Neo4jAn Introduction to NOSQL, Graph Databases and Neo4j
An Introduction to NOSQL, Graph Databases and Neo4jDebanjan Mahata
 
Apache Spark : Genel Bir Bakış
Apache Spark : Genel Bir BakışApache Spark : Genel Bir Bakış
Apache Spark : Genel Bir BakışBurak KÖSE
 
Common MongoDB Use Cases
Common MongoDB Use CasesCommon MongoDB Use Cases
Common MongoDB Use CasesDATAVERSITY
 
Building a modern data warehouse
Building a modern data warehouseBuilding a modern data warehouse
Building a modern data warehouseJames Serra
 
Big Data Analytics with Hadoop
Big Data Analytics with HadoopBig Data Analytics with Hadoop
Big Data Analytics with HadoopPhilippe Julio
 
Big data ecosystem
Big data ecosystemBig data ecosystem
Big data ecosystemmagda3695
 

La actualidad más candente (20)

Pig ve Hive ile Hadoop üzerinde Veri Analizi
Pig ve Hive ile Hadoop üzerinde Veri AnaliziPig ve Hive ile Hadoop üzerinde Veri Analizi
Pig ve Hive ile Hadoop üzerinde Veri Analizi
 
Big Data PPT by Rohit Dubey
Big Data PPT by Rohit DubeyBig Data PPT by Rohit Dubey
Big Data PPT by Rohit Dubey
 
MongoDB - NoSQL Overview
MongoDB - NoSQL OverviewMongoDB - NoSQL Overview
MongoDB - NoSQL Overview
 
Hadoop & Cloudera Workshop
Hadoop & Cloudera WorkshopHadoop & Cloudera Workshop
Hadoop & Cloudera Workshop
 
Big data
Big dataBig data
Big data
 
Streamline Data Governance with Egeria: The Industry's First Open Metadata St...
Streamline Data Governance with Egeria: The Industry's First Open Metadata St...Streamline Data Governance with Egeria: The Industry's First Open Metadata St...
Streamline Data Governance with Egeria: The Industry's First Open Metadata St...
 
Databricks on AWS.pptx
Databricks on AWS.pptxDatabricks on AWS.pptx
Databricks on AWS.pptx
 
Big Data
Big DataBig Data
Big Data
 
Introduction to NoSQL Databases
Introduction to NoSQL DatabasesIntroduction to NoSQL Databases
Introduction to NoSQL Databases
 
Slides: Success Stories for Data-to-Cloud
Slides: Success Stories for Data-to-CloudSlides: Success Stories for Data-to-Cloud
Slides: Success Stories for Data-to-Cloud
 
전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop Québec
 
Introduction to MongoDB
Introduction to MongoDBIntroduction to MongoDB
Introduction to MongoDB
 
Big data-cheat-sheet
Big data-cheat-sheetBig data-cheat-sheet
Big data-cheat-sheet
 
An Introduction to NOSQL, Graph Databases and Neo4j
An Introduction to NOSQL, Graph Databases and Neo4jAn Introduction to NOSQL, Graph Databases and Neo4j
An Introduction to NOSQL, Graph Databases and Neo4j
 
Apache Spark : Genel Bir Bakış
Apache Spark : Genel Bir BakışApache Spark : Genel Bir Bakış
Apache Spark : Genel Bir Bakış
 
Common MongoDB Use Cases
Common MongoDB Use CasesCommon MongoDB Use Cases
Common MongoDB Use Cases
 
Building a modern data warehouse
Building a modern data warehouseBuilding a modern data warehouse
Building a modern data warehouse
 
Big Data Analytics with Hadoop
Big Data Analytics with HadoopBig Data Analytics with Hadoop
Big Data Analytics with Hadoop
 
Big data ecosystem
Big data ecosystemBig data ecosystem
Big data ecosystem
 

Similar a Big Data Sunum

Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziHadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziSerkan Sakınmaz
 
Hadoop @ devveri.com
Hadoop @ devveri.comHadoop @ devveri.com
Hadoop @ devveri.comHakan Ilter
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data AnalyticsMudur Alkan
 
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinPHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinMuhittin Özer
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnıMustafa Tepe
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Veysel Taşcıoğlu
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel BakışBerkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakıştechbase
 
TBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri AnalitiğiTBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri Analitiğiisa ölmez
 
Veri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkVeri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkHakan Sarıbıyık
 
Hepsistream real time click-stream data analytics platform
Hepsistream real time click-stream  data analytics platformHepsistream real time click-stream  data analytics platform
Hepsistream real time click-stream data analytics platformHepsiburada
 
İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01Cihan Özhan
 
İlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrineİlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve DoctrineMuhittin Özer
 
AnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big DataAnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big DataAnkara JUG
 
Bağlı Veri Bulutu Üzerinde Yazılım Geliştirme
Bağlı Veri Bulutu Üzerinde Yazılım GeliştirmeBağlı Veri Bulutu Üzerinde Yazılım Geliştirme
Bağlı Veri Bulutu Üzerinde Yazılım GeliştirmeTayfun Gökmen Halaç
 

Similar a Big Data Sunum (20)

Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziHadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
 
Hadoop @ devveri.com
Hadoop @ devveri.comHadoop @ devveri.com
Hadoop @ devveri.com
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinPHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel BakışBerkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
 
TBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri AnalitiğiTBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri Analitiği
 
MongoDB Overview
MongoDB OverviewMongoDB Overview
MongoDB Overview
 
Linkle mimari
Linkle mimariLinkle mimari
Linkle mimari
 
1 hafta_dersi
1  hafta_dersi1  hafta_dersi
1 hafta_dersi
 
Nosql & MongoDB
Nosql & MongoDBNosql & MongoDB
Nosql & MongoDB
 
Veri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkVeri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan Sarıbıyık
 
NoSQL Sunumu
NoSQL SunumuNoSQL Sunumu
NoSQL Sunumu
 
Hepsistream real time click-stream data analytics platform
Hepsistream real time click-stream  data analytics platformHepsistream real time click-stream  data analytics platform
Hepsistream real time click-stream data analytics platform
 
İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01
 
İlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrineİlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrine
 
AnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big DataAnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big Data
 
Bağlı Veri Bulutu Üzerinde Yazılım Geliştirme
Bağlı Veri Bulutu Üzerinde Yazılım GeliştirmeBağlı Veri Bulutu Üzerinde Yazılım Geliştirme
Bağlı Veri Bulutu Üzerinde Yazılım Geliştirme
 

Big Data Sunum

  • 2. Hakkımda  İstanbul Ünv . Bilgisayar Müh  8+ Java , Java EE  3+ Hadoop,Spark,Pig,Hive,Oozie  Big Data Developer (Comodo)
  • 3. İçerik • Büyük Verilerin Özellikleri • Büyük Verilerin saklanma yöntemleri • Hadoop Nedir ve Temel Bileşenleri (HDFS , MapReduce)? • Apache Spark , Apache Kafka , MongoDB • Kullanım Senaryoları • Uzmanlaşmak için tavsiyeler
  • 4. Büyük Verilerin Özellikleri Veri Miktarı (Volume) ◦ Boeing 737 uçağı tek bir uçuşta 240 terabyte veri üretmektedir Veri hızı (Velocity) ◦ Bir dakika içerisinde 204 milyon e-mail , 1.8 milyon Facebook like , 278000 tweet işlemi yapılmaktadır Veri çeşitliliği (Variety) ◦ Klasik veritabanı sistemleri küçük boyutta düzenli yapıdaki veriler için tasarlanmıştır . Oysa gerçek hayatta resim , ses , konum , log , mekan verileri sıkça karşımıza çıkmaktadır Verinin değerli olması (Value) ◦ Amazon firması tavsiye sistemi ile satış oranlarını %29 artırmıştır
  • 5. Büyük verilerin saklanma yöntemleri Verilerin karakteristiği ve işlenme yöntemine göre bir saklama sistemi kullanılır Wide Column Stores/Column Family database ◦ HBase , Cassandra ◦ Buradaki yapı klasik veritabanına benzer bir şekilde tablo , kolon ve satır yapısı vardır. Document Store ◦ ElasticSearch , MongoDB ◦ Veriler belirli bir şema yapısına sahip olmadan kaydedilir . JSON gibi Key Value Store ◦ Redis , MemcacheDB
  • 6. Hadoop Nedir ? Hadoop , büyük veri kümeleri ile birden fazla makinada paralel olarak işlem yapmamızı sağlayan Java ile yazılmış açık kaynak kodlu kütüphanedir
  • 7. Hadoop Hdfs Nedir ? Hadoop içerisinde büyük verileri sakladığımız bileşene HDFS (Hadoop Distributed File System) denir
  • 8. Hadoop MapReduce Nedir? Hadoop içerisinde büyük verileri paralel olarak işleyebileceğimiz bileşene MapReduce denir .
  • 9. Apache Spark Spark büyük verileri işlemek için kullanılan bir kütüphanedir
  • 10. Apache Kafka ile mesajlasma sistemleri Apache Kafka büyük veri akışını düşük bir gecikme zamanı ile sağlayan açık kaynak kodlu bir kütüphanedir
  • 11. MongoDB Mongo DB verileri JSON tabanlı kaydeden açık kaynak kodlu ilişkisel olmayan bir veritabanıdır
  • 13. Örnek Analizler  Son bir saat içerisinde 50 den fazla reklama tıklayan kullanıcılar  Referer_url bilgisinden arama yapılan anahtar kelimelerin bulunması  Tavsiye motoru (Müzik siteleri , sinema siteleri , alışveriş siteleri)  Network üzerinde anormal durumlar ( fraud , anomaly detection )  Reklam gösterimleri (Ad-network)
  • 14. Big Data Job Trends
  • 15. Uzmanlaşmak için tavsiyeler •Büyük verilerin temel özellikleri •Temel linux •Temel programlama bilgisi (java , scala ..) •Apache Hadoop •Apache Spark •Örnek bir mesajlaşma kütüphanesi (Apache Kafka) •Örnek bir NoSQL kütüphanesi (MongoDB , ElasticSearch ..)