Dokumen ini membahas sumber-sumber data besar (Big Data) yang berasal dari mesin, manusia, dan organisasi. Sumber terbesar adalah data yang dihasilkan mesin seperti sensor dan Internet of Things. Data manusia bersifat tidak terstruktur seperti teks di media sosial. Organisasi menghasilkan data terstruktur namun perlu diintegrasikan dengan sumber lain."
2. Agenda
Data Menurut Sumbernya
Data Yang di Hasilkan Oleh Mesin
Data yang dihasilkan oleh Manusia
Data yang dihasilkan oleh organisasi
Data Menurut Bentuknya
Terstruktur
Tidak Terstruktur
Integrasi Big Data
4. Machine Generated Data
Data yang dihasilkan oleh mesin – misal pesawat terbang
Sensors, kadang di sebut smart device
IoT (Internet of Things)
5. Machine Generated Data
Mesin mengumpulkan data terus
menerus
Smart Device dilengkapi sensor
untuk mengenali lingkungannya
dan algoritma untuk melakukan
response
7. Collective
Behaviour
Contoh kasus smart watch
Dari smart watch di catat
data jumlah langkah,
durasi olahraga, detak
jantung dll
Jika pemakai banyak maka
kita bisa mendapatkan
agregat data – rata rata
waktu olahraga, detak
jantung masyarakat dll
sebagai perilaku kolektif
This Photo by Unknown Author is licensed under CC BY
This Photo by Unknown Author is licensed under CC BY-NC
This Photo by Unknown Author is licensed under CC BY
8. Keunggulan data yg dihasilkan Mesin
Memungkinkan data real time -
real time action, komputasi di
lokasi data (in situ)
Sumber data terbesar adalah data yang dihasilkan mesin!!!
9. Human Generated Data
Sumber
Masalah Data tidak terstruktur
This Photo by Unknown Author is licensed under CC BY
12. Data di sosial media
Company Data Processed Daily
eBay 100 Petabytes (PB)
Google 100 PB
Facebook 30+ PB
Twitter 100 Terabytes(=.1PB)
Spotify 64 Terabytes
13. The Unstructured Data Challenge
This Photo by Unknown Author is licensed under CC BY-SA
This Photo by Unknown Author is
licensed under CC BY-SA
This Photo by Unknown
Author is licensed under CC
BY-SA