Big data merujuk pada kumpulan data dalam jumlah besar yang sulit diolah menggunakan perangkat lunak database konvensional. Meskipun pengumpulan dan analisis data dalam skala besar bukan hal baru, perkembangan teknologi informasi dan digitalisasi proses bisnis telah meningkatkan jumlah titik kontak pelanggan yang menghasilkan data secara signifikan. Dimensi utama big data adalah volume, kecepatan, variasi, dan kebenaran data. Tantangan utama
2. Sejarah Big Data
• Beberapa tahun yang lalu, kata kunci data besar bergema di seluruh negeri. Yang dimaksud
adalah kemunculan dan analisis data dalam jumlah besar yang dihasilkan oleh penyebaran
Internet, media sosial, meningkatnya jumlah sensor bawaan dan Internet of Things, dll.
Fenomena banyaknya data bukanlah hal baru. Sensor pelanggan dan kartu kredit di titik
penjualan, identifikasi produk melalui barcode atau RFID serta sistem pemosisian GPS telah
menghasilkan data dalam jumlah besar untuk waktu yang lama. Demikian pula, analisis data
tidak terstruktur, dalam bentuk laporan bisnis, email, teks bebas formulir web atau survei
pelanggan, misalnya, sering kali menjadi bagian dari analisis internal. Namun, apa yang baru
tentang jumlah data yang termasuk dalam istilah "data besar" yang menarik begitu banyak
perhatian akhir-akhir ini? Tentu saja, jumlah data yang tersedia melalui Internet of Things
(Industri 4.0), melalui perangkat seluler dan media sosial telah meningkat pesat.
3. Big Data bukan hal yang baru
• Pendekatan untuk mendapatkan wawasan dari data untuk tujuan pemasaran
bukanlah hal baru. Pemasaran database atau CRM analitis telah ada selama
lebih dari 20 tahun. Fenomena data dalam jumlah besar juga bukan hal baru:
Point of sale, pelanggan dan kartu kredit atau server web telah lama
menghasilkan data dalam jumlah besar. Demikian pula, analisis data tidak
terstruktur dalam bentuk email, teks gratis formulir web, atau survei
pelanggan, misalnya, sering kali menjadi bagian dari pemasaran dan
penelitian.
4. Big Data yang baru
• Tidak perlu dikatakan bahwa jumlah data telah meningkat pesat berkat
Internet of Things, ponsel, dan media sosial — namun ini merupakan
argumen yang bertahap. Faktor yang menentukan adalah bahwa berkat
kemungkinan TI dan digitalisasi proses bisnis, titik kontak berorientasi
pelanggan untuk menghasilkan data dan untuk mengendalikan komunikasi
secara sistematis telah meningkat. Ditambahkan ke ini adalah kecepatan
tinggi di mana data terkait dikumpulkan, diproses dan digunakan. Demikian
pula, metode penambangan data pembelajaran mendalam dan analitik
semantik meningkatkan penciptaan nilai analitik ke tingkat kualitas yang baru
5. Definisi Big Data
• Karena ada berbagai definisi big data, salah satu definisi yang paling umum
akan digunakan di sini:"Big data" mengacu pada kumpulan data yang
ukurannya di luar kemampuan alat perangkat lunak database biasa untuk
menangkap, menyimpan, mengelola, dan menganalisis. (Manyika et al. 2011).
Mengikuti definisi ini, data besar telah ada sejak pemrosesan data elektronik.
Berabad-abad yang lalu, mainframe adalah jawaban untuk jumlah data yang
terus meningkat dan PC saat ini memiliki lebih banyak ruang penyimpanan
dan daya pemrosesan daripada mainframe saat itu
6. Dimensi Big Data
• Volume: Ini menjelaskan jumlah data masuk yang akan disimpan dan
dianalisis. Titik ketika sejumlah data benar-benar dinyatakan sebagai data
besar seperti yang dijelaskan di atas bergantung pada sistem yang tersedia.
Perusahaan masih menghadapi tantangan untuk menyimpan dan
menganalisis jumlah data yang masuk secara efisien dan efektif. Dalam
beberapa tahun terakhir, berbagai teknologi seperti sistem terdistribusi telah
dikembangkan untuk tujuan ini.
7. • Kecepatan: Ini menjelaskan dua aspek: Di satu sisi, data dihasilkan dengan
kecepatan yang sangat tinggi dan, di sisi lain, sistem harus dapat menyimpan,
memproses, dan menganalisis jumlah data ini dengan segera. Tantangan ini
ditangani baik oleh perangkat keras dengan bantuan teknologi dalam
memori, misalnya, 1 serta perangkat lunak, dengan bantuan algoritme yang
disesuaikan dan paralelisasi masif.
8. • Variasi: Banyaknya variasi data dunia big data menghadapkan sistem dengan
tugas tidak lagi hanya memproses dengan data terstruktur dari tabel tetapi
juga dengan data semi dan tidak terstruktur dari teks, gambar, atau video
berkelanjutan, yang membentuk sebagai sebanyak 85% dari jumlah data.
Khususnya di bidang media sosial, banyak sekali data tidak terstruktur yang
terakumulasi, yang semantiknya dapat dikumpulkan dengan bantuan
teknologi AI.
9. • Kebenaran: Sementara tiga dimensi yang dijelaskan di sini dapat dikuasai oleh
perusahaan saat ini dengan bantuan teknologi yang sesuai, metode dan
penggunaan sarana yang memadai, ada satu tantangan yang belum
diselesaikan pada tingkat yang sama. Veracity berarti istilah yang dapat
dipercaya, kejujuran, dan kebermaknaan data besar. Oleh karena itu,
masalahnya tidak semua data yang disimpan dapat dipercaya dan ini tidak
harus dianalisis. Contohnya adalah sensor yang dimanipulasi di IoT, phishing
mail atau, sejak pemilihan presiden terakhir di AS, juga berita palsu.
10. Referensi
• Gentsch, P. (2018). AI in marketing, sales and service: How marketers without a data
science degree can use AI, big data and bots. Springer.