Beberapa tahun belakangan ini,
jika ditanyakan tentang apa yang sedang menjadi trend dalam dunia
Teknologi Informasi (TI), mungkin banyak yang akan menjawab "Cloud Computing"
Tetapi, sejak awal tahun 2011 muncul
istilah "Big Data" yang kemudian menarik perhatian banyak
profesional maupun pemerhati Teknologi Informasi. Sejauh ini,
perusahaan-perusahaan terkemuka telah memberdayakan infomasi dan data dengan
beragam teknologi manajemen data guna menunjang kemajuan bisnisnya. Sebagian besar
telah menggunakan tools seperti Data Warehouse (DWH) maupun Business
Intelligence (BI) serta aplikasi manajemen harga dan penjualan lainnya
sebagai alat pengolah data yang mereka perlukan dalam aktifitas bisnis.
Jika diterjemahkan secara mentah-mentah maka Big
Data berarti suatu data dengan kapasitas yang besar. Sebagai contoh, saat
ini kapasitas DWH yang digunakan oleh perusahaan-perusahaan di Jepang berkisar
dalam skala terabyte. Namun, jika misalnya dalam suatu sistem terdapat
1000 terabyte (1 petabyte) data, apakah sistem tersebut bisa disebut Big
Data?
Satu lagi, Big Data sering dikaitkan
dengan SNS (Social Network Service), contohnya Facebook. Memang
benar Facebook memiliki lebih dari 800 juta orang anggota, dan dikatakan
bahwa dalam satu hari Facebook memproses sekitar 10 terabyte
data. Pada umumnya, SNS seperti Facebook tidak menggunakan RDBMS(Relational
DataBase Management System) sebagai software pengolah data, melainkan lebih
banyak menggunakan NoSQL. Lalu, apa kita bisa menyebut sistem NoSQL sebagai Big
Data?
Dengan mengkombinasikan kedua uraian diatas,
dapat ditarik sebuah definisi bahwa Big Data adalah "suatu sistem
yang menggunakan NoSQL dalam memproses atau mengolah data yang berukuran sangat
besar, misalnya dalam skala petabyte". Apakah definisi ini tepat?
Boleh dikatakan masih setengah benar. Definisi tersebut masih belum
menggambarkan Big Data secara menyeluruh. Big Data tidak
sesederhana itu,
Big Data memuat arti yang lebih kompleks sehingga perlu
definisi yang sedikit lebih kompleks pula demi mendeskripsikannya secara
keseluruhan.
Mengapa butuh definisi yang lebih kompleks?
Fakta menunjukkan bahwa bukan hanya NoSQL saja yang mampu mengolah data dalam
skala raksasa (petabyte). Beberapa perusahaan telah menggunakan RDBMS
untuk memberdayakan data dalam kapasitas yang sangat besar. Sebagai contoh, Bank
of America memiliki DWH dengan kapasitas lebih dari 1,5 petabyte, Wallmart
Stores yang bergerak dalam bisnis retail (supermarket) berskala dunia telah
mengelola data berkapasitas lebih dari 2,5 petabyte, dan bahkan situs auction
(lelang) eBay memiliki DWH yang menyimpan lebih dari 6 petabyte
data. Oleh karena itu, hanya karena telah berskala petabyte saja, suatu
data belum bisa disebut Big Data. Sekedar referensi, DWH dengan kapasitas
sangat besar seperti beberapa contoh diatas disebut EDW(Enterprise Data
Warehouse) dan database yang digunakannya disebut VLDB(Very Large
Database).
Memang benar, NoSQL dikenal memiliki potensi
dan kapabilitas Scale Up (peningkatan kemampuan mengolah data dengan
menambah jumlah server atau storage) yang lebih unggul daripada
RDBMS. Tetapi, bukan berarti RDBMS tak diperlukan. NoSQL memang lebih tepat
untuk mengolah data yang sifatnya tak berstruktur seperti data teks dan gambar,
namun NoSQL kurang tepat bila digunakan untuk mengolah data yang sifatnya
berstruktur seperti data-data numerik, juga kurang sesuai untuk memproses data
secara lebih detail demi menghasilkan akurasi yang tinggi. Pada kenyataannya,
Facebook juga tak hanya menggunakan NoSQL untuk memproses data-datanya,
Facebook juga tetap menggunakan RDBMS. Lain kata, penggunaan RDBMS dan NoSQL
mesti disesuaikan dengan jenis data yang hendak diproses dan proses macam apa
yang dibutuhkan guna mendapat hasil yang optimal.
Karakteristik Big Data : Volume, Variety,
Velocity (3V)
Kembali ke pertanyaan awal, apakah sebenarnya
Big Data itu? Sayang sekali, hingga saat ini masih belum ada definisi baku yang
disepakati secara umum. Ada yang mendeskripsikan Big Data sebagai
fenomena yang lahir dari meluasnya penggunaan internet dan kemajuan teknologi
informasi yang diikuti dengan terjadinya pertumbuhan data yang luar biasa
cepat, yang dikenal dengan istilah ledakan informasi (Information Explosion)
maupun banjir data (Data Deluge). Hal ini mengakibatkan terbentuknya
aliran data yang super besar dan terus-menerus sehingga sangat sulit untuk
dikelola, diproses, maupun dianalisa dengan menggunakan teknologi pengolahan
data yang selama ini digunakan (RDBMS). Definisi ini dipertegas lagi dengan
menyebutkan bahwa Big Data memiliki tiga karakteristik yang dikenal
dengan istilah 3V: Volume, Variety, Velocity. Dalam hal ini, Volume menggambarkan
ukuran yang super besar, Variety menggambarkan jenis yang sangat
beragam, dan Velocity menggambarkan laju pertumbuhan maupun
perubahannya. Namun demikian, definisi ini tentu masih sulit untuk dipahami.
Oleh karena itu, uraian berikut mencoba memberikan gambaran yang lebih jelas
dan nyata berkaitan dengan maksud definisi Big Data tersebut.
Gambar
Diatas menggambarkan 3 karakteristik Big Data. Gabungan dari ketiga
karakteristik ini menghasilkan data yang terlalu kompleks untuk ditangani
dengan sistem konvensional.
Manfaat BIG DATA
Berikut
adalah beberapa manfaat Big Data :
·
Perusahaan ritel dapat menggunakan informasi dari social
media seperti Facebook, Twitter, Google+ untuk menganalisis bagaimana perilaku,
persepsi pelanggan terhadap suatu produk atau brand dari perusahan.
·
Perusahan manufaktur dapat memantau kondisi peralatan setiap
saat (real-time), sehingga dapat memperkirakan waktu terbaik untuk mengganti
peralatan. Karena mengganti terlalu cepat akan merugikan/buang-buang uang atau
kalau terlambat akan menyebabkan produksi terganggu karena kerusakan peralatan.
·
Perusahaan manufaktur juga bisa memantau produk yang baru
launching melalui social sedia untuk mengetahui apakah ada isu after-sales
sehingga dapat mencegah kegagalan garansi yang menyebabkan publikasi besar yang
dapat merusak citra produk dan perusahaan.
·
Perusahaan periklanan dapat menggunakan informasi dari
social media untuk mengetahui tanggapan terhadap promosi/iklan yang baru
diluncurkan.
·
Rumah sakit dapat merekam catatan medis pasien sehingga big
data tersebut bisa digunakan untuk menganalisis kecenderungan sakit pasien
·
Pemerintahan dapat menggunakan informasi dari social media
untuk mengetahui tingkat kepuasan masyarakat terhadap pemerintah
·
Jasa Keuangan dapat menggunakan analisis big data untuk
melihat aplikasi asuransi yang dapat segera diproses, dan mana yang perlu
divalidasi dengan dilakukan kunjungan oleh agen asuransi
·
Jasa Perbankan dapat menggunakan rekaman transaksi nasabah
untuk mengetahui kemungkinan adanya kegiatan kejahatan seperti pencucian uang,
atau juga untuk merekam catatan kebiasaan karyawan dalam rangka mendeteksi
kemungkinan fraud.
·
Tim olahraga dapat menggunakan big data untuk tracking
penjualan tiket, mengetahui kondisi pemain dan probabilitas akan mengalami
cedera dan bahkan strategi bermain dari tim.