Serba-Serbi tentang Data Science Part-1

Untuk mengurangi kejenuhan dengan riset Fisika, minggu ini saya memborong beberapa majalah: Time, Bloomberg business week, the economist dan MIT technology review.

Yang menyedot perhatian saya adalah data science. Saya mendengar bahwa Data Scientist telah diNobatkan sebagai “the sexiest job” di abad 21.

Rupanya hal ini bukan isapan jempol belaka. Saya melihat banyak iklan dari perusahaan data science memenuhi majalah. Semua menjanjikan bahwa analisis mereka yang didasari data science akan membuat performa perusahaan meroket.

Jadi apa itu data science? Simplifikasi paling kasar adalah Data Science = Business Inteligence + Programming (Machine Learning).

Dengan kata lain, data science menggunakan perangkat algoritma machine learning (seperti neural network) untuk menelaah data2 bisnis dan mencari pola (pattern recognition) sehingga perusahaan bisa menawarkan produk dengan tepat sasaran.

Jadi, seorang data scientist berdiri diantara dua domain: Bisnis dan programming.

Sebagai contoh Amazon dan beberapa e-commerce lain menjadi besar karena fitur rekomendasi yang dimiliki. Mereka menelaah data pencarian dari customer lantas mencari pola hingga produk yg ditawarkan dalam “recommendation” tidaklah random melainkan sudah melaui algoritma machine learning tertentu.

Machine Learning memang sakti, ada beberapa contoh yg aneh: Ada yg menerapkan ke game nintendo Mario bros, sehingga setelah di “training” beberapa kali si mario dapat lewat dgn selamat.

Ada yg bermain dgn Foto (dengan input datanya adalah warna/kecerahan sebagai fungsi koordinat atau pixel), lalu secara random foto itu dihapus beberapa puluh persen. Dan machine learning itu rupanya dapat merekonstruksi kembali foto tersebut dengan utuh.

Ada pula yang dapat men”train” komputer hingga mampu mengalahkan grand master catur.

Kawan saya mempublikasikan hasil risetnnya di physical review dan mendapat editorial suggestion setelah Machine learning nya (Bayesian Neural Network) mampu memprediksi Nuclear Mass.

Contoh lainnya, saya pernah menerapkan algoritma “Boosted decision tree” yang isinya sebenarnya cuma “If statement” untuk mengisolir satu partikel yang diinginkan. 
 

****

Satu contoh yg saya baca di The economis adalah bagaimana data science digunakan dalam pertanian. Disana digambarkan bagaimana seorang petani sedang mengoperasikan traktor yg mirip dengan kokpit pesawat. Jadi ada panel tentang prediksi cuaca, kesuburan tanah, populasi hama dan sebagainya sehingga ketika Ia menyemprot air/pestisida maka kuantitasnya betul2 sesuai dgn output algoritma nya (precise Agriculture).

(Di bagian ini saya merasa miris karena persoalan pertanian di negara kita masih berkutat di distribusi, stabilitas harga, kesejahteraan petani).

****

Maka tak heran ketika lumayan banyak PhD Fisika yang beralih menjadi Data Scientist. Particle physicist yang terbiasa berkelut dgn accelerator dgn luminositas 10 pangkat 34 (ada 10 pangkat 34 partikel yang ditembakan per detik per meter persegi), tentu mudah menghandel data jutaan transaksi bisnis.

Jadi saran saya buat generasi muda yang ingin menjadi data scientist:

1. Kuasai C++.
2. Kuasai phyton.
3. Kuasai R.
4. Pelajari Machine Learning (Neural network).
5. Pelajari Statistik.
6. Baca2 tentang Bisnis
7. Kuasai Linux.

8. Datanglah ke Amerika.

Related Posts

Leave a Reply

Your email address will not be published. Required fields are marked *