Statistika dalam Data Science

Data science adalah salah satu bidang keilmuan yang juga mempelajari statistik hal ini bisa dibilang menjadi salah satu yang melandasi data science menjadi salah satu bidang keilmuan yang paling diminati saat ini. 

Kebutuhan akan sumber daya manusia yang kompeten di bidang data science kian meningkat seiring dengan eksistensi big data. Namun, kebutuhan sumber daya manusia tersebut tidak selaras dengan ketersediaannya. Berdasaarkan Josh Wills, mantan kepala teknik di Slack mengatakan “Seorang data science adalah orang yang lebih baik dalam statistik daripada programmer mana pun dan lebih baik dalam pemrograman daripada ahli statistik manapun”.

Dengan kata lain, statistik adalah komponen inheren yang diperlukan dari ilmu data. Kami akan mengeksplorasi lebih lanjut tentang konsep dibawah ini, disamping cara terbaik untuk kamu agar mendapatkan pengetahuan statistik untuk posisi data scientist. 

Analisis statistik dan probabilitas mempengaruhi kehidupan sehari-hari kita. Statistika bisa digunakan untuk memprediksi cuaca, mengisi kembali rak ritel, memperkirakan kondisi ekonomi dan masih banyak lagi. Digunakan dalam berbagai bidang profesional, statistik memiliki kekuatan untuk memperoleh wawasan berharga dan memecahkan masalah yang komplek dalam bisnis, sains dan masyarakat. 

Dalam data science, statistik adalah inti dari algoritma machine learning yang canggih, menangkap dan menerjemahkan pola data menjadi bukti yang dapat ditindaklanjuti. Data science menggunakan statistik untuk mengumpulkan, meninjau, menganalisa dan menarik kesimpulan dari data, serta menerapkan model matematika yang diukur ke variabel yang sesuai. Dengan demikian, statistik dalam ilmu data sama pentingnya dengan memahami bahasa pemrograman.

Data science membutuhkan campuran keterampilan teknis, seperti bahasa pemrograman R dan python serta soft skill termasuk komunikasi perhatian terhadap detail. Berikut adalah beberapa keterampilan yang paling penting yang perlu diasah oleh para ilmuwan data untuk memperkuat kemampuan statistik. 

  • Manipulasi data ilmuwan data memiliki kemampuan untuk membersihkan dan mengatur kumpulan data besar
  • Berpikir kritis dan perhatian terhadap detail
  • Rasa ingin tahu yang tinggi
  • Management dan pengorganisasian
  • inovasi dan problem solving
  • Komunikasi
  • Statistik

Referensi: 

Richard Gregorius