Data Mining

Data Mining : Discovering Pattern of Data Set

Pernahkah anda mendengar tentang Data Mining? Walaupun kata ini agak asing, sebenarnya Data Mining ini sering di gunakan lhoo. Jadi sebenarnya Data Mining itu apa sih? Data Mining adalah suatu proses yang dilakukan untuk menemukan dan memprediksikan pola dari data-data yang jumlahnya besar.

Kemudian, dari pola data tersebut, kita bisa memprediksikan peluang-peluang dari kejadian untuk tiap data yang baru. Sebagai contoh, diberikan list pelanggan yang berisikan nama, usia, dan gender dari hasil penjualan sebuah barang. Kita dapat memperhitungkan kemungkinan pembeli dan bahkan jenis barang yang akan di beli hanya dari list tersebut.

Kelihatannya simple kan? Nah, dari Data Mining ini, kita bisa memprediksikan tindakan (behavior) dari data – data yang didapat. Singkatnya, kita memproses dan menggali dari jumlah data yang besar untuk mendapatkan persentasi keberhasilan dari prediksi tersebut.

Seperti pada umumnya, ketika kita mengingikan sebuah hasil (output), maka yang harus kita lakukan yaitu memasukkan data (input) dan memproses data tersebut (proses). Input yang diperlukan untuk Data Mining yaitu data – data behavior dalam jumlah yang besar (sebagai contoh, list pelangganyang berisikan nama, usia, gender). Kemudian untuk prosesnya, Data Mining juga mempunyai Algorithm tersendiri lhoo.

Proses dari Data Mining terbagi dari Frequent Pattern Analysis, Classification, dan Clustering. Frequent Pattern Analysis yaitu mencari frequensi dari setiap kandidat dan membatasi / mengeliminasi (eliminate) kandidat yang frequensinya lebih kecil dari frequensi minimum. Kemudian Classification, yang maksudnya membangun suatu model kelas berdasarkan attribute yang dimiliki. Dan yang terkahir, Clusterring , yaitu mengelompokkan tiap data yang  memiliki kemiripan dengan data lainnya. Proses Clusterring bertujuan untuk meminimalisir kemiripan antar kelas.

Setelah proses dijalankan, maka hasil yang didapat yaitu tinggallah beberapa data yang sudah di kelompokkan (sudah di minimalisir). Dari output tersebutlah, kita dapat memprediksi behavior dari data lainnya.

 

Sumber :

https://en.wikipedia.org/wiki/Data_mining