Perbedaan database, data warehouse, dan data mining
Hallo guys, artikel kali ini kita akan membahas perbedaan database, data warehouse, dan data mining, yuk disimak dulu ya
Database atau basis data adalah kumpulan data yang disimpan secara sistematis di dalam komputer dan dapat diolah atau dimanipulasi menggunakan perangkat lunak (program aplikasi) untuk menghasilkan informasi. Pendefinisian basis data meliputi spesifikasi berupa tipe data, struktur, dan juga batasan-batasan data yang akan disimpan. Basis data merupakan aspek yang sangat penting dalam sistem informasi dimana basis data merupakan gudang penyimpanan data yang akan diolah lebih lanjut. Basis data menjadi penting karena dapat menghidari duplikasi data, hubungan antar data yang tidak jelas, organisasi data, dan juga update yang rumit.
Proses memasukkan dan mengambil data ke dan dari media penyimpanan data memerlukan perangkat lunak yang disebut dengan sistem manajemen basis data (database management system | DBMS). DBMS merupakan sistem perangkat lunak yang memungkinkan user untuk memelihara, mengontrol, dan mengakses data secara praktis dan efisien. Dengan kata lain semua akses ke basis data akan ditangani oleh DBMS. Ada beberapa fungsi yang harus ditangani DBMS yaitu mengolah pendefinisian data, dapat menangani permintaan pemakai untuk mengakses data, memeriksa sekuriti dan integriti data yang didefinisikan oleh DBA (Database Administrator), menangani kegagalan dalam pengaksesan data yang disebabkan oleh kerusakan sistem maupun disk, dan menangani unjuk kerja semua fungsi secara efisien.
• Database digunakan untuk Transaksional Pengolahan Online ( OLTP ) tetapi dapat digunakan untuk keperluan lain seperti Data Warehousing .
• Sebuah gudang data digunakan untuk Online Analytical Processing ( OLAP ) . Ini membaca data historis untuk Pengguna untuk keputusan bisnis .
• Dalam database tabel dan bergabung sangat kompleks karena mereka dinormalisasi untuk RDMS . Hal ini mengurangi data yang berlebihan dan menghemat ruang penyimpanan .
• Dalam data warehouse, tabel dan gabungan sederhana karena mereka dinormalisasi . Hal ini dilakukan untuk mengurangi waktu respon untuk permintaan analitis .
• Teknik pemodelan relasional digunakan untuk desain database RDMS , sedangkan teknik pemodelan yang digunakan untuk desain Data Warehouse .
• Database dioptimalkan untuk menulis operasi , sedangkan data warehouse dioptimalkan untuk operasi membaca .
• Dalam database, kinerja yang rendah untuk query analisis, sedangkan pada data warehouse, ada kinerja tinggi untuk permintaan analitis.
Data mining adalah istilah yang digunakan untuk mendeskripsikan penemuan atau “mining” pengetahuan dari sejumlah besar data. Yang termasuk data mining antara lain knowledge extraction, pattern analysis, data archaeology, information harvesting, pattern searching, dan data dredging. Berikut merupakan karakteristik umum dan objektivitas data mining.
• Data seringnya terpendam dalam dalam database yang sangat besar yang kadang-kadang datanya sudah bertahun-tahun.
• Lingkungan data mining biasanya berupa arsitektur client-server atau arsitektur system informasi berbasis web.
• Tool baru yang canggih, termasuk tool visualisasi tambahan, membantu mennghilangkan lapisan informasi yang terpendam dalam file-file yang berhubungan atau record-record arsip public.
• Pemilik biasanya seorang end user, didukung dengan data drill dan tool penguasaan query yang lain untuk menanyakan pertanyaan ad hoc, dan mendapatkan jawaban secepatnya, dengan sedikit atau tidak ada kemampuan pemrograman.
• Tool data mining dengan kesediaannya dikombinasikan dengan spreadsheet dan tool software pengembangan yang lainnya.
• Karena besarnya jumlah data dan usaha pencarian yang besar-besaran, kadang-kadang diperlukan penggunaan proses parallel untuk data mining.
Bagaimana Data mining Bekerja
Data mining secara umum mencari untuk mengidentifikasikan empat tipe pattern utama yaitu:
• Associations, menemukan secara umum mengacu pada pengelompokan hal-hal.
• Predictions, memberitahukan kejadian-kejadian alami di masa yang akan datang di even yang tepat berdasar pada apa yang terjadi di masa lampau.
• Cluster, mengidentifikasikan pengelompokan hal-hal natural berdasar pada karakteristik yang diketahui.
• Sequential relationship, menemukan event dengan waktu yang berurutan.
Data warehouse merupakan sekelompok data yang diproduksi untuk mendukung pembuatan keputusan; juga merupakan tempat penyimpanan saat ini dan data historis dari potensi ketertarikan manager seluruh perusahaan. Karakteristik data warehouse sebagai berikut
• Subject oriented.
• Integrated.
• Time variant (time series).
• Nonvolatile.
Yang termasuk karakteristik tambahan data warehouse antara lain
• Web based.
• Relational/multidimensional.
• Client/server.
• Real time.
• Include metadata.
Sekian pembahasan tentang perbedaan database, data warehouse, dan data mining, semoga bermanfaat