Himpunan Mahasiswa Sistem Informasi

Jenis-jenis Skema pada Data Warehouse

Data warehouse adalah salah satu tipe sistem manajemen data yang dirancang untuk menghimpun data-data yang dihasilkan atau dikumpulkan dalam sebuah organisasi untuk membantu aktivitas business intelligence. Data transaksi pada operasional atau Online Transaction Processing  (OLTP) hanya dapat disimpan sementara, biasanya 7 hari sampai dengan satu bulan, karena itu data warehouse dibutuhkan agar data-data transaksi dari OLTP dapat dipindahkan dan disimpan ke dalam data warehouse. Data dalam data warehouse digunakan untuk analisis atau Online Analytical Processing (OLAP). Proses pemindahan data dari OLTP ke dalam data warehouse adalah Extract, Transform, dan Load atau ETL.

Data warehouse memiliki skema yang berbeda dengan OLTP karena data warehouse tidak menggunakan relational database. Terdapat tiga skema dalam data warehouse, yaitu Star Schema, Snowflake Schema, dan Galaxy Schema.

Star Schema

merupakan skema paling sederhana yang memiliki satu tabel tengah yaitu tabel fakta dimana tabel tersebut terhubung dengan beberapa dimensi tabel lainnya. Contohnya adalah sebagai berikut:

Skema Star di atas memiliki satu tabel fakta yang berisikan key dari tabel-tabel dimensi. Karakteristik dari Skema Star adalah:

  1. Setiap dimensi dalam Skema Star hanya digambarkan dengan satu tabel dimensi.
  2. Tabel dimensi harus memiliki sebuah set atribut.
  3. Tabel dimensi melakukan “join” pada tabel fakta menggunakan FK.
  4. Tabel dimensi TIDAK terhubung satu sama lain.
  5. Tabel fakta mengandung key dan measure.

Snowflake Schema

merupakan perpanjangan dari Skema Star dengan menambahkan tabel dimensi lainnya dimana tabel dimensi lain tersebut merupakan hasil normalisasi tabel-tabel dimensi yang telah ada sebelumnya. Contoh Skema Snowflake dari Skema Star sebelumnya adalah sebagai berikut:

Skema Snowflake di atas memiliki tabel dimensi baru yang merupakan hasil normalisasi dari tabel dimensi dealer, branch, dan product. Karakteristik dari skema ini adalah:

  1. Kinerja query berkurang akibat dari banyaknya tabel yang ada.
  2. Membutuhkan upaya maintenance yang lebih besar karena pencarian tabel lebih banyak.
  3. Lebih mudah untuk menambahkan dimensi ke dalam skema.

Galaxy Schema

Galaxy Schema disebut juga Fact Constellation Schema merupakan skema yang memiliki dua tabel fakta dimana kedua tabel fakta tersebut mungkin berbagi tabel dimensi yang sama. Contoh Skema Galaxy dari skema sebelumnya adalah seperti berikut ini,

  1. Dimensi pada skema ini dipisahkan menjadi beberapa dimensi lainnya berdasarkan hierarki yang dimiliki, contohnya adalah jika suatu tabel geografi memiliki hirarki region, country, state, dan city maka dalam Skema Galaxy harus dipisah menjadi empat dimensi.
  2. Skema ini membantu melakukan agregasi tabel fakta agar lebih mudah untuk dipahami.

Perbedaan antara Skema Snowflake dan Skema Galaxy adalah sebagai berikut:

Skema Snowflake:

  1. Memiliki satu tabel fakta dengan beberapa tabel dimensi dan tabel sub-dimensi (hasil normalisasi).
  2. Mampu menghemat storage secara signifikan.
  3. Merupakan hasil dari sebuah Skema Star.
  4. Tabel lebih mudah untuk dijaga atau diurus.
  5. Skema lebih mudah untuk dioperasikan karena memiliki join table yang lebih sedikit

Skema Galaxy (Fact Constellation Schema):

  1. Memiliki tabel dimensi yang digunakan lebih dari satu tabel fakta.
  2. Tidak hemat storage.
  3. Merupakan hasil dari beberapa Skema Star.
  4. Lebih sulit untuk dijaga atau diurus.
  5. Tidak mudah dioperasikan karena memiliki join table yang sangat banyak.

References:

“What Is a Data Warehouse.” Oracle, https://www.oracle.com/database/what-is-a-data-warehouse/.

“Difference between Snowflake Schema and Fact Constellation Schema – GeeksforGeeks”

https://www.geeksforgeeks.org/difference-between-snowflake-schema-and-fact-constellation-schema/

“Star and Snowflake Schema in Data Warehouse with Model Examples by Taylor, David.”

https://www.guru99.com/star-snowflake-data-warehousing.html.

Adie Satriyo Nirbito