Semoga bisa menjadi referensi buat teman-teman yang sedang mempelajari mata kuliah ini.
Data warehouse didefinisikan sebagai sekumpulan
data
yang bersifat
subject‐oriented, terintegrasi, time variant, nonvolatile yang melayani sebagai implementasi fisik
dari sebuah model data untuk mengambil keputusan dan menyimpan informasi untuk kebutuhan enterprise atas keputusan yang
bersifat strategis.
Teknologi dalam data warehouse meliputi data cleaning, integrasi data, dan
OLAP
sebagai teknik
analisis dengan fungsi
seperti menyimpulkan,
konsolidasi dan agregasi sebaik kemampuan memandang informasi dari berbagai sudut.
Data warehouse dirancang dengan menggunakan model multidimensional dan biasanya diimplementasikan dalam bentuk star scheme. Pada model multidimensional, data warehouse biasanya menyimpan data dalam bentuk database relasional.
Dalam buku
yang berjudul
Data
Warehousing Fundamentals,
karakteristik‐karakteristik
dari data warehouse dapat dijelaskan sebagai berikut (Ponniah, 2001):
1) Subject Oriented
Data warehouse mengorganisasikan subjek utama perusahaan/organisasi bukan pada
area aplikasi utama. Hal ini menyebabkan data warehouse hanya mengorientasikan pada kebutuhan untuk
menyimpan data pendukung keputusan daripada aplikasi yang berorientasi data. Data warehouse
hanya
mengandung
data
yang dibutuhkan untuk fungsi yang berhubungan dengan sebagian aplikasi.
2) Data yang Terintegrasi
Data didalam data warehouse akan memiliki perbedaan database, file dan
segmentasi, dikarenakan sumber data
untuk data warehouse diambil dari aplikasi aplikasi yang berbeda
sehingga platform dan sistem operasi yang digunakan akan memunculkan
perbedaan pada tampilan file, tabel, representasi
kode karakter, dan juga
penamaan field. Oleh
karena itu, data yang akan digunakan untuk data warehouse
harus melewati beberapa proses yaitu transformasi, konsolidasi dan integrasi dengan
sumber data lainnya.
3) Time Variant
Pada sistem operasional, data yang disimpan hanya mengandung
nilai saat ini saja. Namun tentu saja sistem operasional
masih menyimpan
beberapa data yang sifatnya masa lalu.
Pada
data warehouse, disebabkan
oleh tujuan natural
nya, data warehouse mengandung
data historis, tidak hanya
nilai saat ini. Data disimpan sebagai gambaran
masa lalu
dan periode saat
ini. Setiap struktur
data dalam data warehouse mengandung elemen waktu. Secara alamiah,
karakteristik time variant
dalam data warehouse adalah mengizinkan untuk menganalisis masa lalu,
menghubungkan informasi saat
ini, dan memungkinkan untuk memprediksi masa depan.
4) Non Volatile
Data di dalam data warehouse tidak dirancang untuk menjalankan bisnis
setiap harinya.
Sehingga dalam data warehouse tidak ada proses embaharuan data untuk
setiap kali proses transaksi berjalan. Arsitektur data warehouse meliputi alat untuk mengekstrak data dari berbagai sumber data baik eksternal
maupun database operasional, untuk kemudian dilakukan data staging area, transformasi data dan mengintegrasikan data, untuk memasukkan data ke dalam data warehouse, dan secara periodic untuk memperbaharui warehouse
yang mencerminkan pembaharuan pada sumber data warehouse.
Dalam data warehouse dimungkinkan untuk melakukan data representation dengan membuat data marts untuk beberapa dimensi kebutuhan. Database di
dalam data warehouse dan data marts disimpan
dan diatur
oleh satu
atau lebih
server datawarehouse yang menyajikan gambaran data secara multidimensional ke dalam bentuk/format seperti query, penulisan laporan, alat untuk analisis, dan alat
untuk data mining.
Tidak ada komentar:
Posting Komentar