RESUME PERTEMUAN 2
KARAKTERISTIK DATAWAREHOUSE, DATA MART, META DATA dan DATA MINING
A. Karakteristik
Datawarehouse
1. Subject
Oriented (Berorientasi Subject
· Datawarehouse berorientasi subject artinya data warehouse didesain
untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,
bukan pada proses atau fungsi aplikasi tertentu.
· Datawarehouse
diorganisasikan
disekitar subjek-subjek utama dari perusahaan (customers, products dan sales)
dan tidak diorganisasikan pada area-area
aplikasi utama (customer invoicing, stock control dan product sales). Hal ini
dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang
bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang
berorientasi terhadap data.
· Jadi
dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan
terhadap proses. Secara garis besar perbedaan antara data operasional dan data
warehouse yaitu :
2. Integrated (Terintegrasi)
· Data
Warehouse dapat menyimpan
data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format
yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian
data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan
yang menunjang keseluruhan konsep data warehouse itu sendiri.
· Syarat
integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten
dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam
struktur pengkodean dan konsisten dalam atribut fisik dari data.
· Contoh pada lingkungan
operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh
developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi
tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya
berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format
yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena
perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa
dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.
3. Time-variant (Rentang Waktu)
· Seluruh
data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu
tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan
suatu data warehouse, kita dapat menggunakan cara antara lain :
Ø
Cara
yang paling sederhana adalah menyajikan data warehouse pada rentang waktu
tertentu, misalnya antara 5 sampai 10 tahun ke depan.
Ø
Cara
yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam
data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu
dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut
diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan
tetap ada secara implisit didalam data tersebut.
Ø
Cara
yang ketiga, variasi waktu yang disajikan data warehouse melalui serangkaian snapshot
yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai
keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
4. Non-Volatile
· Karakteristik
keempat dari data warehouse adalah non-volatile,
maksudnya data pada data warehouse tidak di-update
secara real time tetapi di refresh dari sistem operasional secara
reguler. Data yang baru selalu
ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai
sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini,
kemudian secara incremental disatukan dengan data sebelumnya.
· Berbeda
dengan database operasional yang dapat melakukan update,insert dan delete
terhadap data yang mengubah isi dari database sedangkan pada data warehouse
hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data)
dan akses data (mengakses data warehouse seperti melakukan query atau
menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
B. Data
Mart
1. Pengertian
Data Mart
· Menurut Scheps (2008:208) Data Mart dapat menerima data dari data warehouse, atau
secara langsung dari sistem transaksional. Data
mart dapat menampilkan transformasi dan kalkulasi pada data yang sama
dengan data warehouse. Tapi data mart selalu terbatas pada ruang
lingkupnya dan tujuan bisnis.
· Menurut Turban, Sharda, Delen dan King (2011:53),
data mart adalah subset dari data warehouse dan berfokus pada topik
tertentu atau departemen, yang biasanya terdiri dari suatu subyek (misalnya
pemasaran, operasi). Terdapat dua jenis data
mart, antara lain:
a. Dependent
Data Mart, adalah sebuah subset yang dibuat secara
langsung dari data warehouse.
Memiliki keuntungan dari penggunaan data model yang konsisten dan menyediakan
kualitas data.
b. Independent
Data Mart, adalah
data mart yang mendukung konsep dari single enterprise-wide data model,
tetapi data warehouse harus dibuat
terlebih dahulu.
· Berdasarkan pengertian yang dijabarkan oleh
para ahli diatas dapat disimpulkan bahwa pengertian data mart adalah subset
dari data warehouse atau data secara
langsung dari sistem transaksional yang berfokus pada topik tertentu atau
departemen yang biasanya terdiri dari suatu subyek (misalnya pemasaran).
C. Meta
Data
1. Pengertian
Meta Data
Menurut
Kimball dan Ross (2010:566), Metadata
adalah semua informasi dalam lingkungan data
warehouse yang bukan merupakan data itu sendiri. Metadata ini hampir sama dengan sebuah insiklopedia untuk data warehouse.
D. Data
Mining
1. Pengertian Data Mining
· Menurut Han dan Kamber (2011:36), data mining adalah proses menemukan pola
yang menarik dan pengetahuan dari data yang berjumlah besar.
· Menurut Vercellis (2009:77), data mining adalah aktivitas yang
menggambarkan sebuah proses analisis yang terjadi secara iteratif pada database yang besar, dengan tujuan
mengekstrak informasi dan knowledge
yang akurat dan berpotensial berguna untuk knowledge
workers yang berhubungan dengan pengambilan keputusan dan pemecahan
masalah.
· Aktivitas data
mining dapat dipisahkan menjadi 2, berdasarkan tujuan dari analisis yaitu:
a. Interpretasi
: Tujuan dari interpretasi adalah untuk mengetahui pola dari data dan
menghasilkannya dalam bentuk aturan dan kriteria yang dapat dimengerti
eksekutif.
b. Prediksi
: Tujuan dari prediksi adalah untuk mengestimasikan kejadian-kejadian yang
terjadi di masa depan. Contohnya, perusahaan retail dapat menggunakan data mining untuk memprediksikan
penjualan dari produk mereka di masa depan dengan menggunakan data-data yang
telah didapatkan dari beberapa minggu.
· Berdasarkan pengertian yang dijabarkan oleh
para ahli diatas dapat disimpulkan bahwa pengertian data mining adalah sebuah proses analisis yang terjadi secara
interatif dan menemukan pola yang menarik, serta pengetahuan dari data yang
berjumlah besar.
Referensi :
1. file .doc dari library.binus.ac.id/
2. file .doc dari zakki.dosen.narotama.ac.id/
Tidak ada komentar:
Posting Komentar