Implementasi Data Model, Data Mining, dan BI PDF
Document Details
Uploaded by FaithfulHarpGuitar3647
Universitas Teknokrat Indonesia Bandar Lampung
Tags
Related
- Statistical Learning and Data Mining Lecture 6: Practical Methodology PDF
- Analytics: A Comprehensive Study PDF
- Process Mining Introduction PDF
- Business Analytics Quiz with Answers PDF
- Artificial Neural Networks Lec 6 2024 PDF
- Chapter 6: Preparing to Model the Data - Discovering Knowledge in Data 2014 PDF
Summary
This document discusses data model implementation, data mining, and business intelligence. It explains the process of identifying and documenting relationships within organizational data, using various schemas like relational, dimensional, and others. The document also touches on data mining techniques and their applications in decision-making.
Full Transcript
Pengelolaan Data BAB VII. IMPLEMENTASI DATA MODEL, DATA MINING, DAN BI 7.1 Uraian Materi Pengelolaan data tidak terlepas dari perancangan data model yang berfungsi untuk mengambarkan relasi antar data yang ada di organ...
Pengelolaan Data BAB VII. IMPLEMENTASI DATA MODEL, DATA MINING, DAN BI 7.1 Uraian Materi Pengelolaan data tidak terlepas dari perancangan data model yang berfungsi untuk mengambarkan relasi antar data yang ada di organisasi. Selain itu, dengan semakin meningkatnya pertumbuhan data yang ada di organisasi serta untuk mengambil manfaat dari data yang ada, maka dilakukan data mining yang hasilnya dapat menjadi input untuk pembuatan business intelligence. Pada bab ini, ketiga aktivitas pengelolaan data tersebut akan dijelaskan termasuk poin penting di setiap aktivitas yang perlu menjadi perhatian. a. Model Data Pemodelan data merupakan proses untuk mengidentifikasi dan mendokumentasikan relasi dari data yang ada di organisasi sehingga selaras satu sama lain. Model data akan memudahkan organisasi dalam memahami aset data yang ada di organisasi. Dalam menyusun model data, beberapa skema yang berbeda dapat digunakan untuk merepresentasikan data. Skema yang seringkali digunakan, yaitu Relational, Dimensional, Object-Oriented, Fact-based, Time-based, dan No- SQL. Level dari skema yang digunakan terdiri dari tiga jenis, yaitu conceptual, logical, dan physical. Tujuan dari pemodelan data adalah untuk mengkonfirmasi dan mendokumentasikan pemahaman dari berbagai sudut pandang sehingga aplikasi yang dihasilkan nantinya dapat selaras dengan kebutuhan bisnis baik saat ini maupun di masa mendatang. Model data juga merupakan dasar untuk menuju inisiatif yang lebih luas, seperti Master Data Management dan program tata kelola data. 1. Komponen Model Data a) Entity pada suatu organisasi dapat ditentukan dengan menjawab pertanyaan dasar, seperti who, what, when, where, why, how, atau 49 Pengelolaan Data kombinasi dari pertanyaan tersebut. Contoh dari definisi dari tiap kategori beserta contohnya adalah sebagai berikut. Tabel 10. Kategori, Definisi, dan Contoh Entitas Kategori Definisi Contoh Who Orang atau organisasi yang Employee, Patient, menjadi fokus. Customer, Student What Produk atau layanan yang Product, Service, Book menjadi fokus organisasi. When Kalender atau rentang waktu Time, Date, Month, yang menjadi fokus Quarter, Year organisasi. Where Lokasi yang menjadi fokus Email Adress, Website organisasi, baik aktual URL maupun lokasi virtual. Why Kejadian atau transaksi yang Order, Return, menjadi fokus organisasi. Complaint How Dokumentasi dari kejadian Invoice, Contract, yang menjadi fokus Acoount, Purchase organisasi. Order Measure Agregasi dari kategori Sales, Item Count, lainnya (what, where) pada Payments, Balance periode tertentu (when) b) Relationship yaitu hubungan antar entity. Contoh relasi antar entity adalah sebagai berikut. 50 Pengelolaan Data Gambar 6. Contoh Relationship Gambar tersebut menunjukkan relasi antara entity Student dan Course, serta Instructor dan Course. Interpretasi dari gambar tersebut adalah: Setiap Student akan menghadiri satu atau lebih Course Setiap Instructor akan mengajar satu atau lebih Course Simbol yang terdapat pada garis disebut cardinality. Pada skema relational, hubungan antara entity akan direpresentasikan melalui foreign key. c) Foreign Key Foreign Key seringkali digunakan pada pemodelan level physical dan terkadang digunakan pada model logical. Foreign key sendiri menunjukkan bahwa antar entity terdapat relasi atau ketergantungan. Gambar 7. Contoh Penggunaan Foreign Key Pada contoh di atas, Registration memiliki dua foreign keys yang berasal dari entity Student dan Course. Student Number pada entity Student 51 Pengelolaan Data berperan sebagai primary key, begitu pula Course Code pada entity Course. d) Attribute Attribute atau atribut pada model data digambarkan sebagai daftar data yang terdapat pada entity. Pada contoh sebelumnya, dapat dilihat bahwa entity Student memiliki beberapa atribut yaitu Student Number, Student First Name, Student Last Name, Student Birth Date. 2. Skema Pemodelan Data Skema pemodelan data yang akan dibahas adalah relational. Skema relational ditujukan untuk rancangan sistem yang membutuhkan input data secara cepat dan hasil penyimpanan data yang akurat. Dengan menggunakan skema relational, maka duplikasi data dapat dikurangi. Salah satu contoh penggunaan skema relational adalah pada pemodelan data dimensional. Model data dimensional menggambarkan pertanyaan bisnis yang menjadi fokus pada tahapan bisnis proses tertentu. Terdapat dua komponen penting pada model data dimensioanl yaitu Fact tables dan Dimension Tables. Baris atau rows yang ada pada fact table berhubungan dengan pengukuran tertentu dan tipenya numerik, sepertu jumlah, persentase. Dimension tables merepresentaskan objek bisnis yang penting dan sebagian besar tipe datanya adalah text. 3. Level Detil dari Model Data a) Model data conceptual menggambarkan real world dari organisasi yang dimodelkan pada database. Kebutuhan data terkait entities bisnis yang penting dan relasi yang terjadi antar entity digambarkan secara high level dengan menggunakan model ini. 52 Pengelolaan Data Gambar 8. Contoh Conceptual Data Model Gambar di atas menunjukkan hubungan antara entitas School dan Student serta Application dan Student. Setiap School dapat terdiri dari satu atau banyak Student dan setiap Student berasal dari satu School. Setiap Student dapat mengirim satu atau lebih Application, dan setiap Application harus dikirim oleh satu Student. b) Model data logical merupakan detil dari representasi kebutuhan data yang biasanya dibutuhkan untuk kebutuhan spesifik, misal kebutuhan aplikasi. Untuk membuat model data logical, maka perlu dilakukan penambahan atribut pada entitas dengan menerapkan teknik normalisasi. 53 Pengelolaan Data Gambar 9. Contoh Logical Data Model c) Model data physical merupakan detil solusi teknis yang telah siap untuk diimplementasikan pada Relational Database Management System (RDBMS). Model data physical dapat sedikit erbeda dari logical karena terdapat kebutuhan tertentu, misal peningkatan perfoma query data sehingga dilakukan denormalisasi sebagaimana contoh berikut. Gambar 10. Contoh Physical Data Model b. Data Mining Data mining adalah kegiatan atau proses untuk menemukan pola tersembunyi atau hubungan yang tidak terduga/diketahui sebelumnya pada data dengan menggunakan teknik data mining yaitu machine learning, artificial intelligence, dan/atau statistik. Fungsi utama dari data mining adalah deskriptif dan prediktif. Deskriptif yaitu untuk mengetahui karakteristik dari dari data, sedangkan prediktif yaitu untuk menemukan pola tertentu dari data sehingga dapat digunakan untuk memprediksi nilai dari suatu variabel. Fungsi lain dari data mining adalah sebagai berikut. 1. Characterization dan discrimination berfungsi untuk mengeneralisasikan, meringkas, dan membedakan karakteristik data. 2. Association untuk menemukan aturan asosiasi antara suatu kombinasi item. 3. Classification and prediction yaitu membangun model yang menggambarkan dan membedakan kelas atau konsep untuk melakukan prediksi terhadap masa depan. 54 Pengelolaan Data 4. Cluster analysis yaitu membuat grup dari data yanga ada, misal dengan cara memaksimalkan kesamaan dalam kelas dan meminimalkan kesamaan antar kelas. 5. Outlier analysis yaitu mendeteksi objek yang tidak memiliki kesesuaian pola umum dari data, berguna untuk melakukan pendeteksian penipuan dan analisis kejadian langka. 6. Trend and evolution analysis yaitu analisis yang menjelaskan dan memodelkan tren dari suatu objek yang memiliki perilaku yang terus-menerus berubah setiap waktu. Metode data mining yang dapat digunakan adalah sebagai berikut. 1. Estimation: Linear Regression, Neural Network, Deep Learning, Support Vector Machine, Generalized Linear Model 2. Forecasting: Regression, Neural Network, Deep Learning, Support Vector Machine, Generalized Linear Model 3. Classification: Decision Tree, Naie Bayes, K-Nearest Neighbor, Linear Discriminant Analysis, Logistic Regression 4. Clustering: K-Means, Fuzzy C-Means, K-Medoids 5. Association: FP-Growth, A Priori, Chi Square, Coefficient of Correlation Kriteria Evaluasi dan Validasi Model 1. Akurasi Ukuran dari seberapa baik model mengkorelasikan antara hasil dengan atribut dalam data yang telah disediakan Terdapat berbagai model akurasi, tetapi semua model akurasi tergantung pada data yang digunakan 2. Kehandalan Ukuran dimana model data mining diterapkan pada dataset yang berbeda Model data mining dapat diandalkan jika mengahsilkan pola umum yang sma terlepas dari data testing yang disediakan 3. Kegunaan Mencakup berbagai metrik yang mengukur apakah model tersebut memberikan informasi yang berguna 55 Pengelolaan Data c. Business Intelligence Istilah Business Intelligence (BI) mempunyai dua arti. Pertama, istilah tersebut merujuk pada tipe analisis data yang bertujuan untuk meningkatkan peluang dari organisasi dengan utilisasi data yang dimiliki sehingga diperoleh insight baru. Kedua, BI merujuk pada teknologi yang digunakan untuk mendukung berbagai macam analisis data. Dengan perkembangan teknologi, BI tools mampu melakukan query, data mining, analisis statistik, pembuatan laporan, pemodelan visualsiasi data, dan pembuatan dashboard. Langkah-langkah dalam perancangan BI adalah sebagai berikut. 1. Mengumpulkan requirement, yang terdiri dari mengidentifikasi pengguna, mengidentifikasi konteks/cakupan bisnis, mengidentifikasi kebutuhan informasi pengguna BI. Kategori informasi yang disajikan dapat terdiri dari tiga, yaitu operational, tactical, dan strategic. Setiap kategori mempunyai sasaran dan KPI yang berbeda. a) Stategic dashboard digunakan oleh pemilik bisnis atau C-level executive. Tujuannya adalah untuk melihat progres organisasi dalam mencapai sasaran yang dibandingkan per periode. b) Operational dashboard menyajikan data secara real time sehingga ketika terdapat kejadian yang tidak diharapkan, dapat segera dilakukan tindakan. c) Tactical dashboard menyajikan in-depth analysis yang memanfaatkan data histori untuk menemukan pola atau melakukan pemodelan. 2. Mengidentifikasi sumber data yang akan digunakan dan merancang aturan bagaimana data diolah/dibersihkan, ditransformasi, diintegrasikan, disimpan, dan disediakan untuk digunakan oleh sistem BI. Proses ini dinamakan data preparation yang biasanya membutuhkan waktu yang lebih lama dibanding pembuatan visualisasinya. 3. Menganalisis dan mengidentifikasi kebutuhan teknologi, yaitu sistem dan proses backend yang mendukung penyimpanan dan pergerakan data. Pada tahapan ini, perencanaan untuk penjadwalan penarikan data (jika realtime) dan pemrosesan data secara otomatis dilakukan. 56 Pengelolaan Data 4. Menganalisis dan mengidentifikasi kebutuhan BI tools yang akan diakses dan digunakan oleh pengguna/konsumen data. Berdasarkan kebutuhan yang telah diidentifikasi sebelumnya, maka dilakukan pemilihan teknologi BI yang dapat menyajikan data sesuai dengan kebutuhan pengguna. 5. Menganalisis dan mengidentifkasi modul BI yang akan disediakan untuk pengguna/konsumen data. Pada tahap ini, konten detil dari BI mulai dirancang, seperti jenis indikator beserta tipe visualisasi yang akan digunakan, pengelompokan informasi, dan filterisasi data yang dibutuhkan. 7.2 Rangkuman 1. Pemodelan data merupakan proses untuk mengidentifikasi dan mendokumentasikan relasi dari data yang ada di organisasi sehingga selaras satu sama lain. 2. Data mining adalah kegiatan atau proses untuk menemukan pola tersembunyi atau hubungan yang tidak terduga/diketahui sebelumnya pada data dengan menggunakan teknik data mining yaitu machine learning, artificial intelligence, dan/atau statistik. 3. Istilah Business Intelligence (BI) merujuk pada tipe analisis data yang bertujuan untuk meningkatkan peluang dari organisasi dengan utilisasi data yang dimiliki sehingga diperoleh insight baru. Selain itu, BI merujuk pada teknologi yang digunakan untuk mendukung berbagai macam analisis data. 7.3 Soal Latihan 1. Sebutkan dan jelaskan level detil dari pemodelan data! 2. Sebutkan fungsi data mining dan contoh kasus dari tiap-tiap fungsi! 3. Sebutkan dan jelaskan langkah-langkah yang harus diperhatikan ketika merancang business intelligence! 7.4 Contoh Kasus 57 Pengelolaan Data Sebuah organisasi akan melakukan perapihan data pegawai, selama ini data yang ada masih belum terintegrasi dengan data cuti pegawai. Informasi yang akan disimpan pada sistem informasi kepegawaian yang baru adalah sebagai berikut. a) Identitas pegawai (nama, jenis kelamin, pangkat/golongan, tanggal lahir, alamat, pendidikan, unit kerja, jabatan, dll). b) Daftar unit kerja yang ada di organisasi tersebut. c) Informasi rekap cuti pegawai dalam satuan hari (jatah cuti tahunan dalam setahun, sisa cuti tahun tahunan sebelumnya, sisa cuti tahunan yang dapat diambil, jumlah cuti sakit, jumlah cuti dengan alasan penting, jumlah cuti besar, jumlah cuti di luar tanggungan negara). Buatlah rancangan model data baik conceptual, logical, maupun physical. dengan memperhatikan kasus di atas! Atribut dari entitas dapat ditambahkan sesuai dengan kebutuhan. 58