Breaking

Selasa, 09 Mei 2017

Data Mining (#1 dari 2)



Data Mining merupakan suatu proses pencarian atau ekstraksi pola yang menarik dari data dalam jumlah yang relatif besar . Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dimengerti, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan yang pasti baru.

Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb.

Beberapa pihak menyampaikan bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. Tapi hal ini dibantah oleh pihak lain yang mempunyai pemikiran bahwa database berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya.

Data mining sering pula disebut Knowledge Discovery in Database. Adapula yang menyebutkan sebagai analisis pola atau arkeologi data. Bahkan ada yang menyebutnya sebagai intelegensia bisnis. Data Mining, atau dalam bahasa Indonesia kita sebut sebagai penggalian data, diperlukan saat data yang tersedia sangat / terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tetapi tidak tahu pola apa yang bisa didapatkan.

Data mining tidak hanya melakukan mining terhadap data transaksi saja. Penelitian di bidang data mining saat ini sudah merambah ke sistem database lanjut seperti object oriented database, image/spatial database, time-series data/temporal database, teks (dikenal dengan nama text mining), web (dikenal dengan nama web mining) dan multimedia database.

Penggalian data adalah salah satu bagian dari proses pencarian pola. Berikut ini urutan proses pencarian pola : 
  • Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.
  • Integrasi Data: yaitu menggabungkan berbagai sumber data. 
  • Pemilihan Data: yaitu memilih data yang relevan. 
  • Transformasi Data: yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data. 
  • Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola. 
  • Evaluasi pola: yaitu mengenali pola-pola yang menarik saja. 
  • Penyajian pola: yaitu memvisualisasi pola ke pengguna.


Sumber :
https://id.wikipedia.org/wiki/Penggalian_data

www.ilmukomputer.com  (Data Mining by Yudho)

Tidak ada komentar:

Posting Komentar

close