Data Management (Data Mining Association Rule)

44 %
56 %
Information about Data Management (Data Mining Association Rule)

Published on January 6, 2017

Author: adfbipotter

Source: slideshare.net

1. Manajemen DATA Adam Mukharil Bachtiar, M.T. Data Mining Association Rule

2. Pemahaman Awal Data Mining

3. apa itu Data Mining?

4. Ekstraksi pengetahuan yang menarik dalam bentuk rule, regularities, pola, constraint, dan lain-lain dari data yang tersimpan dalam sejumlah besar basis data

5. Gambaran Umum Data Mining

6. Data mining atau dikenal juga sebagai KDD (Knowledge Discovery in Databases) menggunakan data historical untuk mengekstraksi pengetahuan

7. Bagaimana proses untuk melakukan Data Mining?

8. Fungsional data mining ada dua, yaitu fungsi predictive dan fungsi descriptive

9. Fungsi Predictive Memprediksi nilai suatu atribut berdasarkan atribut-atribut lainnya

10. Fungsi Descriptive Memperoleh pola yang merangkum relasi pokok pada data yang digunakan

11. What is Know Your Customer (KYC) (https://www.youtube.com/watch?v=vLeC6khWzpM)

12. Business Analytics: Data Trends Let Businesses Spot New Opportunities (https://www.youtube.com/watch?v=HbHTvqZE3D8)

13. Metode data mining ada tiga, yaitu Association Rule, Classification, dan Clustering

14. Dalam bab ini akan dijelaskan data mining menggunakan metode Association Rule

15. Penjelasan Association Rule

16. Metode Association Rule sering juga disebut sebagai Market Basket Analysis

17. Association Rule digunakan untuk mengekstraksi keterhubungan asosiatif atau korelasi yang menarik antar item

18. Gambaran Hubungan Asosiatif Antar Item if then Sebagai contoh: if antecedent then consequent Artinya: 1. Ada hubungan asosiatif antara roti dengan selai. 2. Jika seseorang membeli roti maka dia berkemungkinan juga sebesar n% untuk membeli selai dalam satu pembelian

19. Ada dua parameter yang perlu diketahui pada metode Association Rule, yaitu nilai support dan nilai confidence

20. Nilai support: Rasio antara jumlah transaksi yang memuat antecedent dan consequent terhadap jumlah transaksi Nilai confidence: Rasio antara jumlah transaksi yang memuat antecedent dan consequent terhadap jumlah transaksi yang meliputi semua item dalam antecedent

21. IF A THEN B,C Support = 0.5 (50%) Confidence = 1 (100%) IF B THEN C Support = 1 (100%) Confidence = 1 (100%) IF B THEN C,A Support = 0.5 (50%) Confidence = 0.5 (50%) Cara menghitung nilai support dan confidence Terdapat dua transaksi yang terjadi:

22. Terdapat beberapa algoritma yang bisa digunakan untuk association rule di antaranya algoritma apriori dan FP-Growth

23. Section 1: Algoritma Apriori

24. Ide dasar: Mengembangkan frequent itemset dan memangkas item yang tingkat frekuensinya di bawah minimum support (Support >= Minimal Support)

25. Pseudocode algoritma apriori

26. Bagaimana cara kerjanya?

27. Contoh Kasus Algoritma Apriori Terdapat 9 transaksi yang terjadi:

28. Langkah 1: Tentukan nilai minimum support dan minimum confidence

29. Minimum support: Menyatakan nilai minimum kemunculan itemset pada suatu kumpulan transaksi Minimum confidence: Menyatakan nilai minimum kepercayaan terhadap rule yang dihasilkan

30. Dalam kasus ini, ditentukan nilai minimum support = 2 (22%) dan minimum confidence = 70%

31. Langkah 2: Generate frequent pattern 1-itemset

32. Pada iterasi pertama ini, semua itemset memenuhi aturan minimum supportnya sehingga semua item menjadi kandidat.

33. Langkah 3: Generate frequent pattern 2-itemset

34. 1. C2 adalah hasil dari L1 join L1 2. L2 adalah itemset C2 yang memenuhi aturan minimum support L1

35. Langkah 4: Generate frequent pattern 3-itemset. Lakukan untuk n-itemset apabila masih mungkin terbentuk itemset.

36. 1. Algoritma apriori mulai berjalan di langkah ini 2. Join step: {{I1, I2, I3}, {I1, I2, I5}, {I1, I3, I5}, {I2, I3, I4}, {I2, I3, I5}, {I2, I4, I5}} 3. {I1, I3, I5}, {I2, I3, I4}, {I2, I3, I5}, {I2, I4, I5} tidak dijadikan itemset karena ada subset dari set tersebut yang tidak memenuhi minimum support (prune)

37. Langkah 5: Bentuk Association Rule dari frequent itemset yang sudah dibentuk. Rule yang nilai confidencenya lebih dari minimum confidence akan digunakan (Strong Association Rule).

38. Itemset terpilih: {{I1}, {I2}, {I3}, {I4}, {I5}, {I1,I2}, {I1,I3}, {I1,I5}, {I2,I3}, {I2,I4}, {I2,I5}, {I1,I2,I3}, {I1,I2,I5}}

39. Sebagai contoh dipilih {I1,I2,I5} untuk mencari Strong Association Rule

41. Setelah Strong Association Rule terbentuk maka langkah selanjutnya adalah merepresentasikan pengetahuan

42. Bentuk representasi pengetahuan didasarkan pada tujuan data mining yang dideskripsikan berdasarkan kebutuhan pengguna

43. Representasi pengetahuan No. Strong Association Rule Representasi Pengetahuan 1 if {I1,I2} then {I5} Item I1, I2, dan I5 harus ditempatkan pada rak yang berdekatan/pada satu lorong rak 2 if {I3} then {I1,I2} Item I3, I1, dan I2 harus ditempatkan pada rak yang berdekatan/pada satu lorong rak .. .. .. Misalkan tujuan data mining adalah penempatan item yang memiliki hubungan asosiatif harus ditempatkan berdekatan agar keuntungan lebih optimal

44. Section 2: Algoritma FP-Growth (Coming Soon)

45. Exercise Time

46. Transaction ID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke Terdapat 5 transaksi yang terjadi: Kasus: 1. Tujuan data mining adalah membentuk paket ekonomis dari item yang punya hubungan asosiasi 2. Ditentukan minimum support 2 dan minimum confidence 70%

Add a comment