Download Analisa Keranjang Pasar dengan Algoritma

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
Analisa Keranjang Pasar dengan Algoritma Apriori pada Data Transaksi
Mini Market Lima Bintang
Johan
E-mail : [email protected]
ABSTRAK
Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Algoritma apriori atau
association rule mining adalah teknik data mining untuk menemukan aturan asosiatif antara satu
kombinasi item, dari analisa pembelian di suatu pasar swalayan dapat diketahuinya berapa besar
kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan
tersebut, pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye
pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu. Berdasarkan uji coba
Nilai Support dapat diambil kesimpulan bahwa semakin kecil nilai support maka jumlah itemset
yang dihasilkan semakin banyak, dan jumlah kaidah asosiasi yang dibentuk semakin banyak pula.
Kata kunci : Data Mining, Association Rules, Algoritma Apriori
ABSTRACT
Apriori is an algorithm provided in association rules in data mining. Apriori or association rule
mining is data mining techniques to discover the associative rules between one combination of
items, from analysis of the purchase in a supermarket can know how likely a customer buys bread
with milk. With this knowledge, a supermarket owner can manage the placement of merchandise or
designing marketing campaigns using a combination of discount coupons for certain items. Based
on the experimental value of Support can be concluded that the smaller the value of support then
the number of itemset generated more and more, and the number of association rules established
more and more also.
Keyword : Data Mining, Association Rules, Apriori Algorithm
I. PENDAHULUAN
I.1 LATAR BELAKANG
Data mining adalah kombinasi
secara logis antara pengetahuan data, dan
analisa statistik yang dikembangkan
dalam pengetahuan bisnis atau suatu
proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan,
tiruan dan machine-learning untuk
mengekstraksi dan mengidentifikasi
informasi
yang
bermanfaat
bagi
pengetahuan yang terkait dari berbagai
database besar.
2010 - Johan
Algoritma
apriori
adalah
algoritma analisis keranjang pasar yang
digunakan untuk menghasilkan aturan
asosiasi, dengan pola “if-then”. Algoritma
apriori menggunakan pendekatan iteratif
yang dikenal dengan level-wise search,
dimana k-kelompok produk digunakan
untuk mengeksplorasi (k+1)-kelompok
produk atau (k+1)-itemset.
Dalam penelitian ini peneliti mencoba
menganalisa data transaksi penjualan
pada toko Mini Market Lima Bintang
Pekanbaru. Data yang diambil sebagai
contoh kasus adalah data transaksi
penjualan di mini market. Melalui
Page 1
penelitian ini diharapkan dapat ditemukan
langkah-langkah dan masalah (sebagai
model) dalam menerapkan algoritma
apriori ini dan diketahui apakah data
transaksi penjualan mini market cukup
Implementasi
sistem
analisis
keranjang pasar dengan algoritma
apriori, dan eksperimen penggunaan
sistem dengan data transaksi penjualan
toko Mini Market Lima Bintang
Pekanbaru.
I.2 PERUMUSAN MASALAH
Berdasarkan latar belakang di atas, dapat
dirumuskan masalahnya, sebagai berikut :
1. Bagaimana menganalisa data untuk
keperluan strategi pemasaran, desain
katalog dan proses pembuatan
keputusan bisnis ?
2. Bagaimana menemukan pola-pola
himpunan data
yang sifatnya
tersembunyi ?
3. Bagaimana menerapkan algoritma
apriori dalam data market ?
Tujuan analisis keranjang pasar pada
transaksi penjualan adalah untuk
merancang strategi penjualan atau
pemasaran
yang
efektif
dengan
memanfaatkan data transaksi penjualan
yang telah tersedia di perusahaan.
Dengan menggunakan teknologi data
mining, orang tidak perlu melakukan
analisis data secara manual, melainkan
dapat menggunakan teknik data mining
untuk ini.
I.3 TUJUAN PENELITITAN
Tujuan analisis keranjang pasar pada
transaksi penjualan adalah untuk
merancang strategi penjualan atau
pemasaran
yang
efektif
dengan
memanfaatkan data transaksi penjualan
yang telah tersedia di mini market.
Dengan menggunakan teknologi data
mining, orang tidak perlu melakukan
analisis data secara manual, melainkan
dapat menggunakan teknik data mining
untuk ini. Teknik analisis keranjang pasar
2010 - Johan
berharga untuk ditambang dengan teknik
analisis data market. Penelitian ini
membahas algoritma apriori, analisis ,
imp
bertujuan untuk menemukan pola yang
berupa produk-produk yang sering dibeli
bersamaan (atau cenderung muncul
bersama dalam sebuah transaksi) dari
data transaksi yang pada umumnya
berukuran sangat besar. Perusahaan lalu
dapat menggunakan pola ini untuk
menempatkan produk yang sering dibeli
bersamaan ke dalam sebuah area yang
berdekatan, merancang tampilan produk
di katalog, merancang kupon diskon
(untuk diberikan kepada pelanggan yang
membeli produk tertentu), merancang
penjualan paket produk, dll. Penelitian ini
bertujuan
untuk
mengaplikasikan
algoritma apriori yang merupakan hasil
penelitian yang baru, sebagai teknik
analisis keranjang pasar. Data yang
diambil sebagai contoh kasus adalah data
transaksi mini market. Melalui penelitian
ini diharapkan dapat ditemukan langkahlangkah dan masalah (sebagai model)
dalam menerapkan algoritma ini dan
diketahui apakah data mini market cukup
berharga untuk ditambang dengan teknik
analisis keranjang pasar.
II. TINJAUAN PUSTAKA
Knowledge Discovery and Data
Mining(KDD) adalah proses yang dibantu
oleh komputer untuk menggali dan
menganalisis sejumlah besar himpunan
data dan mengekstrak informasi dan
pengetahuan yang berguna. Data mining
tools memperkirakan perilaku dan tren
masa depan, memungkinkan bisnis untuk
membuat keputusan yang proaktif dan
berdasarkan pengetahuan.
Data mining tools mampu menjawab
permasalahan bisnis
yang secara
tradisional
terlalu
lama
untuk
diselesaikan.
Data
mining
tools
menjelajah database untuk mencari pola
Page 2
tersembunyi, menemukan infomasi yang
prediktif yang mungkin dilewatkan para
pakar karena berada di luar ekspektasi
mereka.
Proses dalam KDD adalah proses
yang digambarkan pada dan terdiri dari
rangkaian proses iteratif sebagai berikut:
1. Data cleaning, menghilangkan noise
dan data yang inkonsisten.
2. Data integration, menggabungkan
data dari berbagai sumber data yang
berbeda
3. Data selection, mengambil data yang
relevan dengan tugas analisis dari
database
4.
Data
transformation,
Mentransformasi atau menggabungkan
data ke dalam bentuk yang sesuai untuk
penggalian lewat operasi summary atau
aggregation.
5. Data mining, proses esensial untuk
mengekstrak pola dari data dengan
metode cerdas.
6.
Pattern
evaluation,
mengidentifikasikan pola yang menarik
dan merepresentasikan pengetahuan
berdasarkan interestingness measures.
7. Knowledge presentation, penyajian
pengetahuan
yang
digali
kepada
pengguna
dengan
menggunakan
visualisasi dan teknik representasi
pengetahuan.
Algoritma apriori adalah algoritma
analisis keranjang pasar yang digunakan
untuk menghasilkan aturan asosiasi,
dengan pola “if-then”. Algoritma apriori
menggunakan pendekatan iteratif yang
dikenal dengan level-wise search, dimana
k-kelompok produk digunakan untuk
mengeksplorasi (k+1)-kelompok produk
atau (k+1)-itemset.
Beberapa istilah yang digunakan dalam
algoritma apriori antara lain:
a. Support (dukungan): probabilitas
pelanggan membeli beberapa produk
secara bersamaan dari seluruh
transaksi. Support untuk aturan
“X=>Y” adalah probabilitas atribut
atau kumpulan atribut X dan Y yang
terjadi bersamaan.
b. Confidence (tingkat kepercayaan):
probabilitas kejadian beberapa produk
dibeli bersamaan dimana salah satu
produk sudah pasti dibeli. Contoh: jika
ada n transaksi dimana X dibeli, dan
ada m transaksi dimana X dan Y dibeli
bersamaan, maka confidence dari
aturan if X then Y adalah m/n.
c. Minimum support: parameter yang
digunakan sebagai batasan frekuensi
kejadian atau support count yang harus
dipenuhi suatu kelompok data untuk
dapat dijadikan aturan.
d. Minimum confidence: parameter yang
mendefinisikan minimum level dari
confidence yang harus dipenuhi oleh
aturan yang berkualitas.
e. Itemset: kelompok produk.
f. Support count: frekuensi kejadian
untuk sebuah kelompok produk atau
itemset dari seluruh transaksi.
g. Kandidat itemset: itemset-itemset yang
akan dihitung support count-nya.
h. Large itemset: itemset yang sering
terjadi, atau itemset-itemset yang
sudah melewati batas minimum
support yang telah diberikan.
Sedangkan notasi-notasi yang digunakan
dalam algoritma apriori antara lain:
Gambar 2.1 Tahap-tahap Data Mining
2010 - Johan
Page 3
a. Ck adalah kandidat k-itemset, dimana k
menunjukkan jumlah pasangan item.
b. Lk adalah large k-itemset.
Contoh tahapan pembangkitan C1, L1, C2,
L2, C3, L3 ditunjukkan pada Gambar 2.
Pembangkitan aturan asosiasi dari large
itemset:
c. D adalah basis data transaksi penjualan
dimana |D| adalah banyaknya
transaksi di tabel basis data.
Ada dua proses utama yang dilakukan
algoritma apriori, yaitu:
1.
Join
(penggabungan):
untuk
menemukan Lk, Ck dibangkitkan dengan
melakukan proses join Lk-1 dengan
dirinya sendiri, Ck=Lk-1*Lk-1, lalu anggota
Ck diambil hanya yang terdapat didalam
Lk-1.
2. Prune (pemangkasan): menghilangkan
anggota Ck yang memiliki support count
lebih kecil dari minimum support agar
tidak dimasukkan ke dalam Lk.
Tahapan yang dilakukan algoritma apriori
untuk membangkitkan large itemset
adalah sebagai berikut:
1.
Menelusuri seluruh record di
basis data transaksi dan menghitung
support count dari tiap item. Ini adalah
kandidat 1-itemset, C1.
2. Large 1-itemset L1 dibangun dengan
menyaring C1 dengan support count yang
lebih besar sama dengan minimum
support untuk dimasukkan kedalam L1.
3. Untuk membangun L2, algoritma
apriori menggunakan proses join untuk
menghasilkan C2.
4. Dari C2, 2-itemset yang memiliki
support count yang lebih besar sama
dengan minimum support akan disimpan
ke dalam L2.
5. Proses ini diulang sampai tidak ada
lagi kemungkinan k-itemset.
2010 - Johan
Gambar 2.2 Ilustrasi Algoritma Apriori
Dari beberapa large itemset yang
telah ditemukan, dapat dibangkitkan
aturan-aturan asosiasi yang berkualitas.
Syarat aturan asosiasi yang adalah harus
memenuhi minimum support dan
minimum
confidence
yang
telah
ditentukan. Confidence dari setiap aturan
yang dibangkitkan dapat dihitung dengan
menggunakan
rumus
peluang
Confidence(A=>B)
=
P(B|A)
=
support_count(A∩B) / support_count(A)
dengan support_count (A∩B) adalah
jumlah transaksi yang berisi itemset A
dan B, dan support_count(A) adalah
jumlah transaksi yang berisi itemset A.
Berdasarkan rumusan diatas, aturan
asosiasi dapat dibangkitkan dengan
langkah:
1. Untuk setiap itemset l, bangkitkan
seluruh subset l yang tidak kosong.
2. Untuk setiap subset s dari l yang tidak
kosong, buat aturan „s => (l- s)‟ jika
support_count(l)/support_count(s)
>=
minimum confidence.
Algoritma
apriori
memiliki
masalah yaitu harus membangkitkan
kandidat itemset, Ck, dalam jumlah besar.
(Banyaknya Ck yang dibangkitkan adalah
kombinasi k dari jumlah itemset Lk-1 atau
C
.) Setelah Ck terbentuk,
k (Σ itemset Lk-1)
Page 4
apriori melakukan penelusuran seluruh
record di basis data untuk menghitung
support count masing-masing itemset
sehingga waktu komputasinya lama.
(Semakin besar jumlah kandidat itemset
semakin besar komputasinya.)
Bentuk Dasar Aturan Asosiatif
Penting tidaknya suatu aturan
assosiatif dapat diketahui dengan dua
parameter, support (nilai penunjang)
yaitu persentase kombinasi item tsb.
dalam database dan confidence(nilai
kepastian) yaitu kuatnya hubungan antar
item dalam aturan assosiatif. Aturan
assosiatif biasanya dinyatakan dalam
bentuk :
{roti,mentega} -> {susu} (support =
40%, confidence = 50%)
Yang artinya : ”50% dari transaksi di
database yang memuat item roti dan
mentega juga memuat item susu.
Sedangkan 40% dari seluruh transaksi
yang ada di database memuat ketiga item
itu”.
Dapat juga diartikan : "Seorang
konsumen yang membeli roti dan
mentega punya kemungkinan 50% untuk
juga membeli susu. Aturan ini cukup
signifikan karena mewakili 40% dari
catatan transaksi selama ini."
Analisis asosiasi didefinisikan suatu
proses untuk menemukan semua aturan
assosiatif
yang
memenuhi syarat
minimum untuk support (minimum
support) dan syarat minimum untuk
confidence (minimum confidence).
Metodologi dasar analisis asosiasi terbagi
menjadi dua tahap :
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item
yang memenuhi syarat minimum dari
nilai support dalam database. Sebagai
contoh, ada database dari transaksi
belanja pasar swalayan seperti berikut :
2010 - Johan
ID
Transaksi
1
2
3
4
5
item terjual
Pena, roti, mentega
Roti, mentega, telur,
susu
Buncis, telur, susu
Roti, mentega
Roti, mentega, kecap,
telur, susu
Syarat minimum dari nilai support untuk
pola frekuensi tinggi dalam contoh ini
adalah 30%.
Diketahui bahwa jumlah transaksi yang
memuat {roti,mentega} ada 4 (support
80%), sedangkan jumlah transaksi yang
memuat {roti,mentega,susu} ada 2
(support 40%), transaksi yang memuat
{buncis} hanya 1 (support 20%) dsb.
Sehingga diperoleh pola frekuensi tinggi
yang memenuhi syarat minimum nilai
support adalah :
Kombinasi item
{roti}
{mentega}
{telur}
{susu}
{roti,mentega}
{telur,susu}
{roti,susu}
{mentega,susu}
{roti,telur}
{mentega,telur}
{roti,mentega,susu}
{roti,mentega,telur,susu}
Support
80%
80%
60%
60%
80%
60%
40%
40%
40%
40%
40%
40%
2. Pembentukan aturan assosiatif
Setelah semua pola frekuensi
tinggi ditemukan, barulah dicari aturan
assosiatif
yang
memenuhi syarat
minimum untuk confidence dengan
menghitung confidence aturan assosiatif
A->B. Dari support pola frekuensi tinggi
A dan B dengan menggunakan rumus
berikut : confidence(A->B) = support(B)
/ support (A U B)
Disini A U B adalah union dari pola A
dan B
Page 5
Bila syarat minimum untuk confidence
dari contoh diatas adalah 50% maka salah
satu aturan assosiatif yang dapat
ditemukan adalah :
{telur,susu} -> {roti,mentega} dengan
nilai
confidence
66.6%
karena
support({roti,mentega})/support({roti,me
ntega,telur,susu}) = 40%/60% = 66.6%
Aturan assosiatif lain yang dapat
ditemukan diantaranya adalah :
aturan assosiatif
support
confidence
{telur,susu} -> {roti,mentega}
{roti,mentega} -> {susu}
{mentega,susu} -> {roti}
40%
40%
40%
66.6%
50%
100%
Perlu dicatat bahwa tahap pertama untuk
mencari pola frekuensi tinggi biasanya
paling banyak menghabiskan waktu
III. METODE PENELITIAN
3.1. Kerangka Kerja Penelitian
Kerangka kerja adalah merupakan
prosedur kegiatan, mulai dari awal
sampai akhir dari tulisan tesis ini.
Kerangka kerja tersebut digambarkan
seperti berikut ini gambar 3 :
Data Generation
Penentuan Tujuan
Literatur
Analisa Data
Analisa data dengan algoritma apriori
Implementasi
Pembahasan Hasil
Gambar 3.1 Kerangka Kerja Penelitian
3.2. Data Generation
Metode pengumpulan data
adalah cara-cara dan prosedur yang
dilakukan dalam penelitian untuk
memperoleh data yang dibutuhkan.
Beberapa metode pengumpulan data yang
2010 - Johan
dilakukan dalam penelitian ini adalah
sebagai berikut :
a. Melakukan observasi dan kajian
tentang data transaksi penjualan
toko mini market Lima Bintang.
Kajian
lapangan
ini
untuk
mengetahui
secara
langsung
permasalahan yang ada, sehingga
diharapkan penerapan disain dan
konsep
analisa
data
market
menggunakan algoritma apriori
dapat dilakukan dengan tepat.
b.
Library Research (tinjauan
kepustakaan)
Library
research
(tinjauan
kepustakaan)
dilakukan
untuk
mengumpulkan informasi tentang
literature dan pedoman dalam
penentuan hasil analisa data market
menggunakan algoritma apriori.
c.
Laboratory
Research
(Penelitian Laboratorium)
Penelitian laboratorium adalah
untuk pengujian data penentuan
hasil analisa data market yang telah
didapatkan dengan menggunakan
algoritma apriori
3.3. Penentuan Tujuan
Yang menjadi tujuan pada tesis ini
untuk menentukan hasil analisa data
market menggunakan algoritma apriori.
Setelah melakukan kajian, maka sasaran
terakhir dari tesis ini adalah sebagai
berikut :
a. Mendisain suatu konsep penentuan
hasil analisa data market dengan
menggunakan algoritma apriori,
sehingga dapat menemukan pola dari
data yang tersembunyi.
b. Memberikan kemudahan atau solusi
bagi pengambil keputusan dalam
menemukan produk-produk yang
sering dibeli bersamaan dari data
transaksi
sehingga
dapat
menempatkan produk yang sering
dibeli bersamaan kedalam suatu area
yang berdekatan, merancang tampilan
Page 6
produk dikatalog, merancang kupon
diskon dan lain-lain.
c. Hasil dari penelitian yang dilakukan
ini nantinya dapat diuji dengan
menggunakan software association
rule.
3.4 . Literatur
Literatur yang dimaksud
disini
adalah literatur yang digunakan untuk
mendapatkan suatu cara atau prosedur
yang akan digunakan untuk menganalisa
data market menggunakan algoritma
apriori agar nantinya dapat diterima oleh
semua pihak yang membutuhkan.
Sumber literatur didapatkan dari
buku-buku yang membahas
tentang
teknik data mining, analisa data market,
algoritma apriori dan jurnal-jurnal dari
web site (internet). Judul buku dan
alamat situs di internet yang dijadikan
sebagai sumber literatur, nantinya
dilampirkan pada daftar pustaka di akhir
tesis ini.
Dari hasil studi literatur diketahui ada
penerapan apriori di bidang mini market
untuk
mengelompokkan
barang
berdasarkan kecenderungan kemunculan
bersama dalam satu transaksi, juga data
mining pada tabel absensi elektronik
untuk mendeteksi kecurangan absensi,
dan analisa keranjang pasar dengan
algoritma hash-based pada data transaksi
penjualan apotek.
3.5 . Analisa Data
Data-data yang sudah diperoleh pada
tahap pengumpulan data, akan dianalisis
pada bagian ini. Berdasarkan hasil kajian
literatur dan observasi lapangan, data
disusun dan dikelompokkan dalam
bentuk tabel multikriteria sederhana. Hal
ini dimaksudkan untuk mempermudah
dalam analisa dan proses penentuan hasil
analisa data market menggunakan
algoritma apriori.
2010 - Johan
3.6 . Pengolahan
Data
Dengan
Algoritma Apriori
Pada tahap ini akan dilakukan analisa
yaitu; analisa terhadap algoritma apriori
pada data market dari data transaksi
penjualan untuk menentukan alternatif
yang terbaik dari sekumpulan alternatif
yang ada melalui suatu proses seperti
yang terjadi pada proses yang terstruktur.
3.7. Implementasi
Pada
penelitian
ini
penulis
mengimplementasikan pengujian model
dari hasil analisa data menggunakan
algoritma apriori dengan menggunakan
alat bantu komputer dengan operating
system windows dan menggunakan
software shoping cart analyzer. Model
yang dirancang ini akan dibuat sebagai
sebuah aplikasi yang siap pakai.
3.8. Pembahasan Hasil
Evaluasi sistem yang telah di uji perlu
dilakukan,
dengan
tujuan
untuk
mengetahui apakah sistem yang diuji
tersebut sudah sesuai dengan yang
diharapkan. Evaluasi dilakukan dengan
cara
membandingkan
hasil
yang
didapatkan pada tahap implementasi
sistem dengan hasil yang dibuat secara
manual.
IV. ANALISA DAN PERANCANGAN
Tahapan yang cukup penting pada
data mining adalah tahapan data
preparation atau tahapan persiapan data.
Dimana nantinya data yang didapatkan
akan dipergunakan pada
tahapan
selanjutnya yaitu modelling. Apabila
data yang didapatkan tidak benar maka
nantinya model yang dihasilkan tidak
akan maksimal hasilnya.
4.1 Data Preparation
Data yang didapatkan merupakan
data primer yaitu data yang didapatkan
langsung dari data transaksi penjualan
toko mini market lima bintang pekanbaru,
berupa data transaksi penjualan dalam
beberapa bulan.
Page 7
Terdapat delapan(8) atribut yang
harus diisi yang ada pada transaksi
penjualan toko mini market lima bintang
pekanbaru yaitu :
1. Tanggal
Kegiatan kapan terjadinya transaksi
2. No_Nota
Nomor kegiatan transaksi yang harus
diisi disaat transaksi terjadi
3. Konsumen
Nama pelanggan yang membeli item
barang
4. Nama_Barang
Pendefinisian item-item barang untuk
membedakan item barang yang satu
dengan item barang yang lain.
5. QTY
6. Jumlah item barang yang dimasukkan
pelanggan ke dalam keranjang
belanjaanya.
2010 - Johan
7. Satuan
Bentuk item barang
8. Harga_Satuan(@)
Harga per item barang yang dibeli
pelanggan
9. Jumlah
Harga yang harus dibayar oleh
pelanggan
4.1.1 Select Data
Dari 8 atribut yang ada pada data
transaksi penjualan yang dapat dijadikan
parameter pada penelitian ini hanya
No_Nota dan Nama_Barang. Dimana kita
hanya melihat item barang mana yang
sering dibeli oleh pelanggan.
Page 8
Tabel 4.1 Data Transaksi Mini Market
Tanggal
2-Jan-10
No_Nota
1704
Konsumen
Café Bintang
2-Jan-10
1705
Warung Restu
Nama Barang
Qty
1
Indomie
Goreng
Special
5
Indomie Kari Ayam
2
Indomie
Ayam
Bawang
2
Indomie Soto Medan
1
Indomie Kaldu Ayam
1
Indomie Goreng Sate
2
Indomie
Goreng
Pedas
Tepung Terigu
Tepung Terigu 2
2-Jan-10
2-Jan-10
1704
1704
Café Bintang
Café Bintang
2-Jan-10
2-Jan-10
2-Jan-10
2-Jan-10
1704
1704
1704
1704
Café Bintang
Café Bintang
Café Bintang
Café Bintang
2-Jan-10
1705
Warung Restu
Tepung KanjiTepung Terigu 3
Kg
Rp
5,500
Rp
16,500
1705
Warung Restu
Super BuburTepung
Rasa Sapi
Terigu 1
Dus
Rp
40,000
Rp
40,000
2-Jan-10
1705
Warung Restu
2
ABC Mie Semur
Pedas
Tepung
Terigu
Dus
Rp
49,000
Rp
98,000
2-Jan-10
1705
Warung Restu
Royco AyamTepung
Sachet Terigu 2
Renceng
Rp
6,000
Rp
12,000
2-Jan-10
1705
Warung Restu
Royco Sapi Sachet
Tepung Terigu 2
Renceng
Rp
6,000
Rp
12,000
2-Jan-10
1705
Telor Ayam Tepung Terigu 2
Papan
Rp
22,000
Rp
44,000
Air Galon SPA
Aqua Cup
Beras Belida 20Kg
Indomie
Goreng
Pedas
Lifebuoy Cair 450ml
Milo Sachet
Kecap Manis Bango
Refill 85ml
Roti Bobo
Sampoerna Mild 16
Lucky Strike Black
Indomilk Susu Kental
Manis Coklat Kaleng
Teh Celup Sari Wangi
@50sch
Ajinomoto @500
Rinso 900gr
Telor Ayam
Roti Bobo
1
5
5
5
Galon
Dus
Bgks
Bgks
Rp
Rp
Rp
Rp
9,500
15,000
80,000
48,000
Rp
Rp
Rp
Rp
9,500
75,000
400,000
240,000
5
10
5
Bgks
Bgks
Bgks
Rp
Rp
Rp
2,000
2,500
8,000
Rp
Rp
Rp
10,000
25,000
40,000
10
5
3
2
Bgks
Bgks
Bgks
klg
Rp
Rp
Rp
Rp
1,000
10,000
11,000
5,600
Rp
Rp
Rp
Rp
10,000
50,000
33,000
11,200
3
Bgks
Rp
6,000
Rp
18,000
2
2
1
12
Bgks
Pack
Papan
Bgks
Rp
Rp
Rp
Rp
7,500
7,500
22,000
1,000
Rp
Rp
Rp
Rp
15,000
15,000
22,000
12,000
Daia Putih 1Kg
1
Kg
Rp
18,000
Rp
18,000
Indomie Kari Ayam
2
Dus
Rp
50,000
Rp
100,000
Indomie
Goreng
Special
Indomie
Goreng
Pedas
ABC Mie Semur Pedas
Telor Ayam
Milo Sachet
Indomie Soto Medan
1
Dus
Rp
49,000
Rp
49,000
1
Dus
Rp
48,000
Rp
48,000
2
3
6
3
Dus
Papan
Bgks
Dus
Rp
Rp
Rp
Rp
49,000
22,000
2,500
46,000
Rp
Rp
Rp
Rp
98,000
66,000
15,000
138,000
2-Jan-10
2-Jan-10
2-Jan-10
2-Jan-10
2-Jan-10
1706
1706
1706
1706
Warung Restu
Salon Van Beauty
Salon Van Beauty
Salon Van Beauty
Salon Van Beauty
2-Jan-10
3-Jan-10
3-Jan-10
1706
1707
1707
Salon Van Beauty
Warung Wiwi
Warung Wiwi
3-Jan-10
3-Jan-10
3-Jan-10
3-Jan-10
1707
1707
1707
1708
Warung Wiwi
Warung Wiwi
Warung Wiwi
Ridho Jaya
3-Jan-10
1708
Ridho Jaya
3-Jan-10
3-Jan-10
3-Jan-10
3-Jan-10
1708
1708
1708
1709
3-Jan-10
1709
3-Jan-10
1709
3-Jan-10
1709
3-Jan-10
1709
3-Jan-10
3-Jan-10
3-Jan-10
3-Jan-10
1710
1710
1710
1710
Ridho Jaya
Ridho Jaya
Ridho Jaya
MM
Masakan
Medan
MM
Masakan
Medan
MM
Masakan
Medan
MM
Masakan
Medan
MM
Masakan
Medan
Kedai Kopi Lin's
Kedai Kopi Lin's
Kedai Kopi Lin's
Kedai Kopi Lin's
2010 - Johan
Satuan
Dus
Harga_Satuan(@)
Rp
49,000
Jumlah
Rp
49,000
Dus
Dus
Rp
Rp
50,000
47,000
Rp
Rp
250,000
94,000
Dus
Dus
Dus
Dus
Rp
Rp
Rp
Rp
46,000
46,000
48,000
48,000
Rp
Rp
Rp
Rp
92,000
46,000
48,000
96,000
Kg
Rp
6,000
Rp
12,000
Page 9
4.1.2 Pembersihan Data
Pembersihan
data
biasanya
dipergunakan untuk mengisi data-data
yang masih kosong atau ada kesalahan
pengisian. Pada data mining ada teknikteknik yang dapat dipergunakan untuk
melakukan pembersihan data. Akan tetapi
untuk penelitian ini, penulis tidak
mempergunakan teknik-teknik pada data
mining tersebut. Karena parameterparameter yang ada, dibutuhkan data
yang sebenarnya, bukan data yang dibuat
berdasarkan rata-rata yang ada.
4.1.3 Integrasi Data
Data-data yang dikumpulkan
dalam proses transaksi seringkali
ditempatkan pada lokasi yang berbedabeda. Maka dari itu dibutuhkan
kemampuan dari sistem untuk dapat
mengumpulkan data dengan cepat.
Tabel 4.2 Contoh Database
Transaksional
No_Fak
Item Bought
tur
Goreng
Special,
1704 Indomie
Indomie Kari Ayam, Indomie
Ayam Bawang, Indomie Soto
Medan, Indomie Kaldu Ayam,
Indomie Goreng Sate, Indomie
Goreng Pedas
1705
Tepung Terigu, Tepung Kanji,
Super Bubur Rasa Sapi, ABC
Mie Semur Pedas, Royco Ayam
Sachet, Royco Sapi Sachet,
Telor Ayam
1706
Air Galon SPA, Aqua Cup,
Beras Belida 20Kg, Indomie
Goreng Pedas, Lifebuoy Cair
450ml
1707
Milo Sachet, Kecap Manis
Bango Refill 85ml, Roti Bobo,
Sampoerna Mild 16, Lucky
Strike Black
1708
Indomilk Susu Kental Manis
Coklat Kaleng, Teh Celup Sari
Wangi @50sch, Ajinomoto
@500, Rinso 900gr, Telor Ayam
2010 - Johan
1709
Roti Bobo, Daia Putih 1Kg,
Indomie Kari Ayam, Indomie
Goreng Special, Indomie Goreng
Pedas
1710
ABC Mie Semur Pedas, Telor
Ayam, Milo Sachet, Indomie
Soto Medan
Dengan menggunakan tabel transaksi
diatas, akan ditunjukkan bagaimana cara
kerja dari algoritma apriori. Minimum
support (minsupp) yang ditetapkan untuk
menjalankan algoritma ini adalah sebesar
20% , dikarenakan akan terjadi transaksi
dengan banyak item sehingga supportnya
di kecilkan.
Langkah 1 : menelusuri seluruh record
di basis data transaksi dan menghitung
support count dari tiap item. Ini adalah
kandidat 1-itemset, C1
Support
Jumlah Transaksi Mengandung A
Total Transaksi
(A)
Tabel 4.3 Candidat 1-itemset
C1
Candidate 1-itemset
Support
Indomie
Goreng
Special
Indomie
Kari
Ayam
Indomie
Soto
Medan
Roti Bobo
ABC Mie Semur
Pedas
Milo Sachet
Indomie
Goreng
Pedas
Telor Ayam
Indomie
Ayam
Bawang
Indomie
Kaldu
Ayam
Indomie
Goreng
Sate
2/7 (28,6%)
Frequen
t
Ya
2/7 (28,6%)
Ya
2/7 (28,6%)
Ya
2/7 (28,6%)
2/7 (28,6%)
Ya
Ya
2/7 (28,6%)
3/7 (42,8%)
Ya
Ya
3/7 (42,8%)
1/7 (14,3%)
Ya
Tidak
1/7 (14,3%)
Tidak
1/7 (14,3%)
Tidak
Page 10
Tepung Terigu
1/7 (14,3%) Tidak
Tepung Kanji
1/7 (14,3%) Tidak
Super Bubur Rasa 1/7 (14,3%) Tidak
Sapi
Royco
Ayam 1/7 (14,3%) Tidak
Sachet
Royco Sapi Sachet 1/7 (14,3%) Tidak
Air Galon SPA
1/7 (14,3%) Tidak
Aqua Cup
1/7 (14,3%) Tidak
Beras Belida 20Kg 1/7 (14,3%) Tidak
Lifebuoy
Cair 1/7 (14,3%) Tidak
450ml
Kecap
Manis 1/7 (14,3%) Tidak
Bango Refill 85ml
Sampoerna Mild 1/7 (14,3%) Tidak
16
Lucky Strike Black 1/7 (14,3%) Tidak
Indomilk
Susu 1/7 (14,3%) Tidak
Kental
Manis
Coklat Kaleng
Teh Celup Sari 1/7 (14,3%) Tidak
Wangi @50sch
Ajinomoto @500
1/7 (14,3%) Tidak
Rinso 900gr
1/7 (14,3%) Tidak
Daia Putih 1Kg
1/7 (14,3%) Tidak
Adapun keterangan dari tabel 4.4 adalah
sebagai berikut.
Nilai Support Indomie Goreng Special
dapat dihitung dengan menggunakan
rumus, yaitu :
Support
Jumlah Indomie Goreng Special
=
Support
Total Transaksi
2
7
=
Support = 2 / 7 = 28,6 %
Nilai Support Indomie Kari Ayam
dapat dihitung dengan menggunakan
rumus, yaitu :
Support = Jumlah Indomie Kari Ayam
Total Transaksi
2
Support =
Support = 2 / 7 = 28,6 %
Nilai Support Indomie Soto Medan
dapat dihitung dengan menggunakan
rumus, yaitu :
Support =
Jumlah Indomie Soto Medan
Total Transaksi
2
Support =
7
Support = 2 / 7 = 28,6 %
Nilai Support Telor Ayam dapat
dihitung dengan menggunakan rumus,
yaitu :
Support =
Jumlah Telor Ayam
Total Transaksi
Support =
3
7
Support = 3 / 7 = 42,8 %
Langkah 2 : large1_itemset L1 dibangun
dengan menyaring C1 (tabel 4.4) dengan
support count yang lebih besar atau sama
dengan
minimum
support
untuk
dimasukkan ke dalam L1
Tabel 4.4 Frequent 1-itemset
L1
Frequent 1-Itemset
Indomie Goreng Special
28,6 %
Indomie Kari Ayam
28,6 %
Indomie Soto Medan
28,6 %
Roti Bobo
28,6 %
ABC Mie Semur Pedas
28,6 %
Milo Sachet
28,6 %
Indomie Goreng Pedas
42,8 %
Telor Ayam
42,8 %
7
2010 - Johan
Page 11
Langkah 3 : untuk membangun L2,
algoritma apriori menggunakan proses
join untuk menghasilkan C2.
Indomie Goreng Pedas
Untuk candidat 2-itemset, dari 8 item
dapat menghasilkan kombinasi 2-itemset
yang memungkinkan sebanyak :
Ayam Semur
0/7 (0%)
Tidak
0/7 (0%)
Tidak
0/7 (0%)
Tidak
Indomie Kari Ayam, ABC
Indomie Goreng Special,
Indomie Kari Ayam, Telor
Ayam
= 28 kombinasi
C82 =
Indomie Goreng Special,
Langkah 4 : dari C2 (tabel 4.6), 2itemset yang memiliki support count
yang lebih besar atau sama dengan
minimum support akan disimpan ke
dalam L2.
Indomie
Kari
Ayam,
Indomie
Goreng
Pedas,
Telor Ayam
Adapun keterangan dari tabel 4.8 adalah
sebagai berikut.
Nilai Support Indomie Goreng Special,
Indomie Kari Ayam, Indomie Goreng
Pedas
dapat
dihitung
dengan
menggunakan rumus, yaitu :
Tabel 4.5 Frequent 2-itemset
L2
Frequent 2-itemset
Indomie
Goreng
Special,
Indomie Kari Ayam
Indomie
Goreng
Special,
Indomie Goreng Pedas
Indomie Kari Ayam, Indomie
Goreng Pedas
ABC Mie Semur Pedas, Telor
Ayam
28,6 %
28,6 %
Support A,B,C = P(A ∩B∩C)
Jumlah transaksi Indomie Goreng Special AND
Indomie Kari Ayam AND Indomie Goreng Pedas
Total Transaksi
28,6 %
2
7
Support =
28,6 %
Support = 2 / 7 = 28,6 %
Langkah 5 : proses ini diulang sampai
tidak ada lagi kemungkinan k-itemset
Untuk candidat 3-itemset, dari 4 item
dapat menghasilkan kombinasi 3-itemset
yang memungkinkan sebanyak :
Tabel 4.7 frequent 3-itemset
Frequent 3-itemset
Indomie Goreng Special, Indomie 28,6 %
Kari Ayam, Indomie Goreng Pedas
C43
= 4 kombinasi
=
Tabel 4.6 Candidat 3-itemset
C3
Candidate 3-itemset
Support
Frequent
Indomie Goreng Special,
2/7
Ya
Indomie
(28,6%)
Kari
2010 - Johan
Ayam,
Karena tidak memungkinkan lagi
dibentuk frequent 4-itemset dari frequent
3-itemset, maka proses pencarian
dihentikan dan maximal frequent itemsetnya adalah {Indomie Goreng Special,
Indomie Kari Ayam, Indomie Goreng
Pedas}. Untuk pembangkitan aturan
asosiasi dari Large
itemset, harus
memenuhi minimum support dan
minimum
confidence
yang
telah
ditentukan. Confidence dari setiap aturan
Page 12
yang dibangkitkan dapat dihitung dengan
menggunakan rumus peluang :
Confidence (A B) = P (B/A) = support
count (A∩ B)/support count (A), dengan
support count (A ∩ B) adalah jumlah
transaksi yang berisi itemset A dan B,
dan support count (A) adalah jumlah
transaksi yang berisi itemset A.
Berdasarkan rumus diatas, aturan asosiasi
dapat dibangkitkan dengan langkah :
support count(l)/support count(s) =
minimum confidence.
4.2 Pembangkitan Association Rule
Setelah proses penghitungan
confidence selesai dilakukan maka kita
dapat menghasilkan association rule
berdasarkan data yang ada. Sebagai
contoh akan dihasilkan association rule
dari 2 itemset seperti yang diperlihatkan
pada tabel 4.10 maka association rule
yang dihasilkan adalah sebagai berikut.
1. Jika konsumen membeli Indomie
Goreng Special juga akan membeli
Indomie Kari Ayam , maka nilai
support = 28,6% dan nilai confidence
= 100%
- item A dan B dibeli bersamaan
sebesar 28,6% dari keseluruhan
data transaksi yang dianalisis dan
100% dari semua konsumen yang
membeli item A juga membeli
item B.
2. Jika konsumen membeli Roti Bobo
juga akan membeli Indomie Goreng
Special, maka nilai support = 14,3%
dan nilai confidence = 50%
3. Jika konsumen membeli Indomie
Soto Medan juga akan membeli
Indomie Goreng Special, maka nilai
support = 14,3% dan nilai confidence
= 50%
4. Jika konsumen membeli Indomie
Goreng Special juga akan membeli
Indomie Goreng Pedas, maka nilai
support = 14,3% dan nilai confidence
= 100%
2010 - Johan
5. Jika konsumen membeli Indomie
Goreng Pedas juga akan membeli
Indomie Goreng Special, maka nilai
support = 14,3% dan nilai confidence
= 66,7%
6. Jika konsumen membeli Indomie
Kari Ayam juga akan membeli
Indomie Goreng Pedas, maka nilai
support = 14,3% dan nilai confidence
= 66,7%
7. Jika konsumen membeli Indomie
Kari Ayam juga akan membeli
Indomie Soto Medan, maka nilai
support = 14,3% dan nilai confidence
= 50%
8. Jika konsumen membeli Roti Bobo
juga akan membeli Indomie Kari
Ayam, maka nilai support = 14,3%
dan nilai confidence = 50%
9. Jika konsumen membeli Telor Ayam
juga akan membeli Indomie Soto
Medan, maka nilai support = 14,3%
dan nilai confidence = 33,3%
10.Jika konsumen membeli Milo Sachet
juga akan membeli Telor Ayam,
maka nilai support = 14,3% dan nilai
confidence = 50%
Sebagai
contoh
akan
dihasilkan
association rule dari 3 itemset seperti
yang diperlihatkan pada tabel 4.8 maka
association rule yang dihasilkan adalah
sebagai berikut.
-
Jika Konsumen membeli Indomie
Goreng Special juga akan
membeli Indomie Kari Ayam dan
juga akan membeli Indomie
Goreng Pedas, maka nilai support
= 28,6% dan nilai confidence =
100%
Artinya item A,B dan C dibeli bersamaan
sebesar 28,6% dari keseluruhan data
transaksi yang dianalisis dan 100% dari
semua konsumen yang membeli item A
dan item B juga membeli item C.
Page 13
V. KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan penelitian yang penulis
lakukan pada Toko Mini Market Lima
Bintang Pekanbaru, maka penulis dapat
menarik kesimpulan bahwa data transaksi
penjualan toko mini market Lima Bintang
Pekanbaru dapat ditambang dengan teknik
association rule dan menghasilkan rule-rule
yang bermanfaat bagi perusahaan.
Atas analisis dan pembahasan yang
penulis lakukan pada system analisa data
market maka penulis dapat mengambil
kesimpulan sebagai berikut:
1.
Berdasarkan uji coba Nilai Support
dengan nilai support 0.25%, 0.5%.0.75%
dan 1 % dapat diambil kesimpulan bahwa
semakin kecil nilai support maka jumlah
itemset yang dihasilkan semakin banyak,
dan jumlah kaidah asosiasi yang dibentuk
semakin banyak pula.
2. Data transaksi sebaiknya diambil pada
periode-periode tertentu (misalnya awal
tahun, pertengahan tahun, akhir tahun),
sebab aturan-aturan yang dibangkitkan
pola pembelian pelanggan dapat berbeda
dari satu periode ke periode lainnya.
Aturan-aturan asosiasi yang dihasilkan
tidak selalu mengandung informasi yang
penting (karena sudah umum diketahui),
dan aturan yang berharga adalah yang
berupa informasi “baru” yang dapat
dimanfaatkan
untuk
meningkatkan
penjualan.
5.2 Saran
Dari hasil pembahasan ini, maka
penulis dapat menyampaikan saran-saran
sebagai berikut:
1. Agar perusahaan dapat memanfaatkan
gudang data mereka untuk informasi
dalam dunia bisnis,
2. Informasi yang ditemukan sebaiknya dapat
diaplikasikan untuk aplikasi manajemen
dan pengambilan keputusan.
2010 - Johan
DAFTAR PUSTAKA
[1] Gregorius Satia Budhi; Felicia Soedjianto
(2007) ”APLIKASI DATA MINING
MARKET BASKET ANALYSIS PADA
TABEL
DATA
ABSENSI
ELEKTRONIK UNTUK MENDETEKSI
KECURANGAN ABSENSI (CHECKLOCK)
KARYAWAN
DI
PERUSAHAAN”.
Jurnal
Teknik
Informatika, Fakultas Teknologi Industri,
Universitas Kristen Petra, Surabaya.
[2] Gregorius S. Budhi, Resmana Lim (2005)
”PENGGUNAAN METODE FUZZY cCOVERING
UNTUK
ANALISA
MARKET
BASKET
PADA
SUPERMARKET”.
Jurnal
Teknik
Informatika, Universitas Kristen Petra,
Surabaya.
[3] Hwung Su J., Yang Lin W. 2004, CBW:
An Efficient Algorithm for Frequent
Itemset Mining. Proceedings of the 37th
Hawaii International Conference on
System Sciences.
[4] Iko Pramudiono (2003), “ Pengantar Data
Mining
Menambang
Permata
Pengetahuan di Gunung Data”. Ilmu
komputer.com1-4
[5] Marsela Yulita dan Veronica S. Moertini
(2004)
”ANALISIS
KERANJANG
PASAR
DENGAN
ALGORITMA
HASH-BASED
PADA
DATA
TRANSAKSI PENJUALAN APOTEK”.
Jurnal Ilmu Komputer, Universitas
Katolik Parahyangan, Bandung.
[6] Mewati Ayub (2007) ”Proses Data
Mining dalam Sistem Pembelajaran
Berbantuan Komputer”. Jurnal Sistem
Informasi Vol. 2 No.1.
[7] Philips Kokoh Prasetyo (2006) “Data
Mining & Knowledge Discovery”.
https://philips.wordpress.com/2006/06/22
/association-rule-mining.
[8] Ravindra Patel, D. K. Swami and K. R.
Pardasani (2006)
“Lattice
Based
Algorithm for Incremental Mining of
Association Rules”. International
Journal of Theoretical and Applied
Computer Sciences.
[9] Veronika S. Moertini (2002) “DATA
MINING
SEBAGAI
SOLUSI
BISNIS”. vol. 7 no.1.
Page 14