Download this PDF file

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
ANALISIS PENGELOMPOKAN JUMLAH PENUMPANG BUS TRANS
JOGJA MENGGUNAKAN METODE CLUSTERING K-MEANS DAN
AGGLOMERATIVE HIERARCHICAL CLUSTERING (AHC)
Lisna Zahrotun
Program Studi Teknik Informatika Universitas Ahmad Dahlan
Jl. Prof. Dr. Soepomo, Janturan, Yogyakarta 55164
Telp: (0274) 563515 ext. 3208
E-mail : [email protected]
Abstrak
Teknik kluster merupakan teknik pengelompokan yang sudah di kenal, dimana dalam
teknik ini bertujuan untuk mengelompokkan data ke dalam kluster sehingga setiap kluster
berisi data yang semirip mungkin.Dengan memanfaatkan data dari dinas
perhubungantentang jumlah penumpang Trans Jogja, maka dalam penelitian ini dilakukan
pengelompokan jumlah penumpang berdasarkan jalur bus dan shelter dengan menggunakan
metode clustering k-means, dan Agglomerative Hierarchical Clustering (AHC). Penelitian
ini menghasilkan 3 cluster untuk metode K-Means dengan jumlah data untuk cluster 0 ada
15 data, cluster 1 ada 44 data dan cluster 2 ada 54 data. Dan metode AHC3 cluster dengan
jumlah data untuk cluster 0 ada 2 data, cluster 1 ada 57 data dan cluster 2 ada 54 data.
Sehingga dari hasil pengelompokkan tersebut dapat terlihat metode K-Means memiliki hasil
yang lebih baik dari pada metode AHC
Kata kunci : shelter, clustering k-means, agglomerative hierarchical clustering .
1.
PENDAHULUAN
Pertumbuhan penduduk di suatu negara akan berbanding lurus dengan kebutuhan
sarana transportasi. Trans Jogja adalah sebuah sistem transportasi bus cepat, murah, dan berAC di seputar Kota Yogyakarta yang dicanangkan Dinas Perhubungan, Komunikasi, dan
Informatika (Dishubkominfo) DIY. Berbeda dengan bus kota kebanyakan, bus Trans Jogja
membutuhkan halte (shelter) khusus sebagai tempat pertemuan antara calon penumpang
dengan bus.
Seiring perkembangan waktu, jumlah penumpang bus Patas Trans Jogja mengalami
kenaikan dari waktu ke waktu. Namun, kenaikan tersebut belum ditopang dengan
peningkatan jumlah shelter, sehingga banyak calon penumpang yang tidak terangkut di jalur
bus Trans Jogja. Sedangkan disisi lain pada shelter-shelter tertentu hanya terdapat sedikit
calon penumpang pada jam-jam tertentu. Selain itu banyak warga yang mengeluhkan
sejumlah tempat yang masuk jalur, tetapi kurang ditemui adanya shelter. Sehingga banyak
diantaranya yang ingin menggunakan jasa bus Trans Jogja, tetapi tidak terpenuhi karena tidak
adanya shelter. (http\\:transjogja.com)
Teknik kluster merupakan teknik pengelompokan yang sudah di kenal, dimana dalam
teknik ini bertujuan untuk mengelompokkan data ke dalam kluster sehingga setiap kluster
berisi data yang semirip mungkin. Menurut Santosa (2007) ada dua pendekatan dalam
clustering, yaitu partisioning dan hirarki.
1039
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
Pada algoritma hierarchical clustering menurut Tang, dkk (2006 ) terdapat beberapa
keunggulan yaitu tidak perlu menentukan jumlah klaster yang diinginkan karena proses dapat
langsung dihentikan pada saat jumlah klaster sesuai dengan yang diinginkan. Namun
algoritma ini juga memiliki kelemahan bergantung pada pemilihan teknik intercluster
similarity yang lebih dikenal dengan istilah linkage. Beberapa kelemahan dari linkage
tersebut adalah sensitif terhadap adanya outlier, kesulitan menangani variasi bentuk dan
ukuran, dan memisahkan cluster yang besar.
Sedangkan Berkhin menyebutkan beberapa kelemahan algoritma K‐means adalah: (1)
sangat bergantung pada pemilihan nilai awal centroid, (2) tidak jelas berapa banyak cluster k
yang terbaik, (3) hanya bekerja pada atribut numerik.
Algoritma K-means ini juga memiliki kelebihan yaitu dinilai cukup efisien, yang
ditunjukkan dengan kompleksitasnya O(tkn), dengan catatan n adalah banyaknya obyek data,
k adalah jumlah cluster yang dibentuk, dan t banyaknya iterasi. Biasanya, nilai k dan t jauh
lebih kecil daripada nilai n. Selain itu, dalam iterasinya, algoritma ini akan berhenti dalam
kondisi optimum lokal (Tang, dkk 2005).
Dengan mengetahui kelebihan dan kelemahan Agglomerative Hierarchical Clustering
(AHC) dan juga permasalahan pada Dinas Perhubungan tentang jumlah penumpan bus Trans
Jogja maka dilakukan penelitian lanjutan dari penelitian sebelumnya yang telah dilakukan
oleh penulis yaitu mengelompokkan jumlah penumpang bus dengan metode clustering KMeans ke dalam penelitian ini dengan judul “Analisis Pengelompokan Jumlah Penumpang
Bus Trans Jogja Menggunakan Metode Clustering
K-Means dan
Agglomerative
Hierarchical Clustering (AHC)”.
2.
TINJAUAN PUSTAKA
Irdiansyah (2007) dalam jurnalnya didapatkan informasi dari data penjualan yang besar
yaitu sebagai gambaran untuk pengambilan keutusan bagi perusahaan. Pengelompokan dalam
penelitian ini juga digunakan oleh perusahaan untuk membuat laporan mengenai karakteristik
umum dari grup-grup konsumen yang berbeda. Clustering yang digunakan adalah
Agglomerative Hierarchical Clustering Algorithm (AHC algorithm).
Pralita (2010) dalam penelitiannya ini penerapan JST digunakan untuk prediksi jumlah
penumpang bus di Kabupaten Kebumen dengan menggunakan metode Backpropagation
berdasarkan pada data bulan Januari 2004 sampai Juli 2009. Dari hasil pelatihan dan
pengujian data yang telah dilakukan, dihasilkan nilai prediksi untuk Agustus 2009 adalah
sebesar 21857 orang.
Zahrotun (2013) dalam penelitiannya melakukan pengelompokkan mengunakan metode
clustering k-means. Dimana dalam penelitian ini masih perlu dikembangkan karena belum
dapat menghasilkan data untuk setiap clusternya.
3.
DASAR TEORI
Analisis kelompok (cluster analisis) adalah pekerjaan mengelompokkan data (objek)
yang didasarkan hanya pada informasi yang ditemukan dalam data yang menggambarkan
objek tersebut dan hubungan diantaranya (Tan, 2006 dalam buku Prasetyo, 2012). Ada
beberapa cara yang dapat digunakan untuk mengukur jarak data ke pusat kelomok, di
antaranya Euclidean (Bezdek, 1981 dalam buku Prasetyo, 2012) menggunakan formula
sebagai berikut:
𝐷 (𝑥2 − 𝑥 1 ) = ‖𝑥2 − 𝑥1 ‖2 = √∑𝑝𝑗=1|𝑥2𝑗 − 𝑥1𝑗 |
2
(1)
1040
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
Algoritma Clustering K-Means
K-Means merupakan algoritma clustering yang berulang-ulang. Algoritma K-Means
dimulai dengan pemilihan secara acak K, K disini merupakan banyaknya cluster yang ingin
dibentuk. Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai tersebut
menjadi pusat dari cluster atau biasa disebut dengan centroid, mean atau “means”. Hitung
jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidian
hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasikan
setiap data berdasarkan kedekatannya dengan centroid. Lakukan langkah tersebut hingga nilai
centroid tidak berubah (stabil) (Pralita, 2010).
Pada tahapan iterasi, nilai centroid cluster ditentukan dengan cara menghitung rata-rata
dari data yang terletak pada cluster yang sama menggunakan rumus berikut:
vij 
1
Ni
Ni
x
k 0
kj
(2)
dimana:
i : indeks dari cluster
j : indeks dari variable
k : indeks dari data
vij : nilai centroid cluster ke-i untuk variabel ke-j
xkj : nilai data ke-k yang ada di dalam cluster tersebut untuk variabel ke-j
Ni : Jumlah data yang menjadi anggota cluster ke-i
Algoritma Clustering AHC
Pengelompokan hierarki aglomeratif merupakan metode pengelompokan hierarki
dengan pendekatan bawah atas (bottom up). Proses pngelompokan dimulai dari masingmasing data sebagai satu buah kelompok, kemudian secara rekursif mencari kelompok
terdekat sebagai pasangan untuk bergabung sebagai satu kelompok yang besar.Proses tersebut
diulang terus sehingga tampak bergerak ke atas membentuk jenjang (hierarki). Cara ini
membutuhkan parameter kedekatan kelompok (cluster proximity). (Prasetyo, 2012)
Single Linked (Jarak Terdekat)
Pada metode single linked (jarak terdekat), kedekatan di antara dua kelompok
ditentukan dari jarak terdekat (terkecil) diantara pasangan diantara dua data dari dua
kelompok yang berbeda (satu dakelompok dari kelompok pertama dan satu lagi dari
kelompok yang lain, atau disebut juga kemiripan termaksimal. Formulasi tautan tunggalnya
adalah (Prasetyo, 2012):
(3)
DUV = min{dUV } , dUV ∈ D
4.
METODOLOGI
1.1 Subjek Penelitian
Subjek penelitian
yang akan dibahas adalah data mining untuk
mengelompokkan jumlah penumpang Trans Jogja dalam satu hari
1.2 Metode Pengumpulan Data
1.2.1 Studi Pustaka
Merupakan pengumpulan data yang dilakukan dengan mencari, membaca
dan mengumpulkan dokumen-dokumen sebagai referensi seperti buku,
artikel dan literature-literatul yang berhubungan dengan data mining
menggunakan metode clustering k-means,serta browsing di internet.
1041
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
1.2.2
5.
Observasi
Metode observasi ini digunakan untuk mempelajari dan mengetahui secara
langsung objek yang diteliti. Objek yang diteliti itu adalah jumlah
penumpang Trans Jogja pada shelter musper untuk tiga jalur bus.
HASIL DAN PEMBAHASAN
Penggunaan Agoritma K-Means
Dari hasil pengolahan menggunakan metode K-Means dapat diperoleh hasil bahwa
jumlah cluster 0 adalah 15 data, cluster 1 adalah 44 data, dan cluster 2 adalah 54 data.
Dengan nilai titik pusat terdapat pada Gambar 4.2
Gambar 4.2 Titik Pusat Cluster K-Means
Dan untuk data yang termasuk dalam cluster 0 ditampilkan dalam Tabel 4.3, cluster 1
ditampilkan dalam Tabel 4.4 dan cluster 2 ditampilkan dalam Tabel 4.5. Dalam cluster 0
ini merupakan data dimana jumlah penumpang dikategorikan banyak, cluster 1 jumlah
penumpang sedang dan cluster 2 jumlah penumpang sedikit. Sebaran dari data terhadap
ketiga cluster menghasilkan jumlah data pada masing-masing cluster sebagai berikut:
cluster 0 = 15 data, cluster 1 = 44 data, dan cluster 2 = 54 data. Dari hasil clustering
terlihat bahwa densitas/kerapatan data pada masing-masing cluster terlihat seimbang , ini
memperlihatkan bahwa data memiliki similiritas yang baik.
1042
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
Tabel 4.3 Data pada cluster 0 metode K-Means
Id
bus
49
53
55
63
65
69
71
73
77
79
81
83
75
97
99
jam
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
Jalur
bus
3B
3B
1B
1A
2A
1A
2A
2B
2B
3A
2A
3A
3A
2A
3A
Halte/ shelter
Terminal Concat
Sarjito Barat
Santika
Malioboro 3
Malioboro 3
Janti 3
Termconcat
Termconcat
Papmi Selatan
MT Haryono
SD Pujokusuman
SD Pujokusuman
Papmi Selatan
Kehutanan
Kehutanan
jumlah
penumpang
74
21
46
53
33
21
37
39
32
22
55
39
34
44
36
Tabel 4.4 Data pada cluster metode 1 K-Means
Id
bus
58
59
60
61
62
64
66
67
68
70
72
74
75
76
78
80
82
86
88
89
90
91
92
Jam
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 13-14
jp 13-14
jp 15-17
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 15-17
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
Jalur
bus
3B
3B
3B
3B
1A
2A
3A
3A
1A
2A
2B
3A
3A
2B
3A
2A
3A
3A
3A
3A
3A
3A
1A
Halte/ shelter
Papmi Utara
Papmi Utara
Tejokusuman
Tejokusuman
Malioboro 3
Malioboro 3
Malioboro 3
Malioboro 3
Janti 2
Termconcat
Termconcat
Papmi Selatan
Papmi Selatan
Papmi Selatan
MT Haryono
SD Pujokusuman
SD Pujokusuman
Tegal turi Utara
wirosaban utara
wirosaban utara
MBS Utara
MBS Utara
JEC 1
jumlah
penumpang
11
11
9
13
11
6
19
14
19
13
16
22
34
8
6
10
6
2
3
12
5
8
12
Id
bus
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
Jam
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
Jalur
bus
1A
1A
3A
3A
2A
2A
3A
3A
3A
3A
3A
3A
3A
3A
3A
3A
2A
2A
3A
3A
3A
3A
Halte/ shelter
JEC 1
JEC 1
JEC 1
JEC 1
Kehutanan
Kehutanan
Kehutanan
Kehutanan
Janti Utara
Janti Utara
Disnaker
Disnaker
Instiper Selatan
Instiper Selatan
UPN
UPN
Manggung
Manggung
Manggung
Manggung
Sarjito Timur
Sarjito Timur
jumlah
penumpang
12
18
11
16
26
44
27
36
7
24
4
11
11
16
3
7
2
6
3
11
3
6
1043
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
Tabel 4.5 Data pada cluster 2 metode K-Means
Id
bus
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Jam
jp 6-8
jp 13-14
jp 15-17
jp 17-19
jp 6-9
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
Jalur
bus
1B
1B
1B
1B
2B
2B
2B
3B
3B
3B
3B
3B
3B
3B
3B
3A
3A
3B
3B
2B
2B
1A
1A
1B
1B
3B
3B
Halte/ shelter
Tamrin Senopati
Tamrin Senopati
Tamrin Senopati
Tamrin Senopati
Tamrin Senopati
Musper
Musper
Musper
Musper
Lowanu barat
Lowanu barat
Wirosaban selatan
Wirosaban selatan
SMA 7
SMA 8
Ngabean
Ngabean
Ngabean
Ngabean
Ngabean
Ngabean
Jayakarta
Jayakarta
Jayakarta
Jayakarta
Jayakarta
Jayakarta
jumlah
penumpang
7
0
0
0
17
15
20
8
33
1
6
5
2
3
25
8
12
6
18
1
6
6
9
5
0
0
4
Id
bus
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
50
51
52
54
56
57
Jam
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 13-14
jp 15-17
jp 13-14
jp 13-14
jp 13-14
jp 15-17
Jalur
bus
1B
1B
3B
3B
3B
3B
2B
2B
1B
1B
3B
3B
3B
3B
3B
3B
3B
3B
3B
3B
3B
2B
2B
3B
1B
3B
3B
Halte/ shelter
HarjoLukito
HarjoLukito
HarjoLukito
HarjoLukito
Banguntapan
Banguntapan
Banguntapan
Banguntapan
JEC Concat
JEC Concat
JEC Concat
JEC Concat
MBS Selatan
MBS Selatan
Instiper
Instiper
Stikers
Stikers
JIH
JIH
Terminal Concat
Kentungan
Kentungan
Sarjito Barat
Santika
Santika
Santika
jumlah
penumpang
2
9
0
3
9
11
6
12
0
3
1
3
0
2
5
9
3
7
0
0
17
3
12
8
6
2
10
Penggunaan Algoritma Clustering AHC
Dari hasil pengolahan menggunakan metode AHC dapat diperoleh hasil bahwa jumlah
cluster 0 adalah 32 data, cluster 1 adalah 57 data, dan cluster 2 adalah 54 data. Dan untuk data yang
termasuk dalam cluster 0 ditampilkan dalam Tabel 4.6, cluster 1 ditampilkan dalam Tabel 4.7 dan
cluster 2 ditampilkan dalam Tabel 4.8.
Sebaran dari data terhadap ketiga cluster menghasilkan jumlah data pada masing-masing
cluster sebagai berikut: cluster 0 = 2 data, cluster 1 = 57 data, dan cluster 2 = 54 data. Dari
hasil clustering terlihat bahwa densitas/kerapatan data pada masing-masing cluster terlihat seimbang
, ini memperlihatkan bahwa data memiliki similiritas yang kurang baik.
Tabel 4.6 Data pada cluster 0 metode AHC
Id
bus
1
5
Jam
jp 6-8
jp 6-9
Jalurbus
1B
2B
Halte/ shelter
Tamrin Senopati
Tamrin Senopati
Jumlah
penumpang
7
17
1044
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
Tabel 4.7 Data pada cluster 1 metode AHC
Id
bus
2
3
6
7
8
10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
52
54
56
Jam
jp 13-14
jp 15-17
jp 13-14
jp 15-17
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
Jalur
bus
1B
1B
2B
2B
3B
3B
3B
3B
3A
3B
2B
1A
1B
3B
1B
3B
3B
2B
1B
3B
3B
3B
3B
3B
3B
2B
3B
1B
3B
Halte/ shelter
Tamrin Senopati
Tamrin Senopati
Musper
Musper
Musper
Lowanu barat
Wirosaban sltan
SMA 7
Ngabean
Ngabean
Ngabean
Jayakarta
Jayakarta
Jayakarta
HarjoLukito
HarjoLukito
Banguntapan
Banguntapan
JEC Concat
JEC Concat
MBS Selatan
Instiper
Stikers
JIH
Terminal Concat
Kentungan
Sarjito Barat
Santika
Santika
Jumlah
penumpang
0
0
15
20
8
1
5
3
8
6
1
6
5
0
2
0
9
6
0
1
0
5
3
0
17
3
8
6
2
Id
bus
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
100
102
104
106
108
110
112
Jam
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
jp 13-14
Jalur
bus
3B
3B
1A
2A
3A
1A
2A
2B
3A
2B
3A
2A
3A
3A
3A
3A
3A
1A
3A
2A
3A
3A
3A
3A
3A
2A
3A
3A
Halte/ shelter
Papmi Utara
Tejokusuman
Malioboro 3
Malioboro 3
Malioboro 3
Janti 2
Termconcat
Termconcat
Papmi Selatan
Papmi Selatan
MT Haryono
SD Pujokusuman
SD Pujokusuman
Lowanu Timur
Tegal turi Utara
wirosaban utara
MBS Utara
JEC 1
JEC 1
Kehutanan
Kehutanan
Janti Utara
Disnaker
Instiper Selatan
UPN
Manggung
Manggung
Sarjito Timur
Jumlah
penumpang
11
9
11
6
19
19
13
16
22
8
6
10
6
0
2
3
5
12
11
26
27
7
4
11
3
2
3
3
Tabel 4.8 Data pada cluster 1 metode AHC
Id
bus
4
5
9
11
13
15
17
19
21
23
25
27
29
31
33
35
jam
jp 17-19
jp 6-9
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
Jalur
bus
1B
2B
3B
3B
3B
3B
3A
3B
2B
1A
1B
3B
1B
3B
3B
2B
Halte/ shelter
Tamrin Senopati
Tamrin Senopati
Musper
Lowanu barat
Wirosaban selatan
SMA 8
Ngabean
Ngabean
Ngabean
Jayakarta
Jayakarta
Jayakarta
HarjoLukito
HarjoLukito
Banguntapan
Banguntapan
jumlah
penumpang
0
17
33
6
2
25
12
18
6
9
0
4
9
3
11
12
Id
bus
59
61
63
65
67
69
71
73
75
77
79
81
83
85
87
89
jam
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
Jalur
bus
3B
3B
1A
2A
3A
1A
2A
2B
3A
2B
3A
2A
3A
3A
3A
3A
jumlah
Halte/ shelter
penumpang
Papmi Utara
11
Tejokusuman
13
Malioboro 3
53
Malioboro 3
33
Malioboro 3
14
Janti 3
21
Termconcat
37
Termconcat
39
Papmi Selatan
34
Papmi Selatan
32
MT Haryono
22
SD Pujokusuman 55
SD Pujokusuman 39
Lowanu Timur
0
Tegal turi Utara
0
wirosaban utara
12
1045
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
37
39
41
43
45
47
49
51
53
55
57
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
1B
3B
3B
3B
3B
3B
3B
2B
3B
1B
3B
JEC Concat
JEC Concat
MBS Selatan
Instiper
Stikers
JIH
Terminal Concat
Kentungan
Sarjito Barat
Santika
Santika
3
3
2
9
7
0
74
12
21
46
10
91
93
95
97
99
101
103
105
107
109
111
113
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
jp 15-17
3A
1A
3A
2A
3A
3A
3A
3A
3A
2A
3A
3A
MBS Utara
JEC 1
JEC 1
Kehutanan
Kehutanan
Janti Utara
Disnaker
Instiper Selatan
UPN
Manggung
Manggung
Sarjito Timur
8
18
16
44
36
24
11
16
7
6
11
6
Dari hasil pengelompokkan menggunakan metode clustering K-Means dan clustering AHC
maka dalam penelitian ini terlihat hasil dari pengelompokkan clustering K-Means memiliki
kemiripan yang lebih seimbang untuk setiap kelompokknya dibandingkan dengan hasil dari
pengelompokkan clustering AHC. Sehingga dapat disimpulkan meskipun pada proses clustering KMeans harus menentukan centroid atau titik
terlebih dahulu namun dalam kasus ini dapat
menghasilkan data pengelompokkan yang labih baik. Sedangkan untuk hasil pengelompokkan
menggunakan metode AHC meskipun lebih efisien karena tidak menggunakan titik pusat pada awal
pengelompokkan dan hanya menghitung tingkat kemiripan memiliki hasil yang kurang baik.
6. KESIMPULAN DAN SARAN
Setelah melakukan data mining dengan algoritma clustering K-Means dan clustering AHC pada
jumlah penumpang bus Trans Jogja, maka dapat ditarik kesimpulan sebagai berikut :
1. Hasil dari data mining yang dapat digunakan untuk menampilkan informasi pengelompokkan
jumlah penumpang berdasarkan jam, halte/shelter dan jalur bus.
2. Hasil dari proses clustering K-Means ini didapatkan 3 cluster dengan jumlah data untuk cluster 0
ada 15 data, cluster 1 ada 44 data dan cluster 2 ada 54 data.
3. Hasil dari proses clustering K-Means ini didapatkan 3 cluster dengan jumlah data untuk cluster 0
ada 2 data, cluster 1 ada 57 data dan cluster 2 ada 54 data.
4. Dalaam penelitian ini dihasilkan metode K-Means memiliki hasil yang lebih baik dari pada
metode AHC.
1046
JURNAL INFORMATIKA Vol. 9, No. 1, Jan 2015
Aplikasi data miningyang dihasilkan pada penelitian ini masih perlu dikembangkan lebih
lanjut dalam hal data yang ditampilkan tidak hanya berupa data namun juga dapat digambarkan
dalam bentuk grafik dan dendograf yang lebih jelas.
DAFTAR PUSTAKA
Berkhin, Pavel. Survey on clustering data mining techniques,
http://www.ee.ucr.edu/~barth/EE242/clustering_survey.pdf di akses pada Desember 2013
Irdiansyah 2007, “Penerapan Data Mining Pada Penjualan Minuman di PT.Pepsi Cola
Indobeverages Menggunakan Metode Clustering”
Pralita, F. 2010 ,“Penerapan Jaringan Syaraf tiruan Untuk Memprediksi Jumlah Penumpang Bus
Dengan Metode BackPropagation”, Skripsi, Fakultas MIPA, Universitas Islam Indonesia.
Prasetyo, Eko. 2012, “Data Mining Konsep dan Aplikasi Menggunakan Matlbab”, Andi offset,
Yogyakarta.
Santosa, Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, Graha Ilmu,
Yogyakarta.
Tan, Pang‐Ning,; Steinbach,Michael; Kumar ,Vipin, 2006 Data Mining Cluster Analysis : Basic
Concepts and Algorithms. http://www-users.cs.umn.edu/~kumar/dmbook/index.php di akses
pada Desember 2013
Tang, ZhaoHui; MacLennan, Jamie. 2005. Data Mining with SQL Server 2005. Indiana Polis : Wiley
Publishing
Zahrotun, L, Perancangan Data Mining Pengelompokan Jumlah Penumpang Trans Jogja
menggunakan metode clustering K-Means, Seminar Teknik Informatika, Universitas Ahmad
Dahlan. 2013, Yogyakarta. 134-142
http://transjogja.com/gunakan-trans-jogja/, tanggal akses 12 Desember 2013
1047