Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
MAKALAH STATISTIKA LANJUT “Ekplorasi Data Sederhana Penjualan Video Game Di Berbagai Negara Menggunakan Python” Disusn Oleh: Cagiva Chaedar Bey Lirna 20083010020 PRODI SAINS DATA FAKULTAS ILMU KOMPUTER UPN “VETERAN” JAWA TIMUR Jl. Rungkut Madya No. 1 Gn.Anyar, Kec. Gn.Anyar, Kota Surabaya, Jawa Timur 60294 2021 1 i DAFTAR ISI DAFTAR ISI.............................................................................................................................. i DAFTAR GAMBAR ................................................................................................................ii BAB 1 PENDAHULUAN ........................................................................................................ 1 1.1. Latar Belakang .......................................................................................................... 1 1.2. Rumusan Masalah ..................................................................................................... 1 1.3. Tujuan ........................................................................................................................ 1 BAB 2 LITERATUR REVIEW .............................................................................................. 2 2.1. Mencari Dataset Untuk Dieksplorasi ...................................................................... 2 2.2. Proses Eksplorasi Sederhana Menggunakan Python ............................................ 2 BAB 3 PENUTUP .................................................................................................................. 12 3.1. Kesimpulan .............................................................................................................. 12 DAFTAR PUSTAKA ............................................................................................................. 13 i ii DAFTAR GAMBAR Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar Gambar 1 Dataset yang diperoleh .......................................................................................................... 2 2 Import Data ........................................................................................................................... 2 3 Periksa Missing Value........................................................................................................... 3 4 Missing Value Cleaning ........................................................................................................ 3 5 Mean...................................................................................................................................... 4 6 Weighted Mean ..................................................................................................................... 4 7 Trimmed Mean ...................................................................................................................... 5 8 MAD ..................................................................................................................................... 5 9 Median .................................................................................................................................. 6 10 Modus.................................................................................................................................. 6 11 Varians ................................................................................................................................ 7 12 Standar Deviasi ................................................................................................................... 7 13 Kuantil................................................................................................................................. 8 14 IQR ...................................................................................................................................... 9 15 Plot NA_Sales ..................................................................................................................... 9 16 Plot EU_Sales ................................................................................................................... 10 17 Plot JP_Sales ..................................................................................................................... 10 18 Plot Other_Sales ................................................................................................................ 11 19 Plot Global_Sales ............................................................................................................... 11 ii BAB 1 PENDAHULUAN 1.1. Latar Belakang Eksplorasi data adalah pendekatan yang mirip dengan analisis data awal , di mana seorang analis data menggunakan eksplorasi visual untuk memahami apa yang ada dalam kumpulan data dan karakteristik datanya, daripada melalui sistem manajemen data tradisional. Karakteristik tersebut dapat mencakup ukuran atau jumlah data, kelengkapan data, kebenaran data, kemungkinan hubungan antar elemen data atau file / tabel dalam data. Di masa pandemi saat ini, jumlah pemain game di seluruh penjuru dunia semakin meningkat, entah itu game console, pc, ataupun android. Dengan adanya peningkatan jumlah pemain game diseluruh dunia, angka penjualan berbagai jenis game yang ada juga ikut meningkat. Oleh karena itu saat ini banyak sekali beredar berbagai jenis game baru dengan harga jual yang juga beragam. Dalam makalah ini akan dijelaskan mengenai berbagai cara eksplorasi data sederhana pada dataset harga jual video game di berbagai negara. Field yang digunakan pada proses eksplorasi ini adalah NA_Sales, EU_Sales, JP_Sales, Other_Sales, dan Global_Sales. Kelima field tersebut dieksplorasi dengan tujuan untuk mengetahui hasil analisis yang didapat setelah dieksplorasi. 1.2. Rumusan Masalah Rumusan masalah dalam makalah ini adalah apa saja yang dilakukan dalam eksplorasi data sederhana pada dataset penjualan video game di berbagai negara menggunakan python. 1.3. Tujuan Tujuan makalah ini dibuat yaitu sebagai media bagi pembaca untuk mengetahui apa saja langkah yang dilalui dalam mengeksplorasi data dengan python. 1 BAB 2 LITERATUR REVIEW 2.1. Mencari Dataset Untuk Dieksplorasi Langkah awal yang dilakukan untuk melakukan eksplorasi data sederhana dengan python yaitu harus memiliki dataset terlebih dahulu. Pada proses ini penulis mendapatkan datasetnya dari https://www.kaggle.com/, dataset yang diperoleh berisi data – data penjualan beragam jenis video game di berbagai negara dengan file bernama vgsales.csv. Gambar 1 Dataset yang diperoleh 2.2. Proses Eksplorasi Sederhana Menggunakan Python 1. Import data .csv ke dalam pemrograman python Gambar 2 Import Data 2 2. Memeriksa missing value yang ada pada data .csv yang sudah di import Gambar 3 Periksa Missing Value 3. Membersihkan data .csv dari missing value dengan tujuan untuk mengetahui nilai dari proses eksplorasi data. Gambar 4 Missing Value Cleaning 3 4. Selanjutnya menghitung rata – rata penjualan seluruh game pada field NA_Sales, EU_Sales, JP_Sales, Other_Sales, Global_Sales. Gambar 5 Mean 5. Menghitung weighted mean pada variable NA_Sales sampai Global_Sales. Gambar 6 Weighted Mean 4 6. Menghitung trimmed mean pada setiap field data dengan nilai ekstrem sebesar 10% pada data terendah dan tertinggi. Gambar 7 Trimmed Mean 7. Menghitung Mean Absolute Deviation pada setiap field data Gambar 8 MAD 5 8. Menghitung Median pada setiap field data Gambar 9 Median 9. Menghitung Modus pada setiap field data Gambar 10 Modus 6 10. Menghitung Varians pada setiap field data Gambar 11 Varians 11. Menghitung Standar Deviasi pada setiap field data Gambar 12 Standar Deviasi 7 12. Menghitung kuantil dengan presentase tertentu Gambar 13 Kuantil 8 13. Menghitung IQR pada setiap field data Gambar 14 IQR 14. Menampilkan plot masing – masing data dengan visualisasi boxplot Gambar 15 Plot NA_Sales 9 Gambar 16 Plot EU_Sales Gambar 17 Plot JP_Sales 10 Gambar 18 Plot Other_Sales Gambar 19 Plot Global_Sales 11 BAB 3 PENUTUP 3.1. Kesimpulan Eksplorasi data merupakan salah satu upaya untuk menggali dan mendapatkan informasi lebih dari pengelolaan suatu data. Eksplorasi data dapat menggunakan berbagai cara, salah satunya yaitu menggunakan python. Pada bahasa pemrograman python terdapat library yang dapat membantu dalam melakukan ekplorasi data contohnya adalah library pandas dan numpy. Data vgsales.csv sangatlah kompleks. Oleh karena itu kita perlu melakukan eksplorasi data sederhana untuk bisa mengambil kesimpulan dari data penjualan video games tersebut. Setelah dilakukan eksplorasi secara sederhana berdasarkan konsep statistika dengan dibantu pemrogaman python kita dapat memperoleh nilai rata-rata hingga IQR pada masing - masing field. 12 DAFTAR PUSTAKA Bruce, P. &. (2017). Practical Statistics for Data Scientists. (C. S., Ed.) 26 - 38. Retrieved May 31, 2021 Certes. (2002, Mei 31). WIKIPEDIA. Diambil kembali dari WIKIPEDIA: https://translate.google.com/translate?u=https://en.wikipedia.org/wiki/Data_exploratio n&hl=id&sl=en&tl=id&client=srp&prev=search Smith, G. (2021, 05 31). kaggle. https://www.kaggle.com/gregorut/videogamesales Retrieved from kaggle: 13