Survey

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
```MAKALAH
STATISTIKA LANJUT
“Ekplorasi Data Sederhana Penjualan Video Game Di Berbagai Negara
Menggunakan Python”
Disusn Oleh:
Cagiva Chaedar Bey Lirna
20083010020
PRODI SAINS DATA
FAKULTAS ILMU KOMPUTER
UPN “VETERAN” JAWA TIMUR
Jl. Rungkut Madya No. 1 Gn.Anyar, Kec. Gn.Anyar, Kota Surabaya, Jawa Timur 60294
2021
1
i
DAFTAR ISI
DAFTAR ISI.............................................................................................................................. i
DAFTAR GAMBAR ................................................................................................................ii
BAB 1 PENDAHULUAN ........................................................................................................ 1
1.1.
Latar Belakang .......................................................................................................... 1
1.2.
Rumusan Masalah ..................................................................................................... 1
1.3.
Tujuan ........................................................................................................................ 1
BAB 2 LITERATUR REVIEW .............................................................................................. 2
2.1.
Mencari Dataset Untuk Dieksplorasi ...................................................................... 2
2.2.
Proses Eksplorasi Sederhana Menggunakan Python ............................................ 2
BAB 3 PENUTUP .................................................................................................................. 12
3.1.
Kesimpulan .............................................................................................................. 12
DAFTAR PUSTAKA ............................................................................................................. 13
i
ii
DAFTAR GAMBAR
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
Gambar
1 Dataset yang diperoleh .......................................................................................................... 2
2 Import Data ........................................................................................................................... 2
3 Periksa Missing Value........................................................................................................... 3
4 Missing Value Cleaning ........................................................................................................ 3
5 Mean...................................................................................................................................... 4
6 Weighted Mean ..................................................................................................................... 4
7 Trimmed Mean ...................................................................................................................... 5
9 Median .................................................................................................................................. 6
10 Modus.................................................................................................................................. 6
11 Varians ................................................................................................................................ 7
12 Standar Deviasi ................................................................................................................... 7
13 Kuantil................................................................................................................................. 8
14 IQR ...................................................................................................................................... 9
15 Plot NA_Sales ..................................................................................................................... 9
16 Plot EU_Sales ................................................................................................................... 10
17 Plot JP_Sales ..................................................................................................................... 10
18 Plot Other_Sales ................................................................................................................ 11
19 Plot Global_Sales ............................................................................................................... 11
ii
BAB 1 PENDAHULUAN
1.1. Latar Belakang
Eksplorasi data adalah pendekatan yang mirip dengan analisis data awal , di mana
seorang analis data menggunakan eksplorasi visual untuk memahami apa yang ada dalam
kumpulan data dan karakteristik datanya, daripada melalui sistem manajemen data
tradisional. Karakteristik tersebut dapat mencakup ukuran atau jumlah data, kelengkapan
data, kebenaran data, kemungkinan hubungan antar elemen data atau file / tabel dalam data.
Di masa pandemi saat ini, jumlah pemain game di seluruh penjuru dunia semakin
meningkat, entah itu game console, pc, ataupun android. Dengan adanya peningkatan
jumlah pemain game diseluruh dunia, angka penjualan berbagai jenis game yang ada juga
ikut meningkat. Oleh karena itu saat ini banyak sekali beredar berbagai jenis game baru
dengan harga jual yang juga beragam.
Dalam makalah ini akan dijelaskan mengenai berbagai cara eksplorasi data sederhana
pada dataset harga jual video game di berbagai negara. Field yang digunakan pada proses
eksplorasi ini adalah NA_Sales, EU_Sales, JP_Sales, Other_Sales, dan Global_Sales.
Kelima field tersebut dieksplorasi dengan tujuan untuk mengetahui hasil analisis yang
didapat setelah dieksplorasi.
1.2. Rumusan Masalah
Rumusan masalah dalam makalah ini adalah apa saja yang dilakukan dalam eksplorasi
data sederhana pada dataset penjualan video game di berbagai negara menggunakan
python.
1.3. Tujuan
Tujuan makalah ini dibuat yaitu sebagai media bagi pembaca untuk mengetahui apa saja
langkah yang dilalui dalam mengeksplorasi data dengan python.
1
BAB 2 LITERATUR REVIEW
2.1. Mencari Dataset Untuk Dieksplorasi
Langkah awal yang dilakukan untuk melakukan eksplorasi data sederhana dengan python yaitu
harus memiliki dataset terlebih dahulu. Pada proses ini penulis mendapatkan datasetnya dari
https://www.kaggle.com/, dataset yang diperoleh berisi data – data penjualan beragam jenis
video game di berbagai negara dengan file bernama vgsales.csv.
Gambar 1 Dataset yang diperoleh
2.2. Proses Eksplorasi Sederhana Menggunakan Python
1. Import data .csv ke dalam pemrograman python
Gambar 2 Import Data
2
2. Memeriksa missing value yang ada pada data .csv yang sudah di import
Gambar 3 Periksa Missing Value
3. Membersihkan data .csv dari missing value dengan tujuan untuk mengetahui nilai dari
proses eksplorasi data.
Gambar 4 Missing Value Cleaning
3
4. Selanjutnya menghitung rata – rata penjualan seluruh game pada field NA_Sales,
EU_Sales, JP_Sales, Other_Sales, Global_Sales.
Gambar 5 Mean
5. Menghitung weighted mean pada variable NA_Sales sampai Global_Sales.
Gambar 6 Weighted Mean
4
6. Menghitung trimmed mean pada setiap field data dengan nilai ekstrem sebesar 10%
Gambar 7 Trimmed Mean
7. Menghitung Mean Absolute Deviation pada setiap field data
5
8. Menghitung Median pada setiap field data
Gambar 9 Median
9. Menghitung Modus pada setiap field data
Gambar 10 Modus
6
10. Menghitung Varians pada setiap field data
Gambar 11 Varians
11. Menghitung Standar Deviasi pada setiap field data
Gambar 12 Standar Deviasi
7
12. Menghitung kuantil dengan presentase tertentu
Gambar 13 Kuantil
8
13. Menghitung IQR pada setiap field data
Gambar 14 IQR
14. Menampilkan plot masing – masing data dengan visualisasi boxplot
Gambar 15 Plot NA_Sales
9
Gambar 16 Plot EU_Sales
Gambar 17 Plot JP_Sales
10
Gambar 18 Plot Other_Sales
Gambar 19 Plot Global_Sales
11
BAB 3 PENUTUP
3.1. Kesimpulan
Eksplorasi data merupakan salah satu upaya untuk menggali dan mendapatkan informasi
lebih dari pengelolaan suatu data. Eksplorasi data dapat menggunakan berbagai cara, salah
satunya yaitu menggunakan python. Pada bahasa pemrograman python terdapat library yang
dapat membantu dalam melakukan ekplorasi data contohnya adalah library pandas dan numpy.
Data vgsales.csv sangatlah kompleks. Oleh karena itu kita perlu melakukan eksplorasi data
sederhana untuk bisa mengambil kesimpulan dari data penjualan video games tersebut. Setelah
dilakukan eksplorasi secara sederhana berdasarkan konsep statistika dengan dibantu
pemrogaman python kita dapat memperoleh nilai rata-rata hingga IQR pada masing - masing
field.
12
DAFTAR PUSTAKA
Bruce, P. &. (2017). Practical Statistics for Data Scientists. (C. S., Ed.) 26 - 38. Retrieved May
31, 2021
Certes.
(2002, Mei 31). WIKIPEDIA. Diambil kembali dari WIKIPEDIA:
n&hl=id&sl=en&tl=id&client=srp&prev=search
Smith,
G.
(2021,
05
31).
kaggle.
https://www.kaggle.com/gregorut/videogamesales
Retrieved
from
kaggle:
13
```
Related documents