Download 3-STATISTIK DISKRIPTIF.

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
STATISTIK DISKRIPTIF
Seorang manajer bank ingin mengetahui nasabah dar banknya berkisar umur berapa, ketika
mengambil atau menabung berapa jumlah uang yang ditarik atau ditabung?
3.1 Ukuran Pemusatan Untuk Data Tidak Berkelompok.
Salah satu ukuran untuk menggambarkan sekelompok data adalah ukuran pemusatan (central of
tendency).
Ukuran pemusatan (central of tendency) memberikan informasi mengenai pusat atau nilai
tengah dari sekelompok angka.
Contoh.
Data Tidak Berkelompok: Umur Pembeli HP
28
23
27
30
24
35
29
21
25
18
21
31
19
22
44
17
24
29
42
31
24
41
34
24
27
32
28
25
25
35
25
17
24
29
22
Data Tidak Berkelompok: Umur Pembeli HP
28
23
27
30
24
35
29
21
25
18
21
31
19
22
44
17
24
29
42
31
24
41
34
24
27
32
28
25
25
35
25
17
24
29
22
Ukuran pemusatan dapat menyediakan informasi umur rata-rata manajer UKM; umur manajer
UKM yang terletak ditengah atau umur yang paling sering muncul.
Ukuran pemusatan untuk data tidak berkelompok:
a) The Mode (Modus)
b) The Median (Nilai tengah)
c) The Mean (Rata-rata)
The mode.
The mode adalah nilai yang sering muncul dalam sejumlah data tertentu.
Cara mengetahui the mode:
 Mengurutkan data
 Steam and Leaf
Data Tidak Berkelompok: Umur Pembeli HP
28
23
27
30
24
35
29
21
25
18
21
31
19
22
44
17
24
29
42
31
24
41
34
24
27
32
28
25
25
35
25
17
24
29
22
 Mengurutkan data
28 23 27 30 24 35 29 21 25 18 32 28 25 25 35 25 17 24 29 22 24 41 34
24 27 21 31 19 22 44 17 24 29 42 31
Setelah diurutkan menjadi:
17 17 18 19 21 21 22 22 23 24 24 24 24 24 25 25 25 25 27 27 28 28
29 29 29 30 31 31 32 34 35 35 41 42 44
17 17
18
19
21 21
22 22
23
24 24 24 24 24
25 25 25 25
27 27
28 28
29 29 29
30
31 31
32 34
35 35
41 42
44
Jumlah angka paling banyak adalah = 24 tahun
Umur Manajer UKM
86
77
91
60
55
76
92
47
88
67
23
59
72
75
83
77
68
82
97
89
81
75
74
39
67
79
83
70
78
91
68
49
56
94
81
 Steam and Leaf
Steam
Leaf
2
3
3
9
4
7
9
5
5
6
9
6
0
7
7
8
8
7
0
2
4
5
5
6
7
7
8
1
1
2
3
3
6
8
9
9
1
1
2
4
7
8
9
LATIHAN: Data Tidak Berkelompok: Umur Manajer Perusahaan
42
26
32
34
57
30
58
37
50
30
53
40
30
47
49
50
40
32
31
40
52
28
23
35
25
30
36
58
26
50
55
30
43
64
52
49
33
43
46
32
61
31
30
40
60
74
37
29
43
54
Data Tidak Berkelompok: Umur Pembeli HP
28
23
27
30
24
35
29
21
25
18
21
31
19
22
44
17
24
29
42
31
24
41
34
24
27
32
28
25
25
35
25
17
24
29
22
The Median.
The median adalah nilai tengah dari sejumlah angka yang telah diurutkan.
 Jika jumlah angka dari sejumlah angka tersebut adalah ganjil, maka mediannya adalah angka
yang dtengah
 Jika jumlah angka dari sejumlah angka tersebut adalah genap, maka mediannya adalah dua
angka yang dtengah dibagi 2
Contoh:
 Angka berjumlah ganjil
28 23 27 30 24 35 29 21 25 18 35 29 21 25 18. Urutkan menjadi:
18 18 21 21 23 24 25 25 27 28 29 29 30 35 35. Nilai median =25
Angka berjumlah genap
28 23 27 30 24 35 29 21 27 18 35 29 21 25 18 12. urutkan menjadi
12 18 18 21 21 23 24 25 27 27 28 29 29 30 35 35. Nilai median = (25+27)/2 = 26
The Mean.
a) The arithmetic mean (average) (μ) untuk populasi dan ( ) untuk sampel adalah
penjumlahan seluruh angka dibagi dengan jumlah angka.
o Populaton mean = μ =
o Sampel mean = 𝐗 =
𝐍
𝐢=𝟏 𝐗 𝐢
𝐍
𝐢=𝟏 𝐗 𝐢
𝐧
𝐍
Contoh.
Ada 5 kecelakaan pada hari rabu di beberapa kota. Korbannya 24,13,19,26, dan 11 pasien.
The population mean = (24 + 13 + 19 + 26 + 11)/5 = 18,6
Ada angka 57,86,42,38,90 dan 66, maka jika angka ini merupakan sampel, maka sample mean=
Sample mean = (57+86+42+38+90+66)/6 = 63,167
3.2 Penghitungan The Mean untuk Data Berkelompok.
Kelompok data tidak memberikan informasi mengenai nilai individu.
The mean untuk data berkelompok =
o μdata berkelompok =
Contoh.
𝐟𝐌
Umur
Frekuensi
𝐟
10-15
6
15-20
22
20-25
35
25-30
29
30-35
16
35-40
8
40-45
4
45-50
2
Umur
Frekuensi
Nilai Tengah
fM
10-15
6
12,5
15-20
22
17,5
20-25
35
22,5
25-30
29
27,5
30-35
16
32,5
35-40
8
37,5
40-45
4
42,5
45-50
2
47,5
75
385
787.5
797.5
520
300
170
95
3,130
122
o μdata berkelompok =
= 3,130/122 = 25,66
𝐟𝐌
𝐟
b) The Weighted mean (μ)
μ=
μ=
𝐰𝟏 𝐗 𝟏+𝐰𝟐𝐱𝟐+𝐖𝟑𝐗𝟑+⋯+𝐖𝐍𝐗𝐍
𝐰𝟏 +𝐰𝟐 +𝐰𝟑 +⋯+𝐰𝐍
𝒘𝒊 𝑿𝒊
𝒘𝒊
Contoh.
Sorang mahasiswa memperoleh nilai dar 3 matakuliah yang memiliki bobot 3 sks, 2sks,dan 3
sksk dengan nilai A, B, B. Nilai rata-rata mahasiswa tersebut:
μ=
𝟑∗𝟒+𝟐∗𝟑+𝟑∗𝟑
𝟑+𝟐+𝟑
= 3,375
c) The Geometric mean (μ)
Geometric mean menghitung rata-rata dengan memperhatikan tingkat pertumbuhan
kumulatif dari waktu ke waktu
RG = [(1+R1) (1+R1) … (1+R1)]0.5 -1
Contoh.
Periode
0
1
2
Harga Saham
500
600
550
R1= (600-500)/500 = 0,2
R1= (550-600)/600 = -0,083
Arithmetic mean = (0,2-0,083)/2 = 0,05833
RG = [(1+0,2)(1-0,083)]0.5-1 = 0,04883
3.3 Ukuran Variabilitas Untuk Data Tidak Berkelompok.
Ukuran pemusatan menggambarkan pusat atau dari sejumlah data atau porsi inti (data terpusat)
dari sekelompok data.
Peneliiti menggunakan ukuran lain yakni variabilitas yang menggambarkan sebaran/dispersi dari
sejumlah data.
Contoh.
Suatu perusahaan memliki 25 orang tenaga pemasaran dan nilai penjualannya terletak pada
median $1,200,000. apakah tenaga pemasaran dapat dkatakan berhasil sebagai tim pemasaran
atau tidak?. Jika tenaga pemasaran yang lain ada yang menjual $ 5,000,000 dan yang lain $
150,0000,apakah dianggap berhasil?
Variabilitas untuk data:
a) Tidak Berkelompok diukur dengan range, mean absolute deviation, variance, dan standard
deviation
b) Berkelompok diukur dengan variance dan standard deviation
Range (jangkauan).
Range adalah selisih antara nilai terbesar dengan terkecil dari suatu jumlah data tertentu.
Contoh.
Jangkauan = 3.240.000 – 540.000 = 2.700.000
Harga Tanah/meter
Kota
2012
A
Rp 540.000
B
600.000
C
750.000
D
1.300.000
E
1.400.000
F
2.200.000
G
2.800.000
H
3.240.000
Mean Absolute Deviation (MAD).
MAD adalah rata-rata nilai deviasi/penyimpangan absolut dari the mean.
MAD =
ǀ𝐗−𝛍ǀ
𝐍
Contoh.
Umur
Manajer
(Xi)
Mean
5
9
16
μ = 65/5
= 13
Deviation
from the
mean (Xi –
μ)
ǀX-μǀ
-8
8
-4
4
3
3
17
4
4
18
5
5
∑Xi = 65
∑(X – μ)=0
∑ǀX-μǀ=24
MAD = 24/5 = 4.8
3
μ
-4
-8
4
5
Series1
Variance dan Standard Deviation.
Populasi.
Variance adalah rata-rata nilai deviasi/penyimpangan dari the arithmetic mean yang
dikuadratkan. Standard Deviation adalah akar dati variance.
σ2=
σ=
𝐗−𝛍
𝐍
√
𝟐
𝐗−𝛍
𝐍
𝟐
Contoh.
Umur Manajer (Xi)
Mean
Deviation from the mean
(Xi – μ)
(Xi-μ)2
-8
64
-4
16
16
3
9
17
4
16
18
5
25
∑Xi = 65
∑(X – μ)=0
∑(Xi-μ)2
=130
5
9
μ = 65/5 = 13
Variance = 130/5 = 26
Standard Deviation = √ 26 = 5.1
Sample.
Sample varance (S2) dan sample SD (S). Penggunaan sample variance dan standard
deviation merupkan estimasi dari population variance dan standard deviation.
Perbedaan population dan sample varance dan standard deviation terletak pada simbol variance
dan standard deviation dan pembaginya. Untuk populasi, pembaginya adalah n dan untuk
sample, pembaginya adalah n-1. Pembagi n-1 untuk sample varance dan standard deviation
akan memberikan hasil estimasi bagi nilai populasi.
2
(𝑿− 𝑿)𝟐
Variance (S )=
Deviation Standard (S)=√s2
𝒏−𝟏
Contoh.
Dekan mengambil 8 orang mahasiswa sebagai sample untuk diukur tingkat IQ dengan hasil sbb:
Mahasiswa
IQ
(X - Ẋ )2
A
106
138,06
B
109
76,56
C
114
14,06
D
116
3,06
E
121
10,56
F
122
18,06
G
125
52,56
H
129
126,56
∑Xi =942
∑(X - Ẋ )2 = 439,48
𝟗𝟒𝟐
𝑿=
= 𝟏𝟏𝟕, 𝟕𝟓
𝟖
2
Variance (S )=
(𝑿− 𝑿)𝟐 𝟒𝟑𝟗,𝟒𝟖
𝒏−𝟏
=
𝟖−𝟏
= 𝟔𝟐, 𝟕𝟖
Deviation Standard (S)=√s2 = √62,78 = 7,92
Makna Standard Deviation.
Apa itu standard deviation? Apa yang standard deviation lakukan dan apa artinya?.
Ada 2 cara untuk mengaplkasikan SD: (a) Aturan empiris; dan (b) Teorema Chebyshev
(a) Aturan Empiris
Aturan ini menyatakan bahwa sebagian besar (hampir semua) nilai-nilai dari sejumlah data
berada pada batasan standard deviation dengan syarat sejumlah data tersebut berdistrbusi
normal.
Aturan empirisnya menggunakan 3 standard deviation: a). 1σ; b). 2σ; dan c). 3σ
Jarak dari Rata-Rata
Persentase Nilai yang berada dalam jarak
μ ± 1σ
68%
μ ± 2σ
95%
μ ± 3σ
99,7%
Contoh.
8
16
18
11
12
17
18
14
20
6
DATA UMUR ARTIS REMAJA
22
17
19
19
16
13
20
16
12
21
13
10
11
20
9
8
16
11
10
18
11
20
18
11
10
8
17
16
7
17
MEAN
SD
BB
BA
14.4
4.44
9.96
18.84
KURANG
LEBH 68%
DATA
BERADA
PADA
BATAS BB
DAN BA
b) Teorema Chebyshev
Teorema ini berlaku untuk semua distribusi tanpa melihat bentuk. Oleh karena dapat
dberlakukan ke semua distribusi, maka teorema ini lebh konservatif daripada aturan empiris.
Teorema inii menyatakan bahwa dalam k standard deviation dari mean, maka minimal
proporsi data adalah sebesar (1-1/k2)
TEOREMA CHEBYSHEV
Jumlah SD
Jarak dari RataRata
Minimum Proporsi Data dalam Jarak (1-1/k2)
k=2
μ ± 2σ
1-1/22 =75%
k=3
μ ± 3σ
1-1/32 =89%
k=4
μ ± 4σ
1-1/42 =94%
Oleh karena rumus tersebut digunakan untuk menghitung proporsi dalam teorema
chebyshev, maka setiap nilai k > 1 dapat digunakan.
Contoh.
jika k=2,5, maka minimal 84% nilai data-data terletak dalam μ ± 2.5σ
1-1/k2 = 1-1/2.52 = 0.84
Z Score.
Z Score adalah luas standard deviation dari nilai x datas atau dibawah Mean.
Z=
𝐱− 𝛍
95%
𝛔
2.5%
-2σ
+2σ
2.5%
Jika Z score negatif berarti data nilai x berada dibawah mean dan jika Z score positf berarti nilai x
berada diatas mean.
Contoh.
Mean = 50 dan standard deviation = 10, maka ahli statistik ingin menentukan Z score untuk nilai
70. Nilai X=70 adalah 20 unit diatas mean.
Z = (70-50)/10 = 2. Nilai 70 terletak pada 2σ diatas mean, maka 95% dari data nilai berada antara
30 sampai 70, tapi 5% data nilai berada diluar jangkauan tersebut (dibawah 30 dan atau datas
70)
2.5%
2.5%
-2σ
30
+2σ
50
70