Download 2015-01-12 exam and solutions

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
Kurskod: TAMS11
Provkod: TENB
12 January 2015, 08:00-12:00
Examiner: Xiangfeng Yang (Tel: 070 2234765). Please answer in ENGLISH if you can.
a. You are allowed to use:
• a calculator;
• formel -och tabellsamling i matematisk statistik (from MAI);
• TAMS 11: Notations and Formulae (by Xiangfeng Yang),
• a dictionary.
b. Scores rating: 8-11 points giving rate 3; 11.5-14.5 points giving rate 4; 15-18 points giving rate 5.
English Version
1
(3 points)
Two random variables X and Y have a joint probability mass function as follows
X\Y
100
250
0
0.20
0.05
100
0.10
0.15
200
0.20
0.30
The table tells that X can take values 100 and 250, and Y can take values 0, 100 and 200.
(1.1). (1p) Find P (X = 250) and P (Y = 200).
(1.2). (1p) Find the expected value µ = E(Y ) of the random variable Y.
(1.3). (1p) Are X and Y independent? Why?
Solution. (1.1). P (X = 250) = 0.05 + 0.15 + 0.3 = 0.5, and P (Y = 200) = 0.2 + 0.3 = 0.5.
(1.2). The expected value µ = E(Y ) = 0 × 0.25 + 100 × 0.25 + 200 × 0.5 = 125.
(1.3). Form (1.1) we know that P (X = 250) = 0.5 and P (Y = 200) = 0.5, thus
0.3 = P (X = 250, Y = 200) 6= P (X = 250) · P (Y = 200) = 0.25.
Therefore, X and Y are NOT independent.
2
(3 points)
Suppose that the mass X of a certain particle has a probability density function
f (x) =
x − 10
,
c
10 ≤ x ≤ 70.
(2.1). (1p) Find the value of the constant c = ?
(2.2). (1p) Find the expected value µ = E(X) of X.
(2.3). (1p) Find the conditional probability P (X > 30 | X < 50).
Solution. (2.1). From the definition of a probability density function we know that
Z
∞
1=
Z
70
f (x)dx =
−∞
10
1
x − 10
dx = · 1800,
c
c
thus c = 1800.
(2.2).
Z
∞
µ = E(X) =
Z
70
xf (x)dx =
−∞
10
Page 1/3
x2 − 10x
90000
dx =
= 50.dx
1800
1800
(2.3).
R 50
P (30 < X < 50)
P (X > 30 | X < 50) =
= R30
50
P (X < 50)
x−10
1800 dx
x−10
dx
10 1800
3
=
600/1800
= 3/4 = 0.75.
800/1800
(3 points)
There are 40 students in an elementary statistics class. On the basis of years of experience, the instructor knows that
the time needed to grade a randomly chosen first examination paper is a random variable with an expected value of 6
min and a standard deviation of 6 min. If grading times are independent and the instructor begins grading at 6:50 P.M.
and grades continuously, what is the probability that he is through grading before the 11:00 P.M. TV news begins?
(Hint: apply Central Limit Theorem).
Solution. Let Xj = grading time for the j-th examination, j = 1, . . . , 40. From the conditions we know that X1 , . . . , X40
are independent and all have a mean µ = E(Xj ) = 6 and a standard deviation σ = 6. We find the probability as follows
P (he is through grading before the 11:00 P.M) = P (X1 + . . . + X40 ≤ 250 minutes)
250
X1 + . . . + X40
≤
) = P (X̄ ≤ 25/4)
= P(
40
40
X̄ − 6
25/4 − 6
√
= P( √ ≤
)
6/ 40
6/ 40
= P (N (0, 1) ≤ 0.26) = 0.6026.
4
(3 points)
Suppose that a population X is a continuous random variable having a probability density function
f (x) =
1
,
θ+1
0 ≤ x ≤ θ + 1,
with an unknown parameter θ > 0. There is a sample {x1 , . . . , xn } from this population.
(4.1). (1p) Find a point estimate θ̂M M of θ using Method of Moments.
(4.2). (2p) Find a point estimate θ̂M L of θ using Maximum-Likelihood method.
Solution. (4.1). For Method of Moments, the first equation is E(X) = x̄. The mean E(X) can be calculated as
Z ∞
Z θ+1
1
x
xf (x) =
dx = (θ + 1).
E(X) =
θ
+
1
2
−∞
0
By solving E(X) = x̄, we have θ = 2x̄ − 1 which yields θ̂M M = 2x̄ − 1.
(4.2). For the Maximum-Likelihood method, we write the likelihood function as
L(θ) = f (x1 ) · f (x2 ) . . . f (xn ) =
1
,
(θ + 1)n
for x1 ≤ θ + 1, . . . , xn ≤ θ + 1.
Maximizing L(θ) is equivalent to maximize ln L(θ) where
ln L(θ) = −n ln(θ + 1).
By looking at the first derivative d lndθL(θ) = −n/(θ + 1) < 0, the function ln L(θ) is decreasing. This means that the least
value of θ will give a maximal value of the function ln L(θ). But what is the lease value of θ? In L(θ) we had
x1 ≤ θ + 1, . . . , xn ≤ θ + 1, thus
θ ≥ max {x1 − 1, . . . , xn − 1}.
Therefore
θ̂M L = max {x1 − 1, . . . , xn − 1}.
(no need to check the second derivative of ln L(θ).)
Page 2/3
5
(3 points)
16 measurements of the same item have resulted in the following values:
5.14, 3.76, 5.09, 5.87,
6.33, 4.03, 6.25, 5.57,
3.28, 5.12, 5.66, 5.10,
4.63, 5.74, 4.20, 4.69.
The average of the data is x̄ = 5.03, and the standard deviation of the data is s = 0.885. Assume that the observations
are independent and from a population N (µ, σ 2 ).
(5.1). (1p) If σ is unknown, find a 95% confidence interval of µ.
(5.2). (1p) If σ = 1 is known, find a 95% confidence interval of µ.
(5.3). (1p) If σ is unknown, find a 95% confidence interval of σ.
Solution. (5.1). Since σ is unknown, a 95% confidence interval of µ would be
s
0.885
= 5.03 ∓ 2.13 · 0.22125 = 5.03 ∓ 0.47 = (4.56,
Iµ = x̄ ∓ tα/2 (n − 1) · √ = 5.03 ∓ t0.025 (16 − 1) · √
n
16
5.5).
(5.2). Since σ is known σ = 1,, a 95% confidence interval of µ would be
σ
1
1
Iµ = x̄ ∓ zα/2 · √ = 5.03 ∓ z0.025 · √ = 5.03 ∓ 1.96 · √ = 5.03 ∓ 0.49 = (4.54,
n
16
16
5.52).
(5.3). A 95% confidence interval of σ 2 would be
! (n − 1)s2
(16 − 1)0.8852 (16 − 1)0.8852
11.75 11.75
(n − 1)s2
,
=
,
=
,
= (0.428,
Iσ2 =
χ2α/2 (n − 1) χ21−α/2 (n − 1)
χ20.025 (16 − 1) χ20.975 (16 − 1)
27.5
6.26
Thus a 95% confidence interval of σ is
6
√
Iσ = ( 0.428,
√
1.877) = (0.654,
1.877).
1.37).
(3 points)
Extensive experience shows that if a certain disease is treated in the traditional way, then the probability p that the
patient recovers is only 0.6. Now there is a new medicine against the disease. In a treatment experiment, there were 68
recovered out of 100 patients using this new medicine.
(6.1). (1p) Test the following hypotheses with a significance level α = 0.05 :
H0 : p = 0.6
versus
Ha : p > 0.6.
(6.2). (2p) For the test in (6.1), what is the probability of not concluding that p > 0.6 when the actual p = 0.8 ?
Solution. (6.1). T S = √
p̂−p0
p0 (1−p0 )/n
= √ 68/100−0.6
0.6(1−0.6)/100
= 0.08/0.049 = 1.63, and the rejection region
C = (zα , ∞) = (1.645, ∞). Since T S ∈
/ C, we do NOT reject H0 .
(6.2). This is a Type II error, namely
β(0.8) = P (don’t reject H0 when H0 is wrong and p = 0.8)
p̂ − p0
= P(p
< 1.645 when p = 0.8)
p0 (1 − p0 )/n
p̂ − p0
p̂ − p
p̂ − p
to p
since p
∼ N (0, 1))
(need to change p
p0 (1 − p0 )/n
p(1 − p)/n
p(1 − p)/n
s
p̂ − p + p − p0
p(1 − p)
= P( p
·
< 1.645 when p = 0.8)
p
p(1 − p)/n
0 (1 − p0 )
s
p̂ − p
p0 (1 − p0 )
p − p0
= P(p
< 1.645 ·
−p
when p = 0.8) = P (Z < −2.985) = 1 − 0.9986 = 0.0014.
p(1 − p)
p(1 − p)/n
p(1 − p)/n
Page 3/3
Kurskod: TAMS11
Provkod: TENB
12 januari 2015, kl. 8-12
Examinator: Xiangfeng Yang (Tel: 070 2234765). Vänligen svara på ENGELSKA om du kan.
a. Tillåtna hjälpmedel är:
• en räknare;
• formel -och tabellsamling i matematisk statistik (från MAI);
• TAMS 11: Notations and Formulae (by Xiangfeng Yang);
• en ordbok.
b. Betygsgränser: 8-11 poäng ger betyg 3; 11.5-14.5 poäng ger betyg 4; 15-18 poäng ger betyg 5.
Svensk Version
1
(3 poäng)
Två stokastiska variabler X och Y har sannolikhetsfunktionen
X\Y
100
250
0
0.20
0.05
100
0.10
0.15
200
0.20
0.30
Tabellen berättar att X kan ha värden 100 och 250, och Y kan ha värden 0, 100 och 200.
(1.1). (1p) Beräkna P (X = 250) och P (Y = 200).
(1.2). (1p) Beräkna väntevärdet µ = E(Y ) för den stokastiska variabeln Y.
(1.3). (1p) Är X och Y oberoende? Varför?
2
(3 poäng)
Antag att mass X av en viss partikel har täthetsfunktionen
f (x) =
x − 10
,
c
10 ≤ x ≤ 70.
(2.1). (1p) Beräkna värdet på konstanten c = ?
(2.2). (1p) Beräkna väntevärdet µ = E(X) för X.
(2.3). (1p) Beräkna den betingade sannolikheten P (X > 30 | X < 50).
3
(3 poäng)
Det finns 40 elever i en elementär statistik klass. På grundval av många års erfarenhet, vet instruktören att den tid som
behövs för att gradera en slumpmässigt vald första tentamen är en stokastisk variabel med ett väntevärd på 6 min och
en standardavvikelse på 6 min. Om betygstider är oberoende och instruktören börjar gradering på 6:50 P.M. och
graderar kontinuerligt, vad är sannolikheten att han avslutar gradering innan 11:00 P.M. TV-nyheter börjar? (Ledning:
använd centrala gränsvärdessatsen).
4
(3 poäng)
Antag att fördelningen för en population X har täthetsfunktionen
f (x) =
1
,
θ+1
0 ≤ x ≤ θ + 1,
med en okänd parameter θ > 0. Det finns ett stickprov {x1 , . . . , xn } från denna population.
(4.1). (1p) Hitta en punktskattning θ̂M M av θ genom att använda momentmetoden.
(4.2). (2p) Hitta en punktskattning θ̂M L av θ genom att använda Maximum Likelihood-metoden.
Page 1/2
5
(3 poäng)
Man har gjort 16 upprepade oberoende mätningar av samma storhet och erhållit följande mätvärden:
5.14, 3.76, 5.09, 5.87,
6.33, 4.03, 6.25, 5.57,
3.28, 5.12, 5.66, 5.10,
4.63, 5.74, 4.20, 4.69.
Observationernas medelvärde är x̄ = 5.03, och observationernas standardavvikelse är s = 0.885. Antag att
observationerna är oberoende och från en population N (µ, σ 2 ).
(5.1). (1p) Om σ är okänd, finn ett 95% konfidensintervall för µ.
(5.2). (1p) Om σ = 1 är känd, finn ett 95% konfidensintervall för µ.
(5.3). (1p) Om σ är okänd, find a 95% confidence interval of σ.
6
(3 poäng)
Lång erfarenhet visar att om en viss sjukdom behandlas på traditionellt sätt, så är sannolikheten p att patienten
tillfrisknar bara 0.6. I en inledande studie för en ny medicin mot den aktuella sjukdomen har man behandlat 100
patienter och 68 av dem blev friska.
(6.1). (1p) Pröva på nivån α = 0.05 :
H0 : p = 0.6
mot
Ha : p > 0.6.
(6.2). (2p) För testet i (6.1), vad är sannolikheten att inte dra slutsatsen att p > 0.6 men p = 0.8 ?
Page 2/2