Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
Kurskod: TAMS11 Provkod: TENB 12 January 2015, 08:00-12:00 Examiner: Xiangfeng Yang (Tel: 070 2234765). Please answer in ENGLISH if you can. a. You are allowed to use: • a calculator; • formel -och tabellsamling i matematisk statistik (from MAI); • TAMS 11: Notations and Formulae (by Xiangfeng Yang), • a dictionary. b. Scores rating: 8-11 points giving rate 3; 11.5-14.5 points giving rate 4; 15-18 points giving rate 5. English Version 1 (3 points) Two random variables X and Y have a joint probability mass function as follows X\Y 100 250 0 0.20 0.05 100 0.10 0.15 200 0.20 0.30 The table tells that X can take values 100 and 250, and Y can take values 0, 100 and 200. (1.1). (1p) Find P (X = 250) and P (Y = 200). (1.2). (1p) Find the expected value µ = E(Y ) of the random variable Y. (1.3). (1p) Are X and Y independent? Why? Solution. (1.1). P (X = 250) = 0.05 + 0.15 + 0.3 = 0.5, and P (Y = 200) = 0.2 + 0.3 = 0.5. (1.2). The expected value µ = E(Y ) = 0 × 0.25 + 100 × 0.25 + 200 × 0.5 = 125. (1.3). Form (1.1) we know that P (X = 250) = 0.5 and P (Y = 200) = 0.5, thus 0.3 = P (X = 250, Y = 200) 6= P (X = 250) · P (Y = 200) = 0.25. Therefore, X and Y are NOT independent. 2 (3 points) Suppose that the mass X of a certain particle has a probability density function f (x) = x − 10 , c 10 ≤ x ≤ 70. (2.1). (1p) Find the value of the constant c = ? (2.2). (1p) Find the expected value µ = E(X) of X. (2.3). (1p) Find the conditional probability P (X > 30 | X < 50). Solution. (2.1). From the definition of a probability density function we know that Z ∞ 1= Z 70 f (x)dx = −∞ 10 1 x − 10 dx = · 1800, c c thus c = 1800. (2.2). Z ∞ µ = E(X) = Z 70 xf (x)dx = −∞ 10 Page 1/3 x2 − 10x 90000 dx = = 50.dx 1800 1800 (2.3). R 50 P (30 < X < 50) P (X > 30 | X < 50) = = R30 50 P (X < 50) x−10 1800 dx x−10 dx 10 1800 3 = 600/1800 = 3/4 = 0.75. 800/1800 (3 points) There are 40 students in an elementary statistics class. On the basis of years of experience, the instructor knows that the time needed to grade a randomly chosen first examination paper is a random variable with an expected value of 6 min and a standard deviation of 6 min. If grading times are independent and the instructor begins grading at 6:50 P.M. and grades continuously, what is the probability that he is through grading before the 11:00 P.M. TV news begins? (Hint: apply Central Limit Theorem). Solution. Let Xj = grading time for the j-th examination, j = 1, . . . , 40. From the conditions we know that X1 , . . . , X40 are independent and all have a mean µ = E(Xj ) = 6 and a standard deviation σ = 6. We find the probability as follows P (he is through grading before the 11:00 P.M) = P (X1 + . . . + X40 ≤ 250 minutes) 250 X1 + . . . + X40 ≤ ) = P (X̄ ≤ 25/4) = P( 40 40 X̄ − 6 25/4 − 6 √ = P( √ ≤ ) 6/ 40 6/ 40 = P (N (0, 1) ≤ 0.26) = 0.6026. 4 (3 points) Suppose that a population X is a continuous random variable having a probability density function f (x) = 1 , θ+1 0 ≤ x ≤ θ + 1, with an unknown parameter θ > 0. There is a sample {x1 , . . . , xn } from this population. (4.1). (1p) Find a point estimate θ̂M M of θ using Method of Moments. (4.2). (2p) Find a point estimate θ̂M L of θ using Maximum-Likelihood method. Solution. (4.1). For Method of Moments, the first equation is E(X) = x̄. The mean E(X) can be calculated as Z ∞ Z θ+1 1 x xf (x) = dx = (θ + 1). E(X) = θ + 1 2 −∞ 0 By solving E(X) = x̄, we have θ = 2x̄ − 1 which yields θ̂M M = 2x̄ − 1. (4.2). For the Maximum-Likelihood method, we write the likelihood function as L(θ) = f (x1 ) · f (x2 ) . . . f (xn ) = 1 , (θ + 1)n for x1 ≤ θ + 1, . . . , xn ≤ θ + 1. Maximizing L(θ) is equivalent to maximize ln L(θ) where ln L(θ) = −n ln(θ + 1). By looking at the first derivative d lndθL(θ) = −n/(θ + 1) < 0, the function ln L(θ) is decreasing. This means that the least value of θ will give a maximal value of the function ln L(θ). But what is the lease value of θ? In L(θ) we had x1 ≤ θ + 1, . . . , xn ≤ θ + 1, thus θ ≥ max {x1 − 1, . . . , xn − 1}. Therefore θ̂M L = max {x1 − 1, . . . , xn − 1}. (no need to check the second derivative of ln L(θ).) Page 2/3 5 (3 points) 16 measurements of the same item have resulted in the following values: 5.14, 3.76, 5.09, 5.87, 6.33, 4.03, 6.25, 5.57, 3.28, 5.12, 5.66, 5.10, 4.63, 5.74, 4.20, 4.69. The average of the data is x̄ = 5.03, and the standard deviation of the data is s = 0.885. Assume that the observations are independent and from a population N (µ, σ 2 ). (5.1). (1p) If σ is unknown, find a 95% confidence interval of µ. (5.2). (1p) If σ = 1 is known, find a 95% confidence interval of µ. (5.3). (1p) If σ is unknown, find a 95% confidence interval of σ. Solution. (5.1). Since σ is unknown, a 95% confidence interval of µ would be s 0.885 = 5.03 ∓ 2.13 · 0.22125 = 5.03 ∓ 0.47 = (4.56, Iµ = x̄ ∓ tα/2 (n − 1) · √ = 5.03 ∓ t0.025 (16 − 1) · √ n 16 5.5). (5.2). Since σ is known σ = 1,, a 95% confidence interval of µ would be σ 1 1 Iµ = x̄ ∓ zα/2 · √ = 5.03 ∓ z0.025 · √ = 5.03 ∓ 1.96 · √ = 5.03 ∓ 0.49 = (4.54, n 16 16 5.52). (5.3). A 95% confidence interval of σ 2 would be ! (n − 1)s2 (16 − 1)0.8852 (16 − 1)0.8852 11.75 11.75 (n − 1)s2 , = , = , = (0.428, Iσ2 = χ2α/2 (n − 1) χ21−α/2 (n − 1) χ20.025 (16 − 1) χ20.975 (16 − 1) 27.5 6.26 Thus a 95% confidence interval of σ is 6 √ Iσ = ( 0.428, √ 1.877) = (0.654, 1.877). 1.37). (3 points) Extensive experience shows that if a certain disease is treated in the traditional way, then the probability p that the patient recovers is only 0.6. Now there is a new medicine against the disease. In a treatment experiment, there were 68 recovered out of 100 patients using this new medicine. (6.1). (1p) Test the following hypotheses with a significance level α = 0.05 : H0 : p = 0.6 versus Ha : p > 0.6. (6.2). (2p) For the test in (6.1), what is the probability of not concluding that p > 0.6 when the actual p = 0.8 ? Solution. (6.1). T S = √ p̂−p0 p0 (1−p0 )/n = √ 68/100−0.6 0.6(1−0.6)/100 = 0.08/0.049 = 1.63, and the rejection region C = (zα , ∞) = (1.645, ∞). Since T S ∈ / C, we do NOT reject H0 . (6.2). This is a Type II error, namely β(0.8) = P (don’t reject H0 when H0 is wrong and p = 0.8) p̂ − p0 = P(p < 1.645 when p = 0.8) p0 (1 − p0 )/n p̂ − p0 p̂ − p p̂ − p to p since p ∼ N (0, 1)) (need to change p p0 (1 − p0 )/n p(1 − p)/n p(1 − p)/n s p̂ − p + p − p0 p(1 − p) = P( p · < 1.645 when p = 0.8) p p(1 − p)/n 0 (1 − p0 ) s p̂ − p p0 (1 − p0 ) p − p0 = P(p < 1.645 · −p when p = 0.8) = P (Z < −2.985) = 1 − 0.9986 = 0.0014. p(1 − p) p(1 − p)/n p(1 − p)/n Page 3/3 Kurskod: TAMS11 Provkod: TENB 12 januari 2015, kl. 8-12 Examinator: Xiangfeng Yang (Tel: 070 2234765). Vänligen svara på ENGELSKA om du kan. a. Tillåtna hjälpmedel är: • en räknare; • formel -och tabellsamling i matematisk statistik (från MAI); • TAMS 11: Notations and Formulae (by Xiangfeng Yang); • en ordbok. b. Betygsgränser: 8-11 poäng ger betyg 3; 11.5-14.5 poäng ger betyg 4; 15-18 poäng ger betyg 5. Svensk Version 1 (3 poäng) Två stokastiska variabler X och Y har sannolikhetsfunktionen X\Y 100 250 0 0.20 0.05 100 0.10 0.15 200 0.20 0.30 Tabellen berättar att X kan ha värden 100 och 250, och Y kan ha värden 0, 100 och 200. (1.1). (1p) Beräkna P (X = 250) och P (Y = 200). (1.2). (1p) Beräkna väntevärdet µ = E(Y ) för den stokastiska variabeln Y. (1.3). (1p) Är X och Y oberoende? Varför? 2 (3 poäng) Antag att mass X av en viss partikel har täthetsfunktionen f (x) = x − 10 , c 10 ≤ x ≤ 70. (2.1). (1p) Beräkna värdet på konstanten c = ? (2.2). (1p) Beräkna väntevärdet µ = E(X) för X. (2.3). (1p) Beräkna den betingade sannolikheten P (X > 30 | X < 50). 3 (3 poäng) Det finns 40 elever i en elementär statistik klass. På grundval av många års erfarenhet, vet instruktören att den tid som behövs för att gradera en slumpmässigt vald första tentamen är en stokastisk variabel med ett väntevärd på 6 min och en standardavvikelse på 6 min. Om betygstider är oberoende och instruktören börjar gradering på 6:50 P.M. och graderar kontinuerligt, vad är sannolikheten att han avslutar gradering innan 11:00 P.M. TV-nyheter börjar? (Ledning: använd centrala gränsvärdessatsen). 4 (3 poäng) Antag att fördelningen för en population X har täthetsfunktionen f (x) = 1 , θ+1 0 ≤ x ≤ θ + 1, med en okänd parameter θ > 0. Det finns ett stickprov {x1 , . . . , xn } från denna population. (4.1). (1p) Hitta en punktskattning θ̂M M av θ genom att använda momentmetoden. (4.2). (2p) Hitta en punktskattning θ̂M L av θ genom att använda Maximum Likelihood-metoden. Page 1/2 5 (3 poäng) Man har gjort 16 upprepade oberoende mätningar av samma storhet och erhållit följande mätvärden: 5.14, 3.76, 5.09, 5.87, 6.33, 4.03, 6.25, 5.57, 3.28, 5.12, 5.66, 5.10, 4.63, 5.74, 4.20, 4.69. Observationernas medelvärde är x̄ = 5.03, och observationernas standardavvikelse är s = 0.885. Antag att observationerna är oberoende och från en population N (µ, σ 2 ). (5.1). (1p) Om σ är okänd, finn ett 95% konfidensintervall för µ. (5.2). (1p) Om σ = 1 är känd, finn ett 95% konfidensintervall för µ. (5.3). (1p) Om σ är okänd, find a 95% confidence interval of σ. 6 (3 poäng) Lång erfarenhet visar att om en viss sjukdom behandlas på traditionellt sätt, så är sannolikheten p att patienten tillfrisknar bara 0.6. I en inledande studie för en ny medicin mot den aktuella sjukdomen har man behandlat 100 patienter och 68 av dem blev friska. (6.1). (1p) Pröva på nivån α = 0.05 : H0 : p = 0.6 mot Ha : p > 0.6. (6.2). (2p) För testet i (6.1), vad är sannolikheten att inte dra slutsatsen att p > 0.6 men p = 0.8 ? Page 2/2