Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
HEC - FORMATION FONDAMENTALE COURS DE STATISTIQUE Estimation et Test Exercices Professeur : Michel Tenenhaus Ce document ne peut être utilisé, reproduit ou cédé sans l’autorisation du Groupe HEC EXERCICES ESTIMATION ET TEST Les textes en anglais sont extraits de : J.T. McClave, P.G. Benson & T. Sincich, Statistics for Business and Economics, Seventh Edition, Prentice Hall International, 1998. Les textes en français ont été proposés par les professeurs du département SIAD. I. ESTIMATION D’UNE MOYENNE 1. Unoccupied seats on flights cause the airlines to lose revenue. Suppose a large airline wants to estimate its average number of unoccupied seats per flight over the past year. To accomplish this, the records of 225 flights are randomly selected and the number of unoccupied seats is noted for each of the sampled flights. The sample mean and standard deviation are x 11.6 seats s = 4.1 seats Estimate , the mean number of unoccupied seats per flight during the past year, using a 90% confidence interval. 2. The United States Golf Association (USGA) tests all new brands of golf balls to assure that they meet USGA specifications. One test conducted is intended to measure the average distance traveled when the ball is hit by a machine called “Iron Byron,” a name inspired by the swing of the famous golfer Byron Nelson. Suppose the USGA wants to estimate the mean distance for a new brand with a 90% confidence interval of width 2 yards. Assume that past tests have indicated that the standard deviation of the distances “Iron Byron” hits golf balls is approximately 10 yards. How many golf balls should be hit by “Iron Byron” to achieve the desired accuracy in estimating the mean. 3. La société Unilever possède une division Produits de Soins, dont fait partie le savon DOVE. Pour estimer le marché potentiel d’un nouveau produit, un sondage est effectué pour mesurer la consommation moyenne de savon dans la population considérée comme la cible privilégiée de ce produit (femmes actives de plus de trente cinq ans et de moins de soixante ans). La consommation mensuelle moyenne ressort à 3,73 onces (l’unité de mesure internationale utilisée chez Unilever) sur un échantillon de trente personnes, avec un écart-type calculé de 1,6 once. a) b) Donner un intervalle de confiance à 95% de la consommation mensuelle moyenne de savon de la population cible. Calculer la taille de l’échantillon permettant de réduire la largeur totale de l’intervalle de confiance à 95% à 0.5 onces ? 1 II. TESTS DE COMPARAISON D’UNE MOYENNE A UN STANDARD 4. Florida’s housing market remains strong due to the steady stream of new residents fleeing harsh northern winters. This year, the state association of realtors claims that the mean cost of a new home in Florida is $90 380. One realtor who claims that this figure is too low obtained a random sample of 30 sale prices from a list of all homes sold in Florida during the last 6 months. The sample mean and standard deviation were: x $93 290 a. b. 5. The realtor wishes to conduct a hypothesis test to substantiate her claim. Identify the null and alternative hypotheses of interest to her. Find the observed significance level for this test, and interpret its value. The beta coefficients of stocks are a measure of their volatility (or risk) relative to the market as a whole. Stocks with beta coefficients greater than 1 generally bear greater risk (more volatility) than the market, whereas stocks with beta coefficients less than 1 are less risky (less volatile) than the overall market (Sharpe and Alexander, 1990). A random sample of 15 high-technology stocks was selected at the end of 1990, and the mean and standard deviation of the beta coefficients were calculated: x 1.23 a. b. c. d. e. 6. s = $6 500 s = 0.37 Set up the appropriate null and alternative hypotheses to test that average hightechnology stock is riskier than the market as a whole. Establish the appropriate test statistic and rejection region for the test. Use = 0.10. What assumptions are necessary to assure the validity of the test? Calculate the test statistic and state your conclusion. What is the approximate p-value (or significance level) associated with this test? Interpret it. In any bottling process, a manufacturer will lose money if the bottles contain either more or less than is claimed on the label. Accordingly, bottlers pay close attention to the amount of their product being dispensed by bottle-filling machines. Suppose a quality manager for a catsup company is interested in testing whether the mean number of ounces of catsup per family-size bottle differs from the labeled amount of 20 ounces. The manager samples nine bottles, measures the weight of their contents, and finds that x 19.7 ounces and s = 0.3 ounce. a. Does the sample evidence indicate that the catsup-dispensing machine needs adjustment? Test at = 0.05. b. What is the p-value for the hypothesis test you conducted in part a? c. What assumptions are necessary so that the procedure used in part a is valid? d. Find a 90% confidence interval for the mean number of ounces of catsup being dispensed 2 7. A cigarette manufacturer advertises that its new low-tar cigarette “contains on average no more than 4 milligrams of tar”. You have been asked to test the claim using the following sample information: n = 25, x 4.16 milligrams, s = 0.30 milligrams. Does the sample information disagree with the manufacturer’s claim? Test using = 0.05. List any assumptions you make. 8. A major car manufacturer wants to test a new engine to determine whether it meets new air pollution standards. The mean emission, , of all engines of this type must be less than 20 parts per million of carbon. Ten engines are manufactured for testing purposes, and the mean and standard deviation of the emissions for this sample of engines are determined to be x 17.1 parts per million s = 3.0 parts per million Do the data supply sufficient evidence to allow the manufacturer to conclude that this type of engines meets the pollution standard? Assume that the manufacturer is willing to risk a Type 1 error with probability equal to = 0.01. 9. La société SOGEC Une société est spécialisée dans le crédit à la consommation. En 1993, le montant des crédits accordés à ses 60 000 clients était de 24 120 000 F. La société souhaite déterminer la provision pour créances douteuses. A. Le chef comptable fait deux hypothèses : La proportion des créances douteuses dans la population des 60 000 créances vaut 0.05. La valeur moyenne des créances douteuses dans cette population est égale à la valeur moyenne de toutes les créances. Calculer la provision pour créances douteuses sous ces deux hypothèses. B. Un sondage est organisé afin de valider les hypothèses du chef comptable. On tire au hasard 50 créances parmi les 60 000 et on observe 8 créances douteuses dans l'échantillon. 1) Estimer la proportion des créances douteuses, à partir des données de cet échantillon. 2) Calculer un intervalle de confiance de au niveau 0.95. 3) La précision de ce sondage apparaissant comme insuffisante, on décide d'augmenter la taille de l'échantillon. Calculer la taille minimum n de l'échantillon permettant d'obtenir un intervalle de confiance de au niveau 0.95 ayant une largeur au plus égale à 0.08. Utiliser dans la formule permettant d'obtenir le résultat la proportion de créances douteuses estimée dans ce premier sondage et le fractile exact de la loi normale réduite. C. On tire au hasard dans la population des 60 000 créances m nouvelles créances de telle sorte que 50 + m = n, valeur trouvée à la question B 3). On observe 43 créances douteuses parmi ces n créances. Ces 43 créances douteuses ont une moyenne de 408 F et un écart-type de 93 F. 3 En utilisant les résultats sur l'échantillon de n créances, répondre aux questions suivantes. 1) Tester l'hypothèse du chef comptable concernant la proportion de créances douteuses dans la population des 60 000 créances, au risque = 0.05. 2) Construire un intervalle de confiance de au niveau 0.95. 3) Tester l'hypothèse du chef comptable concernant la valeur moyenne de l’ensemble de toutes les créances douteuses au niveau de la population, au risque = 0.05. 4) En utilisant l'estimation de et la conclusion de la question (C.3), estimer la valeur totale des créances douteuses. 5) En utilisant l'intervalle de confiance de de la question (C.2) et la conclusion de la question (C.3), construire un intervalle de confiance à 95% de la valeur totale des créances douteuses. Préciser les applications pratiques de ce résultat au niveau de la provision pour créances douteuses. 4