Download Estimation et test

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
HEC - FORMATION FONDAMENTALE
COURS DE STATISTIQUE
Estimation et Test
Exercices
Professeur : Michel Tenenhaus
Ce document ne peut être utilisé, reproduit ou cédé sans l’autorisation du Groupe HEC
EXERCICES
ESTIMATION ET TEST
Les textes en anglais sont extraits de : J.T. McClave, P.G. Benson & T. Sincich, Statistics for
Business and Economics, Seventh Edition, Prentice Hall International, 1998. Les textes en
français ont été proposés par les professeurs du département SIAD.
I.
ESTIMATION D’UNE MOYENNE
1.
Unoccupied seats on flights cause the airlines to lose revenue. Suppose a large airline
wants to estimate its average number of unoccupied seats per flight over the past year.
To accomplish this, the records of 225 flights are randomly selected and the number of
unoccupied seats is noted for each of the sampled flights. The sample mean and
standard deviation are
x  11.6 seats
s = 4.1 seats
Estimate , the mean number of unoccupied seats per flight during the past year, using
a 90% confidence interval.
2.
The United States Golf Association (USGA) tests all new brands of golf balls to assure
that they meet USGA specifications. One test conducted is intended to measure the
average distance traveled when the ball is hit by a machine called “Iron Byron,” a
name inspired by the swing of the famous golfer Byron Nelson. Suppose the USGA
wants to estimate the mean distance for a new brand with a 90% confidence interval of
width 2 yards. Assume that past tests have indicated that the standard deviation of the
distances “Iron Byron” hits golf balls is approximately 10 yards. How many golf balls
should be hit by “Iron Byron” to achieve the desired accuracy in estimating the mean.
3.
La société Unilever possède une division Produits de Soins, dont fait partie le savon
DOVE. Pour estimer le marché potentiel d’un nouveau produit, un sondage est
effectué pour mesurer la consommation moyenne de savon dans la population
considérée comme la cible privilégiée de ce produit (femmes actives de plus de trente
cinq ans et de moins de soixante ans). La consommation mensuelle moyenne ressort à
3,73 onces (l’unité de mesure internationale utilisée chez Unilever) sur un échantillon
de trente personnes, avec un écart-type calculé de 1,6 once.
a)
b)
Donner un intervalle de confiance à 95% de la consommation mensuelle
moyenne de savon de la population cible.
Calculer la taille de l’échantillon permettant de réduire la largeur totale de
l’intervalle de confiance à 95% à 0.5 onces ?
1
II.
TESTS DE COMPARAISON D’UNE MOYENNE A UN STANDARD
4.
Florida’s housing market remains strong due to the steady stream of new residents
fleeing harsh northern winters. This year, the state association of realtors claims that
the mean cost of a new home in Florida is $90 380. One realtor who claims that this
figure is too low obtained a random sample of 30 sale prices from a list of all homes
sold in Florida during the last 6 months. The sample mean and standard deviation
were:
x  $93 290
a.
b.
5.
The realtor wishes to conduct a hypothesis test to substantiate her claim.
Identify the null and alternative hypotheses of interest to her.
Find the observed significance level for this test, and interpret its value.
The beta coefficients of stocks are a measure of their volatility (or risk) relative to the
market as a whole. Stocks with beta coefficients greater than 1 generally bear greater
risk (more volatility) than the market, whereas stocks with beta coefficients less than 1
are less risky (less volatile) than the overall market (Sharpe and Alexander, 1990). A
random sample of 15 high-technology stocks was selected at the end of 1990, and the
mean and standard deviation of the beta coefficients were calculated:
x  1.23
a.
b.
c.
d.
e.
6.
s = $6 500
s = 0.37
Set up the appropriate null and alternative hypotheses to test that average hightechnology stock is riskier than the market as a whole.
Establish the appropriate test statistic and rejection region for the test. Use  =
0.10.
What assumptions are necessary to assure the validity of the test?
Calculate the test statistic and state your conclusion.
What is the approximate p-value (or significance level) associated with this
test? Interpret it.
In any bottling process, a manufacturer will lose money if the bottles contain either
more or less than is claimed on the label. Accordingly, bottlers pay close attention to
the amount of their product being dispensed by bottle-filling machines. Suppose a
quality manager for a catsup company is interested in testing whether the mean
number of ounces of catsup per family-size bottle differs from the labeled amount of
20 ounces. The manager samples nine bottles, measures the weight of their contents,
and finds that x  19.7 ounces and s = 0.3 ounce.
a.
Does the sample evidence indicate that the catsup-dispensing machine needs
adjustment? Test at  = 0.05.
b.
What is the p-value for the hypothesis test you conducted in part a?
c.
What assumptions are necessary so that the procedure used in part a is valid?
d.
Find a 90% confidence interval for the mean number of ounces of catsup being
dispensed
2
7.
A cigarette manufacturer advertises that its new low-tar cigarette “contains on average
no more than 4 milligrams of tar”. You have been asked to test the claim using the
following sample information: n = 25, x  4.16 milligrams, s = 0.30 milligrams. Does
the sample information disagree with the manufacturer’s claim? Test using  = 0.05.
List any assumptions you make.
8.
A major car manufacturer wants to test a new engine to determine whether it meets
new air pollution standards. The mean emission, , of all engines of this type must be
less than 20 parts per million of carbon. Ten engines are manufactured for testing
purposes, and the mean and standard deviation of the emissions for this sample of
engines are determined to be
x  17.1 parts per million
s = 3.0 parts per million
Do the data supply sufficient evidence to allow the manufacturer to conclude that this
type of engines meets the pollution standard? Assume that the manufacturer is willing
to risk a Type 1 error with probability equal to  = 0.01.
9.
La société SOGEC
Une société est spécialisée dans le crédit à la consommation. En 1993, le montant des crédits
accordés à ses 60 000 clients était de 24 120 000 F. La société souhaite déterminer la
provision pour créances douteuses.
A.
Le chef comptable fait deux hypothèses :
La proportion  des créances douteuses dans la population des 60 000 créances
vaut 0.05.
La valeur moyenne  des créances douteuses dans cette population est égale à
la valeur moyenne de toutes les créances.
Calculer la provision pour créances douteuses sous ces deux hypothèses.
B.
Un sondage est organisé afin de valider les hypothèses du chef comptable. On tire au
hasard 50 créances parmi les 60 000 et on observe 8 créances douteuses dans
l'échantillon.
1) Estimer la proportion  des créances douteuses, à partir des données de cet
échantillon.
2) Calculer un intervalle de confiance de  au niveau 0.95.
3) La précision de ce sondage apparaissant comme insuffisante, on décide d'augmenter
la taille de l'échantillon. Calculer la taille minimum n de l'échantillon permettant
d'obtenir un intervalle de confiance de  au niveau 0.95 ayant une largeur au plus égale
à 0.08. Utiliser dans la formule permettant d'obtenir le résultat la proportion de créances
douteuses estimée dans ce premier sondage et le fractile exact de la loi normale réduite.
C. On tire au hasard dans la population des 60 000 créances m nouvelles créances de telle
sorte que 50 + m = n, valeur trouvée à la question B 3). On observe 43 créances
douteuses parmi ces n créances. Ces 43 créances douteuses ont une moyenne de 408 F et
un écart-type de 93 F.
3
En utilisant les résultats sur l'échantillon de n créances, répondre aux questions suivantes.
1) Tester l'hypothèse du chef comptable concernant la proportion  de créances douteuses
dans la population des 60 000 créances, au risque  = 0.05.
2) Construire un intervalle de confiance de  au niveau 0.95.
3) Tester l'hypothèse du chef comptable concernant la valeur moyenne  de l’ensemble
de toutes les créances douteuses au niveau de la population, au risque  = 0.05.
4) En utilisant l'estimation de  et la conclusion de la question (C.3), estimer la valeur
totale des créances douteuses.
5) En utilisant l'intervalle de confiance de  de la question (C.2) et la conclusion de la
question (C.3), construire un intervalle de confiance à 95% de la valeur totale des
créances douteuses. Préciser les applications pratiques de ce résultat au niveau de la
provision pour créances douteuses.
4