Calculer une moyenne et une moyenne pondérée
Introduction :
Quand le caractère étudié lors d’une enquête ou dans une série de mesures est quantitatif, différentes caractéristiques permettent d’avoir une vue d’ensemble de la série statistique pour interpréter des résultats, ou pour comparer des séries entre elles. La moyenne est une de ces caractéristiques.
Nous commencerons ce cours par un rappel du vocabulaire des statistiques, avant d’introduire l’exemple qui nous servira pour une partie du cours. Nous définirons ensuite la moyenne d’une série statistique, puis nous indiquerons comment calculer une moyenne pondérée.
Vocabulaire (rappels)
Vocabulaire (rappels)
La listes des données collectées lors d’une enquête ou d’une série de mesures est appelée série de données statistique.
Étudier une série statistique, c’est étudier un caractère dans une population :
- la population est l’ensemble des individus étudiés ;
- le caractère est le type de mesure que l’on recueille ; il peut être :
- qualitatif (couleur des yeux, marque de voiture, de téléphone portable…),
- ou quantitatif (poids, nombre de voitures au domicile, temps passé au téléphone…) ;
- les valeurs sont les valeurs prises par ce caractère ;
- l’effectif d’une valeur du caractère est le nombre de fois que cette valeur apparaît dans la liste, c’est-à-dire le nombre d’individus qui possèdent cette valeur du caractère ;
- l’effectif total de la série est le nombre total d’individus de la population étudiée, c’est-à-dire la somme des effectifs ;
- la fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total.
Nous avons demandé aux $25$ élèves d’une classe de 5e le nombre de livres qu’ils ont lus durant les douze derniers mois.
Voici les réponses obtenues : $2$ – $1$ – $0$ – $0$ – $5$ – $4$ – $0$ – $5$ – $7$ – $2$ – $2$ – $3$ – $3$ – $0$ – $4$ – $1$ – $0$ – $2$ – $1$ – $2$ – $5$ – $3$ – $2$ – $3$ – $5$ |
Dans cette série statistique :
- la population étudiée est une classe de 5e ;
- le caractère étudié est le nombre de livres lus durant les douze derniers mois ;
- c’est un caractère quantitatif ;
- les valeurs prises par le caractère sont : $0$ ; $1$ ; $2$ ; $3$ ; $4$ ; $5$ ; $7$ ;
- l’effectif total est le nombre d’élèves interrogés, soit $25$.
Déterminons l’effectif de la valeur $\red 2$, en comptant le nombre de fois où elle apparaît :
$\red 2$ – $1$ – $0$ – $0$ – $5$ – $4$ – $0$ – $5$ – $7$ – $\red 2$ – $\red 2$ – $3$ – $3$ – $0$ – $4$ – $1$ – $0$ – $\red 2$ – $1$ – $\red 2$ – $5$ – $3$ – $\red 2$ – $3$ – $5$
« $2$ » apparaît $6$ fois dans la liste.
- L’effectif de la valeur « $2$ » est donc $6$ ; autrement dit, $6$ élèves ont lu $2$ livres durant les douze derniers mois.
La fréquence de la valeur « $2$ » vaut :
$$\dfrac{\text{effectif de la valeur « 2 »}}{\text{effectif total}}=\dfrac{6}{25}=0,24=24\,\%$$
- $24\ \%$ des élèves de cette classe (soit près d’un quart) ont lu $2$ livres durant les douze derniers mois.
En effectuant les mêmes calculs pour toutes les valeurs de la série, nous obtenons les résultats regroupés dans le tableau ci-dessous :
Livres lus | $\footnotesize 0$ | $\footnotesize 1$ | $\footnotesize 2$ | $\footnotesize 3$ | $\footnotesize 4$ | $\footnotesize 5$ | $\footnotesize 7$ | Totaux |
Effectifs | $\footnotesize 5$ | $\footnotesize 3$ | $\footnotesize 6$ | $\footnotesize 4$ | $\footnotesize 2$ | $\footnotesize 4$ | $\footnotesize 1$ | $\footnotesize 25$ |
Fréquences | $\footnotesize 0,2$ | $\footnotesize 0,12$ | $\footnotesize 0,24$ | $\footnotesize 0,16$ | $\footnotesize 0,08$ | $\footnotesize 0,16$ | $\footnotesize 0,04$ | $\footnotesize 1$ |
Remarque :
Nous avons ici choisi de donner les fréquences sous leurs formes décimales, car on a des valeurs exactes.
Nous aurions aussi pu les exprimer sous forme de fraction ou de pourcentage.
Ces rappels étant faits, nous pouvons maintenant introduire les notions de moyenne et de moyenne pondérée d’une série statistique.
Moyenne et moyenne pondérée
Moyenne et moyenne pondérée
Quand le caractère étudié lors d’une enquête ou dans une série de mesures est quantitatif, la moyenne est une des caractéristiques de la série (on parle aussi d’indicateurs de la série).
Moyenne
Moyenne
Moyenne :
La moyenne d’une série de données numériques est égale à la somme de toutes les données de cette série, divisée par l’effectif total :
$$\text{moyenne}=\dfrac{\text{somme des données}}{\text{effectif total}}$$
- La moyenne est toujours comprise entre les deux valeurs extrêmes.
- La moyenne de la série de données n’est pas forcément une des valeurs de la série.
- Ce n’est généralement pas la moyenne des deux valeurs extrêmes de la série (la plus petite et la plus grande).
Nous avons demandé aux $25$ élèves d’une classe de 5e le nombre de livres qu’ils ont lus durant les douze derniers mois.
Voici les réponses obtenues : $2$ – $1$ – $0$ – $0$ – $5$ – $4$ – $0$ – $5$ – $7$ – $2$ – $2$ – $3$ – $3$ – $0$ – $4$ – $1$ – $0$ – $2$ – $1$ – $2$ – $5$ – $3$ – $2$ – $3$ – $5$ |
Pour calculer la moyenne de cette série, commençons par calculer la somme des données, que l’on note $S$ :
$$\begin{aligned} S&=2+1+0+0+5+4+0+5+7+2+2+3 \\ &\qquad +3+0+4+1+0+2+1+2+5+3+2+3+5 \\ S&=62 \end{aligned}$$
La moyenne de cette série, que l’on note $M$, est donc égale à :
$$M=\dfrac S{25}=\dfrac {62}{25}=2,48$$
- Le nombre moyen de livres lus, durant les douze derniers mois, par les élèves de cette classe est de $2,48$.
Remarques :
- $2,48$ est bien compris entre $0$ et $7$ : $0< 2,48 <7$
- $2,48$ n’est pas une des valeurs de la série de données.
- La moyenne de la série n’est pas non plus égale à la moyenne des deux valeurs extrêmes qui sont $0$ et $7$ :
$$\dfrac{0+7}{2} = 3,5 \neq 2,48$$
Moyenne pondérée
Moyenne pondérée
Les données recueillies peuvent être nombreuses, et en faire la somme est un travail long qui peut être source d’erreurs, comme nous l’avons déjà un peu illustré au point précédent.
- On calculera alors plutôt la moyenne pondérée, qui donnera bien sûr le même résultat que le calcul de la moyenne.
Moyenne pondérée :
La moyenne pondérée d’une série statistique numérique est égale à la somme des produits de chaque valeur par son effectif, divisée par l’effectif total :
$$\text{moyenne pondérée}=\dfrac{\text{somme des produits des valeurs par leurs effectifs}}{\text{effectif total}}$$
Continuons avec notre exemple du nombre de livres lus, et reprenons le tableau des effectifs que nous avons réalisé :
Livres lus | $\textcolor{#1BAF79} 0$ | $\textcolor{#1BAF79} 1$ | $\textcolor{#1BAF79} 2$ | $\textcolor{#1BAF79} 3$ | $\textcolor{#1BAF79} 4$ | $\textcolor{#1BAF79} 5$ | $\textcolor{#1BAF79} 7$ | Total |
Effectifs | $\textcolor{#9F32BF} 5$ | $\textcolor{#9F32BF} 3$ | $\textcolor{#9F32BF} 6$ | $\textcolor{#9F32BF} 4$ | $\textcolor{#9F32BF}2$ | $\textcolor{#9F32BF} 4$ | $\textcolor{#9F32BF} 1$ | $25$ |
Pour calculer la moyenne pondérée, que l’on note $M_\text{p}$ :
- on effectue donc tous les produits du nombre de livres par le nombre d’élèves ayant lu cette quantité de livres ;
- on effectue la somme des résultats ;
- on divise le tout par l’effectif total, soit $25$.
- On obtient :
$$\begin{aligned} M_\text{p}&=\dfrac{\textcolor{#1BAF79}0\times \textcolor{#9F32BF}5+\textcolor{#1BAF79}1\times \textcolor{#9F32BF}3+\textcolor{#1BAF79}2\times 6+\textcolor{#1BAF79}3\times \textcolor{#9F32BF}4+\textcolor{#1BAF79}4\times \textcolor{#9F32BF}2+\textcolor{#1BAF79}5\times \textcolor{#9F32BF}4+\textcolor{#1BAF79}7\times \textcolor{#9F32BF}1}{25} \\ &=\dfrac{0+3+12+12+8+20+7}{25} \\ &=\dfrac{62}{25} \\ &=2,48 \end{aligned}$$
Remarque :
On retrouve bien le même résultat qu’avec le calcul de la moyenne classique.
« Pondérer » vient du latin pondus, qui signifie « poids ».
Les valeurs de la série n’ayant pas le même effectif, on peut dire qu’elles n’ont pas le même « poids ». On affecte donc à chaque valeur son « poids », égal à son effectif : plus l’effectif d’une valeur est grand, plus celle-ci « pèse ».
Approfondissement : cas du regroupement par classes
Approfondissement : cas du regroupement par classes
Dans le cours « Les statistiques : vocabulaire et interprétation des résultats », nous sommes allés un peu plus loin dans le programme de 5e, en abordant avec un peu d’avance les séries pour lesquelles il est intéressant de regrouper les données par classes.
Nous avons alors travaillé sur une étude qui demandait à ces mêmes $25$ élèves de 5e le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.
- Nous avons alors obtenu le tableau suivant :
Nombre d’heures $h$ | $\footnotesize 0\leq h<1$ | $\footnotesize 1\leq h<2$ | $\footnotesize 2\leq h<3$ | $\footnotesize 3\leq h<4$ | $\footnotesize 4\leq h<5$ |
Effectifs | $\textcolor{#9F32BF}4$ | $\textcolor{#9F32BF}5$ | $\textcolor{#9F32BF}9$ | $\textcolor{#9F32BF}4$ | $\textcolor{#9F32BF}3$ |
Voyons comment, dans un tel cas, calculer une moyenne.
Dans une série de données numériques qui ont été regroupées par classes, pour calculer la moyenne :
- on détermine le centre de chaque classe, tout simplement en faisant la moyenne des valeurs extrêmes de la classe ;
- on calcule la moyenne pondérée avec les centres comme valeurs.
Dans notre cas, déterminons le centre de chaque classe :
$$\begin{aligned} \dfrac{0+1}2&=0,5 \\ \dfrac{1+2}2&=1,5 \\ \dfrac{2+3}2&=2,5 \\ \dfrac{3+4}2&=3,5 \\ \dfrac{4+5}2&=4,5 \end{aligned}$$
On peut les reporter dans notre tableau :
Nombre d’heures $h$ | $\footnotesize 0\leq h<1$ | $\footnotesize 1\leq h<2$ | $\footnotesize 2\leq h<3$ | $\footnotesize 3\leq h<4$ | $\footnotesize 4\leq h<5$ |
Centres | $\textcolor{#1BAF79}{0,5}$ | $\textcolor{#1BAF79}{1,5}$ | $\textcolor{#1BAF79}{2,5}$ | $\textcolor{#1BAF79}{3,5}$ | $\textcolor{#1BAF79}{4,5}$ |
Effectifs | $\textcolor{#9F32BF}4$ | $\textcolor{#9F32BF}5$ | $\textcolor{#9F32BF}9$ | $\textcolor{#9F32BF}4$ | $\textcolor{#9F32BF}3$ |
Calculons maintenant la moyenne pondérée $M_\text{p}$ en prenant comme valeurs les centres :
$$\begin{aligned} M_\text{p}&=\dfrac{\textcolor{#1BAF79}{0,5}\times \textcolor{#9F32BF}4+\textcolor{#1BAF79}{1,5}\times \textcolor{#9F32BF}5 + \textcolor{#1BAF79}{2,5}\times \textcolor{#9F32BF}9+\textcolor{#1BAF79}{3,5}\times \textcolor{#9F32BF}4+\textcolor{#1BAF79}{4,5}\times \textcolor{#9F32BF}3}{\textcolor{#9F32BF}4+\textcolor{#9F32BF}5+\textcolor{#9F32BF}9+\textcolor{#9F32BF}4+\textcolor{#9F32BF}3} \\ &=\dfrac{2+7,5+22,5+14+13,5}{25} \\ &=\dfrac{59,5}{25} \\ &=2,38\ \text{h} \end{aligned}$$
- Avec les centres des classes, on trouve une moyenne de $2,38\ \text{h}$ de sport par semaine.
On peut calculer la moyenne exacte, en reprenant l’ensemble des $25$ données relevées :
$2$ – $4$ – $0$ – $0,5$ – $1,5$ – $2$ – $2,5$ – $3$ – $2,5$ – $0$ – $0,75$ – $4$ – $4,75$ – $3$ – $1,5$ – $1$ – $2$ – $3,5$ – $1,5$ – $1$ – $2,5$ – $3,5$ – $2$ – $2,5$ – $2$
La somme $S$ des données est alors égale à :
$$\begin{aligned} S&=2+4+0+0,5+1,5+2+2,5+3+2,5+0+0,75+4+4,75 \\ &\qquad+3+1,5+1+2+3,5+1,5+1+2,5+3,5+2+2,5+2 \\ S&=53,5 \end{aligned}$$
On obtient la moyenne $M$ :
$$M=\dfrac{S}{25}=\dfrac{53,5}{25}=2,14\ \text{h}$$
La différence entre la moyenne trouvée avec le centre des classes et la moyenne exacte vaut :
$$M_\text{p}-M=2,38-2,14=0,24\approx \dfrac 14\ \text{h}$$
Il y a ainsi un écart d’environ un quart d’heure.
- Le calcul de la moyenne par les centres des classes est ici relativement fiable.
Conclusion :
Dans ce cours, nous avons introduit une nouvelle notion de la statistique : la moyenne. Elle prend ici un sens purement mathématique et rigoureux, mais c’est une notion que nous utilisons dans la vie de tous les jours (« en moyenne », « ma moyenne est de… ») et qui nous permet de situer, de positionner un élément par rapport à un ensemble (une note par rapport à la moyenne de la classe) ou un ensemble par rapport à un autre (la moyenne d’une classe par rapport à celle d’une autre classe), de donner un ordre d’idée d’une valeur ou d’avoir une vue globale sur un sujet.