Les statistiques
Introduction :
La statistique est une science qui étudie les données recueillies lors d’une enquête ou d’une série de mesures. Au cycle 3, nous avons appris à trier des informations recueillies et vu rapidement les différentes représentations graphiques de données. En 5e, nous allons consolider ces connaissances tout en intégrant de nouvelles notions comme l’effectif et la fréquence.
Nous commencerons ce cours par un point sur le vocabulaire des statistiques, puis nous définirons les notions d’effectif et de fréquence. Nous enchaînerons ensuite par les méthodes d’organisation et de représentations de résultats pour lire et interpréter des données.
Vocabulaire et définitions
Vocabulaire et définitions
Vocabulaire
Vocabulaire
La liste des données collectées lors d’une enquête ou d’une série de mesures est appelée série de données statistique. Étudier une série statistique, c’est étudier un caractère dans une population :
- la population est l’ensemble des individus étudiés ;
- le caractère est le type de mesure que l’on recueille ; il peut être qualitatif (couleur des yeux, marque de la voiture, du téléphone portable) ou quantitatif (poids, nombre de voitures au domicile, temps passé au téléphone) ;
- les valeurs sont les valeurs prises par ce caractère.
Étude 1 : On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e. Voici la série des $25$ données que nous avons recueillies : marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron |
- La population étudiée est une classe de 5e.
- Le caractère étudié est la couleur des yeux.
- C’est un caractère qualitatif.
- Les valeurs possibles du caractère sont : bleu, gris, marron, noir, noisette et vert ($6$ valeurs).
Effectif et effectif total
Effectif et effectif total
Effectif d’une valeur :
L’effectif d’une valeur du caractère est le nombre de fois que cette valeur apparaît dans la liste, c’est-à-dire le nombre d’individus qui possèdent cette valeur du caractère.
Effectif total :
L’effectif total de la série est le nombre total d’individus de la population étudiée, c’est-à-dire la somme des effectifs.
Étude 1 : On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e. Voici la série des $25$ données que nous avons recueillies : marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron |
Dans cette série de données statistique :
- l’effectif de la valeur « bleu » est $8$ (« bleu » apparaît $8$ fois dans la liste ; $8$ élèves ont les yeux bleus) alors que l’effectif de la valeur « noir » est $1$ (« noir » apparaît $1$ fois dans la liste ; $1$ seul élève a les yeux noirs) ;
- l’effectif total est le nombre d’élèves interrogés, soit $25$.
Fréquence d’une valeur
Fréquence d’une valeur
Fréquence d’une valeur :
La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total, soit :
$$\text{Fréquence d’une valeur}=\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}}$$
- La fréquence d’une valeur est un nombre compris entre $0$ et $1$.
- La somme de toutes les fréquences est égale à $1$.
La fréquence peut être laissée sous forme de fraction, ou donnée sous forme décimale ou de pourcentage.
Sous forme de pourcentage, la valeur de la fréquence devient :
$$\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}} \times 100\,\%$$
Étude 1 : On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e. Voici la série des $25$ données que nous avons recueillies : marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron |
Dans cette série de données statistiques, la fréquence de la valeur « bleu » est :
$$\dfrac{\text{Effectif de la valeur «\ bleu\ »}}{\text{Effectif total}}=\dfrac{8}{25}=0,32=32\,\%$$
La fréquence de la valeur « bleu » dans cette classe de 5e est $0,32$.
- Autrement dit, $32\,\%$ des élèves de cette classe ont les yeux bleus.
Organiser et représenter des données pour lire et interpréter des résultats
Organiser et représenter des données pour lire et interpréter des résultats
Organisation des données sous forme de tableau
Organisation des données sous forme de tableau
Les résultats d’une étude statistique sont le plus souvent rassemblés dans un tableau de données.
Tableau de données :
Un tableau de données permet de rassembler et d’organiser des données afin de faciliter la lecture et l’interprétation des informations.
Un tableau de données regroupe les valeurs, les effectifs, voire les fréquences de la série statistique.
Étude 1 : On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e. Voici la série des $25$ données que nous avons recueillies : marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron |
Pour cette étude, en relevant les effectifs de chacune des valeurs du caractère, puis en calculant leur fréquence (comme nous l’avons fait pour la valeur « bleu »), nous obtenons les résultats que nous avons rassemblés dans le tableau de données ci-dessous :
Couleur des yeux |
Bleu | Gris | Marron | Noir | Noisette | Vert | Total |
Effectifs |
$\footnotesize 8$ | $\footnotesize 1$ | $\footnotesize 11$ | $\footnotesize 1$ | $\footnotesize 2$ | $\footnotesize 2$ | $\footnotesize 25$ |
Fréquences |
$\footnotesize \dfrac{8}{25}$ | $\footnotesize \dfrac{1}{25}$ | $\footnotesize \dfrac{11}{25}$ | $\footnotesize \dfrac{1}{25}$ | $\footnotesize \dfrac{2}{25}$ | $\footnotesize \dfrac{2}{25}$ | $\footnotesize \dfrac{25}{25}$ |
Fréquences |
$\footnotesize 0,32$ | $\footnotesize 0,04$ | $\footnotesize 0,44$ | $\footnotesize 0,04$ | $\footnotesize 0,08$ | $\footnotesize 0,08$ | $\footnotesize 1$ |
Fréquences |
$\footnotesize 32\,\%$ | $\footnotesize 4\,\%$ | $\footnotesize 44\,\%$ | $\footnotesize 4\,\%$ | $\footnotesize 8\,\%$ | $\footnotesize 8\,\%$ | $\footnotesize 100\,\%$ |
Représentations graphiques
Représentations graphiques
Pour illustrer graphiquement les résultats d’une étude statistique, il existe plusieurs types de représentations, sous forme de diagrammes ou de graphiques.
Diagramme en bâtons
Diagramme en bâtons :
Un diagramme en bâtons est composé de bâtons (ou de barres) de même largeur dont la hauteur est proportionnelle à l’effectif.
Un diagramme en bâtons représente une série statistique en illustrant la répartition des effectifs.
Étude 1 : On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e. Voici la série des $25$ données que nous avons recueillies : marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron |
Nous avons plus haut donné les effectifs pour chaque couleur de yeux :
Couleur des yeux |
Bleu | Gris | Marron | Noir | Noisette | Vert | Total |
Effectifs |
$8$ | $1$ | $11$ | $1$ | $2$ | $2$ | $25$ |
On peut ainsi représenter cette étude par le diagramme suivant :
Diagramme en bâtons
Un seul coup d’œil suffit pour voir, par exemple :
- que les élèves aux yeux marron sont les plus nombreux (c’est le bâton le plus haut) ;
- il y a autant d’élèves qui ont les yeux noisette que d’élèves qui ont les yeux verts (les deux bâtons ont la même hauteur).
Diagramme circulaire
Diagramme circulaire :
Un diagramme circulaire est un disque partagé en secteurs circulaires dont l’angle est proportionnel à l’effectif.
Un diagramme circulaire représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.
On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque secteur circulaire.
MÉTHODOLOGIE :
Pour calculer la valeur de l’angle de chaque secteur circulaire, on multiplie la valeur de la fréquence concernée par la valeur de l’angle de la totalité du disque, soit $360\degree$.
Étude 1 : On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e. Voici la série des $25$ données que nous avons recueillies : marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron |
Nous avons plus haut donné la fréquence de chaque couleur (nous utiliserons ici les pourcentages, mais toutes les formes sont possibles) :
Couleur des yeux |
Bleu | Gris | Marron | Noir | Noisette | Vert | Total |
Fréquences |
$32\,\%$ | $4\,\%$ | $44\,\%$ | $4\,\%$ | $8\,\%$ | $8\,\%$ | $100\,\%$ |
Pour calculer la mesure de l’angle du secteur circulaire représentant la proportion d’yeux bleus, on calcule $32\,\%$ de $360\degree$ :
$$\dfrac{32}{100}\times 360\degree = 115,2 \degree$$
- On procède de la même manière pour calculer les autres mesures d’angle, et on obtient le diagramme :
Diagramme circulaire
Remarque :
On utilise parfois un diagramme semi-circulaire, c’est-à-dire un demi-disque au lieu d’un disque.
- Pour obtenir les mesures d’angles, logiquement, on multiple cette fois les fréquences par $180\degree$ (soit la moitié de $360\degree$).
Diagramme à bandes
Diagramme à bandes :
Un diagramme à bandes est une bande rectangulaire partagée en bandes dont la longueur est proportionnelle à l’effectif.
Un diagramme à bandes représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.
On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque bande.
Un classement par ordre décroissant (ou croissant) de cette proportion facilite la lecture du diagramme.
MÉTHODOLOGIE :
Pour calculer la longueur de chaque bande, on multiplie la valeur de la fréquence concernée par la longueur de la totalité de la bande.
Étude 1 : On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e. Voici la série des $25$ données que nous avons recueillies : marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron |
Reprenons le tableau avec les fréquences :
Couleur des yeux |
Bleu | Gris | Marron | Noir | Noisette | Vert | Total |
Fréquences |
$32\,\%$ | $4\,\%$ | $44\,\%$ | $4\,\%$ | $8\,\%$ | $8\,\%$ | $100\,\%$ |
On choisit une bande de longueur totale $15\text{ cm}$.
Pour calculer la longueur de la bande représentant la proportion d’yeux marron, on calcule $44\,\%$ de $15\text{ cm}$, soit :
$$\dfrac{44}{100}\times 15 = 6,6\text{ cm}$$
- On procède de la même manière pour calculer les autres longueurs de bande, et on obtient le diagramme :
Diagramme à bandes
Graphique
Graphique :
Un graphique représente une série statistique en illustrant l’évolution d’une grandeur $G_1$ par rapport à une grandeur $G_2$.
Le graphique suivant représente les précipitations tombées à Carcassonne chaque mois de l’année 2021. Autrement dit, on voit l’évolution des précipitations à Carcassonne en fonction du mois.
- Sur l’axe horizontal (appelé axe des abscisses), on a mis la grandeur $G_2$, ici le mois.
- Sur l’axe vertical (appelé axe des ordonnées), on a mis la grandeur $G_1$, ici les précipitations.
Img-04 Graphique représentant les précipitations à Carcassonne en 2021 (Données : Infoclimat)
Ce graphique permet de bien se rendre compte de l’évolution des précipitations tout au long de l’année, avec ses « creux » et ses « pics ».
Il permet ainsi de repérer d’un seul coup d’œil :
- le mois le plus sec : mars, avec un peu moins de $10\ \text{mm}$ de précipitations ;
- le mois où il a plu le plus : novembre, avec environ $135\ \text{mm}$.
Approfondissement : regroupement par classes
Approfondissement : regroupement par classes
Dans une série de données numériques, lorsque les valeurs sont diverses et nombreuses, on peut regrouper les valeurs par classes.
- Pour comprendre comment on procède, nous allons traiter un exemple.
Étude 2 : Nous avons demandé aux mêmes 25 élèves de 5e le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine. Voici les réponses obtenues en nombre d’heures : $2$ – $4$ – $0$ – $0,5$ – $1,5$ – $2$ – $2,5$ – $3$ – $2,5$ – $0$ – $0,75$ – $4$ – $4,75$ – $3$ – $1,5$ – $1$ – $2$ – $3,5$ – $1,5$ – $1$ – $2,5$ – $3,5$ – $2$ – $2,5$ – $2$ |
Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes de $1$ heure.
- On dit que les classes ont une amplitude de $1$ heure.
Amplitude d’une classe :
L’amplitude d’une classe est le différence entre sa plus grande valeur et sa plus petite.
Soit donc $n$ le nombre d’heures de sport par semaine.
Les $5$ classes de valeurs obtenues sont :
$$\begin{aligned} 0\leq &\ n<1 \\ 2\leq &\ n<3 \\ 3\leq &\ n<4 \\ 4\leq &\ n<5 \end{aligned}$$
Ainsi, par exemple, l’effectif de la classe $\red{2\leq n<3}$ est $9$ : dans la série de données ci-dessus, il y a $9$ valeurs qui sont supérieures ou égales à $2$ et strictement inférieures à $3$ :
$\red 2$ – $4$ – $0$ – $0,5$ – $1,5$ – $\red 2$ – $\red {2,5}$ – $3$ – $\red {2,5}$ – $0$ – $0,75$ – $4$ – $4,75$ – $3$ – $1,5$ – $1$ – $\red 2$ – $3,5$ – $1,5$ – $1$ – $\red {2,5}$ – $3,5$ – $\red 2$ – $\red {2,5}$ – $\red 2$
- En relevant de la même manière les effectifs pour les autres classes de valeurs, puis en calculant leur fréquence, voici le tableau de données que nous pouvons établir :
$n$ = nombre d’heures de sport par semaine |
$\small 0\leq n<1$ | $\small 1\leq n<2$ | $\small 2\leq n<3$ | $\small 3\leq n<4$ | $\small 4\leq n<5$ | Total |
Effectifs |
$4$ | $5$ | $9$ | $4$ | $3$ | $25$ |
Fréquence |
$\dfrac{4}{25}$ | $\dfrac{5}{25}$ | $\dfrac{9}{25}$ | $\dfrac{4}{25}$ | $\dfrac{3}{25}$ | $\dfrac{25}{25}$ |
Fréquence |
$0,16$ | $0,2$ | $0,36$ | $0,16$ | $0,12$ | $1$ |
Fréquence |
$16\,\%$ | $20\,\%$ | $36\,\%$ | $16\,\%$ | $12\,\%$ | $100\,\%$ |
Pour représenter graphiquement ces données regroupées par classes, on utilise un histogramme, qui ressemble, en quelque sorte, à un diagramme en bâtons.
Histogramme :
Dans un histogramme, les rectangles représentant les effectifs sont accolés, et leurs aires sont proportionnelles aux effectifs des classes.
Au collège, nous allons travailler uniquement avec des classes de même amplitude. Dans ce cas :
- les largeurs des rectangles sont égales (puisque les classes ont la même amplitude) ;
- les hauteurs des rectangles sont alors proportionnelles aux effectifs des classes.
Dans notre exemple, en nous servant du tableau des effectifs que nous avons réalisé, nous pouvons construire l’histogramme suivant :
Histogramme
Conclusion :
Les statistiques sont de plus en plus présentes dans les médias de par l’utilisation de tableaux, de diagrammes ou de graphiques. Il est donc important de savoir comment sont recueillies les informations et de comprendre comment sont construites les représentations qu’on nous propose et leur signification. Il faut également assimiler les deux notions essentielles que sont l’effectif et la fréquence d’une valeur. Et toujours garder un œil critique !