Les statistiques

Introduction :

La statistique est une science qui étudie les données recueillies lors d’une enquête ou d’une série de mesures. Au cycle 3, nous avons appris à trier des informations recueillies et vu rapidement les différentes représentations graphiques de données. En 5e, nous allons consolider ces connaissances tout en intégrant de nouvelles notions comme l’effectif et la fréquence.

Nous commencerons ce cours par un point sur le vocabulaire des statistiques, puis nous définirons les notions d’effectif et de fréquence. Nous enchaînerons ensuite par les méthodes d’organisation et de représentations de résultats pour lire et interpréter des données.

Vocabulaire et définitions

Vocabulaire

La liste des données collectées lors d’une enquête ou d’une série de mesures est appelée série de données statistique. Étudier une série statistique, c’est étudier un caractère dans une population :

  • la population est l’ensemble des individus étudiés ;
  • le caractère est le type de mesure que l’on recueille ; il peut être qualitatif (couleur des yeux, marque de la voiture, du téléphone portable) ou quantitatif (poids, nombre de voitures au domicile, temps passé au téléphone) ;
  • les valeurs sont les valeurs prises par ce caractère.
bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e.

Voici la série des $25$ données que nous avons recueillies :

marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron

  • La population étudiée est une classe de 5e.
  • Le caractère étudié est la couleur des yeux.
  • C’est un caractère qualitatif.
  • Les valeurs possibles du caractère sont : bleu, gris, marron, noir, noisette et vert ($6$ valeurs).

Effectif et effectif total

bannière definition

Définition

Effectif d’une valeur :

L’effectif d’une valeur du caractère est le nombre de fois que cette valeur apparaît dans la liste, c’est-à-dire le nombre d’individus qui possèdent cette valeur du caractère.

bannière definition

Définition

Effectif total :

L’effectif total de la série est le nombre total d’individus de la population étudiée, c’est-à-dire la somme des effectifs.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e.

Voici la série des $25$ données que nous avons recueillies :

marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron

Dans cette série de données statistique :

  • l’effectif de la valeur « bleu » est $8$ (« bleu » apparaît $8$ fois dans la liste ; $8$ élèves ont les yeux bleus) alors que l’effectif de la valeur « noir » est $1$ (« noir » apparaît $1$ fois dans la liste ; $1$ seul élève a les yeux noirs) ;
  • l’effectif total est le nombre d’élèves interrogés, soit $25$.

Fréquence d’une valeur

bannière definition

Définition

Fréquence d’une valeur :

La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total, soit :

$$\text{Fréquence d’une valeur}=\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}}$$

bannière propriete

Propriété

  • La fréquence d’une valeur est un nombre compris entre $0$ et $1$.
  • La somme de toutes les fréquences est égale à $1$.

La fréquence peut être laissée sous forme de fraction, ou donnée sous forme décimale ou de pourcentage.
Sous forme de pourcentage, la valeur de la fréquence devient :

$$\dfrac{\text{Effectif de la valeur}}{\text{Effectif total}} \times 100\,\%$$

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e.

Voici la série des $25$ données que nous avons recueillies :

marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron

Dans cette série de données statistiques, la fréquence de la valeur « bleu » est :

$$\dfrac{\text{Effectif de la valeur «\ bleu\ »}}{\text{Effectif total}}=\dfrac{8}{25}=0,32=32\,\%$$

La fréquence de la valeur « bleu » dans cette classe de 5e est $0,32$.

  • Autrement dit, $32\,\%$ des élèves de cette classe ont les yeux bleus.

Organiser et représenter des données pour lire et interpréter des résultats

Organisation des données sous forme de tableau

Les résultats d’une étude statistique sont le plus souvent rassemblés dans un tableau de données.

bannière definition

Définition

Tableau de données :

Un tableau de données permet de rassembler et d’organiser des données afin de faciliter la lecture et l’interprétation des informations.

bannière à retenir

À retenir

Un tableau de données regroupe les valeurs, les effectifs, voire les fréquences de la série statistique.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e.

Voici la série des $25$ données que nous avons recueillies :

marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron

Pour cette étude, en relevant les effectifs de chacune des valeurs du caractère, puis en calculant leur fréquence (comme nous l’avons fait pour la valeur « bleu »), nous obtenons les résultats que nous avons rassemblés dans le tableau de données ci-dessous :

Couleur des yeux

Bleu Gris Marron Noir Noisette Vert Total

Effectifs

$\footnotesize 8$ $\footnotesize 1$ $\footnotesize 11$ $\footnotesize 1$ $\footnotesize 2$ $\footnotesize 2$ $\footnotesize 25$

Fréquences
(sous forme de quotient)

$\footnotesize \dfrac{8}{25}$ $\footnotesize \dfrac{1}{25}$ $\footnotesize \dfrac{11}{25}$ $\footnotesize \dfrac{1}{25}$ $\footnotesize \dfrac{2}{25}$ $\footnotesize \dfrac{2}{25}$ $\footnotesize \dfrac{25}{25}$

Fréquences
(sous forme décimale)

$\footnotesize 0,32$ $\footnotesize 0,04$ $\footnotesize 0,44$ $\footnotesize 0,04$ $\footnotesize 0,08$ $\footnotesize 0,08$ $\footnotesize 1$

Fréquences
(sous forme de pourcentage)

$\footnotesize 32\,\%$ $\footnotesize 4\,\%$ $\footnotesize 44\,\%$ $\footnotesize 4\,\%$ $\footnotesize 8\,\%$ $\footnotesize 8\,\%$ $\footnotesize 100\,\%$

Représentations graphiques

Pour illustrer graphiquement les résultats d’une étude statistique, il existe plusieurs types de représentations, sous forme de diagrammes ou de graphiques.

Diagramme en bâtons

bannière definition

Définition

Diagramme en bâtons :

Un diagramme en bâtons est composé de bâtons (ou de barres) de même largeur dont la hauteur est proportionnelle à l’effectif.

bannière à retenir

À retenir

Un diagramme en bâtons représente une série statistique en illustrant la répartition des effectifs.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e.

Voici la série des $25$ données que nous avons recueillies :

marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron

Nous avons plus haut donné les effectifs pour chaque couleur de yeux :

Couleur des yeux

Bleu Gris Marron Noir Noisette Vert Total

Effectifs

$8$ $1$ $11$ $1$ $2$ $2$ $25$

On peut ainsi représenter cette étude par le diagramme suivant :

Diagramme en bâtons Diagramme en bâtons

Un seul coup d’œil suffit pour voir, par exemple :

  • que les élèves aux yeux marron sont les plus nombreux (c’est le bâton le plus haut) ;
  • il y a autant d’élèves qui ont les yeux noisette que d’élèves qui ont les yeux verts (les deux bâtons ont la même hauteur).

Diagramme circulaire

bannière definition

Définition

Diagramme circulaire :

Un diagramme circulaire est un disque partagé en secteurs circulaires dont l’angle est proportionnel à l’effectif.

bannière à retenir

À retenir

Un diagramme circulaire représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.

On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque secteur circulaire.

MÉTHODOLOGIE :
Pour calculer la valeur de l’angle de chaque secteur circulaire, on multiplie la valeur de la fréquence concernée par la valeur de l’angle de la totalité du disque, soit $360\degree$.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e.

Voici la série des $25$ données que nous avons recueillies :

marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron

Nous avons plus haut donné la fréquence de chaque couleur (nous utiliserons ici les pourcentages, mais toutes les formes sont possibles) :

Couleur des yeux

Bleu Gris Marron Noir Noisette Vert Total

Fréquences

$32\,\%$ $4\,\%$ $44\,\%$ $4\,\%$ $8\,\%$ $8\,\%$ $100\,\%$

Pour calculer la mesure de l’angle du secteur circulaire représentant la proportion d’yeux bleus, on calcule $32\,\%$ de $360\degree$ :

$$\dfrac{32}{100}\times 360\degree = 115,2 \degree$$

  • On procède de la même manière pour calculer les autres mesures d’angle, et on obtient le diagramme :

Diagramme circulaire Diagramme circulaire

Remarque :
On utilise parfois un diagramme semi-circulaire, c’est-à-dire un demi-disque au lieu d’un disque.

  • Pour obtenir les mesures d’angles, logiquement, on multiple cette fois les fréquences par $180\degree$ (soit la moitié de $360\degree$).

Diagramme à bandes

bannière definition

Définition

Diagramme à bandes :

Un diagramme à bandes est une bande rectangulaire partagée en bandes dont la longueur est proportionnelle à l’effectif.

bannière à retenir

À retenir

Un diagramme à bandes représente une série statistique en illustrant les proportions des effectifs, soit la fréquence de chaque valeur du caractère étudié.

On peut inclure la valeur de cette fréquence (en pourcentage) à l’intérieur de chaque bande.
Un classement par ordre décroissant (ou croissant) de cette proportion facilite la lecture du diagramme.

MÉTHODOLOGIE :

Pour calculer la longueur de chaque bande, on multiplie la valeur de la fréquence concernée par la longueur de la totalité de la bande.

bannière exemple

Exemple

Étude 1 :
On a relevé la couleur des yeux des $25$ élèves d’une classe de 5e.

Voici la série des $25$ données que nous avons recueillies :

marron – marron – bleu – marron – gris – bleu – bleu – noisette – marron – marron – bleu – noir – marron – vert – marron – marron – bleu – vert – marron – bleu – bleu – noisette – marron – bleu – marron

Reprenons le tableau avec les fréquences :

Couleur des yeux

Bleu Gris Marron Noir Noisette Vert Total

Fréquences

$32\,\%$ $4\,\%$ $44\,\%$ $4\,\%$ $8\,\%$ $8\,\%$ $100\,\%$

On choisit une bande de longueur totale $15\text{ cm}$.
Pour calculer la longueur de la bande représentant la proportion d’yeux marron, on calcule $44\,\%$ de $15\text{ cm}$, soit :

$$\dfrac{44}{100}\times 15 = 6,6\text{ cm}$$

  • On procède de la même manière pour calculer les autres longueurs de bande, et on obtient le diagramme :

Diagramme à bandes Diagramme à bandes

Graphique

bannière definition

Définition

Graphique :

Un graphique représente une série statistique en illustrant l’évolution d’une grandeur $G_1$ par rapport à une grandeur $G_2$.

bannière exemple

Exemple

Le graphique suivant représente les précipitations tombées à Carcassonne chaque mois de l’année 2021. Autrement dit, on voit l’évolution des précipitations à Carcassonne en fonction du mois.

  • Sur l’axe horizontal (appelé axe des abscisses), on a mis la grandeur $G_2$, ici le mois.
  • Sur l’axe vertical (appelé axe des ordonnées), on a mis la grandeur $G_1$, ici les précipitations.

Img-04 Graphique représentant les précipitations à Carcassonne en 2021 (Données : Infoclimat)

Ce graphique permet de bien se rendre compte de l’évolution des précipitations tout au long de l’année, avec ses « creux » et ses « pics ».
Il permet ainsi de repérer d’un seul coup d’œil :

  • le mois le plus sec : mars, avec un peu moins de $10\ \text{mm}$ de précipitations ;
  • le mois où il a plu le plus : novembre, avec environ $135\ \text{mm}$.

Approfondissement : regroupement par classes

Dans une série de données numériques, lorsque les valeurs sont diverses et nombreuses, on peut regrouper les valeurs par classes.

  • Pour comprendre comment on procède, nous allons traiter un exemple.

Étude 2 :
Nous avons demandé aux mêmes 25 élèves de 5e le temps qu’ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d’heures :

$2$ – $4$ – $0$ – $0,5$ – $1,5$ – $2$ – $2,5$ – $3$ – $2,5$ – $0$ – $0,75$ – $4$ – $4,75$ – $3$ – $1,5$ – $1$ – $2$ – $3,5$ – $1,5$ – $1$ – $2,5$ – $3,5$ – $2$ – $2,5$ – $2$

Vu le nombre et la disparité des réponses, nous pouvons choisir de les regrouper par classes de $1$ heure.

  • On dit que les classes ont une amplitude de $1$ heure.
bannière definition

Définition

Amplitude d’une classe :

L’amplitude d’une classe est le différence entre sa plus grande valeur et sa plus petite.

Soit donc $n$ le nombre d’heures de sport par semaine.
Les $5$ classes de valeurs obtenues sont :

$$\begin{aligned} 0\leq &\ n<1 \\ 2\leq &\ n<3 \\ 3\leq &\ n<4 \\ 4\leq &\ n<5 \end{aligned}$$

Ainsi, par exemple, l’effectif de la classe $\red{2\leq n<3}$ est $9$ : dans la série de données ci-dessus, il y a $9$ valeurs qui sont supérieures ou égales à $2$ et strictement inférieures à $3$ :

$\red 2$ – $4$ – $0$ – $0,5$ – $1,5$ – $\red 2$ – $\red {2,5}$ – $3$ – $\red {2,5}$ – $0$ – $0,75$ – $4$ – $4,75$ – $3$ – $1,5$ – $1$ – $\red 2$ – $3,5$ – $1,5$ – $1$ – $\red {2,5}$ – $3,5$ – $\red 2$ – $\red {2,5}$ – $\red 2$

  • En relevant de la même manière les effectifs pour les autres classes de valeurs, puis en calculant leur fréquence, voici le tableau de données que nous pouvons établir :

$n$ = nombre d’heures de sport par semaine

$\small 0\leq n<1$ $\small 1\leq n<2$ $\small 2\leq n<3$ $\small 3\leq n<4$ $\small 4\leq n<5$ Total

Effectifs

$4$ $5$ $9$ $4$ $3$ $25$

Fréquence
(sous forme de quotient)

$\dfrac{4}{25}$ $\dfrac{5}{25}$ $\dfrac{9}{25}$ $\dfrac{4}{25}$ $\dfrac{3}{25}$ $\dfrac{25}{25}$

Fréquence
(sous forme décimale)

$0,16$ $0,2$ $0,36$ $0,16$ $0,12$ $1$

Fréquence
(sous forme de pourcentage)

$16\,\%$ $20\,\%$ $36\,\%$ $16\,\%$ $12\,\%$ $100\,\%$

Pour représenter graphiquement ces données regroupées par classes, on utilise un histogramme, qui ressemble, en quelque sorte, à un diagramme en bâtons.

bannière definition

Définition

Histogramme :

Dans un histogramme, les rectangles représentant les effectifs sont accolés, et leurs aires sont proportionnelles aux effectifs des classes.

bannière à retenir

À retenir

Au collège, nous allons travailler uniquement avec des classes de même amplitude. Dans ce cas :

  • les largeurs des rectangles sont égales (puisque les classes ont la même amplitude) ;
  • les hauteurs des rectangles sont alors proportionnelles aux effectifs des classes.

Dans notre exemple, en nous servant du tableau des effectifs que nous avons réalisé, nous pouvons construire l’histogramme suivant :

Histogramme mathématiques cinquième Histogramme

Conclusion :

Les statistiques sont de plus en plus présentes dans les médias de par l’utilisation de tableaux, de diagrammes ou de graphiques. Il est donc important de savoir comment sont recueillies les informations et de comprendre comment sont construites les représentations qu’on nous propose et leur signification. Il faut également assimiler les deux notions essentielles que sont l’effectif et la fréquence d’une valeur. Et toujours garder un œil critique !