Statistiques
Statistiques
I – Rappel :
1/ Etude statistique :
2/ Population statistique :
3/ Caractère :
a- Caractère quantitatif :
b- Caractère qualitatif :
4/ Effectif :
5/ Effectif total :
6/ Effectif cumulé :
7/ Fréquence :
8/ Fréquence cumulée :
9/ Pourcentage :
Pourcentage est le produit de la fréquence par 100.p_{i} = \frac{Effectif}{Effectif \;total} \times 100 = f_{i} \times 100\\
⇒ Remarques importantes :
→ La somme de toutes les fréquences d’une série statistique est égale à 1.
→ La fréquence cumulée d’une valeur est la somme de la fréquence de cette valeur et des fréquences des valeurs précédentes.
→ On a deux types de série statistiques.
∗ discret : En valeurs si le nombre des valeurs est petit et on les range dans l’ordre croissant.
∗ continu : En classes si le nombre des valeurs est élevé et on les regroupe en classes de même amplitude a ≤ x ≤ b
II – Tableau des effectifs, des effectifs cumulés des fréquences et des fréquences cumulés :
1/ Série statistique discrète en valeur :
→ Application 1 :
Le tableau suivant représente une série statistique qui exprime la répartition de 24 adhérent dans un club sportif selon leur âge :
Caractère | 12 | 13 | 14 | 15 | 16 |
Effectif | 5 | 6 | x | 8 | 4 |
Effectif cumulée | 11 | 24 | |||
Fréquence | |||||
Fréquence cumulé |
- La population statistique est 24 adhérent dans un club
- L’unité statistique est un adhérent.
- Le caractère étudié est l’âge de l’adhérent qui est un caractéristique quantitatif discret.
- Le nombre d’adhérents x dont leur âges est 14 ans :
On a l’effectif total est N = 24\\
On a : 5 + 6 + x + 8 + 4 = 24\\
23 + x = 24\\
x = 24 - 23\\
x = 1 - Remplissons le tableau précédent :
Caractère | 12 | 13 | 14 | 15 | 16 |
Effectif | 5 | 6 | x | 8 | 4 |
Effectif cumulée | 5 | 11 | 12 | 20 | 24 |
Fréquence | \frac{5}{24} = 0,26 | \frac{6}{24} = 0,25 | \frac{1}{24} = 0,04 | \frac{8}{24} = 0,33 | 0,17 |
Fréquence cumulé | 0,21 | 0,46 | 0,50 | 0,83 | 1 |
6. On a 0,21 + 0,25 + 0,04 + 0,33 + 0,17 = 1\\
Alors la somme de tous les fréquences est égale à 1
7. Représentation graphique :
a- Diagramme en bâtons :
b- Diagramme à ligne brisée :
(Courbe polygonale)
→ Application 2 :
Une étude statistique a été menée sur le nombre d’enfants dans 20 familles et a donné les résultats suivants :
2 - 3 - 4 - 3 - 0 - 4 - 3 - 2 - 1 - 1 - 2 - 1 - 0 - 2 - 3 - 4 - 1 - 3 - 0 - 1- Donner le tableau des effectifs et des effectifs cumulées de cette serie.
- Calculer la fréquence de la valeur 0
- Calculer le pourcentage de la valeur 0
- Calculer le pourcentage du nombre de familles dont le nombre d’enfant dépasse 2
- Représenter cette série en colonnes.
Solution :
- Le tableau des effectifs et effectifs cumulées
Caractère : nombre d’enfants 0 1 2 3 4 Effectif : nombre de familles 3 5 4 5 3 Effectif cumulée 3 8 12 17 20 - Soit f la fréquence de la valeur 0, donc :
f = \frac{n}{N} = \frac{3}{20} = 0,15 - Le pourcentage de la valeur 0 est :
p = f \times 100 = 0.15 \times 100 = 15% - Le nombre de familles dont le nombre d’enfants dépasse 2 est : n = 5 + 3 = 8\\
Donc le pourcentage est : p = f \times 100 = \frac{n}{N} \times 100 = \frac{8}{20} \times 100 = 40% - Diagramme en colonnes
2/ Série statistique en classes :
→ Application 3 :
Le bilan suivant dans la répartition d’âges des ouvriers dans une ferme.
16 - 26 - 34 - 17 - 22 - 45 - 36 - 27 - 29 - 25 - 19 - 18 - 32 - 42 - 21 - 33 - 35 - 16 - 26 - 34 - 17 - 22 - 38 - 36 - 27 - 29 - 38 - 13 - 18 - 32 - 30 - 39- Déterminer la population de cette série.
- Déterminer le caractère étudie et son type.
- Compléter le tableau suivant :
Age en année [10,20[ [20,30[ [30,40[ [40,50[ Centre de classe Effectif : nombre d’ouvriers - Combien d’ouvriers dans la ferme ?
- Calculer le pourcentage des ouvriers dont l’âge et inférieur à 20 ans.
- Calculer la fréquence de la classe [30,40[
- Construire l’histogramme de la répartition des ouvriers de la ferme selon les classes de leurs âges.
⇒ Solution :
- La population est les ouvriers de la ferme.
- La caractère statistique est l’âge d’ouvrier et c’est une caractère quantitatif continu.
-
Age en année [10,20[ [20,30[ [30,40[ [40,50[ Centre de classe \frac{12 + 20}{2} = 15 25 35 45 Effectif : nombre d’ouvriers 8 10 12 2 - Le nombre d’ouvrier dans la ferme est :
N = 8 + 10 + 12 + 2 = 32 - Le nombre d’ouvriers dont l’âge est inférieur à 20 ans est n = 8\\
Donc leur pourcentage est :
p = \frac{n}{N} \times 100 = \frac{8}{32} \times = 25%\\ - La fréquence f de la classe [30,40[ est :
f = \frac{n}{N} \times 100 = \frac{12}{32} \times = 0,375\\ - Si la répartition est sous forme de classes [a,b[ ou d’intervalles a ≤ x ≤ b, on emploie un histogramme
⇒ Diagramme circulaire :
Convenable pour les caractères qualitatifs.
Un diagramme circulaire est un diagramme qui a la forme d’un disque décomposé en secteurs dont les mesures des angles sont proportionnelles aux effectifs (et également aux fréquences)
Mésure \; de \; l'angle = \frac{Effectif}{Effectif \; total} \times 360°\\ = fréquence \times 360°\\ = \frac{pourcentage}{100} \times 360°III – Les paramètres de position :
1/ Le mode :
a- Définition :
b- Exemples :
→ Exemple 1 : Regarde Application 1
Caractère | 12 | 13 | 14 | 15 | 16 |
Effectif | 5 | 6 | 1 | 8 | 4 |
On a le plus grand effectif est 8 et sa valeur est 15
Donc le mode de cette série est 15
→ Exemple 2 :
Caractère (coefficient) | 1 | 2 | 3 | 5 |
Effectif nombre de matières) | 3 | 2 | 2 | 3 |
Pour cette série, le plus grand effectif est 3, correspondant aux valeurs 1 et 5, donc cette série admet deux modes 1 et 5.
→ Exemple 3 :
Les longueurs de 8 élèves en cm sont :
61 - 68 - 67 - 73 - 66 - 64 - 59 - 70Existe-t-il une valeur plus fréquente que d’autres dans ces données ?
La réponse est non.
Donc cette série n’admet pas de mode.
∗ Série en classes :
⇒ Définition :
⇒ Exemple :
On considère la série suivante :
Classe | [120,130[ | [130,140[ | [140,150[ | [150,160[ |
Effectif | 9 | 11 | 12 | 18 |
Le plus grand effectif est 18, correspond à la classe [150,160[, donc la classe modale est [150,160[
Remarque :
Une série statistique ne peut pas avoir un mode (classe modale), comme elle peut avoir plusieurs modes (classes modale)
2/ La moyenne arithmétique :
a- Définition :
Remarque :
La moyenne arithmétique m est égale au rapport de la somme de toutes les valeurs sur l’effectif total.
C’est à dire c’est la valeur obtenu si toutes les valeurs du caractère sont égaux.
b- Exemples :
∗ Série en valeurs :
→ Exemple 1 :
Regarde l’application 2 :
On a : m = \frac{(0 \times 3) + (1 \times 5) + (2 \times 4) + (3 \times 5) + (4 \times 3)}{20}\\
m = \frac{0 + 5 + 8 + 15 + 12}{20} = 2Donc 2 est la moyenne du nombre d’enfants dans chaque famille.
→ Exemple 2 :
On considère la série suivante :
Caractère (coefficient) | 1 | 2 | 3 | 5 |
Effectif (nombre de matières) | 3 | 2 | 2 | 3 |
∗ Série en classes :
→ Règle :
Si a ≤ x < b est une classe d’une série, alors son milieu est \frac{a + b}{2}∗ Pour calculer la moyenne d’une série statistique en classes, on utilise la définition précédente en remplaçant les valeurs par les centres des classes.
→ Exemple :
Regarde l’application 3 :
Age (années) | [10,20[ | [20,30[ | [30,40[ | [40,50[ |
Centre de classe | \frac{10 + 20}{2} = 15 | 25 | 35 | 45 |
Effectif : nombre d’ouvrier | 8 | 10 | 12 | 2 |
Alors la moyenne d’âges des ouvriers est 27.5 et cela signifie que si on a supposé que tous les ouvriers, ont le même âge,
L’âge de chaque ouvrier va être 27,5 ans.
3/ La médiane :
a- Définition :
b- Exemples :
∗ Série en valeurs :
Regarde l’application 1 :
Caractère | 12 | 13 | 14 | 15 | 16 |
Effectif | 5 | 6 | 1 | 8 | 4 |
Effectif cumulé | 5 | 11 | 12 | 20 | 24 |
- La moitié de l’effectif totale est \frac{50}{2} = 25
- Le premier effectif cumulé supérieur ou égale à 25 est 32, correspond à la classe [140,150[
Donc la médiane de cette série se trouve dans la classe [140,150[
Remarque :
On peut dire que 145 (centre de la classe [140,150[) est la médiane de cette série statistique.
c- Autre définition : médiane
La médiane d’une série statistique, dont les valeurs sont ordonnées, est la valeur du caractère qui partage la série en deux parties de même effectif.
→ Cas 1 : effectif total N est impaire
∗ Exemple :
Nombre d’absences pendant 7 jours d’ouvriers d’une société sont : 3 - 1 - 2 - 0 - 4 - 2 - 3
On les range dans l’ordre croissant :
0 - 1 - 2 – 2 – 3 - 3 - 4
Donc la médiane est 2
→ Cas 2 : N est pair
∗ Exemple :
Nombre d’absences pendant 8 jours ordonné :
0 - 1 - 1 - 2 – 3 - 4 - 4 - 5\\
M = \frac{2 + 3}{2} = \frac{5}{2} = 2,5\\On peut prendre comme médiane tout nombre compris entre 14 et 16 d’où la médiane de cette série est : 2,5
VI – La dispersion :
1/ Définition :
2/ Exemple :
On considère le tableau suivant :
Devoir | D_{1} | D_{2} | D_{3} | 1D_{4}5 | D_{5} |
Notes de Sabrine | 9 | 14 | 10 | 13 | 14 |
Notes de Saad | 8 | 16 | 10 | 17 | 9 |
– Moyenne de Sabrine :
m_{1} = \frac{9 + 14 + 10 + 13 + 14}{5} = \frac{60}{5} = 12\\– Moyenne de Saad :
m_{2} = \frac{8 + 16 + 10 + 17 + 9}{5} = \frac{60}{5} = 12\\Donc m_{1} = m_{2}
C’est à dire Sabrine et Saad ont même moyanne.
On remarque que les notes de Sabrine sont plus proches de la moyenne 12 que celle de Saad
On dit que : les notes de Sabrine sont moins dispersés que les notes de Saad.