Durée: 12 mois
Rubrique: Responsable ingénierie
Dans cette leçon, nous aborderons les concepts fondamentaux des statistiques descriptives avec un focus particulier sur trois mesures de tendance centrale : la moyenne, la médiane et le mode. Ces mesures sont essentielles pour résumer et comprendre la distribution de vos données.
La moyenne est la somme de toutes les valeurs divisée par le nombre de valeurs. Elle fournit une indication de ce à quoi ressemble une « valeur typique » dans un ensemble de données.
Formule : [ \text{Moyenne} = \frac{\sum{i=1}^{n} xi}{n} ]
La médiane est la valeur centrale qui sépare les données en deux moitiés lorsqu'elles sont ordonnées. Si le nombre de valeurs est pair, la médiane est la moyenne des deux valeurs centrales.
Comment la déterminer : 1. Trier les données dans un ordre croissant. 2. Trouver la valeur centrale.
Le mode est la valeur qui apparaît le plus fréquemment dans un ensemble de données. Il est possible d'avoir plus d'un mode dans une distribution (bimodale, multimodale).
Exemple : Pour les données [ 2, 3, 3, 5, 7 ], le mode est 3 parce qu’il apparaît plus souvent que les autres valeurs.
Ces trois statistiques de base sont à la fondation de toute analyse descriptive. Elles permettent de résumer, comparer et interpréter les données collectées, facilitant ainsi la prise de décision basée sur les données.
Considérons un petit ensemble de données : [ 4, 8, 15, 16, 23, 42 ]
Ces concepts vous aideront à mieux comprendre et à analyser vos données avant de procéder à des techniques d'analyse plus avancées, comme l'analyse exploratoire des données (EDA) et l'analyse prédictive.