Statistiques descriptives
3.1. Statistiques descriptives
Les statistiques descriptives sont des techniques qui permettent de résumer et de décrire les caractéristiques principales d’un ensemble de données. Elles jouent un rôle essentiel dans l'analyse quantitative en fournissant une première compréhension des informations recueillies avant de passer à des analyses plus complexes.
3.1.1. Moyenne, médiane, mode
- Moyenne : C’est la somme de toutes les valeurs divisée par le nombre de valeurs. Elle est très couramment utilisée mais peut être influencée par les valeurs extrêmes.
- Médiane : C’est la valeur centrale d’un ensemble de données ordonnées. Elle n'est pas affectée par les valeurs extrêmes, offrant ainsi une mesure plus robuste de la tendance centrale.
- Mode : C’est la valeur qui apparaît le plus fréquemment dans un ensemble de données. Elle est particulièrement utile pour les données catégorielles.
3.1.2. Variance et écarttype
- Variance : Elle mesure la dispersion des données autour de la moyenne. Une variance élevée indique que les données sont très dispersées, tandis qu’une variance faible indique que les données sont concentrées autour de la moyenne.
- Écarttype : Il s’agit de la racine carrée de la variance. Il est exprimé dans la même unité que les données et est souvent plus intuitif pour comprendre la dispersion des données.
3.1.3. Distribution des fréquences
La distribution des fréquences permet de comprendre comment les valeurs d'un ensemble de données se répartissent. Elle est souvent représentée sous forme de tableaux ou d'histogrammes et fournit une vue d’ensemble de la répartition des données.
- Histogrammes : Utilisés pour représenter la distribution des données numériques.
- Tableaux de fréquences : Ils regroupent les données en catégories et comptabilisent le nombre d’occurrences dans chaque catégorie.
Les statistiques descriptives sont une première étape cruciale dans toute analyse de données. Elles fournissent des informations fondamentales qui peuvent orienter les analyses ultérieures et garantir que les données sont bien comprises avant d'entreprendre des tests plus complexes.