
La description d’un ensemble de données repose sur l’utilisation de statistiques descriptives, lesquelles constituent un ensemble de méthodes destinées à résumer, organiser et présenter les informations contenues dans les données observées, sans recourir à une énumération exhaustive de celles-ci. Ces statistiques se déclinent généralement sous deux formes complémentaires :
○des représentations graphiques (telles que les histogrammes, diagrammes en bâtons ou courbes), qui permettent une visualisation intuitive de la distribution des valeurs ;
○et indices statistiques qui condensent les caractéristiques essentielles de la distribution.
Parmi ces indices, les plus couramment utilisés sont les mesures de tendance centrale (moyenne, médiane, mode), les mesures de dispersion (étendue, variance, écart-type) ainsi que les indicateurs de corrélation, permettant d’apprécier les relations entre variables. Pour les échelles d’intervalle ou de rapport, il est en outre possible de calculer des paramètres de forme de la distribution, tels que le coefficient d’asymétrie (skewness) et le coefficient d’aplatissement (kurtosis), qui fournissent des informations complémentaires sur la structure des données.