La variance est une mesure de l’écart entre les chiffres d’un ensemble de données. La variance mesure la distance entre chaque nombre de l’ensemble et la moyenne.
En utilisant un tableau de données, nous pouvons observer la relation linéaire entre les différents points de données, ou nombres. Pour ce faire, nous traçons une ligne de régression, qui tente de minimiser la distance entre un point de données individuel et la ligne elle-même. Dans le graphique ci-dessous, les points de données sont les points bleus, la ligne orange est la ligne de régression et les flèches rouges représentent la distance entre les données observées et la ligne de régression.
Lorsque nous calculons un écart, nous nous demandons, compte tenu de la relation entre tous ces points de données, quelle est la distance prévue au point de données suivant? Cette « distance » est appelée le terme d’erreur, et c’est ce que la variance mesure.
En soi, la variance n’est pas souvent utile car elle n’a pas d’unité, ce qui la rend difficile à mesurer et à comparer. Cependant, la racine carrée de la variance est l’écart-type, ce qui est à la fois pratique et une mesure.
Calcul de l’écart dans Excel
Le calcul de la variance dans Excel est facile si vous avez déjà saisi l’ensemble des données dans le logiciel. Dans l’exemple ci-dessous, nous allons calculer la variance de 20 jours de rendements quotidiens du très populaire fonds négocié en bourse (ETF) nommé SPY, qui investit dans le S&P 500.
- La formule est =VAR.S(sélectionner les données)
La raison pour laquelle vous voulez utiliser VAR.S et non VAR.P (qui est une autre formule proposée) est que souvent vous n’avez pas toute la population de données à mesurer. Par exemple, si nous avions tous les rendements de l’historique du SPY ETF dans notre tableau, nous pourrions utiliser la mesure de population VAR.P, mais comme nous ne mesurons que les 20 derniers jours pour illustrer le concept, nous utiliserons VAR.S.
Comme vous pouvez le voir, la valeur de variance calculée de 0,000018674 ne nous dit pas grand-chose sur l’ensemble des données, en soi. Si nous passions à la racine carrée de cette valeur pour obtenir l’écart-type des rendements, cela serait plus utile.