L’analyse de cohorte : définition et exemples
Et si vous analysiez enfin le comportement de vos utilisateurs ou la conversion de vos leads de la bonne façon ? Découvrez l'analyse de cohorte, illustrée par des exemples concrets.
Pour analyser l’évolution d’un groupe d’utilisateurs ou de leads dans le temps, tout professionnel devrait maîtriser l’analyse de cohorte. Marketing, produit, finance, ventes, il n’y a pas un métier qui passe à la trappe.
L’objectif de cet article est de vous expliquer les bases de l’analyse de cohorte pour vous aider à comprendre en quoi elle est essentielle et comment elle peut vous aider à prendre de meilleures décisions.
Mais commençons d’abord par une définition. Une cohorte est un groupe d’éléments qui partagent une ou plusieurs caractéristiques communes. Historiquement, c’était une unité tactique de base de la légion romaine (environ 600 hommes, soit un dixième de la légion).
On peut par exemple parler d’une cohorte d’humains, d’une cohorte de moutons… Bref, vous avez compris l’idée.
Dans un univers professionnel et plus proche de nos sujets, une cohorte peut être :
La notion d’analyse de cohorte est utilisée très régulièrement en data analyse, et notamment dans le calcul de la rétention produit. Pourquoi ? Parce que la cohorte permet d’appréhender si le produit / service proposé s’améliore dans le temps et donc si le travail des équipes produit porte ses fruits.
Prenons l’exemple de Shapr.
Partons du principe que l’un des KPIs que l’équipe produit doit suivre et améliorer est le taux de conversion d’un utilisateur gratuit en utilisateur payant. En effet, a priori, plus la proportion de gens qui payent un abonnement est grande, plus l’entreprise gagne de l’argent (toute chose égale par ailleurs).
Si nous n’avions pas la notion d’analyse de cohorte, comment concrètement pourrions-nous calculer chaque semaine ce taux de conversion au premium et donc mesurer son évolution ? En divisant le nombre de nouveaux abonnés premium d’une semaine donnée par le nombre de nouveaux inscrits d’une semaine donnée ? Ou par le nombre d’actifs d’une semaine donnée ?
Le problème, c’est qu’en faisant cela, nous mélangeons les torchons et les serviettes. En effet, si l’on compte tous les nouveaux abonnés premium d’une semaine donnée, vous aurez évidemment parmi eux des nouveaux utilisateurs de Shapr (au sens où ils viennent de s’inscrire) mais vous aurez aussi des utilisateurs qui se sont inscrits il y a 2 semaines, 1 mois, 6 mois…
Or ceux-ci auront eu une expérience du service complètement différente depuis leur inscription, ils se seront peut être inscrits sur un produit avec une interface différente, auront déjà rencontré des gens… Et dans ce cas, est-il pertinent de mélanger ces cohortes d’utilisateurs différents pour calculer leur taux de conversion ?
De plus, en raisonnant de la sorte, nous omettons intellectuellement la notion de temps de conversion au premium, ô combien importante pour l’entreprise et l’équipe produit. En effet, il est beaucoup plus intéressant pour une entreprise de parvenir à convertir rapidement les utilisateurs gratuits en utilisateurs payants pour maximiser ses chances de faire des revenus.
Le Data Analyst suit donc le taux de conversion au premium en regroupant ses utilisateurs par date d’inscription (= “une cohorte par date d’inscription”). Il lui est alors possible de mesurer si l’expérience produit s’est améliorée du point de vue de la conversion au premium, toute chose égale par ailleurs.
Attention enfin, les chiffres de cohorte que vous observez sont susceptibles d’évoluer (s’ils ne sont pas figés dans le temps).
Par exemple, si vous regardez combien de personnes sont passées premium parmi les utilisateurs inscrits en février 2020 sur votre service, les chiffres vont sûrement varier si vous les regardez en février 2020 ou en juin 2020.
Une des manières de vous prémunir de ce genre d’erreur est alors de figer dans le temps les KPIs que vous observez en cohorte. Au lieu de regarder le taux de conversion global d’une cohorte, vous pourrez regarder le taux de conversion à 7 jours, 14 jours, 30 jours…
Pour illustrer l’analyse de cohorte sur le cas Shapr, prenons des données chiffrées fictives.
Imaginons que vous ayez un produit freemium : les utilisateurs ont accès gratuitement au service, puis peuvent opter pour la version premium. C’est souvent le cas pour des applications B2C – Spotify ou Tinder par exemple.
L’indicateur-clé dans ce type de business model est donc le taux de conversion des inscrits gratuits en inscrits payants.
Si on n’utilisait pas l’analyse de cohorte, on utiliserait une formule de ce type : nombre d’inscrits payants / nombre d’inscrits gratuits x 100.
Si l’on prend les données de la semaine 28, on aurait donc : 40/100*100 = 10%.
Mais dans la réalité, ce ne sont pas forcément pas forcément 40 inscrits gratuits de la semaine 28 qui ont tout de suite convertis.
Si l’on complète notre analyse :
Parmi les 40 personnes qui ont acheté l’abonnement la semaine 28 ****:
Parmi les 400 personnes qui se sont inscrites la semaine 28 ****:
On change donc la question pour : “Parmi les inscrits gratuits d’une période donnée, combien sont devenus des inscrits payants ?”
Si l’on reprend les chiffres de l’exemple, pour calculer le taux de conversion de la semaine 28, nous allons prendre les 20 personnes s’étant abonnées en semaine 28, mais aussi les 30 de la semaine 29 et les 10 de la semaine 30.
Ce qui fait : 60/400×100 = 15%.
Pour découvrir les KPIs de base utilisés en data analyse, s’initier au langage SQL, maîtriser Google Data Studio et apprivoiser les APIs, découvrez la formation Emil à la Data Analyse.