Les chaînes de Markov, un outil utile pour créer un modèle d’attribution axé sur les données

Quel est l’impact du référencement payant sur le parcours client ?

Par ARBEN KQIKU

Le monde du du marketing digital évoluant rapidement, vous avez tout intérêt à suivre de près les données de vos parcours clients. Effectivement, c’est ce suivi qui vous permettra d’investir votre budget publicitaire dans les leviers les plus efficaces – tout en bénéficiant d’un rendement optimal. Dans cette optique, vous devez donc être au fait des différents modèles de présentation à votre disposition pour déchiffrer ces données.

Tout professionnel du marketing digital se doit de suivre précisément l’efficacité des investissements média, notamment pour identifier les canaux qui génèrent des conversions. En vue de créer des modèles axés sur les données qui nous permettent d’optimiser les besoins de nos clients, comtogether étudie en permanence de nouvelles méthodes pour exploiter ces données. Notre objectif : en extraire des enseignements utiles et des éclairages innovants sur l’activité précise de nos portefeuilles de marketing digital.

Comment les chaînes de Markov peuvent-elles être utilisées pour une attribution multicanal correcte ?

Parmi toutes les solutions de modélisation que nous proposons pour l’attribution multicanal, les chaînes de Markov sont d’une redoutable efficacité pour extraire des probabilités précises d’une série d’événements séquentiels. Applicable à un très large éventail de domaines, cet outil est ainsi utilisé depuis longtemps dans des secteurs très différents de la recherche, comme la gestion prévisionnelle des stocks, l’innovation dans la gestion des files d’attente dans les aéroports et la conception d’algorithmes de classement des pages dans les moteurs de recherche.

Dans le cadre du marketing digital, nous réalisons des analyses markoviennes sur des ensembles de données de parcours clients et leurs chemins de conversion, ce qui nous permet d’évaluer l’efficacité des canaux en attribuant à chacun une valeur pondérée, notamment pour le résultat souhaité – la conversion. Pour ce faire, nous calculons tout d’abord les probabilités de transition pour chaque canal, puis nous supprimons chacun d’entre eux du parcours afin de calculer l’impact de leur absence – et donc leur importance relative dans la conversion. Étudions ce point de plus près.

Probabilités de transition

Chaque parcours client compte un certain nombre d’étapes pouvant impliquer plusieurs canaux. Partons du principe que dans le cadre d’une campagne, vous assurez le suivi des trois canaux suivants : C1) Réseaux sociaux, C2) Référencement payant, C3) Référencement naturel. Avant toute conversion, un client empruntera au moins l’un de ces trois canaux, ce qui créera un parcours spécifique engendrant des données statistiques plus génériques. En agrégeant les données de tous ces parcours, nous pouvons donc calculer les probabilités de transition – en d’autres termes, la probabilité qu’un client passe de C1 à C2, de C3 à C1, de C2 à C1, etc.

Méthode removal effects

Dans un second temps, nous appliquons la méthode removal effect, qui nous montre l’impact global de la suppression des différentes étapes dans le parcours client. Nous supprimons ainsi tour à tour chaque canal de l’ensemble de données pour calculer l’effet sur les conversions. Combien de conversions perdons-nous si nous supprimons les réseaux sociaux, le référencement payant ou le référencement naturel ? L’agrégation de ces données nous permet dès lors de dresser un tableau exhaustif et précis des parcours clients et d’avoir une valeur correctement pondérée de l’impact de chaque canal sur les conversions.

Nos outils et méthodologies

Nous avons récemment réalisé une analyse markovienne sur un ensemble de données de notre portefeuille, qui comprenait plus de 40 000 parcours clients uniques. Pour ce client spécifique, la conversion souhaitée prenait la forme d’une réservation d’un service logistique. Après avoir construit un pipeline de données brutes entre Google Analytics 360 et Google BigQuery, nous avons créé dans BigQuery un tableau indiquant l’identifiant unique du client, la date à laquelle chaque client s’est rendu sur le site web et le statut de la conversion. Nous nous sommes ensuite appuyés sur le langage de programmation R, utilisé en analyse statistique, pour calculer et intégrer les probabilités de transition et les valeurs d’importance. Enfin, nous avons compilé toutes ces données avec le package de visualisation de données ggplot2 du langage R.

Les résultats que vous pouvez espérer

Les résultats de cette analyse nous ont permis de démontrer précisément l’efficacité de chaque canal. Dans le cas présent, il a été possible de définir le pourcentage de conversion pour chacun d’entre eux : 35,1 % pour le référencement naturel, 38,5 % pour le référencement payant et 23.6 % pour le trafic direct (qui comprend les sources impossibles à déterminer et la saisie directe de l’adresse du site web).

Par ailleurs, ces chiffres nous ont aussi permis de démontrer que le référencement payant est venu renforcer d’autres canaux très performants : il a ainsi contribué directement à 13,39 % des conversions réalisées par le référencement naturel et à 7,29 % des conversions réalisées par le trafic direct.

Obtenir une vision d’ensemble

Dès lors, au moment de choisir une méthode d’attribution des canaux et des ressources dans le cadre de votre stratégie de marketing digital, gardez un élément essentiel à l’esprit : votre modèle actuel ne saisit peut-être pas toutes les nuances intégrées dans les données. Si vous voulez avoir une vision d’ensemble, les chaînes de Markov font partie de l’éventail des méthodes à votre disposition.

Souhaitez-vous connaître le parcours que suivent vos clients avant la conversion sur votre site ? Contactez-nous pour une séance de stratégie gratuite. 

À propos de l'auteur

Arben
Arben graduated with a Master in Psychology. Apart from keeping us in good mental shape, he brings his passion & creativity to data analytics and programs the automations that save our customers valuable time.