Le marketing de contenu orienté données

December 18, 2023
Sébastien MOUGEL
Sébastien MOUGEL (CEO Beyond1)

AI and Software Engineer : LinkedIn

Photo by Lukas @goumbik

Le content marketing et ses objectifs

Il n’existe pas définition claire et précise du content marketing (Elle diffère chez les anglos-saxons). Nous proposons ici d’observer son champ d’application et ses objectifs. En effet la difficulté à définir le content marketing réside dans le fait que cette discipline se trouve à l’intersection de plusieurs domaines : le SEO, le branding, la communication, la définition d’une ligne éditoriale et sert plusieurs objectifs : véhiculer une image de marque, attirer des leads, générer des ventes auprès d’une audience plus ou moins large, générer du trafic.

Une chose est certaine, le content marketing repose sur du contenu qui peut revêtir différentes formes :

  • Une page web
  • Un livre blanc
  • Un cas d’étude
  • Une vidéo
  • Une communication sur les réseaux sociaux
  • Un webinaire

Et s’inscrit dans différentes temporalités :

  • Éphémère ( une communication sur les réseaux sociaux)
  • Intemporelle (Contenu evergreen)
  • Actualité / News (Contenu périssable)

Ce contenu à pour vocation à toucher une cible (B2B, B2C, etc.) en répondant à ses besoins, en éveillant ses centres d’intérêts, en piquant sa curiosité ou en suscitant sa réflexion.

Traditionnellement, le marketing de contenu s’effectue par une étude préalable de son audience via la définition des personnas. Ces personnas permettent « en théorie » de bien cerner les attentes / envies et besoins des utilisateurs. En théorie seulement... En effet, on constate que :


Carte sémantique d'un e-commerce : seulement 20% du contenu (en rouge) a permis de générer au moins une vente.

80% du contenu produit sur un site web ne permet pas d’atteindre l’objectif fixé
( Réalisation d’une vente, demande de devis, demande de RDV etc.)

Cela pousse de nombreux marketeurs à s’interroger si nous sommes à même de deviner les attentes de notre cible ? Dans ces conditions, comment pouvons-nous produire du contenu pertinent sans gaspiller d’énormes moyens ?

Une des clés réside dans le fait de revenir à des fondamentaux. Sommes-nous capable de comprendre notre cible sur la base de devinettes ? La réponse est NON ! Nous devons donc guider nos choix par des faits concrets et de la DATA.

Quels sont les avantages du content marketing guidé par la data ?

Un des avantages majeur est que nous passons de l’empirisme à des choix basés sur des données collectées.


Extrait de la Google Search Console : on peut extraire le volume de clics et d'impressions réalisés au cours d'une période donnée.

Exemple :

Je décide de rédiger un article sur tel sujet car les données de la Google Search Console m’indiquent que ce sujet est :

  • Recherché par les internautes avec tel volume mensuel / journalier
  • Le contenu actuel est très peu cliqué
  • Il s’agit d’un mot clé longue traîne (mot clé très précis)

Nos choix éditoriaux seront dorénavant guidés par des métriques : volume de recherche, nombre de clics, CTR, volume de vente, nombre de devis demandés.

Avant, nous nous décidions sur la base de ce que l’on pressentait...maintenant, on parle de clics, de volume de vente et de temps de lecture. Nos équipes comprennent nos choix et nous sommes alignés.

Un autre avantage est que cela permet d’avoir un langage commun. Les discussions autour du plan éditorial passent de : “J’ai l’impression que cette attente est forte chez nos consommateurs” à “Les internautes ont recherché 524 fois : canapé en cuir noir avec méridienne” et “12 fois : canapé en simili cuir beige”.

Autre cas concret :

Je focalise mes actions (rédactionnelle) la ou ça marche !

Je constate que certains type de contenus ne génèrent pas de vente sur mon site web. Par contre cette thématique permet de réaliser 20% des ventes. Je décide de capitaliser sur ce constat pour focaliser mes efforts de production de contenu sur le thème adéquat.

Comment mettre place une stratégie de content marketing basée sur la data ?

Comme nous venons de le voir, cela peut remettre en cause ses processus décisionnels et de redéfinir parfois ses objectifs.

Exemple : Avant je faisais du SEO pour avoir du trafic.

J’utilise les outils SEO du marché pour avoir des idées de mots clés. J’ai rédigé 200 articles et les performances sont au rendez-vous : nous avons multiplié par 3 notre audience. J’ai présenté les chiffres au board qui semble satisfait à l’exception du CFO. Il nous fait remarquer que nos coûts d’infrastructure IT dérapent (achat de serveur pour l’hébergement web), que notre production de contenu est onéreuse, que le ROI de notre production n’est clairement pas atteint... Nos ventes ont à peine progressé. Nous aurions du investir nos efforts d’acquisition sur du SEA avec des résultats plus immédiat !

Ou se situe le problème ?

Le CFO nous fait remarquer une énième fois que la générer de la marge est le nerf de la guerre. En focalisant les efforts SEO sur l’acquisition du trafic cela s’est fait au détriment de la marge.

Comment corriger le problème ? En redéfinissant l’objectif : l’augmentation des ventes !

Comment atteindre cet objectif ?

Le processus à mettre en place se décompose en 3 parties :

  1. Définir les données à collecter
  2. Analyser les données
  3. Établir un plan d’action

On peut résumer ce processus de manière succincte: on se sert des données du passé pour définir nos actions à venir afin d’atteindre un objectif donné. A l’aide des résultats obtenus nous pourrons à nouveau itérer et nous inscrire dans un processus d’amélioration continue.

Prenons l’exemple d’un CMO dont l’objectif est d’accroître les ventes par le levier SEO. Voici ce qu’il peut faire :

Enjeu : Connaître les contenus SEO qui génèrent des ventes


SEOCopilot : Extrait des contenus (pages) qui génèrent des ventes

Action à mettre en place : Demander au service IT d’intégrer une solution de suivi des conversions SEO (Tracking).

Résultats :

L’idée est de connaître quelle page d’entrée de mon site web (issus d’une recherche Google) a déclenché ensuite un acte d’achat. (L’analyse du parcours client complet est également un sujet très intéressant mais délicat à mettre en place)

La collecte de cette donnée nous permet d’isoler le contenu qui mène à une vente de celui qui ne convertit pas. Cette donnée est actionnable : je décide de continuer à écrire du contenu dans cette thématique ou non.

Outils gratuits disponibles : Google Analytics 4,Matomo, SEOCopilot.

Enjeu : Savoir ce que les internautes veulent / recherchent

Action à mettre en place : Demander au service IT de créer un compte pour accéder à la google search console.

Résultats : La Google Search Console permet de collecter des renseignements précis sur les recherches qui permettent d’aboutir sur votre site web et également des recherches avec des thèmes proches. Autre intérêt, vous découvrez qu’une page apparaît de nombreuses fois dans les résultats de recherche mais le “snippet” proposé par Google n’incite pas au click.

Action corrective : Retravailler le titre et la balise meta description pour rendre le contenu plus attractif.

Enjeu : Connaître le comportement des internautes sur son site web

Action à mettre en place : Surveillance de ces KPIs : (Temps de lecture, taux de rebond et lien cliqué)

Outils : GA4, SEOCopilot, HotJar

Résultats : Ces KPIs pourront vous mettre sur la piste d’un contenu qui serait éventuellement non pertinent. Plusieurs action peuvent en découler : ré-écriture d’un article, actualisation, complétion, enrichissement sémantique.

Quelles sont les difficultés ?

Elles sont de plusieurs natures.

Introduire la culture data : C’est probablement le point le plus difficile car le facteur humain est ici en jeu. Des actions de formation pourront être envisagées en amont afin d’aligner ses équipes sur cette vision « Data Driven Marketing »

La mise en place des outils de mesure, analytics, plan de taggage : Ce sont des chantiers qui peuvent être plus ou moins compliqués en fonction du niveau technique de ses équipes et de la diversité / quantité de contenu présent sur le site et des CMS employés. Heureusement les outils se sont simplifiés mais sont souvent morcelés : un outils pour faire ceci, un autre pour faire cela. Néanmoins certains outils proposent une vision SEO centric et pleinement intégrés (Connexion à la search console, intégration du tracking de contenu).

Les erreurs à éviter

1) Se tromper sur ses objectifs !

Exemple : Acquisition de trafic ou croissance des ventes ?

La logique de production de contenu sera complètement différente.

2) Penser que le contenu produit par l’IA va tout changer ?

L’IA permet de rendre la production de contenu moins onéreuse... Mais la encore pour quels résultats ? Est-ce que votre contenu sera jugé comme étant pertinent par Google face à un contenu produit par un humain ? Feriez-vous vous même confiance au contenu de cet article s’il était écrit par une IA ? Quel degré de confiance allez vous donner à un site entier si vous savez que x% de son contenu a été généré par une IA ?

3) Tout miser sur des critères « techniques » de contenu

Explications : Bon nombre d’outils émergent et vous proposent de surveiller la densité de mots clé d’une page de votre site face aux concurrents qui sont déjà positionné... A mon avis, le bon sens doit à nouveau l’emporter !

Allez-vous choisir un livre dans une bibliothèque sur la base d’une quantité/densité de mots qui apparaîtrait dans tel ou tel livre ? Ça n’a absolument aucun sens !

Votre intuition vous incitera à faire confiance à tel ou tel auteur de part son authorité, ses compétences, ses expériences ou sa popularité.

Quels sont les solutions et services disponibles pour être « data driven »?

Outils SEO

Les outils SEO sont nombreux sur le marché avec des spécificités différentes pour vous aider dans vos tâches.

Des outils comme (SEMRush, Moz, aHref, Ubersuggest) sont de véritables couteaux suisses... Ils en font beaucoup voir trop ? Cependant l’ADN même de ces outils repose sur l’analyse concurrentielle. Cette idéologie est problématique dans le sens ou les suggestions de mots clés se font la ou la concurrence est déjà présente et bien installée... En somme, la ou le plus fortuné gagne le plus souvent. La tentation de copier l’autre est grande et les contenus se ressemblent. Dès lors, comment avoir une identité propre ? Qu’est-ce qui vous distinguera des autres ?

Autre volet inexplorés par ces outils : celui de l’analyse de la performance de vos conversions. En effet, ils sont principalement destinés à l’acquisition de trafic et les performances globales sur les ventes s’en ressentent.


80% du contenu que vous allez produire à partir des idées de mots clés des outils SEO du marché n’aura pas permis de réaliser le moindre euros de Chiffre d’Affaires. SEOCopilot permet de multiplier par 3 le nombre de pages qui convertissent pour vos nouveaux contenus.

Autre point d’attention, ces outils ne font pas d’analyse prédictive de positionnement. Vous devez donc vous en remettre à des scores KD (Keyword Difficulty) pour estimer vos chances de vous positionner.

Les outils d’analytics / Mesure d’audience

Le leader incontesté est Google Analytics dans sa version 4 (RGPD compliant). C’est un outil complet et puissant mais dont la prise en main est difficile. Bon nombre d’utilisateurs révèlent utiliser seulement 10% de ses fonctionnalités.

Matomo est un nouvel entrant dans le paysage de la mesure d’audience. Il se définit lui même comme étant une alternative à Google Analytics plus « respectueuse » de votre vie privée.

HotJar est un outils d’analyse de comportement d’utilisateur, de génération de carte de chaleur (Heat Map) et d’enregistrement de session.

L’analyse de contenu : les cartes sémantiques SEO

Les cartes sémantiques sont une nouvelle manière d’appréhender le contenu. Elles permettent de représenter l’intégralité du site Web sur une carte ou chaque page est représentée par un point. 2 points proches représentant 2 pages avec un contenu présentant une forte similarité. 2 points éloignés représentant des pages sans lien apparent. Prenons l’exemple d’un vendeur de vin. L’ensemble des pages parlant du vin rouge (bourgogne, bordeaux) seraient regroupées dans un cluster de contenu, les champagnes dans un autre.

Outre le regroupement de contenu, la puissance des cartes sémantiques se développe à l’aide de calque comme avec Google Maps.

Exemple : L’analyse de conversion

Visualisation du taux de conversion par page
Visualisation d'un volume de vente par page

En superposant la carte sémantique avec les contenus qui génèrent des conversions, on peut visualiser les zones de contenu qui concentrent ou non les ventes. On a donc des données actionnables pour décider dans quel domaine orienter sa production de contenu.

Autre exemple : L’analyse concurrentielle

En superposant la carte sémantique de son site web avec celui de ses concurrents cette fois signe on gagne des insights sur le positionnement stratégique : Est-ce que mon concurrent s’axe plus vers le luxe que le milieu de gamme ? Quelles sont les thématiques qu’il développe ou à l’inverse il délaisse... ? Les possibilités sont infinies.

Outils pour réaliser des cartes sémantique : SEOCopilot.

Les agences SEO

Certaines agences SEO peuvent vous accompagner dans la mise en application d’une stratégie de marketing orienté data. Veillez à vérifier les points essentiels suivants : qui vous accompagnera ? Aurez-vous un interlocuteur et un accompagnement dédié ? Est-ce qu’elle vous fournira un audit sur mesure ou un “recraché” d’un outils SEO que vous auriez pu vous même utiliser en interne ? Quel engagement prendra le prestataire à votre égard ? Est-ce que sa volumétrie de client lui permettra de générer un audit de qualité ? Y’a t’il un engagement sur résultat ?

Ces agences proposent généralement des pré-audit gratuit pour mettre en confiance la clientèle. Elles peuvent présenter un biais à délivrer le plus rapidement possible un livrable dans le but de passer au client suivant. Les intérêts client / agence ne sont pas forcément alignés sans modèle de rémunération au résultat.

Ces agences ont le plus souvent des compétences en interne dans le domaine du web marketing mais assez peu la culture data. Les profils présents dans ces agences sont généralement : rédacteurs de contenu, graphistes, développeurs web, trafic manager, content manager et consultants SEO. Les profils rarement trouvés sont les Data Scientists, Ingénieurs IA, Data Engineers, Développeurs Back end.

Le futur du content marketing via le prisme SEO

Le domaine est en pleine ébullition et les usages des consommateurs sont mouvants. L’environnement technologique est également incertain. En 2024, Google devrait probablement généraliser l’usage de la SGE (Search Generative Expérience) dont les résultats sont déjà connu outre atlantique.

Result for a generative AI search for e-bikes

Certaines verticales de site internet ont perdu 30% de clics au global (parfois plus sur des pages spécifiques). Du jour au lendemain votre trafic pourra baisser dans ces proportions. (Source : Search Engine Land)

Le paradigme de l’acquisition de trafic sera mis sous tension car les internautes auront directement le résultat à leurs interrogations via Google. Se pose alors la question de comment obtenir ces fameux clics ? Comment apparaître dans les résultats de l’agent conversationnel ? Apparaître comme étant une source de « confiance » « d’autorité » sera d’une importance capitale.

L’agent Google sera multi-modal (textuel, image et vidéo), mais on pourra faire en sorte d’attirer le lecteur à en savoir plus qu’au travers la réponse de l’agent.

Limitation liée à la taille de la réponse : si l’extrait de réponse est en 20 lignes et ne permet pas une réponse complète mais trop succincte, l’internaute souhaitera quitter Google pour aller consulter le site de référence. A noter que la suggestion de « follow up » permet de garder l’internaute captif.

Limitation liée au domaine de recherche : Certains sujet sensibles sont pour l’instant exclu du champ de réponse de l’agent : domaines financier, santé, juridiques.

Le format vidéo est également un bon moyen d’inciter à aller consulter la source d’autorité (chaîne Youtube)

Requêtes navigationnelles : C’est un domaine ou la SGE devrait peu changer les comportements. Je recherche le site des impôts, Google me donne accès au site des impôts (impots.gouv.fr) Je recherche le site ameli, on me renvoie dessus.

Requêtes géographiques : Google SGE me répond avec un plan et me redirige vers Google Maps.

Requête informationnelles : Combien mesure ? Combien pèse ? Ou se situe ? Qui est le président ? L’agent SGE apportera directement la réponse en citant ses sources. La profondeur de la question posée amènera l’internaute à en savoir plus que l’extrait proposé avec Google.

Requête transactionnelle : Combien coûte ? Quel est le meilleur ? Ici l’agent SGE pourra répondre avec des extraits Google Shopping. Faire partie du catalogue Google Shopping sera un préalable.

On voit bien que si l’enjeu est d’obtenir du trafic, Google vous en donnera moins. Si vous espérez obtenir des conversions, le jeu change car de nouvelles apparitions de produit seront directement intégrées dans la réponse.

Dès lors, la question que tout bon SEO va se poser est : comment apparaître dans les résultats de la SGE ?

Avis de l’auteur :

La technologie de la SGE repose sur les LLMs. Ce sont principalement des modèles de langages qui sont pré-entraînés à générer des suites de texte statistiquement les plus probables. Ces LLMs sont entraînés comme tout modèle d’IA sur d’énormes jeux de données. (Probablement les données de crawl de GoogleBot).

Deux constats :

1) figurer dans le jeu de donnée d’entraînement de la SGE pourra aider à induire sa réponse d’autant plus que le domaine est pauvre en contenu. Mais... Si le domaine est pauvre en contenu, est-ce que SGE se déclenchera ? (L’expérimentation permettra de le vérifier)

2) Du fait de ressources de calculs qui ne sont pas infinies (La recherche générative est onéreuse mais les coûts sont diminution) et d’après plusieurs sources outre-atlantique, l’agent SGE fournirait sa réponse en fonction des premiers résultats proposés préalablement par Google (Technique RAG : Retrieval Augmented Generation *cf.def ). Qu’est-ce que ça pourrait signifier ? Sommairement, que l’agent se servirait du contexte textuel des premiers sites web pour faire sa réponse. L’enjeu SEO reste donc le même que précédemment : apparaître comme étant une source de confiance et d’autorité auprès de Google.

Technique RAG : Les LLMs sont entraînés sur de vaste corpus de texte mais peuvent néanmoins ne pas avoir été entraînés sur des parties fermées du Web ou sur des domaines très pointus. Une technique pour améliorer la performance de ces modèles se fait via le prompt engineering et l’ajout d’un contexte de réponse.

Exemple de prompt :

Quel recours juridique à cet automobiliste en s’appuyant sur la legislation décrite dans le paragraphe suivant :

“Extrait du paragraphe qui se trouve sur une page web donnée... Ici Google va injecter les 5 premiers résultats de son index”

Conclusion

Nous ne sommes qu’au début de l’ère du data driven content marketing. La donnée/culture data permet d’envisager des cas d’usages encore jamais vu : carte sémantique concurrentielle, carte sémantique de conversion / traffic. Le métier du SEO et du content marketing va évoluer au grès des avancements dans les domaines tels que l’IA (générative, analyse sémantique via LLM). Cela passe néanmoins par la mise en place d’une culture data au sein de son organisation et par l’acceptation de ces nouvelles pratiques.

Try SEOCopilot for free

I want to explore content ideas that can boost my conversions.