SEO et Intelligence artificielle

J’ai animé en début de semaine une conférence sur les applications concrètes de l’intelligence artificielle pour le e-commerce. Du coup, je me suis dit que c’était une bonne idée pour vous parler aujourd’hui de l’impact de l’intelligence artificielle dans le SEO. Allez, je vous explique tout ça.

Bonjour à toutes et à tous, je suis Christophe Vidal. Alors, vous le savez, le terme IA intelligence artificielle, il est de plus en plus souvent utilisé, et cela, quel que soit le domaine d’activité.

C’est quoi l’intelligence artificielle ?

Alors souvent, on associe l’intelligence artificielle à la robotique, mais bien évidemment, c’est bien plus que cela. On peut parler d’intelligence artificielle dès qu’une technologie réussit à reproduire une faculté associée d’ordinaire à l’intelligence humaine. Les champs d’application sont infinies: recherche vocale, reconnaissance d’images, génération de contenu, on va parler aujourd’hui de tout ça, car ça impacte fortement notre métier de SEO. Dans la pratique, l’intelligence artificielle n’est pas si intelligente que ça. Il s’agit essentiellement de big data, de grosses bases de données et d’algorithmes qui ne datent pas d’aujourd’hui, c’est juste qu’aujourd’hui, on a les machines et les technologies qui nous permettent de faire tourner ses algorithmes sur une grosse quantité de données.

Qu’est-ce que le Machine Learning ?

Parmi les différentes disciplines de l’intelligence artificielle, celle qui va majoritairement nous intéresser aujourd’hui, c’est le machine learning ou apprentissage automatique, c’est une application de l’intelligence artificielle qui a pour but de permettre aux machines d’apprendre de manière autonome sans avoir à être programmé pour cela. C’est une technologie qui a donc pour objectif de rendre l’ordinateur capable de donner des solutions à des problèmes complexes et variés, mais aussi d’établir des prédictions et d’établir des modèles, et tout cela en se basant sur des bases de données statistiques. Alors, forcément, le SEO ne déroge pas à la règle, avec notamment de nombreuses applications telles que la génération de contenu, la recherche de mots clés, la génération automatique d’images, la reconnaissance d’images, mais aussi en tout premier lieu, il y a forcément un impact sur notre moteur de recherche préféré Google, qui est dopé alias depuis la mise en place de RankBrain.

Qu’est-ce que RankBrain ?

RankBrain, c’est donc un algorithme créé par Google en 2015 et qui s’appuie sur l’intelligence artificielle. Dans le cadre de RankBrain, l’intelligence artificielle a pour objectif de mieux comprendre l’intention et les requêtes posées par l’internaute de manière à fournir les résultats les plus pertinents possibles. RankBrain est basé sur le Machine Learning, Il est capable de prendre, d’apprendre de manière totalement autonome de nouvelles expressions, et RankBrain est aussi capable de comprendre des expressions spécifiques à chaque langue. RankBrain est aussi capable d’analyser et de comprendre le comportement de l’internaute et les interactions de l’internaute avec le moteur de recherche, et ça, c’est très important, on va l’avoir juste après.

Sans rentrer dans des considérations mathématiques, RankBrain va transformer, convertir les données présentes dans l’expression saisie par l’internaute dans le moteur de recherche en un vecteur mathématique, et si jamais RankBrain découvre un vecteur inconnu ou peu utilisé jusqu’à présent, il va le comparer à sa base de données existante, de manière à établir une nouvelle relation entre les vecteurs et proposer le meilleur résultat. On ne va pas plus rentrer dans le détail, rassurez vous.

Dans tous les cas, ce nouveau résultat, il va être intégré dans la base de données pour l’apprentissage automatique afin d’en tirer des leçons  et afin d’améliorer le processus. C’est comme ça que Google est capable de donner des réponses pertinentes sur de nouvelles requêtes que personne n’avait tapées jusqu’à présent. Alors comment ça fonctionne? Comme on vient de le voir, RankBrain est capable d’analyser le comportement de l’internaute? Ainsi, il va être capable de détecter une éventuelle insatisfaction de l’utilisateur pour une requête donnée grâce à des indicateurs clés que l’on connaît bien, comme le temps passé sur la page, le taux de rebond, le taux de clics, etc…En fonction de ça, il va pouvoir modifier l’algorithme, par exemple en réduisant l’importance du nombre de backlinks pour un résultat sur une recherche donnée, etc. Il va ensuite mesurer l’impact sur la satisfaction de l’utilisateur en utilisant toujours ces mêmes indicateurs et en fonction de ça, il va appliquer le changement, si ce changement est positif en termes d’expérience utilisateur. Grâce à l’IA, Google est donc capable de proposer des résultats de plus en plus pertinents et qui correspondent à votre recherche, et il est même capable de vous proposer des pages qui potentiellement, ne contiendront même pas le mot clé que vous avez saisi, car il l’aura compris malgré tout, même si le mot clé n’est pas indiqué dans la page, que cette page parle du bon sujet.

Les applications de l’IA dans le SEO

Alors en dehors de cette partie moteur de recherche avec RankBrain, en quoi l’IA va potentiellement révolutionner notre quotidien de SEO et de référencement? On va voir maintenant différentes applications de l’IA et comment on va utiliser nous l’IA pour automatiser un certain nombre de tâches qu’on réalisait jusqu’à présent manuellement et qui vont pouvoir être rendues beaucoup plus performantes grâce à la puissance de calcul des machines.

Clustering

La première chose que l’IA va nous permettre d’accomplir, c’est le clustering. À partir d’une base de données de plusieurs milliers, voire centaines de milliers de mots, l’IA va pouvoir les classer automatiquement en silo, les fameux silos thématiques en fonction de différents types de critères comme l’intention de l’internaute, mais aussi éventuellement des marques, des catégories et des expressions associées, des services, etc… Ainsi, l’algorithme va séparer en silo des centaines de milliers d’expressions en réunissant les expressions qui ont le même sens, mais qui, pour autant, ne se ressemblent pas.

Calcul de la difficulté

L’IA va ensuite nous permettre de calculer la difficulté, elle va nous permettre de déterminer les chances que nous avons de nous positionner sur ces différentes expressions clés, cela notamment en comparant les différentes pages déjà présentes dans la SERP. On se rappellera par exemple du fameux Keyword difficulty de SEMRUSH, qui a été mis en place il y a quelques temps, en tout cas amélioré il y a quelques temps.

Maillage interne

Enfin, l’IA peut automatiquement calculer le maillage interne entre les différentes pages de notre site. L’IA va permettre de hiérarchiser les catégories, de mettre en avant les produits et même de créer la structure d’un cocon sémantique en respectant le fameux glissement sémantique, on en a parlé dans une précédente vidéo. En gros, tout ce que l’humain est capable de faire, qui peut être automatisé, l’IA va pouvoir le faire à sa place, et cela, de manière beaucoup plus de puissance, avec une force de calcul impressionnante et de manière totalement exhaustive, en omettant aucun paramètre.

Bon, vous le savez, si vous me connaissez déjà, j’aime malgré tout pas trop ce terme « intelligence artificielle », ça reste de l’algorithme et de la data et du machine learning, il n’y a rien de très intelligent dans tout ça, l’IA n’est pas capable de réfléchir ni de penser, ni vraiment de prendre de décisions intelligentes toute seule, voilà, je préférais le rappeler.

La reconnaissance d’image et vocale

Le deuxième champ d’application du Machine Learning dans le cadre du SEO, ça va toucher la reconnaissance d’image et la reconnaissance vocale. En effet, l’intelligence artificielle est capable aujourd’hui, sans trop de soucis, de reconnaître et d’interpréter des images et donc indirectement du langage, puisque la voix peut être retranscrite en une image via des visuels de type spectrogramme. Donc, l’intelligence artificielle est capable de reconnaître l’image, je peux lui donner un visuel et ces algorithmes vont être capables de me détailler ce qui se trouve sur le visuel. Je vous invite à tester Google Vision, qui est disponible gratuitement, pour cela, vous pouvez lui passer une image et voir dans le détail comment Google et comment l’intelligence artificielle de Google comprend cette image? Inversement, un outil comme DALI est capable de générer une image automatiquement à partir d’un contenu et ça, ça commence à être un petit peu plus fort.

Génération automatique de contenu

On en arrive à la génération automatique de contenus, le Graal pour tous les SEO. Alors ça fait des années qu’on travaille sur de la génération automatique de contenu et attention, je ne parle pas là de générer de la bouillie, de la bouillie en scrappant tout un tas de pages sur Internet pour remettre des mots et des phrases au hasard. Non non, je parle de vraie génération de contenu, et là, il semblerait bien que l’on soit arrivé à un point de rupture avec le lancement, il y a quelques mois, de GPT-3.  Donc GPT-3 est actuellement toujours en version fermée en beta test, mais j’ai eu la chance de pouvoir le tester, donc je vais pouvoir vous en dire un peu plus.

OpenAI GPT-3

C’est un outil de génération de contenu qui a été créé par Open AI. Pour rappel, Open AI est une société qui a été cofondée par Elon Musk et dans laquelle Microsoft a investi plus d’un milliard de dollars. Open AI se focalise donc sur le Machine Learning appliquée au traitement du langage, avec des technologies telles que le NLP (Naturel Language Processing) et le NLG (Natural Language Generation). Aujourd’hui, GPT-3, c’est le réseau de neurones le plus complexe jamais inventé au monde. C’est certainement l’une des plus grandes avancées dans le domaine de l’IA.

GPT-3 est tout simplement capable de créer une structure de langage digne d’un texte créé et rédigé par un humain. Alors, pour faire simple, GPT-3 à crawlé l’intégralité des données du Web entre 2016 et 2019 pour disposer d’une énorme base de contenus documentaires, d’une énorme base de contenus de connaissances. Et suite à cet entraînement, GPT-3 est aujourd’hui capable de générer n’importe quel type de contenus ayant une structure de type langage. GPT-3 peut fournir une réponse à des questions et créer différents types de textes, que ce soit des poèmes ou des fiches produits ou des articles de journaux ou des articles de blogs, etc.. Ils peut faire des résumés de texte, ils peut faire des traductions automatiques, il peut rédiger donc des articles et il peut même rédiger du code informatique. Je vous invite à aller voir, il y a quelques démonstrations assez bluffantes, je vous  mettrais le lien en commentaire, où on voit notamment la génération automatique de maquettes avec Sigma et GPT-3. Il suffit d’indiquer à GPT-3 des phrases intelligibles qui sont automatiquement transformées en une maquette graphique pour un site Internet  dans SIGMA, franchement, c’est assez bluffant.

Sans aller jusqu’à tester GPT-3 avec SIGMA, j’ai moi même pu tester la génération automatique de contenu pour le SEO et de contenu pour les fiches produits d’un site e-commerce et franchement, le résultat était largement à la hauteur de mes attentes. Ce qui est intéressant avec GPT-3, c’est qu’on peut lui donner pour, par exemple, de la création de fiches produits, un ensemble de caractéristiques qui vont lui permettre de générer automatiquement des fiches produits, mais on va aussi pouvoir lui donner différentes consignes et pourquoi pas, envisager petit à petit d’utiliser GPT-3 en lui indiquant de respecter les bonnes règles du SEO, de générer du balisage, d’intégrer des Call to action, etc… On va vraiment pouvoir aller très, très, très, très loin avec GPT-3. Alors, est-ce que ça va engendrer la mort du rédacteur web? Bien sûr que non, mais par contre, ça va peut-être permettre d’améliorer certains processus de création et on pourra aussi imaginer des utilisations un peu plus Black hat, potentiellement pour des personnes qui voudraient générer des PBN ou ce genre de choses là tout en ayant un très haut niveau de qualité.

Alors, on en arrive aux excès qui peuvent être provoqués par l’utilisation excessive de GPT-3. N’oublions pas malgré tout qu’aujourd’hui on est sur un aperçu en bêta, on est vraiment sur une version précoce de GPT-3. On n’a pas encore, à mon avis, en vue toute l’étendue des possibilités que nous permettra ce type d’outil.

Conclusion

Voilà, je n’irai pas plus loin aujourd’hui sur GPT-3. N’hésitez pas à me contacter si vous voulez avoir une démo et que vous voulez que je vous explique un peu plus comment ça fonctionne, ce sera avec plaisir.

J’espère que cette présentation rapide des impacts de l’intelligence artificielle et du Machine Learning sur le SEO vous aura permis d’ouvrir un peu plus vos chakras et de comprendre un peu plus où on risque d’aller dans les années à venir. Je vous remercie pour votre attention. N’hésitez pas à activer la cloche si vous voulez pouvoir suivre mes proches vidéo, à aimer la chaîne et vous abonner à la chaîne SEMRUSH. Allez, à très vite.