Partager cette discussion
Toute personne disposant du lien peut voir cette conversation.
On doit améliorer le SEO d'un site qui compte des millions de pages. Je veux donner à Google des informations de qualité pour qu'il lise chaque page proprement et la fasse ranker, sans s'y perdre. La difficulté : le site est multilingue, on a des millions de produits, et certaines pages ne contiennent presque rien à part le nom du produit, la marque et un extrait du manuel. Concrètement, qu'est-ce qu'on doit servir à Google ?
Avec des millions de pages, ton vrai ennemi, c'est le filtre anti-spam de Google sur le thin content : Google va considérer que tu as créé ces pages uniquement pour ranker, et il va toutes les déclasser dans les résultats. Il faut donc que chaque page soit clairement différente des autres, et que la structure du site soit limpide.
- Une hiérarchie claire. Une page principale, une page par marque qui liste ses produits, une page par produit. Bien une page par produit, pas une par manuel, sinon tu te retrouves avec des quasi-doublons.
- Supprime les pages sans contenu propre. Tout ce qui est pauvre ou dupliqué pénalise le référencement du domaine entier : supprime ou fusionne ces pages.
- Des données structurées dans le head. Ajoute du JSON-LD qui décrit le produit, pour que Google comprenne la page sans avoir à deviner.
- Traduis l'intégralité du document, sérieusement. Chaque langue doit avoir une vraie page entièrement traduite et déclarée comme telle, pas une copie à moitié traduite.
La structure d'abord, le contenu ensuite : la page doit être extrêmement simple à interpréter pour Google.
J'ai fait l'essentiel. Voilà ce qui est en place :
- La traduction complète, avec les informations structurées placées haut dans le HTML, dans une mise en page que Google lit facilement.
- Le JSON-LD dans le head, adapté aux données dont je dispose réellement pour chaque produit.
- Les images du produit et du manuel sur la page.
J'ai aussi ajouté des descriptions générées par IA : quand quelqu'un visite une page, si j'ai assez de données fiables sur le produit, je génère un texte plus riche dans la langue de la page, mais uniquement à la demande, pour ne pas gaspiller de tokens. Le texte est généré à la première visite dans une langue donnée, puis sauvegardé pour toutes les visites suivantes.
Bonne idée de mettre ça en cache, mais fais attention à ce qui déclenche la génération. Googlebot crawle tes pages très vite : si n'importe quelle visite peut lancer une génération, le crawler va la déclencher sur des millions de pages d'un coup, et ta facture de tokens va exploser dès le premier crawl.
- Ne génère jamais pour les bots. Génère uniquement quand un vrai humain ouvre la page produit, puis sers la version sauvegardée à tout le monde, crawler compris.
- Ne génère rien quand les données sont trop incertaines. Mieux vaut aucune description qu'un texte générique qui n'apporte rien.
Il reste aussi la question du sitemap. Avec autant d'URLs, un seul fichier sitemap ne suffit pas, et bien le découper demande un peu de réflexion. Laisse-moi chercher la bonne structure.
Le sitemap, je l'ai réglé moi-même. J'ai construit un sitemap index qui pointe vers des sitemaps enfants découpés selon la première lettre de la marque, avec les produits classés par marque puis par produit. Un seul index référence donc tous ces sitemaps par lettre. Et j'ai mis les alternates de traduction directement dans le sitemap, ce qui m'évite un sitemap séparé par langue. Ça a tout simplifié : Google le parse sans problème et continue d'indexer à un rythme régulier.
Envoyer un email à Eliott
Écrivez votre message ici : il s'ouvrira dans votre messagerie.
Envoyer un email à Eliott
Message envoyé !
Eliott vous répondra très vite.
On fait connaissance ?
Juste pour qu'Eliott sache à qui il parle. Seul votre nom est obligatoire.
Claude est une IA et peut se tromper se trompe. Vérifiez ses réponses trois fois plutôt qu'une.