Liste non-exhaustive de problèmes SEO rencontrés en auditant des sites utilisant le CMS Salesforce Commerce Cloud (ex-Demandware). Des correctif natifs existent sans doute, mais voyez ça comme une liste de points à vérifier.
1 – L’accueil n’est jamais à la racine
La racine est une redirection (souvent 302) vers l’accueil réel ( /home ou /index).
2 – Robots.txt
Consignes inefficaces et bientôt obsolètes : Noindex:
Aucune déclaration d’User-agent. Même si on vise all (*), ce n’est pas standard.
Et blocage remarquable de ressources CSS et JS, comme WordPress en 2014.
3 – Balises canonical
Renseignées vers des URLs non réécrites, qui elles-mêmes redirigent en 301 vers la page originale. Parfait si votre crawl est trop efficace et vous voulez ralentir les bots.
4 – Page d’erreur en HTTP 302
Plutôt qu’en HTTP 404. Le risque ? Une page disparue (ou une URL incorrecte) restera indexée. A terme, Google remarquera le problème et supprimera ces pages, mais le rapport des Soft 404 (Search Console > Couverture) devrait exploser.
5 – HTTP 410 pour une maintenance
Un site en maintenance doit renvoyer un code HTTP 503 pour indiquer aux moteurs que son indisponibilité est volontaire et temporaire. Une 410 indique à l’inverse qu’une URL a définitivement disparu (plus fortement qu’une 404). Vous exigez donc que Google désindexe votre site.
6 – Des pages au code HTML trop long car plein d’espaces blancs
Le code source commence souvent par 3 lignes vides…
7 – Des ressources JSON accessibles par des liens en front
Des boutons de type « Ajouter au panier » appellent des URLs de type
https://www.exemple.com/on/demandware.store/Product-ShowQuickView?pid=19E1BG
que les moteurs de recherche se feront un plaisir de crawler, suivant basiquement les <a href>. Un blocage dans le robots.txt peut compenser la faille, mais ce n’est pas optimal.
8 – Des infos contradictoires données au moteur
Un splendide <html lang=”en”> sur des pages françaises.
Mais un back-office en amélioration
Malgré ces défauts, le CMS évolue et propose tout un éventail de modules SEO pour gérer les éléments importants :
- Réécriture d’URLs
- Robots.txt
- Gestion du CDN
- Gestion des redirections d’URLs
- Réécritures d’URLs
- Règles de balises meta
- Sitemaps