Faire un Audit SEO piloté par la data : théorie et pratique en R

Faire un Audit SEO piloté par la data : théorie et pratique en R

1150,00 HT

Effacer
UGS : ND Catégories : ,

Description

Faire un Audit SEO piloté par la data : théorie et pratique en R

Descriptif

Le fonctionnement des moteurs de recherche modernes sont largement dépendant d'algoritmes utilisant largement la data récupérées par les mastodontes du web.

Afin de comprendre l'état du référencement web d'un site, une approche très pragmatique et efficace consiste à se mettre dans les chaussures du moteur de recherche en traitant le site d'une façon très similaire à ce que le moteur ferait.

Pour cela, nous allons, durant 2 jours complets, aborder les algorithmiques qui sont utilisés par les moteurs de recherche, et faire un audit SEO grâce à des briques assemblées en R.

Type de public :
Les participants qui profiteront le plus de la formation sont les professionnels du référencement web souhaitant approfondir leur connaissance de la discipline. Ils sont plutôt à l'aise avec la technique mais souhaitent passer au niveau supérieur de l'audit SEO de site en récoltant et analysant la data.

Méthodes pédagogiques :
Méthode affirmative (cours magistral), interrogative (par le questionnement) et démonstrative (par l'exemple).

Documents nécessaires :
Aucun

Équipements nécessaires :
Un ordinateur portable. Nous fournissons la connexion internet. Nous utiliserons des scripts en R à travers RStudio Cloud.

Pré-requis :
Afin d'être le plus à l'aise possible avec cette formation, il est préférable de déjà avoir approché le référencement web, notamment en ayant suivi la Masterclass Moteurs+SEO étendue ou les essentiels de la Masterclass.
Avoir des connaissances de R est un plus.

But de la formation :
Comprendre l'importance de la data pour faire l'audit SEO le plus poussé possible.
Etre capable de faire l'audit SEO d'un site, piloté par la data.

Moyens pédagogiques :
La formation se déroule sous forme d'un cours magistral, animé par un ou des formateurs, aidé(s) d'un support numérique, avec toute une partie pratique où un site est audité par les participants.

Sanction de la formation :
Attestation de formation

 


Déroulement des 2 journées de formation

  • 09h00 : Accueil
  • 09h15 – 12h45 : Formation
  • 12h45 – 14h : Pause déjeuner (repas non inclus)
  • 14h – 17h30 : Formation

Adresse

IX-LABS - Le 108
Accès Métro 7

108 avenue de Fontainebleau,
94270 Le Kremlin-Bicêtre

 


Intervenants

Guillaume et Sylvain Peyronnet.


Programme

  1. Les primitives du fonctionnement d’un moteur de recherche, la structure d’un audit algorithmique
    Durée
    4h
    Objectifs pédagogiques Comprendre comment fonctionne un moteur de recherche comme Google afin de situer l’utilité de chacune des briques fonctionnelles d’un audit algorithmique. Présenter chacune de ces briques fonctionnelles.
    Savoir identifier les pièces qui constituent un moteur de recherche.
    •    Crawl par le bot
    •    Analyse de la pertinence
    •    Analyse de la popularité via le pagerank
    •    Analyse des contenus pour estimer leur qualité
    Contenu Connaître les enjeux liés à la recherche d'information et connaître les définitions importantes comme le besoin informationnel.
    Connaître les piliers d’un bon audit :
    •    Aspects techniques du site et du serveur
    •    Audit sémantique
    •    Linking interne et externe
    •    Analyse du comportement des visiteurs
    •    Analyse qualitative
  2. Aspects techniques de l’audit
    Durée 2h
    Objectifs pédagogiques Comprendre et analyser les critères techniques de configuration du serveur qui entrave le positionnement.
    Comprendre et analyser les barrières au positionnement dans le développement du code source d’un site web.
    Contenu Un site web est hébergé sur un serveur qui nécessite une configuration technique particulière. Certains aspects techniques sont importants pour le positionnement dans un moteur de recherche. Cette séquence présente les différents aspects techniques importants, comment mesurer leur  mise en place et les interprétations associées.
    Une fois le serveur configuré, il faut que le site web soit développé selon un certain nombres de bonnes pratiques. Cette séquence présente les différentes bonnes pratiques importantes, comment mesurer leur  mise en place et les interprétations associées.
  3. Analyse sémantique
    Durée 2h
    Objectifs pédagogiques Comprendre ce qu’est une analyse sémantique. Réaliser une telle analyse sur un ensemble de pages web.
    Contenu Savoir comment mettre en place des scripts permettant de quantifier la pertinence entre une requête et des pages. Se servir de ces mesures pour proposer un contenu adapté aux moteurs de recherche.
  4. Linking interne et externe
    Durée 2h
    Objectifs pédagogiquesDéterminer si le maillage mis en place permet de maximiser le pagerank d'un site web. Visualiser les pages qui profitent le plus de la structure du site en terme de “ventilation” de pagerank.
    Vérifier si la structure de liens entre les pages d'un site permet de minimiser la perte de pagerank.
    La notion de force induite : comment la calculer, comment l’utiliser.
    Les critères d’un bon netlinking externe : notion de citation flow, trustflow. Vérifier que l’ancrage des liens est correct, les critères du filtre penguin.
  5. Analyse de la qualité
    Durée 2h
    Objectifs pédagogiques Comprendre ce qu’est une page web de qualité. Comprendre les différents niveaux de qualité et les critères constitutifs de cette qualité. utiliser les 21 critères constitutifs pour classifier les contenus.
    Contenu Savoir déterminer les pages qui sembleraient être du spam pour Google. Savoir déterminer les pages de haute qualité dans un site web. Etre capable de créer et utiliser un filtre, en utilisant des datas et un outil de création d'arbre de classification (C5, adaboost, random forest, SVM).
  6. Comportement des visiteurs
    Durée
    2h
    Objectifs pédagogiques Analyser des logs apache ou nginx pour déterminer le comportement des visiteurs humains, des bots et les erreurs serveurs associées.
    Analyser les stats issues de Google Analytics pour croiser l’information des logs avec des données d’utilisation.
    Contenu Qu’est ce qu’un log apache/nginx, comment les lire et les analyser pour comprendre le comportement “macro” au niveau d’un site web ?
    Quelles sont les barrières de positionnement liées à tel ou tel schéma temporel d’apparition de codes HTTP spécifiques ?
    Comment sont agrégées les statistiques de Google Analytics ? Comment s’en servir pour déterminer les pages actives et les pages mortes ?

 

Les formations dispensées par les IX-LABS, sont, dans certains cas, éligibles aux financements de type Plan de Formation Entreprise ou AIF (Aide Individuelle à la Formation). Nous contacter pour en savoir plus.

Informations complémentaires

Choix de la session

2 et 3 avril 2020, 1 et 2 octobre 2020, 19 et 20 novembre