Formation : Les Essentiels de la Masterclass 11 Octobre 2018

Formation : Les Essentiels de la Masterclass 11 Octobre 2018

550,00 HT

12 en stock

Catégories : ,

Description

Comment fonctionne un moteur de recherche ?

Descriptif

Les moteurs de recherche modernes fonctionnent grâce à de nombreux algorithmes permettant de classer de façon "intelligente" les pages du web en fonction du besoin de l'utilisateur.

Dans ce modèle, après le crawl du web, les pages sont soumises à plusieurs analyses poussées et des mécanismes d'ajustements se mettent en place pour répondre à l'utilisateur et fabriquer les meilleurs serps possibles :

- analyse de la popularité de chaque page par rapport au reste du web (PageRank, liens)
- analyse de la pertinence des pages (contenu face au besoin de l'utilisateur : cosinus de Salton, tfidf, vecteurs de contexte, etc.)
- analyse des signaux utilisateurs (un classement est-il bon ? On le détermine grâce aux retours utilisateurs)
- compréhension avancée du besoin informationnel en retravaillant la requête (co-occurrences, Hummingbird)
- détermination de l'importance des critères de classement pour chaque requête (learning to rank)

Durant cette journée de formation, les notions essentielles (voire indispensables) pour bien comprendre ce qu'est un moteur de recherche moderne sont abordées.
Le référenceur en devenir, débutant ou expert aura ainsi l'occasion de (re)découvrir un monde qui change largement depuis quelques années, avec maintenant l'utilisation de l'intelligence artificielle (RankBrain chez Google) pour améliorer les résultats.

La formation oscille entre la théorie, l'explication des concepts, et attache régulièrement les algorithmes à la pratique du référenceur web ou à ses outils (Screaming Frog, Gephi, etc.).

Type de public :
Tous publics, déjà sensibilisé au référencement web.
Les participants qui profiteront le plus de la formation sont les professionnels du référencement web souhaitant approfondir leur connaissance de la discipline.

Méthodes pédagogiques :
Méthode affirmative (cours magistral), interrogative (par le questionnement) et démonstrative (par l'exemple).

Documents nécessaires :
Aucun

Équipements nécessaires :
Aucun

Pré-requis :
Afin d'être le plus à l'aise possible avec cette formation au contenu dense, il est préférable de déjà avoir approché le référencement web.
Cependant, même les débutants de la discipline profiteront avantageusement des connaissances transmises tout au long de la journée de formation.

But de la formation :
Comprendre comment fonctionne un moteur de recherche moderne, en théorie, et comment utiliser la connaissance de ce fonctionnement en pratique.
Le but est de devenir un meilleur référenceur et de connaître tous les leviers utilisables dans une stratégie de référencement web, avec leurs limites et leurs avantages.

Moyens pédagogiques :
La formation se déroule sous forme d'un cours magistral, animé par un ou des formateurs, aidé(s) d'un support numérique, avec des démonstrations ponctuelles sur la façon de passer de la théorie à la pratique.

Sanction de la formation :
Attestation de formation


Déroulement de la journée

  • 09h00 : Accueil
  • 09h10 – 12h45 : Formation
  • 12h45 – 14h : Pause déjeuner (repas non inclus)
  • 14h – 17h30 : Formation

Adresse


IX-LABS - Le 108
Accès Métro 7

108 avenue de Fontainebleau,
94270 Le Kremlin-Bicêtre

 


Intervenants

Guillaume et Sylvain Peyronnet.


Programme

  1. Histoire et définitions sélectives des moteurs de recherche
    Durée
    30 min
    Objectifs pédagogiques Savoir comment les moteurs de recherche en sont venus à exister, qui les a crées.
    Contenu Connaître les enjeux liés à la recherche d'information et connaître les définitions importantes comme le besoin informationnel.
  2. Le crawl du web (vitesse, logs, quota de crawl, duplicate content)
    Durée
    1h30
    Objectifs pédagogiques Comprendre comment fonctionne un moteur de recherche moderne tel que Google, quelle est son architecture, sa structure.
    Comprendre comment un robot d'indexation récupère les pages web, sous quelles contraintes.
    Contenu Connaître les enjeux du crawl de pages web, l'importance de la vitesse pour une page web, lire un fichier de logs apache en ligne de commande, identifier le Googlebot, détecter le contenu dupliqué. 
  3. Les PageRank et les surfeurs aléatoires (visualiser la popularité interne d'un site, le surfeur raisonnable, les PageRank sémantiques et thématiques, le cocon sémantique, les fermes de liens)
    Durée 2h
    Objectifs pédagogiques 
    Comprendre les enjeux du pagerank sémantique et la notion de surfeur aléatoire pour savoir comment optimiser son maillage et son linking. Calculer le PageRank interne d'un site web avec Gephi.
    Utiliser la thématisation pour optimiser le PageRank (cocon sémantique)
    Contenu
    Connaître l'idée du surfeur aléatoire et son pendant raisonnable, appréhender sa spécificité thématique et évaluer la popularité d'une page par son maillage. 
  4. La pertinence des contenus (modèle vectoriel, salton, tf.idf, l'expansion de Rocchio, clustering)
    Durée 2h
    Objectifs pédagogiques 
    Comprendre comment un moteur de recherche moderne tel que Google fait pour considérer qu'une page web est pertinente. Comprendre les mesures de similarité sémantique. Comprendre la personnalisation de la SERP en fonction de la correction des utilisateurs.
    Contenu
     En sachant comment procède un moteur de recherche pour déterminer qu'une page est pertinente, on peut améliorer les contenus d'un site web pour les faire correspondre davantage aux requêtes visées. Lemmatisation, cosinus de salton, tf.idf, etc. Rédiger des contenus optimisés pour le référencement web 
  5. Les requêtes et la co-occurrence (hummingbird)
    Durée 20 minutes
    Objectifs pédagogiques
    Connaître les traitements que peuvent subir des requêtes pour améliorer leur pertinence et mieux répondre au besoin informationnel de l'internaute.
    Contenu Elargir une requête pour lever des ambiguïté ou améliorer la demande. Trouver les mots co-occurrents pour mieux travailler des mots-clés.
  6. Les vecteurs de contexte
    Durée 20 minutes
    Objectifs pédagogiques
    Comprendre que Salton, tf.idf, etc. sont maintenant dépassés par des algorithmes plus récents à base de réseaux de neurones qui embarquent du contexte.
    Contenu
    Découverte des vecteurs de contexte et exemples d'utilisations qui démontrent qu'embarquer le contexte permet de bien comprendre la langue. 
  7. Les signaux utilisateurs (learning to rank)
    Durée 20 minutes
    Objectifs pédagogiques 
    Devenir conscient qu'un moteur de recherche demande toujours la validation humaine.
    Contenu 
    Déterminer si un site mérite d'être bien positionné par rapport à son rapport avec l'utilisateur. Le learning to Rank, la durée des visites et le taux de rebonds passés sous le filtre de la qualité.

 


 

Les formations dispensées par les IX-LABS, sont, dans certains cas, éligibles aux financements de type Plan de Formation Entreprise. Nous contacter pour en savoir plus et/ou faire une demande de convention au moment de l'inscription des participants.