Comment scraper et crawler un site web sans programmation ?
Problème de lecture
Cette vidéo ne semble pas disponible
00:00
00:00
Sous-titres non disponibles

TUTO Comment scraper et crawler un site web sans programmation ?

Gabin Desserprit
36,99€
3 paiements de 12,00€ avec Klarna. En savoir plus

Téléchargement & visionnage illimité

Satisfait ou remboursé

Paiement 100% sécurisé

(Cette formation fait suite à la formation Comment scraper une page web en 2 minutes et sans programmation pour laquelle vous avez été très nombreux à me contacter pour me remercier et me demander une suite. La voilà !) 

Je vous invite dans cette formation à devenir un expert de l'art d'extraire des données. Vous apprendrez ainsi à extraire les données de n'importe quel site internet, de manière automatiquement, structurée et sur plusieurs niveaux.
Vous avez simplement besoin du navigateur Chrome et de l'extension gratuite Web Scraper.

L'efficacité du Web Crawler ajoutée au Web Scraper

Vous avez découvert dans la précédente formation comment extraire simplement les informations d'une page. Mais vous avez très vite compris que les annuaires, les listes de produits, les sites en général, sont composés de centaines de pages. Le web crawler va vous permettre ici de consulter automatiquement chacune de ces pages pour récupérer nos informations.

Récupérez des listes de prospects pour votre démarche marketing. Analysez les listes de produits de vos concurrents pour vous positionner. Étudiez la SEO de concurrents pour optimiser la votre en conséquence.
L'extraction de données est un outil de plus pour vous aider dans n'importe quelle tâche impliquant la collecte et l'analyse d'un nombre de données important.

Au programme de ce tuto sur le web scraping à l'aide de web crawling

  • introduction au web scraping et web crawling
  • crawler simple : explication par l'exemple des 3 différents types avec de nombreux exemples
  • crawler multi-niveaux: explication avec plusieurs exemples
  • comment purifier l'information avec les expressions régulières 
  • aller plus loin avec l'extraction d'attributs 
  • extraire des tableaux d'informations automatiquement 
  • utilisation des liens pop-ups
  • gestion des délais (être fair-play avec les sites, éviter les sécurités)
  • importer et exporter les sitemaps (configuration)
  • exporter les données vers Google Sheet 
  • exporter les données vers Excel 

Ce cours est destiné aux personnes ayant déjà utilisé le Web Scraper Chrome et ayant consulté la courte première formation sur le sujet
Comme beaucoup l'ont déjà fait pour la précédente formation, n'hésitez pas à me solliciter si vous avez des remarques ou des questions (notamment dans la partie "Entraide"),
Bon scraping!

Attention : cette vidéo est réalisée dans un but pédagogique. Avant de scrapper les données d'un site, vérifiez que ce dernier autorise ou n'interdit pas ce genre de pratique !

Attention bis : Web scraping et web crawling ne sont pas synonymes de "hacking". A aucun moment nous sommes en train de pirater des données. Nous récupérons simplement des données qui nous sont rendues accessibles de manière automatique.

Qu’allez-vous apprendre dans ce cours ?

Plan de cours
Chapitre 1
Introduction
Chapitre 2
Crawler simple : Les liens de pagination
Chapitre 3
Crawler simple : Les adresses URL structurées
Chapitre 4
Crawler simple : "Lazy loading" ou chargement dynamique
Chapitre 5
Crawler multi-niveaux
Chapitre 6
Notions supplémentaires pour aller plus loin
Chapitre 7
Et ensuite ?

Plan détaillé du cours

Chapitre 1 : Introduction
07m49
 
Leçon 1Découvrez le sommaire! + Rappel de quelques notions
Chapitre 2 : Crawler simple : Les liens de pagination
25m18
 
Leçon 1Démonstration par l'exemple : liens de pagination
Leçon 2Exemple supplémentaire
Chapitre 3 : Crawler simple : Les adresses URL structurées
14m36
 
Leçon 1Démonstration par l'exemple : adresses URL structurées
Leçon 2La théorie des Adresses URL Structurées
Leçon 3Exemple supplémentaire
Chapitre 4 : Crawler simple : "Lazy loading" ou chargement dynamique
39m25
 
Leçon 1Démonstration par l'exemple : chargement dynamique type pagination
Leçon 2Démonstration par l'exemple : chargement dynamique type "Load more"
Leçon 3Deuxième exemple : chargement dynamique type "Load more"
Leçon 4Démonstration par l'exemple : chargement dynamique type "Défilement infini"
Leçon 5Autre exemple : chargement dynamique type
Leçon 6Récapitulatifs des différents cas d'usage de chargement dynamique
Chapitre 5 : Crawler multi-niveaux
34m35
 
Leçon 1Démonstration par l'exemple : crawler multi-niveaux
Leçon 2Deuxième exemple : crawler multi-niveaux complexe
Chapitre 6 : Notions supplémentaires pour aller plus loin
55m41
 
Leçon 1Purifier l'information avec les expressions régulières
Leçon 2Aller plus loin avec l'extraction d'attributs
Leçon 3Extraire des tableaux d'informations automatiquement
Leçon 4Utiliser les liens pop-up
Leçon 5Prendre en compte les délais (temps) et les sécurités
Leçon 6Importer et Exporter les Sitemaps
Leçon 7Exporter les données vers Google Sheet
Leçon 8Exporter les données vers Excel
Chapitre 7 : Et ensuite ?
02m58
 
Leçon 1Les mots de la fin

Aperçus

Avis des apprenants

Détail des avis
430
Apprenants
18
Commentaires
4,3/5
Note moyenne
5/5
12
4/5
3
3/5
1
2/5
0
1/5
2
Baderdine Yakhlef
Baderdine Yakhlef
Publié le 27/07/2022
Merci pour ce tuto Très intéressant qui m’a permis de scraper mon premier site Web après plusieurs essais quand même. Formateur très pédagogue, je recommande vivement.
Sebastien Mignot
Sebastien Mignot
Publié le 22/04/2021
Tombé par hasard sur le sujet et regardé par curiosité, j'ai vraiment le sentiment d'avoir appris un outil essentiel en très peu de temps. Merci et hâte de voir des formations complémentaires.
Elhachemi Amriou
Elhachemi Amriou
Publié le 28/01/2021
Très bon cours, explication très claire et simple pour mieux comprendre rapidement sauf que je ne trouve pas l'extension sur web store de google

Vos questions sur le cours

Avec quelle version de logiciel ce tuto est-il compatible ?

Web Scraping

Quel est le niveau requis pour suivre ce tuto ?

intermédiaire

Bonjour, faut'il avoir suivie vos autres tuto au préalable et faut il un logiciel payant ?merci

Bonjour, il est en effet préférable d'avoir acquis les bases avec le premier tutoriel. Aucun logiciel payant n'est requis. Vous êtes l'élément qui fera toute la différence ;) Au plaisir, Gabin

Bonjour, scraper avec Webscraper OK, je trouve cela assez simple à comprendre. Par contre, scraper de l'Ajax... Je ne sais pas s'il s'agit d'un bug de l'extension mais je n'y parviens pas ! Votre formation aborde-t-elle ce contexte particulier ? Merci

Bonjour, Bien sûr, cette formation vous apprendra à scraper absolument n'importe quel site internet (même en ajax). :)

Payer plus tard ou en 3x

Prix d'achat : 36,00 €
Pour payer plus tard ou en plusieurs versements échelonnés, sélectionnez Klarna comme moyen de paiement lors du règlement.

Ajoutez des articles à votre panier

Sélectionnez Klarna lors du règlement

Recevez une autorisation

Payez plus tard ou en plusieurs fois

3 paiements de 12,00 €
tous les mois, sans intérêts
Total : 36,00 €
Afficher les conditions : Klarna
Klarna : conditions d'utilisation du paiement différé en 3 échéances.

Attendez ! 🤗

Accédez à plus de 1429 tutos gratuits

Notre politique de protection des données