(Cette formation fait suite à la formation Comment scraper une page web en 2 minutes et sans programmation pour laquelle vous avez été très nombreux à me contacter pour me remercier et me demander une suite. La voilà !)
Je vous invite dans cette formation à devenir un expert de l'art d'extraire des données. Vous apprendrez ainsi à extraire les données de n'importe quel site internet, de manière automatiquement, structurée et sur plusieurs niveaux.
Vous avez simplement besoin du navigateur Chrome et de l'extension gratuite Web Scraper.
L'efficacité du Web Crawler ajoutée au Web Scraper
Vous avez découvert dans la précédente formation comment extraire simplement les informations d'une page. Mais vous avez très vite compris que les annuaires, les listes de produits, les sites en général, sont composés de centaines de pages. Le web crawler va vous permettre ici de consulter automatiquement chacune de ces pages pour récupérer nos informations.
Récupérez des listes de prospects pour votre démarche marketing. Analysez les listes de produits de vos concurrents pour vous positionner. Étudiez la SEO de concurrents pour optimiser la votre en conséquence.
L'extraction de données est un outil de plus pour vous aider dans n'importe quelle tâche impliquant la collecte et l'analyse d'un nombre de données important.
Au programme de ce tuto sur le web scraping à l'aide de web crawling
- introduction au web scraping et web crawling
- crawler simple : explication par l'exemple des 3 différents types avec de nombreux exemples
- crawler multi-niveaux: explication avec plusieurs exemples
- comment purifier l'information avec les expressions régulières
- aller plus loin avec l'extraction d'attributs
- extraire des tableaux d'informations automatiquement
- utilisation des liens pop-ups
- gestion des délais (être fair-play avec les sites, éviter les sécurités)
- importer et exporter les sitemaps (configuration)
- exporter les données vers Google Sheet
- exporter les données vers Excel
Ce cours est destiné aux personnes ayant déjà utilisé le Web Scraper Chrome et ayant consulté la courte première formation sur le sujet.
Comme beaucoup l'ont déjà fait pour la précédente formation, n'hésitez pas à me solliciter si vous avez des remarques ou des questions (notamment dans la partie "Entraide"),
Bon scraping!
Attention : cette vidéo est réalisée dans un but pédagogique. Avant de scrapper les données d'un site, vérifiez que ce dernier autorise ou n'interdit pas ce genre de pratique !
Attention bis : Web scraping et web crawling ne sont pas synonymes de "hacking". A aucun moment nous sommes en train de pirater des données. Nous récupérons simplement des données qui nous sont rendues accessibles de manière automatique.
Table des matières de cette formation Web Scraping (durée : 3h22s)
-
Introduction
- Découvrez le sommaire! + Rappel de quelques notions gratuit 00:07:49
-
Crawler simple : Les liens de pagination
- Démonstration par l'exemple : liens de pagination 00:18:20
- Exemple supplémentaire 00:06:58
-
Crawler simple : Les adresses URL structurées
- Démonstration par l'exemple : adresses URL structurées 00:08:21
- La théorie des Adresses URL Structurées 00:01:52
- Exemple supplémentaire 00:04:23
-
Crawler simple : "Lazy loading" ou chargement dynamique
- Démonstration par l'exemple : chargement dynamique type pagination 00:12:06
- Démonstration par l'exemple : chargement dynamique type "Load more" 00:06:18
- Deuxième exemple : chargement dynamique type "Load more" 00:05:07
- Démonstration par l'exemple : chargement dynamique type "Défilement infini" 00:03:55
- Autre exemple : chargement dynamique type 00:07:13
- Récapitulatifs des différents cas d'usage de chargement dynamique 00:04:46
-
Crawler multi-niveaux
- Démonstration par l'exemple : crawler multi-niveaux 00:12:32
- Deuxième exemple : crawler multi-niveaux complexe 00:22:03
-
Notions supplémentaires pour aller plus loin
- Purifier l'information avec les expressions régulières 00:12:39
- Aller plus loin avec l'extraction d'attributs 00:09:49
- Extraire des tableaux d'informations automatiquement 00:06:37
- Utiliser les liens pop-up 00:04:01
- Prendre en compte les délais (temps) et les sécurités 00:10:13
- Importer et Exporter les Sitemaps 00:05:00
- Exporter les données vers Google Sheet 00:05:07
- Exporter les données vers Excel 00:02:15
-
Et ensuite ?
- Les mots de la fin 00:02:58
- Fichiers sourcestélécharger
- Certificat
Formateur : Gabin Desserprit
-
Formation très intéressante qui permet de pendre en main efficacement l'outil Web Scraper et de commencer à scraper des sites construits de différentes manières. Le contenu est de qualité et le formateur très pédagogue. Je conseille vivement cette formation !
-
Tuto très bien et très complet mais web srapper ne marche plus sur google chrome.J'ai envoyé deux mails à Gabin mais pas de réponse et je trouve cela dommage
-
- La première chose qui est vraiment bien, au delà de la formation elle même c'est l'outil qui est présenté (web scrapper). Vraiment fabuleux. Et les expression régulières aussi; Je ne connaissait pas. - La deuxième est que cette formation à la mérite d'exister alors qu'on ne trouve pas grand chose (si ce n'est rien) sur le sujet en français. - La troisième c'est que c'est très bien expliqué. Par contre - Souvent l'auteur se répété (il n'est pas le seul c'est souvent le cas de tuto payant). Ce qui est expliqué en 10 min pourrait l'être en 5 min. Du coup parfois c'est un peu soporifique (endémique aux tuto payant) et on n'aura past rop envie de revoir une vidéo si on à oublié une information. - Au début les démonstrations de l'utilisation de l'outil fonctionnent un peut trop bien. A la fin de la troisième vidéo (5'51) j'entends ceci « donc vous avez vu qu’on peut récupérer comme ça, crawler, très facilement n’importe quel site... » ! Ben non ! Moi dans la réalité tout n'allait pas droit. J'aurais aimé qu'il y ait un peu plus de temps pour les sites qui ne sont pas configurés idéalement pour le scrapping Toutefois malgré ces inconvénients ça mérite quand même 5 étoile. (PS. pour tuto.fr les retours à la ligne et les espaces c'est pas pour les chiens)
-
Avec quelle version de logiciel ce tuto est-il compatible ?Web Scraping
-
Quel est le niveau requis pour suivre ce tuto ?intermédiaire
-
Bonjour, faut'il avoir suivie vos autres tuto au préalable et faut il un logiciel payant ?merciBonjour, il est en effet préférable d'avoir acquis les bases avec le premier tutoriel. Aucun logiciel payant n'est requis. Vous êtes l'élément qui fera toute la différence ;) Au plaisir, Gabin
-
Bonjour, scraper avec Webscraper OK, je trouve cela assez simple à comprendre. Par contre, scraper de l'Ajax... Je ne sais pas s'il s'agit d'un bug de l'extension mais je n'y parviens pas ! Votre formation aborde-t-elle ce contexte particulier ? MerciBonjour, Bien sûr, cette formation vous apprendra à scraper absolument n'importe quel site internet (même en ajax). :)
note moyenne
avis laissés