Devenir un expert du Web Scraping - La formation complète
Problème de lecture
Cette vidéo ne semble pas disponible
00:00
00:00
Sous-titres non disponibles

TUTO Devenir un expert du Web Scraping - La formation complète

Sébastien Daviot
58,99€
3 paiements de 19,33€ avec Klarna. En savoir plus

Téléchargement & visionnage illimité

Satisfait ou remboursé

Paiement 100% sécurisé

Chaque jour sur Internet, des millions d’informations sont générées et stockées, faisant du web un immense hub de données, qui à l’heure du Big DATA, représente une opportunité immense.

Ces données n’étant pas accessible directement depuis une base de données ou une API, le web scraping joue pleinement son rôle d’extracteur de données massives.
En effet, le web scraping, c’est l’art de créer des programmes naviguant à la vitesse de la lumière sur des sites web et extraire toutes les informations souhaitées.
Je vous propose donc d’obtenir cette compétence avec moi, à travers 16h de cours qui vous feront passer de novice total à expert.

Je suis Sébastien Daviot, consultant pour le compte d’un logiciel web analytics, et j’utilise de mon côté le webscraping pour enrichir les analyses comportementales et de tendances des site web de mes clients.

Au programme de cette formation en ligne Devenir un expert du Web Scraping 

Dans ce cours en ligne, vous apprendrez à coder en Python, le fonctionnement d’un site web et l'utilisation les principaux framework du web scraping comme Beautiful Soup, Scrapy, Splash, Selenium.

A l’issue de ce cours en vidéo vous pourrez répondre aux problématiques les plus complexes :

  • Scraper des milliers de pages en quelques minutes,
  • Scraper des données en simulant une visite sur un navigateur,
  • Accéder à des données uniquement accessibles via une authentification,
  • Exploiter l’API d’un site
  • Enregistrer votre travail dans le Cloud.

Pour cela, vous coderez avec moi vos premiers scrapers. 
Puis, je challengerai régulièrement vos nouvelles compétences sur un site web spécialement créé pour l’occasion.
 

Pourquoi ce cours plutôt qu’un autre ?

  • Vous allez apprendre toutes les libraires Python de webscraping en un seul cours, ce qui est rare !
  • Aucune connaissance de départ exigée, le début du cours étant dédié à l’apprentissage du Python et des langages web côté client.
  • Je privilégie la pratique plutôt que faire un cours magistral.
  • Je reste disponible pour répondre à vos questions via la FAQ ou l'espace d'entraide.
  • Je suis formateur en ligne sur d’autres thématiques et les avis sont très positifs
  • Testez vos connaissances via le QCM de fin de cours

J’espère vous avoir donné envie d’apprendre cette compétence et on se retrouve tout de suite pour démarrer le cours !

Qu’allez-vous apprendre dans ce cours ?

Plan de cours
Chapitre 1
Introduction au web scraping
Chapitre 2
Les fondamentaux de la programmation en Python pour le web scraping
Chapitre 3
Programmation en Python - Préparation de l'environnement de travail
Chapitre 4
Programmation en Python - Gestion des variables en Python
Chapitre 5
Programmation en Python - Les conditions
Chapitre 6
Programmation en Python - Les listes
Chapitre 7
Programmation en Python - Les dictionnaires

Plan détaillé du cours

Chapitre 1 : Introduction au web scraping
17m24
 
Leçon 1Qu'est ce que le web scraping ?
Leçon 2Dans quels cas utiliser le web scraping ?
Leçon 3Quelles sont les compétences nécessaires pour le web scraping ?
Chapitre 2 : Les fondamentaux de la programmation en Python pour le web scraping
08m43
 
Leçon 1Contenu de la section
Leçon 2Introduction à la programmation
Chapitre 3 : Programmation en Python - Préparation de l'environnement de travail
11m33
 
Leçon 1Installation Anaconda
Leçon 2Présentation d'anaconda
Leçon 3Installation Visual Studio Code
Leçon 4Lancer un script depuis VS Code
Chapitre 4 : Programmation en Python - Gestion des variables en Python
35m
 
Leçon 1Introduction aux variables
Leçon 2Les variables numériques
Leçon 3Les variables textuelles
Leçon 4Consulter et modifier le type d'une variable
Leçon 5Gérer la concaténation
Leçon 6Présentation exercices
Leçon 7Corrections exercices
Chapitre 5 : Programmation en Python - Les conditions
30m16
 
Leçon 1Introduction aux conditions
Leçon 2Les booléens
Leçon 3Les opérateurs logiques
Leçon 4Construction d'une condition simple
Leçon 5Les conditions successives
Leçon 6Les conditions multiples
Leçon 7Enoncé exercice
Leçon 8Correction exercice
Chapitre 6 : Programmation en Python - Les listes
28m36
 
Leçon 1Introduction aux listes
Leçon 2Obtenir des informations sur une liste
Leçon 3Modifier une liste
Leçon 4Enoncé exercice
Leçon 5Correction exercice
Chapitre 7 : Programmation en Python - Les dictionnaires
19m49
 
Leçon 1Introduction aux dictionnaires
Leçon 2Modifier un dictionnaire
Leçon 3Créer des sous dictionnaires
Leçon 4Enoncé exercice
Leçon 5Correction exercice
Chapitre 8 : Programmation en Python - Les boucles
19m08
 
Leçon 1Introduction aux boucles
Leçon 2La boucle while
Leçon 3La boucle for
Leçon 4Itérer sur une liste numérique
Chapitre 9 : Programmation en Python - Les fonctions
27m35
 
Leçon 1Introduction aux fonctions
Leçon 2Créer sa première fonction
Leçon 3Les arguments de fonctions
Leçon 4Les valeurs par défaut sur les arguments
Leçon 5Les variables globales et locales
Leçon 6Enoncé exercice
Leçon 7Correction exercice
Chapitre 10 : Programmation en python - Les librairies
11m30
 
Leçon 1Utiliser une librairie
Leçon 2Installer une librairie
Chapitre 11 : Programmation en Python - La programmation orientée objet
14m37
 
Leçon 1La POO
Chapitre 12 : Utiliser un terminal de commandes
28m22
 
Leçon 1Comprendre et lancer le terminal de commandes
Leçon 2Naviguer dans les dossiers
Leçon 3Modifier un dossier
Leçon 4Copier un dossier ou un fichier
Leçon 5Utiliser Python dans le terminal
Leçon 6Gérer des arguments depuis le terminal
Chapitre 13 : La programmation web avec les langages côté client
08m20
 
Leçon 1Qu'est ce que le développement côté client
Leçon 2Comment lire le code d'une page web
Chapitre 14 : Comprendre le langage HTML pour le web scraping
34m16
 
Leçon 1Créer son premier fichier HTML
Leçon 2Les principales balises
Leçon 3Les liens hyper text
Leçon 4Les images
Leçon 5Les listes et les tableaux
Leçon 6La personnalisation graphique
Leçon 7Enoncé exercice
Leçon 8Correction exercice
Chapitre 15 : Comprendre le langage CSS pour le web scraping
27m20
 
Leçon 1Comprendre la syntaxe du CSS
Leçon 2Cibler les balises
Leçon 3Les classes CSS
Leçon 4Les IDs en CSS
Leçon 5Les DIV
Leçon 6Les SPAN
Leçon 7Enoncé exercice
Leçon 8Correction exercice
Chapitre 16 : Comprendre le langage Javascript pour le web scraping
43m04
 
Leçon 1Gérer ses variables en JS
Leçon 2Créer des conditions
Leçon 3Créer des boucles
Leçon 4Les fonctions en js
Leçon 5Préparer son code à la dynamisation
Leçon 6Le DOM en Javacript
Leçon 7Ajouter un évènement
Leçon 8Modifier une page HTML dynamiquement
Leçon 9Naviguer dans le DOM
Leçon 10Enoncé exercice
Leçon 11Correction exercice
Chapitre 17 : Web scraping avec BeautifulSoup
2h01
 
Leçon 1Préambule
Leçon 2Disclaimer sites du cours
Leçon 3Première analyse du site
Leçon 4Installation des librairies nécéssaires
Leçon 5Requêter une page web et vérifier son fonctionnement
Leçon 6Choisir son interpréteur html
Leçon 7Cibler des balises
Leçon 8Utiliser les attributs des balises
Leçon 9Récupérer les valeurs d'attributs
Leçon 10Extraire les données des balises
Leçon 11Les sélecteurs CSS
Leçon 12Naviguer dans le DOM
Leçon 13Préparer son scraping
Leçon 14Utiliser la librairie Pandas pour mieux comprendre son extract
Leçon 15Extraire des données sur plusieurs pages
Leçon 16Enoncé Atelier
Leçon 17Correction Atelier
Chapitre 18 : Web scraping avec Scrapy - principe de fonctionnement
36m49
 
Leçon 1Présentation de Scrapy
Leçon 2Préparation de son espace de travail
Leçon 3Les commandes windows
Leçon 4Générer son premier spider
Leçon 5Générer son premier spider (suite)
Leçon 6L'architecture d'un projet scrapy
Leçon 7Premières exécutions de son spider
Chapitre 19 : Web scraping avec Scrapy - Selectionner les données avec xpath
1h36
 
Leçon 1La sélection de balises simples
Leçon 2Extraire le texte d'une balise
Leçon 3Sélection avec les attributs
Leçon 4Les références relatives
Leçon 5Récupérer la valeur d'un attribut
Leçon 6Les filtres "contient"
Leçon 7Nettoyer le texte récupéré
Leçon 8Naviguer dans le DOM
Leçon 9Enoncé Atelier
Leçon 10Correction atelier
Chapitre 20 : Web scraping avec Scrapy - Les sélecteurs CSS
09m21
 
Leçon 1Sélection de balises simples
Leçon 2Sélection à partir d'attributs
Chapitre 21 : Web scraping avec Scrapy - Exporter en Json et en CSV
06m05
 
Leçon 1Préparation de l'environnement de travail
Leçon 2Exporter en json ou en csv
Chapitre 22 : Web scraping avec Scrapy - Récupérer des données sur plusieurs pages
21m43
 
Leçon 1Gérer la pagination
Leçon 2Récupérer des données sur des pages détail
Chapitre 23 : Web scraping avec Scrapy - Les rules objects
22m18
 
Leçon 1Les spiders de type "Crawl"
Leçon 2Gestion des rule objects
Leçon 3Enrichir son spider
Chapitre 24 : Web scraping avec Scrapy - Les item loaders
27m37
 
Leçon 1Déclaration des items
Leçon 2Les item loaders
Chapitre 25 : Utiliser l'API d'un site web pour votre web scraper
37m28
 
Leçon 1Repérer l'utilisation d'une API sur un site web
Leçon 2Préparer l'environnement de travail
Leçon 3Exploration des données d'une API
Leçon 4Récupérer les données dans une API
Leçon 5Itérer sur une API
Chapitre 26 : Web scraping avec Scrapy - Atelier
07m27
 
Leçon 1Enoncé Atelier
Leçon 2Correction atelier
Chapitre 27 : Le Web scraping avec Selenium
58m41
 
Leçon 1Présentation Selenium
Leçon 2Vérifier si Sélénium est nécessaire à votre projet
Leçon 3Faire le setup d'installation
Leçon 4Préparer le spider
Leçon 5Scraping simple avec Selenium
Leçon 6Scraping avec interactions - installatioon
Leçon 7Scraping avec interactions
Leçon 8Les autres interactions possibles avec Selenium
Leçon 9Enoncé Atelier
Leçon 10Correction atelier
Chapitre 28 : Contourner les blocages des sites web
38m04
 
Leçon 1Introduction
Leçon 2Apprendre à lire un fichier robots.txt
Leçon 3Ne pas suivre les règles du fichier robots.txt
Leçon 4Modifier le user agent
Leçon 5Dynamiser le user agent à chaque requête partie 1
Leçon 6Dynamiser le user agent à chaque requête partie 2
Leçon 7Bloquer les cookies
Leçon 8Ralentir le scraper
Chapitre 29 : Web Scraping avec Splash
53m19
 
Leçon 1Introduction à la librairie Splash
Leçon 2Installation splash
Leçon 3Découverte de splash et du langage LUA
Leçon 4Créer un script en LUA
Leçon 5Intégrer Splash dans un projet Scrapy
Leçon 6Limiter les ressources appelées
Leçon 7L'autothrottle
Leçon 8Enoncé Atelier
Leçon 9Correction atelier
Chapitre 30 : Simuler une connexion à un compte en ligne
32m40
 
Leçon 1Gérer le login avec Scrapy
Leçon 2Gérer le login avec Splash
Leçon 3Entrainement
Chapitre 31 : Gestion des requêtes en AJAX
15m02
 
Leçon 1Comprendre l'AJAX
Leçon 2Récupérer des données depuis une requête dynamique
Chapitre 32 : Envoyer vos données vers l'extérieur avec les pipelines
12m14
 
Leçon 1Connecter son projet Scrapy au système Mongo DB cloud - partie 1
Leçon 2Connecter son projet Scrapy au système Mongo DB cloud - partie 2
Chapitre 33 : Conclusion et remerciements
01m59
 
Leçon 1Conclusion et remerciements

Aperçus

Avis des apprenants

Détail des avis
286
Apprenants
4
Commentaires
5/5
Note moyenne
5/5
4
4/5
0
3/5
0
2/5
0
1/5
0
Jean-François Leroi
Jean-François Leroi
Publié le 22/11/2022
Excellent! Très complet et didactique. Cas pratiques. Bravo. Je vais faire un 2ème tour pour mieux intégrer toutes ces infos. Merci.
Niko76
Niko76
Publié le 06/11/2022
J'ai adoré cette formation : construction méthodique et progressive en pas à pas, explications claires du formateur, répétitions des exercices facilitant l'assimilation des connaissances ... Je recommande vivement ce tuto à toute personne désirant se lancer dans le webscraping. Encore BRAVO !
Hippolyte Kengni
Hippolyte Kengni
Publié le 07/08/2021
Le cours est très intéressant pour les novice ou les professionnels, tout le monde y trouve son compte. Le formateur est assez méthodique comme dans tous ses tutos. Je recommande fortement ce cours pour toute personne voulant débuter le Webscraping.

Vos questions sur le cours

Avec quelle version de logiciel ce tuto est-il compatible ?

Python 3

Quel est le niveau requis pour suivre ce tuto ?

débutant

Bonjour, Y a t-il un budget pour utiliser les outils afin de suivre cette formation ?

Bonjour, Toutes les logiciels et librairies Python utilisés dans ce cours sont Open source. Aucun budget supplémentaire à prévoir mis à part l’obtention du cours en lui même donc :)

Bonjour, Je souhaiterais apprendre à faire du scrapping de la SERP afin d'améliorer mon SEO. Cette formation pourrait-elle m'aider en ce sens? Merci

Bonjour, les moteurs de recherche sont des site web comme les autres, donc cette formation peut tout à fait répondre à ce besoin. Vous avez par ailleurs tout un chapitre sur le scraping de résultats de recherches sur le moteur interne de Wikipedia, très proche de votre cas, donc :) Sébastien

Payer plus tard ou en 3x

Prix d'achat : 58,00 €
Pour payer plus tard ou en plusieurs versements échelonnés, sélectionnez Klarna comme moyen de paiement lors du règlement.

Ajoutez des articles à votre panier

Sélectionnez Klarna lors du règlement

Recevez une autorisation

Payez plus tard ou en plusieurs fois

3 paiements de 19,33 €
tous les mois, sans intérêts
Total : 58,00 €
Afficher les conditions : Klarna
Klarna : conditions d'utilisation du paiement différé en 3 échéances.

Attendez ! 🤗

Accédez à plus de 1422 tutos gratuits

Notre politique de protection des données