Utiliser des outils gratuits pour extraire de l'information de valeur. C'est encore une fois ce que je vous propose de faire. Cette fois-ci nous utiliserons l'équivalent Excel de chez Google : Google Sheet.
Cette formation requiert une certaine volonté de vouloir découvrir comment fonctionne une page internet afin d'en extraire précisément des informations. (Mais vous verrez, c'est encore mieux lorsque l'on comprend ce que l'on fait !)
Apprendre en pratiquant
Comme chacune de mes formations, je vous propose à chaque fois d'apprendre en faisant. Je prends un sujet d'étude et je vous explique comment l'on va pouvoir arriver à nos faims. J'aborde également des sujets plus théoriques afin que vous puissiez comprendre la logique derrière les actions.
Envie d'extraire des données plus facilement ?
En effet, nous allons rentrer en peu plus en détail dans le code dans cette formation. Si ce n'est pas ce que vous recherchez, je vous invite à aller voir mes 2 précédentes formations sur le sujet.
La première étant une introduction à l'extension WebScraper de Google Chrome (40min de formation).
La seconde étant une formation complète pour devenir un maitre dans l'art d'extraire les données d'un site internet, toujours avec cette même extension Google Chrome (3h de formation).
Sachez que ces 2 formations précédentes sont complètement compatibles avec celle-ci sur Google Sheet. Les informations apprises dans l'une vous aideront dans l'autre et vice-versa.
Au programme de cette formation sur l'extraction de données avec Google Sheet
- résumé des notions importantes abordées (pas de pré-requis)
- introduction au web scraping et web crawling
- découverte et création d'une feuille Google Sheet
- la fonction IMPORTXML()
- la structure XML
- le langage XPath
- la structure HTML
- comment se compose une page web
- extensions Google Chrome pour XPath
- la fonction REGEXEXTRACT()
- les Expressions Régulières (REGEX)
- présentation tableau de bord tuto.com dans Google Sheet
- pistes pour aller plus loin
Comme beaucoup l'ont déjà fait pour la précédente formation, n'hésitez pas à me solliciter si vous avez des remarques ou des questions (notamment dans la section Entraide),
Bonne découverte et bon scraping !
Attention : cette vidéo est réalisée dans un but pédagogique. Avant de scraper les données d'un site, vérifiez que ce dernier autorise ou n'interdit pas ce genre de pratique !
Attention bis : Web scraping et web crawling ne sont pas synonymes de "hacking". A aucun moment nous sommes en train de pirater des données. Nous récupérons simplement automatiquement des données qui nous sont rendues accessibles.
Avis des apprenants