Ce cours est dédié à l'apprentissage de la programmation en R appliqué à la Data Science.
Si vous avez envie d'apprendre à coder, d'apprendre à manipuler de la data ou les deux, alors n'hésitez pas, cette formation en vidéo est un concentré de tout ça !
Au programme de cette formation Apprendre la Data Science avec R de A à Z
Ce cours de 8 heures vous permettra dans un premier temps d'acquérir les outils nécessaires pour coder en R et faire de la Data Science.
Puis il enchaînera sur la partie théorique de la programmation en R, avec des exercices à chaque étape, afin de comprendre la théorie en pratiquant.
Dans un troisième temps, vous apprendrez à manipuler et explorer/visualiser des données efficacement.
Enfin, un cas pratique de Data Science viendra reprendre tout ces concepts pour les appliquer sur des données réelles en plus de vous apprendre à appliquer des algorithmes de Machine Learning sur vos données.
A la fin de ce cours, vous serez capable d'aller récupérer un jeu de données qui vous intéresse et de l'analyser de A à Z pour en sortir les informations qui vous intéresse.
J'espère que ce cours vous plaira, j'ajouterai d'avantage de cas pratiques au fur et à mesure pour le rendre encore plus complet qu'il ne l'est déjà.
Le but de ce cours de Data Science est réellement de vous apprendre à programmer en R, de vous faire pratiquer afin de devenir totalement autonome pour analyser tous les jeux de données qui vous intéresse. Et je compte bien vous aider à chaque étape pour arriver à cette finalité !
Pourquoi utiliser R ?
J'ai choisi R pour la simple et bonne raison que c'est un des langages les plus utilisés en Data Science.
De plus, c'est un langage que je maîtrise et qui a fait ses preuves pour résoudre tout mes problèmes d'analyse de données. Mais aussi parce que c'est un langage de programmation libre, intuitif et très bien documenté.
Enfin, R est un langage extrêmement efficace pour effectuer des analyses statistiques et de l'exploration de données.
Je veux que ce cours soit le plus complet possible. Ainsi, n'hésitez surtout pas à me contacter si vous avez la moindre question ou la moindre remarque sur ce cours.
C'est aussi grâce à vous que je pourrais l'améliorer et le faire évoluer. Mon objectif est réellement de vous aider à devenir un Data Scientist autonome et passionné !
Table des matières de cette formation Data Science, R (durée : 8h06m)
-
Introduction et mise en place du cours
- Installation de R et Rstudio (Windows, Mac, Linux) 00:05:58
- Découverte de l'interface Rstudio 00:03:50
- Création d'un projet sous Rstudio 00:01:57
- Installation des packages R essentiels pour la Data Science 00:05:50
-
Débuter avec R
- Les types de données (character, int, double, booléens, données manquantes) 00:04:43
- Les variables 00:03:02
- Les opérateurs arithmétiques 00:03:32
- Les vecteurs 00:03:31
- Opérations sur les vecteurs 00:05:13
- Manipuler les vecteurs grâce aux indexs 00:03:47
- Qu'est-ce qu'une fonction en R? 00:02:34
- Utiliser les fonctions fournis par R 00:06:23
- Qu'est-ce qu'un package R? 00:01:53
- Savoir utiliser l'aide de R 00:04:19
- Exercice : manipuler un vecteur contenant les moyennes d'une classe de 20 élèves 00:12:07
-
Les matrices en R
- Qu'est-ce qu'une matrice en R? 00:05:04
- Colnames() et rownames() 00:03:43
- Accéder aux éléments d'une matrice 00:04:03
- Modifier une matrice 00:02:04
- Opérations sur les matrices 00:04:33
- Exercice : manipuler une matrice 00:20:01
-
Les dataframes en R
- Qu'est-ce qu'un dataframe en R? 00:03:34
- Colnames() et rownames() 00:02:15
- Importation de données 00:08:30
- Exportation de données 00:04:55
- Accéder aux éléments d'un dataframe 00:04:22
- Créer un sous-ensemble à partir d'un dataframe 00:10:16
- Exercice: manipuler les dataframes 00:17:39
-
Les bases de la programmation en R
- Les opérateurs logiques 00:07:54
- Les instructions de condition (if .. else) 00:04:26
- Les instructions de boucles (for) 00:06:14
- Les instructions de boucles (while) 00:04:22
- Exercice sur les instructions de condition et les boucles 00:15:33
- Comment créer sa propre fonction en R? 00:13:13
-
Manipulation avancée des données
- Apply() 00:09:55
- Aggregate() et by() 00:09:14
- Dplyr : les tibbles 00:04:04
- Dplyr : select() 00:07:38
- Dplyr : filter() 00:11:01
- Dplyr : l'opérateur pipe (%>%) 00:04:05
- Dplyr : arrange() 00:05:02
- Dplyr : summarise() 00:08:07
- Dplyr : group_by() 00:05:16
- Dplyr : mutate() 00:05:28
- Exercice : explorer les données de l'ensemble des fast-foods aux USA 00:26:00
-
Visualisation avancée des données
- Créer son premier graphique avec la fonction plot() 00:19:59
- Créer des graphiques plus élaborés avec ggplot2 00:07:11
- Ggplot2 : Les couleurs, les formes et les tailles 00:08:55
- Ggplot2 : La légende (introduction aux thèmes) 00:13:12
- Ggplot2 : Axes et titres 00:09:10
- Ggplot2 : Combiner plusieurs graphes (facet) 00:05:57
- Ggplot2 : Ajouter des annotations aux graphiques 00:10:00
- Ggplot2 : Les différents types de graphes(geoms) 00:11:16
- Exercice : visualisation des données de l'ensemble des fast-foods aux USA 00:20:22
- BONUS : rendre votre graphique interactif avec Plotly 00:04:46
-
Cas pratique de Data Science : appliquer des algorithmes de Machine Learning
- Qu'est-ce que l'apprentissage automatique (Machine Learning)? 00:04:58
- Données : prédire la souscription d'un client à un produit bancaire 00:09:05
- Visualisation des données avec ggplot2 00:06:33
- Création d'un jeu de données test et d'entrainement 00:16:11
- Traitement des classes déséquilibrées et normalisation 00:11:52
- Entrainer un modèle avec Caret : méthode Naïve Bayes 00:12:32
- Entrainer un modèle avec Caret : méthode SVM (Support Vector Machine) 00:03:59
- Trouver les variables prédictives les plus importantes 00:02:56
- Fichiers sourcestélécharger
- QCMaccéder
- Certificat
Formateur : Amandine Velt
-
Merci beaucoup pour ce tuto sur R que je recommande vivement . J'avais auparavant fait le tuto de FUN intitulé "Bases de la statistique avec R". Votre cours le complète à merveille et m'a fait découvrir ggplot2, les tibbles et la data science. Il m'a permis également d'utiliser ggmap qui fonctionne comme ggplot pour réaliser des cartes de données. Félicitation !
-
Clair et efficace ! Je recommande vivement ce tuto pour celles et ceux qui souhaitent se lancer dans la data science avec R ;)
-
Cours bien organisé, expliqué de manière simple, juste parfait !
-
Avec quelles versions de logiciels ce tuto est-il compatible ?Data Science , R
-
Quel est le niveau requis pour suivre ce tuto ?débutant
-
Que contient le fichier source ?L'ensemble du code R utilisé durant le cours et rendu disponible. Pour ce qui est des fichiers de données, je vous guide pas à pas dans le cours pour les récupérer et les charger dans votre session R.
note moyenne
avis laissés