Importer des données
R propose plusieurs fonctions pour importer des données à partir de différents formats :
- read.csv() : Pour importer des données au format CSV
- read_excel() (package readxl) : Pour importer des données au format Excel
- read_sas() (package haven) : Pour importer des données au format SAS
- read_stata() (package haven) : Pour importer des données au format Stata
- read_spss() (package haven) : Pour importer des données au format SPSS
Manipulation de données
R propose plusieurs fonctions pour manipuler des données :
- head() et tail() : Pour afficher les premières et dernières lignes d’un dataframe
- str() : Pour afficher la structure d’un dataframe
- summary() : Pour afficher un résumé statistique des variables d’un dataframe
- View() : Pour afficher un dataframe dans une interface graphique
- dim() : Pour afficher les dimensions d’un dataframe
- nrow() et ncol() : Pour compter le nombre de lignes et de colonnes d’un dataframe
- subset() : Pour sélectionner des lignes et des colonnes d’un dataframe
- filter() (package dplyr) : Pour filtrer des lignes d’un dataframe
- select() (package dplyr) : Pour sélectionner des colonnes d’un dataframe
- arrange() (package dplyr) : Pour trier un dataframe
- mutate() (package dplyr) : Pour créer de nouvelles variables dans un dataframe
- group_by() et summarise() (package dplyr) : Pour regrouper et résumer des données
Nettoyage de données
R propose plusieurs fonctions pour nettoyer des données :
- na.omit() : Pour supprimer les lignes contenant des valeurs manquantes
- et complete.cases() : Pour identifier les valeurs manquantes
- replace_na() (package tidyr) : Pour remplacer les valeurs manquantes
- drop_na() (package tidyr) : Pour supprimer les lignes contenant des valeurs manquantes
- fill() (package tidyr) : Pour remplir les valeurs manquantes avec les valeurs précédentes ou suivantes
Exploration de données
R propose plusieurs fonctions pour explorer des données :
- plot() : Pour créer des graphiques de base
- ggplot() (package ggplot2) : Pour créer des graphiques avancés
- hist() : Pour créer des histogrammes
- boxplot() : Pour créer des boîtes à moustaches
- density() : Pour créer des densités de probabilité
- cor() : Pour calculer les corrélations
- scale_color_manual() et scale_fill_manual() (package ggplot2) : Pour personnaliser les couleurs des graphiques
