Fonction Aggregate() dans R
La fonction Aggregate() dans R Divise les données en sous-ensembles, calcule des statistiques récapitulatives pour chaque sous-ensemble et renvoie le résultat dans un formulaire group by. La fonction d’agrégation dans R est similaire à group by dans SQL. La fonction Aggregate() est utile pour effectuer toutes les opérations d’agrégation telles que sum, count, mean, minimum et Maximum.
Voyons un exemple de ce qui suit
- Aggregate() qui calcule la somme du groupe
- calculez le maximum et le minimum du groupe en utilisant la fonction aggregate()
- fonction Aggregate() qui calcule la moyenne du groupe
- Obtenez le nombre de groupes en utilisant la fonction aggregate()
A la représentation pictographique de la fonction aggregate(), c’est-à-dire la somme agrégée, est indiquée ci-dessous
Syntaxe de la fonction Aggregate() dans R:
X | un objet R, principalement une trame de données |
par | une liste d’éléments de regroupement, par laquelle les sous-ensembles sont regroupés par |
FUN | une fonction pour calculer les statistiques récapitulatives |
simplifier | une logique indiquant si les résultats doivent être simplifiés en vecteur ou en matrice si possible |
drop | une logique indiquant s’il faut supprimer les combinaisons inutilisées de valeurs de regroupement. |
Exemple de fonction Aggregate() dans R:
Utilisons l’ensemble de données iris pour démontrer un exemple simple de fonction aggregate dans R. Nous connaissons tous l’ensemble de données iris. Supposons que si vous voulez trouver la moyenne de toutes les métriques (Sépal.Sépale de longueur.Pétale de largeur.Pétale de longueur.Largeur) pour les espèces distinctes, nous pouvons utiliser la fonction d’agrégation
# Aggregate function in R with mean summary statisticsagg_mean = aggregate(iris,by=list(iris$Species),FUN=mean, na.rm=TRUE)agg_mean
le code ci-dessus prend les 4 premières colonnes de l’ensemble de données iris et les groupes par « espèces » en calculant la moyenne pour chaque groupe, donc la sortie sera
note: Lorsque vous utilisez la fonction aggregate(), les variables by doivent être dans une liste.
Exemple de fonction aggregate() dans R avec sum:
Utilisons la fonction aggregate() dans R pour créer la somme de toutes les métriques entre espèces et groupe par espèces.
# Aggregate function in R with sum summary statisticsagg_sum = aggregate(iris,by=list(iris$Species),FUN=sum, na.rm=TRUE)agg_sum
Lorsque nous exécutons le code ci-dessus, la sortie sera
Exemple de fonction aggregate() dans R avec count:
Utilisons la fonction aggregate() pour créer le nombre de toutes les métriques entre espèces et grouper par espèces.
# Aggregate function in R with countagg_count = aggregate(iris,by=list(iris$Species),FUN=length)agg_count
le code ci-dessus prend les 4 premières colonnes de l’ensemble de données iris et les regroupe par « espèces » en calculant le nombre pour chaque groupe, de sorte que la sortie sera
Exemple de fonction aggregate() dans R avec un maximum:
Utilisons la fonction aggregate() pour créer le maximum de toutes les métriques entre espèces et grouper par espèces.
# Aggregate function in R with maximumagg_max = aggregate(iris,by=list(iris$Species),FUN=max, na.rm=TRUE)agg_max
le code ci-dessus prend les 4 premières colonnes de l’ensemble de données iris et les regroupe par « espèces » en calculant le maximum pour chaque groupe, de sorte que la sortie sera
Exemple de fonction aggregate() dans R avec un minimum:
Utilisons la fonction aggregate() pour créer le minimum de toutes les métriques entre espèces et grouper par espèces.
# Aggregate function in R with minimumagg_min = aggregate(iris,by=list(iris$Species),FUN=min, na.rm=TRUE)agg_min
le code ci-dessus prend les 4 premières colonnes de l’ensemble de données iris et les regroupe par « espèces » en calculant le min pour chaque groupe, de sorte que la sortie sera