Aggregate() -Funktion in R
Die Funktion Aggregate () in R teilt die Daten in Teilmengen auf, berechnet Zusammenfassungsstatistiken für jede Teilmenge und gibt das Ergebnis in einer Gruppe nach Form zurück. Die Aggregatfunktion in R ähnelt group by in SQL. Die Funktion Aggregate () ist nützlich, um alle Aggregatoperationen wie Summe, Anzahl, Mittelwert, Minimum und Maximum auszuführen.
Sehen wir uns ein Beispiel für Folgendes an
- Aggregate(), das die Gruppensumme berechnet
- Berechnen Sie das Maximum und Minimum der Gruppe mit der aggregate() -Funktion
- Aggregate() -Funktion, die den Gruppenmittelwert berechnet
- Holen Sie sich Gruppenzahlen mit der aggregate() -Funktion
die piktografische Darstellung der Aggregat () -Funktion, dh der Aggregatsumme, ist unten dargestellt
Syntax für die Funktion Aggregate() in R:
X | ein R-Objekt, meistens ein Datenrahmen |
by | eine Liste von Gruppierungselementen, nach denen die Teilmengen |
FUN | eine Funktion zur Berechnung der Zusammenfassungsstatistik |
simplify | ein logischer Wert, der angibt, ob die Ergebnisse nach Möglichkeit zu einem Vektor oder einer Matrix vereinfacht werden sollen |
drop | ein logischer Wert, der angibt, ob nicht verwendete Kombinationen von Gruppierungswerten gelöscht werden sollen. |
Beispiel für die Aggregate() -Funktion in R:
Verwenden wir den Iris-Datensatz, um ein einfaches Beispiel für die Aggregatfunktion in R zu demonstrieren. Angenommen, Sie möchten den Mittelwert aller Metriken ermitteln (Sepal.Länge Sepal.Breite Blütenblatt.Länge Blütenblatt.Breite) für die verschiedenen Arten dann können wir Aggregatfunktion verwenden
# Aggregate function in R with mean summary statisticsagg_mean = aggregate(iris,by=list(iris$Species),FUN=mean, na.rm=TRUE)agg_mean
Der obige Code nimmt die ersten 4 Spalten des Datensatzes und gruppiert nach „Arten“, indem der Mittelwert für jede Gruppe berechnet wird, so dass die Ausgabe
hinweis: Bei Verwendung der Funktion aggregate() müssen sich die by-Variablen in einer Liste befinden.
Beispiel für die Funktion aggregate() in R mit sum:
Verwenden wir die Funktion aggregate() in R, um die Summe aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.
# Aggregate function in R with sum summary statisticsagg_sum = aggregate(iris,by=list(iris$Species),FUN=sum, na.rm=TRUE)agg_sum
Wenn wir den obigen Code ausführen, lautet die Ausgabe
Beispiel für die Funktion aggregate() in R mit count:
Verwenden wir die Funktion aggregate(), um die Anzahl aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.
# Aggregate function in R with countagg_count = aggregate(iris,by=list(iris$Species),FUN=length)agg_count
Der obige Code verwendet die ersten 4 Spalten des Iris-Datensatzes und gruppiert nach „Spezies“, indem die Anzahl für jede Gruppe berechnet wird, sodass die Ausgabe
Beispiel für die Funktion aggregate() in R mit maximum:
Verwenden wir die Funktion aggregate(), um das Maximum aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.
# Aggregate function in R with maximumagg_max = aggregate(iris,by=list(iris$Species),FUN=max, na.rm=TRUE)agg_max
Der obige Code verwendet die ersten 4 Spalten des Iris-Datensatzes und gruppiert nach „Spezies“, indem das Maximum für jede Gruppe berechnet wird, sodass die Ausgabe
Beispiel für die Funktion aggregate() in R mit minimum:
Verwenden wir die Funktion aggregate(), um das Minimum aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.
# Aggregate function in R with minimumagg_min = aggregate(iris,by=list(iris$Species),FUN=min, na.rm=TRUE)agg_min
Der obige Code verwendet die ersten 4 Spalten des Iris-Datensatzes und gruppiert nach „Spezies“, indem die min für jede Gruppe berechnet wird, sodass die Ausgabe