Aggregate() -Funktion in R

Die Funktion Aggregate () in R teilt die Daten in Teilmengen auf, berechnet Zusammenfassungsstatistiken für jede Teilmenge und gibt das Ergebnis in einer Gruppe nach Form zurück. Die Aggregatfunktion in R ähnelt group by in SQL. Die Funktion Aggregate () ist nützlich, um alle Aggregatoperationen wie Summe, Anzahl, Mittelwert, Minimum und Maximum auszuführen.

Sehen wir uns ein Beispiel für Folgendes an

  • Aggregate(), das die Gruppensumme berechnet
  • Berechnen Sie das Maximum und Minimum der Gruppe mit der aggregate() -Funktion
  • Aggregate() -Funktion, die den Gruppenmittelwert berechnet
  • Holen Sie sich Gruppenzahlen mit der aggregate() -Funktion

die piktografische Darstellung der Aggregat () -Funktion, dh der Aggregatsumme, ist unten dargestellt

Aggregatfunktion in R 0

Syntax für die Funktion Aggregate() in R:

aggregieren(x, by, FUN, …, simplify = TRUE, drop = TRUE)
X ein R-Objekt, meistens ein Datenrahmen
by eine Liste von Gruppierungselementen, nach denen die Teilmengen
FUN eine Funktion zur Berechnung der Zusammenfassungsstatistik
simplify ein logischer Wert, der angibt, ob die Ergebnisse nach Möglichkeit zu einem Vektor oder einer Matrix vereinfacht werden sollen
drop ein logischer Wert, der angibt, ob nicht verwendete Kombinationen von Gruppierungswerten gelöscht werden sollen.

Beispiel für die Aggregate() -Funktion in R:

Verwenden wir den Iris-Datensatz, um ein einfaches Beispiel für die Aggregatfunktion in R zu demonstrieren. Angenommen, Sie möchten den Mittelwert aller Metriken ermitteln (Sepal.Länge Sepal.Breite Blütenblatt.Länge Blütenblatt.Breite) für die verschiedenen Arten dann können wir Aggregatfunktion verwenden

# Aggregate function in R with mean summary statisticsagg_mean = aggregate(iris,by=list(iris$Species),FUN=mean, na.rm=TRUE)agg_mean

Der obige Code nimmt die ersten 4 Spalten des Datensatzes und gruppiert nach „Arten“, indem der Mittelwert für jede Gruppe berechnet wird, so dass die Ausgabe

 Aggregatfunktion in R 1

hinweis: Bei Verwendung der Funktion aggregate() müssen sich die by-Variablen in einer Liste befinden.

Beispiel für die Funktion aggregate() in R mit sum:

Verwenden wir die Funktion aggregate() in R, um die Summe aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.

# Aggregate function in R with sum summary statisticsagg_sum = aggregate(iris,by=list(iris$Species),FUN=sum, na.rm=TRUE)agg_sum

Wenn wir den obigen Code ausführen, lautet die Ausgabe

Aggregatfunktion in R 2

Beispiel für die Funktion aggregate() in R mit count:

Verwenden wir die Funktion aggregate(), um die Anzahl aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.

# Aggregate function in R with countagg_count = aggregate(iris,by=list(iris$Species),FUN=length)agg_count

Der obige Code verwendet die ersten 4 Spalten des Iris-Datensatzes und gruppiert nach „Spezies“, indem die Anzahl für jede Gruppe berechnet wird, sodass die Ausgabe

Aggregatfunktion in R 3

Beispiel für die Funktion aggregate() in R mit maximum:

Verwenden wir die Funktion aggregate(), um das Maximum aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.

# Aggregate function in R with maximumagg_max = aggregate(iris,by=list(iris$Species),FUN=max, na.rm=TRUE)agg_max

Der obige Code verwendet die ersten 4 Spalten des Iris-Datensatzes und gruppiert nach „Spezies“, indem das Maximum für jede Gruppe berechnet wird, sodass die Ausgabe

Aggregatfunktion in R 4

Beispiel für die Funktion aggregate() in R mit minimum:

Verwenden wir die Funktion aggregate(), um das Minimum aller Metriken für alle Arten und Gruppen nach Arten zu erstellen.

# Aggregate function in R with minimumagg_min = aggregate(iris,by=list(iris$Species),FUN=min, na.rm=TRUE)agg_min

Der obige Code verwendet die ersten 4 Spalten des Iris-Datensatzes und gruppiert nach „Spezies“, indem die min für jede Gruppe berechnet wird, sodass die Ausgabe

Aggregatfunktion in R 5