Um Data Frames in R zu joinen, können Sie die Funktionen aus dem dplyr-Paket verwenden. Zuerst müssen Sie das Paket installieren und laden:
install.packages("dplyr")
library(dplyr)Nehmen wir an, Sie haben zwei Data Frames df1 und df2, die Sie joinen möchten. Hier sind die verschiedenen Join-Typen:
- Inner Join: Behält nur die Zeilen bei, bei denen es in beiden Data Frames übereinstimmende Werte gibt.
inner_join_df <- df1 %>%
inner_join(df2, by = "key")- Outer Join: Behält alle Zeilen aus beiden Data Frames bei und füllt fehlende Werte mit
NAauf.
outer_join_df <- df1 %>%
full_join(df2, by = "key")- Left Join: Behält alle Zeilen aus dem ersten (linken) Data Frame bei und fügt die übereinstimmenden Zeilen aus dem zweiten (rechten) Data Frame hinzu. Fehlende Werte werden mit
NAaufgefüllt.
left_join_df <- df1 %>%
left_join(df2, by = "key")- Right Join: Behält alle Zeilen aus dem zweiten (rechten) Data Frame bei und fügt die übereinstimmenden Zeilen aus dem ersten (linken) Data Frame hinzu. Fehlende Werte werden mit
NAaufgefüllt.
right_join_df <- df1 %>%
right_join(df2, by = "key")In diesen Beispielen ist "key" die Spalte, anhand derer die Data Frames gejoined werden. Ersetzen Sie "key" durch den Namen der Spalte, die in Ihren Data Frames verwendet wird.