Um Data Frames in R zu joinen, können Sie die Funktionen aus dem dplyr
-Paket verwenden. Zuerst müssen Sie das Paket installieren und laden:
install.packages("dplyr")
library(dplyr)
Nehmen wir an, Sie haben zwei Data Frames df1
und df2
, die Sie joinen möchten. Hier sind die verschiedenen Join-Typen:
- Inner Join: Behält nur die Zeilen bei, bei denen es in beiden Data Frames übereinstimmende Werte gibt.
inner_join_df <- df1 %>%
inner_join(df2, by = "key")
- Outer Join: Behält alle Zeilen aus beiden Data Frames bei und füllt fehlende Werte mit
NA
auf.
outer_join_df <- df1 %>%
full_join(df2, by = "key")
- Left Join: Behält alle Zeilen aus dem ersten (linken) Data Frame bei und fügt die übereinstimmenden Zeilen aus dem zweiten (rechten) Data Frame hinzu. Fehlende Werte werden mit
NA
aufgefüllt.
left_join_df <- df1 %>%
left_join(df2, by = "key")
- Right Join: Behält alle Zeilen aus dem zweiten (rechten) Data Frame bei und fügt die übereinstimmenden Zeilen aus dem ersten (linken) Data Frame hinzu. Fehlende Werte werden mit
NA
aufgefüllt.
right_join_df <- df1 %>%
right_join(df2, by = "key")
In diesen Beispielen ist "key"
die Spalte, anhand derer die Data Frames gejoined werden. Ersetzen Sie "key"
durch den Namen der Spalte, die in Ihren Data Frames verwendet wird.