Wie kann man Data Frames in R joinen (inner, outer, left, right)?

Um Data Frames in R zu joinen, können Sie die Funktionen aus dem dplyr-Paket verwenden. Zuerst müssen Sie das Paket installieren und laden:

install.packages("dplyr")
library(dplyr)

Nehmen wir an, Sie haben zwei Data Frames df1 und df2, die Sie joinen möchten. Hier sind die verschiedenen Join-Typen:

  1. Inner Join: Behält nur die Zeilen bei, bei denen es in beiden Data Frames übereinstimmende Werte gibt.
inner_join_df <- df1 %>%
  inner_join(df2, by = "key")
  1. Outer Join: Behält alle Zeilen aus beiden Data Frames bei und füllt fehlende Werte mit NA auf.
outer_join_df <- df1 %>%
  full_join(df2, by = "key")
  1. Left Join: Behält alle Zeilen aus dem ersten (linken) Data Frame bei und fügt die übereinstimmenden Zeilen aus dem zweiten (rechten) Data Frame hinzu. Fehlende Werte werden mit NA aufgefüllt.
left_join_df <- df1 %>%
  left_join(df2, by = "key")
  1. Right Join: Behält alle Zeilen aus dem zweiten (rechten) Data Frame bei und fügt die übereinstimmenden Zeilen aus dem ersten (linken) Data Frame hinzu. Fehlende Werte werden mit NA aufgefüllt.
right_join_df <- df1 %>%
  right_join(df2, by = "key")

In diesen Beispielen ist "key" die Spalte, anhand derer die Data Frames gejoined werden. Ersetzen Sie "key" durch den Namen der Spalte, die in Ihren Data Frames verwendet wird.