患者IDの重複を削除してデータフレーム作成

df <- df2_covid19hp_2_age_ex %>%
+ group_by(患者ID) %>% 患者IDでグループ化
+ slice_head(n=1) %>%  行の1行目を取り出す
+ ungroup()       グループ化を解除する

そうすると最後のデータフレームが作成される

 df <- df2_covid19hp_2_age_ex %>%
+ group_by(患者ID) %>%
+ summarize(diag_date = min(有効開始日))  %>%
+ distinct(患者ID, diag_date)

このように作成すると、患者ごとに有効開始日から統一されたdiag_dateが作成されて、それで異なるIDとdiag_dateをもつデータフレームが作成される(患者IDとdiag_dateのみの)。

コメント

タイトルとURLをコピーしました