isdsucph / isds2024

Introduction to Social Data Science 2024 - a summer school course https://isdsucph.github.io/isds2024/
MIT License
13 stars 7 forks source link

Appende dataframes vertikalt med forskellige kolonne-navne #9

Open fls808 opened 2 months ago

fls808 commented 2 months ago

Hej,

Vi har nogle forskellige dataframes, som vi har lyst til at appende vertikalt. Lad os tage udgangspunkt i df1 og df2, som er data for fx to forskellige personer. I df1 er der kolonnerne ”age” og ”sex”. I df2 er der kolonerne ”age” og ”occupation”.

Problemet, er at når vi bruger

df_append = pd.concat([df1, df2], axis=0)

så får vi fejlkoden ”InvalidIndexError: Reindexing only valid with uniquely valued Index objects”.

Efter at have googlet rundt, tror vi, at det netop skyldes, at der i df1 er nogle andre kolonnenavne end i df2, som jo bruges til at appende. Vi vil bare gerne have, at der så tilføjes en kolonne til df_append, som så er fyldt med NaN, når der ikke er nogle værdier i df1, altså fuldstændig som brugte man append i STATA.

Vi håber, I kan hjælpe.

johankll commented 2 months ago

Det lyder som om, I gerne vil merge/joine to DataFrames. Da I arbejder med DataFrames, kan I med fordel kigge på dokumentationen for Pandas' merge method. Husk at være opmærksom på, hvordan i merger (‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’).

Jeg håber, det hjælper. Hvis ikke, bør I poste et minimalt reproducerende eksempel.