Programim dhe zhvillim, javascript, python, php, html

Grupimi i pandave Python në një mënyrë tjetër

Kam shumë korniza të dhënash të lexuara nga skedarët pdf. Dhe ata duken kështu:

e.g order 1 - this is a dataframe:
code    description   price   quantity       
000001  product A       1       10
000002  product B       2       20
000003  product C       3       30 
...

order 2 - this is a dataframe:
code    description   price   quantity
000001  product A       1       100
000002  product B       2       20
000004  product D       4       40

Do të ketë porosi 3, 4 etj. Më pëlqen t'i bashkoj dhe të grupoj sipas kodit (i cili është unik) por të shfaq veçmas sasitë.

code    description   price   order1 quantity  order2 quantity
000001  product A       1       10              100
000002  product B       2       20              20
000003  product C       3       30               0 
000004  product D       4        0              40

Përveç përdorimit të sytheve të lodhshme, pyes veten nëse ka një mënyrë më të pastër për ta arritur këtë tek panda. Unë e kam përpunuar këtë në excel vba më parë duke përdorur sythe të shëmtuara dhe është hera ime e parë që e provoj në panda.

Faleminderit shumë për çdo ndihmë!

16.07.2019


Përgjigjet:


1

Ju mund të krijoni MultiIndex Series nga DataFrame.set_index ose përmbledh sum në kuptimin e listës dhe më pas bashkohu duke concat :

dfs = [df1, df2, ..., dfn]

#if triples code, description, price are unique
L = [x.set_index(['code', 'description', 'price'])['quantity'] for x in dfs]

#if triples are not unique and necessary aggregate sum
L = [x.groupby(['code', 'description', 'price'])['quantity'].sum() for x in dfs]

df1 = (pd.concat(L, axis=1, keys=range(1, len(dfs) + 1))
         .add_prefix('quantity')
         .fillna(0)
         .astype(int)
         .reset_index())
print (df1)
     code description  price  quantity1  quantity2
0  000001   product A      1         10        100
1  000002   product B      2         20         20
2  000003   product C      3         30          0
3  000004   product D      4          0         40

EDIT:

Për caktimin e emrave të parazgjedhur të kolonave për çdo DataFrame në kuptimin e listës është e mundur nga DataFrame.set_axis:

L = [x.set_axis(np.arange(len(x.columns)), axis=1, inplace=False).set_index([0,1,2])[3] 
                                             for x in dfs]
16.07.2019
  • Faleminderit për kontributin, përpara se të provoj këto zgjidhje, më duhet të ripunoj kornizën time të të dhënave. A e dini se si të hiqni indeksimin e bezdisshëm të kolonës? Unë do të thotë se çdo rresht tashmë ka një indeks, kështu që çdo rresht është etiketuar 0 1 2 etj. Por unë kam të njëjtën 0,1,2 etj për kolonat? Besoj se kjo po më pengon të thërras .kolona dhe të jap emrat e kolonave të kornizës së të dhënave. A do të kishit ndonjë ide? 17.07.2019
  • Nuk mund të shpreh mirënjohjen time, ju më përgjigjët brenda 10 minutave nga postimi i pyetjes sime dhe kjo funksionon sipas asaj që doja. Për ta bërë këtë në excel vba do të më kishte marrë pak kohë dhe nuk do të doja të shkoja në këtë rrugë. Faleminderit shumë jezrael senpai. 18.07.2019
  • Materiale të reja

    Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.
    Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

    Faketojeni derisa ta arrini me të dhënat false
    A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

    Si të përdorni kërkesën API në Python
    Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

    Një udhëzues hap pas hapi për të zotëruar React
    Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

    AI dhe Psikologjia — Pjesa 2
    Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

    Esencialet e punës ditore të kodit tim VS
    Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

    Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues
    Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..