Pandas Sum Column

Pandas Sum Column



“Ovaj članak će pokazati kako zbrojiti sve ili određene stupce u Pandas DataFrameu pomoću Pythona. Funkcija DataFrame.sum() koristit će se zajedno s nekoliko korisnih parametara u brojnim primjerima ovog vodiča.”

Kada ovaj vodič završi, možda ćete znati kako:







    • Pronađite zbroj stupca okvira podataka u Pandas.
    • Dodavanje stupaca podatkovnog okvira zajedno
    • Dodajte stupce u Pandas Dataframe koji ispunjavaju navedene uvjete.
    • Odredite zbroj nakon grupiranja podataka podatkovnog okvira.

Kako odrediti zbroj stupaca okvira podataka?

Funkcija “dataframe.sum()” u Pandasu vraća ukupni zbroj za navedenu os. Ako je ulaz os indeksa, funkcija dodaje vrijednosti svakog stupca pojedinačno, zatim čini isto za svaki stupac, vraćajući niz pohranjujući zbroj podataka/vrijednosti u svakom stupcu. Dodatno, podržava izračun zbroja podatkovnog okvira ignoriranjem vrijednosti koje nedostaju.



Sintaksa: DataFrame.sum(os = Ništa, skipna = Ništa, razina = Ništa, numeric_only = Ništa, min_count = 0, **kwargs)



Gdje,





os: {kolone (1), indeks (0)}

narudžba: Zanemarite NA/null vrijednosti prilikom izračunavanja rezultata.



razina: Ako je navedena os hijerarhijska (višeindeks), brojite do određene razine indeksa prije pretvaranja u niz.

numerički_samo: Prihvatljivi su samo stupci float, int i boolean. Ako Ništa, pokušajte koristiti sve; ako ne, samo numerički podaci. Za serije, nije implementirano.

min_count: Broj mogućih vrijednosti potrebnih za dovršetak operacije. Ishod će biti NA ako je prisutno manje vrijednosti koje nisu NA nego min_count.

Povratak: DataFrame (ako je navedena razina) ili serija.

Primjer # 01: Određivanje zbroja stupca okvira podataka i svih stupaca

Prvo smo zahtijevali podatkovni okvir s valjanim tipovima podataka, tj. int, float itd., stupac ili stupce za koje možemo pronaći zbroj podataka. Dataframe će biti kreiran pomoću funkcije pd.DataFrame().


Stvorili smo potrebni podatkovni okvir iz python rječnika unutar funkcije pd.DataFrame(). U gore stvorenom podatkovnom okviru postoje četiri stupca 'Naziv', 'dan1', 'dan2' i 'dan3'. Od četiri stupca, tri stupca, tj. 'dan1', 'dan2' i 'dan3' su numerički stupci s vrijednostima podataka (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2), odnosno (7, 4, 3, 5, 6, 2, 1, 4). Možemo pronaći samo zbroj za ova tri stupca. Zbroj za niz (tj. stupac) i cijeli podatkovni okvir može se odrediti pomoću metode sum(). Počnimo s podučavanjem kako zbrojiti sve podatke u stupcu Panda.


Za određivanje zbroja koristili smo metodu sum() na stupcu 'dan2'. Funkcija je vratila vrijednost zbroja 28. Slično ovome, možemo odrediti zbroj svakog stupca Dataframea. Ovo će se postići jednostavnom upotrebom metode sum() u cijelom podatkovnom okviru.


Kao što se može vidjeti, zbroj stupca “dan1” je 31; za “dan2” vrijednost zbroja je 28, dok je za stupac “dan3” vrijednost zbroja 32.

Primjer # 02: Upotreba funkcije sum() za zbrajanje vrijednosti stupca okvira podataka zajedno

Kao što možete vidjeti iz rezultata prethodnog primjera, funkcija nije vratila stvarne podatke stupca okvira podataka koji su činili zbroj. Međutim, dodjeljivanjem metode “DataFrame.sum()”  stupcu DataFrame, možete pristupiti svakom stupcu u DataFrameu, uključujući stupac zbroja. Prvo, stvaramo još jedan podatkovni okvir za ovaj primjer.


Korištenjem pd.DataFrame() kreiran je naš podatkovni okvir. Napravili smo podatkovni okvir s tri stupca: artikl, cijena i porez. Stavka stupca koja sadrži vrijednosti niza (“olovka”, “marker”, “ravnalo”, “gumica”, “olovka”, “međuspremnik”, “klamerica”, “igle”), cijena stupca koja pohranjuje vrijednosti (20, 15, 10, 3, 5, 30, 35, 10), a stupac „porez“ sastoji se od vrijednosti (8, 5, 3, 3, 4, 10, 5, 2). Sada zbrojimo vrijednosti stupca cijena i poreza i pohranimo rezultate u novi stupac zadržavajući izvorne stupce podatkovnog okvira.


Kao što se može primijetiti uz novi stupac 'ukupno', funkcija vraća i izvorne stupce danog podatkovnog okvira. Stupac 'ukupno' pohranjuje zbroj vrijednosti stupaca 'cijena' i 'porez' za svaki podatak 'stavka'.

Primjer # 03: Upotreba funkcije sum() za određivanje zbroja navedenih stupaca podatkovnog okvira

Za zbrajanje višestrukih stupaca podatkovnog okvira zajedno, možemo navesti popis s oznakama stupaca, a zatim primijeniti metodu sum() na popisu kako bismo pronašli zbroj. Kao i u prethodnim primjerima, prvo ćemo stvoriti podatkovni okvir.


Napravili smo naš podatkovni okvir s četiri stupca 'učenici', 'ocjene1', 'ocjene2' i 'ocjene3'. Stupac “students” pohranjuje podatke (“Larry”, “James”, “Rob”, “Arya”, “Max”, “Ben”, “Gwen”, “Bill”), a stupac “marks1” pohranjuje vrijednosti (8, 9, 6, 8, 10, 7, 9, 9), dok stupci 'oznake2' i 'oznake3' pohranjuju numeričke vrijednosti (6, 6, 8, 6, 7, 9, 10, 9 ) odnosno (7, 6, 9, 7, 8, 7, 10, 10).


Prvo smo stvorili objekt popisa s oznakama stupaca “students”, “marks1” i “marks3”. Zatim se metoda sum() primjenjuje na popis. Funkcija je zbrojila vrijednosti stupaca marks1 i marks3 samo zato što je stupac 'studenti' nenumerički, pa funkcija sum() ne može pronaći zbroj za vrijednosti stupca 'studenti'. Zbroj vrijednosti stupaca “marks1” i “marks3” pohranili smo u stupac “sum”.

Primjer # 04: Dodavanje stupaca okvira podataka Pandas koji zadovoljavaju određeni uvjet

U ovom primjeru ćemo dodati vrijednosti navedenih stupaca ako ispunjavaju navedeni uvjet.


Postoji 5 stupaca u novostvorenom podatkovnom okviru, tj. 'tvrtka', 'week1_sales', 'week2_sales', 'week3_sales' i 'branches'. Sada, pretpostavimo da ne želimo dodati vrijednost posljednjeg stupca kada dodajemo ili pronalazimo zbroj vrijednosti zadanih redaka podatkovnog okvira. Recimo da samo želimo dodati vrijednosti stupaca s riječju 'tjedan' u njihovim oznakama. Može se izraditi razumijevanje popisa kako bi se utvrdilo postoji li riječ 'tjedan' u oznaci stupca ili ne.


Sada smo dohvatili stupce koji u svojim oznakama imaju riječ 'tjedan'. Možemo sažeti stupce koji sadrže riječ 'tjedan' pomoću argumenta axis=1 u funkciji sum().


Na taj način možemo sigurno zbrojiti podatke po stupcima po redovima bez uključivanja stupaca koje ne želimo.

Primjer # 5: Odredite zbroj nakon grupiranja podataka podatkovnog okvira

Također možemo pronaći zbroj stupaca podatkovnog okvira nakon grupiranja podataka jednog ili više stupaca. Metoda groupby() koristit će se za grupiranje podataka u kategorije unutar stupca. Kreirajmo podatkovni okvir kako bismo mogli grupirati podatke jednog od njegovih stupaca.


Sada ćemo grupirati podatke u stupac “dob” i zbrojiti vrijednosti stupaca “ocjena1” i “ocjena2” za svaku kategoriju grupe.


Možemo vidjeti da zbrajanje podataka u podatkovnom okviru nakon prvog grupiranja podataka prema dobi rezultira zbrojem stupaca ovisno o dobnim skupinama.

Zaključak

U ovom smo vas vodiču pokušali naučiti kako izračunati zbroj kroz podatkovne okvire koristeći Pandas metodu zbroja. U primjerima ovog posta raspravljali smo o zbrajanju vrijednosti u redovima i stupcima. Osim toga, naučili ste kako uvjetno dodati stupce i kako zbrojiti vrijednosti nakon grupiranja stupca podatkovnog okvira. Sada ćete možda moći zbrojiti stupce okvira podataka zajedno ili sami zbrojiti vrijednosti unutar stupca okvira podataka.