Pandas Dataframe Unique

Pandas Dataframe Unique



Najpopularnija Python biblioteka koja se koristi u znanosti o podacima zove se Pandas. Python programerima nudi alate visokih performansi, jednostavne za korištenje i analizu podataka. Nakon što shvatite temeljne funkcije i kako ih koristiti, Pandas je moćan alat za mijenjanje podataka. U 'pandama' standardne metode za pohranu podataka u tabličnom obliku su DataFrames. Možemo upotrijebiti neke 'pandas' metode za dobivanje jedinstvenih vrijednosti u stupcu 'pandas' DataFramea. Kada trebamo dobiti jedinstvene vrijednosti u stupcima DataFramea i ne želimo dupliciranje vrijednosti u stupcu DataFramea 'pandas', možemo koristiti metode koje 'pandas' pruža za to. Pogledajmo takve metode u ovom vodiču, zajedno s nekim primjerima i izlazom za dobivanje jedinstvenih vrijednosti u DataFrameovom stupcu 'pande'.

Metode za dobivanje jedinstvenih vrijednosti u 'pandas' DataFrame stupcima

Možemo upotrijebiti dvije metode za dobivanje jedinstvenih vrijednosti u stupcima 'pandas' DataFrame. Ispuštamo duplicirane vrijednosti i dobivamo samo jedinstvene vrijednosti u stupcima DataFramesa. Metode koje 'pande' pružaju za obavljanje ovog zadatka su:







  • Korištenjem metode unique().
  • Korištenjem metode drop_dupliactes().

Sada ćemo upotrijebiti obje metode u 'pandas' kodovima za dobivanje jedinstvenih vrijednosti u 'pandas' DataFrame stupcima.



Primjer # 01

Aplikacija 'Spyder' ovdje se koristi za generiranje ovih 'panda' kodova za korištenje tih metoda koje nam pomažu u dobivanju jedinstvenih vrijednosti u 'pandas' DataFrame stupcima. Moramo uvesti 'pandas' module, koji su neophodni za 'pandas' kod, prije stvaranja DataFramea. Korištenjem izraza 'uvoz' i postavljanjem 'pande kao pd', uvozimo ove module.



Sada, uz pomoć 'pd', možemo brzo dobiti 'pandas' funkcije ili metode. Zatim stavljamo 'Subject_data' u koji dodajemo 'Name' i u 'Name', dodajemo podatke o imenu koji su 'Roman, William, Peter, Smith, John, Milli, Thomas i James'. Zatim dodajemo podatke o predmetu u “Subj” koji su “Matematika, Ekonomija, Znanost, Matematika, Statistika, Statistika, Statistika i Računalo”. Zatim pretvaramo ovaj “Subject_data” u “Subject_df” DataFrame pomoću metode “pd.DataFrame()”. Postavljamo “Subject_df” u metodu “print()” tako da će se prikazati na terminalu.





Sada želimo dobiti jedinstvene vrijednosti u 'pandas' DataFrame stupcu 'Subj'. U tu svrhu ovdje koristimo metodu 'unique()' i dodajemo naziv stupca i također naziv DataFramea kao što je prikazano u nastavku. Ovu metodu dodajemo u “print()” tako da će se rezultat također prikazati na terminalu.



Sada pritišćemo “Shift+Enter” za dobivanje rezultata ovog koda i on se prikazuje na terminalu i također je prikazan ovdje, koji sadrži DataFrame sa svim vrijednostima. Ovo je izvorni DataFrame koji smo dodali u kod i ispod njega prikazuju se jedinstvene vrijednosti stupca 'Subj'. Ispušta duplicirane vrijednosti i prikazuje jedinstvene vrijednosti stupca 'Subj' DataFramea.

Primjer # 02

Mi stvaramo 'Sample_list' koji sadrži neke informacije. Umećemo 'Layla, 21, 28, 31, 14 i 39' koji će se pojaviti kao prvi stupac kada ovaj popis pretvorimo u DataFrame. Zatim dodajemo 'Lusy, 31, 25, 34, 26 i 21' kao drugi red DataFramea. Nakon ovoga, imamo 'Peter, 38, 20, 20, 35 i 24' i 'Layla 38, 23, 39 24, 23' koji će biti treći i četvrti red DataFramea. Također ubacujemo još tri podatka, a to su “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” i također “Peter, 21, 21, 31, 21, 29” .

Sada pretvaramo “Sample_list” u “DF_Sample” što je ovdje naziv DataFramea stavljanjem funkcije “pd.DataFrame()”. Također, postavili smo nazive stupaca ovog DataFramea i ti nazivi su 'Ime, Ass_1, Ass_2, Ass_3, Ass_4 i Ass_5'. Zatim koristimo 'print()' koji pomaže u prikazivanju DataFrame 'DF_Sample'. Sada koristimo drugu metodu u ovom primjeru za dobivanje jedinstvenih vrijednosti u stupcu DataFrame. Ova metoda je “drop_duplicates()” metoda “pande”.

U metodi 'drop_duplicates()' postavljamo naziv stupca u kojem želimo dobiti jedinstvene vrijednosti u stupcu DataFramea. Dobivamo jedinstvene vrijednosti stupca 'Ime' ispuštanjem dupliciranih vrijednosti u ovom stupcu uz pomoć metode 'drop_duplicates()', a također renderiramo ove jedinstvene vrijednosti pomoću funkcije 'print()' ovdje.

Imena koja su duplicirana ispuštaju se, a jedinstvene vrijednosti se prikazuju nakon primjene metode 'drop_duplicates()'. Možete primijetiti da se ime 'Layla' pojavljuje u tri ćelije stupca 'Ime'. Ali kada se metoda 'drop_duplicates()' primijeni na ovaj stupac, sve duplicirane vrijednosti se ispuštaju i na ekranu se pojavljuje jedno ime 'Layla'. Nakon ispuštanja dupliciranih vrijednosti pojavio se novi DataFrame koji sadrži jedinstvene vrijednosti u ovom stupcu 'Naziv'. Na ovaj način možemo ispustiti duplicirane vrijednosti i dobiti jedinstvenu vrijednost u stupcu DataFramea uz pomoć metode 'drop_duplicates()'.

Primjer # 03

Ponovno se koristi isti DataFrame i sada ovdje primjenjujemo metodu 'unique()'. Metodom “unique()” postavljamo naziv stupca kao i naziv DataFrame-a na koji želimo primijeniti ovu metodu “unique()” za dobivanje jedinstvenih vrijednosti. Ovo će prikazati samo jedinstvene vrijednosti tog stupca i neće prikazati te vrijednosti u obliku DataFrame.

Ovdje DataFrame sadrži sedam vrijednosti u stupcu 'Name', ali kada primijenimo metodu 'unique()' na ovaj stupac, pojavile su se samo četiri vrijednosti i to su jedinstvene vrijednosti tog stupca. Ne prikazuje duplicirane vrijednosti.

Primjer # 04

DataFrame koji stvaramo u ovom primjeru je 'F_G_df'. Umećemo 'My_fruits' i 'my_Vegs' u ovaj DataFrame. Stupac 'My_fruits' sadrži 'Jabuka, Naranča, Jabuka, Kruška, Liči, Jabuka, Jabuka, Kruška i Jabuka'. Zatim imamo “My_Vegs” koji sadrži nazive povrća koji su “Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic, and Ginger”. Ovaj DataFrame sadrži samo dva stupca.

Sada dobivamo jedinstvene vrijednosti u oba stupca uz pomoć metode 'unique()'. Spominjemo naziv DataFrame. Zatim prvo stavite naziv stupca. Nakon toga koristimo metodu append(). U ovaj dodatak ponovno postavljamo naziv DataFramea i naziv drugog stupca i postavljamo metodu 'unique()'. Ovo će dobiti jedinstvene vrijednosti oba stupca, a zatim će dodati jedinstvene vrijednosti oba stupca i prikazati ih na zaslonu.

Prvo se prikazuje DataFrame koji sadrži sve vrijednosti. Nakon toga se primjenjuje metoda 'unique()' i jedinstvene vrijednosti oba stupca prikazane su u nastavku. U ovom kodu dobivamo jedinstvene vrijednosti u višestrukim stupcima DataFramea pomoću metode 'unique()'.

Zaključak

Potpuno objašnjenje dobivanja jedinstvenih vrijednosti u stupcu DataFramea nalazi se u ovom vodiču. Raspravljali smo o metodama 'unique()' i 'drop_duplicates()' koje nam pomažu u dobivanju jedinstvenih vrijednosti stupca DataFramea. Istražili smo kako koristiti ove metode u 'pandas' kodu korištenjem ovih metoda ovdje u našim kodovima. Ilustrirali smo različite primjere u ovom vodiču i pokazali vam kako dobiti jedinstvene vrijednosti jednog stupca pomoću metode 'unique()', kao i metode 'drop_duplicates()'. Također smo istražili kako dobiti jedinstvene vrijednosti u više stupaca korištenjem metode 'unique()' u ovom vodiču.