Pandas Join vs Merge

Pandas Join Vs Merge



“Pandas” je alat visokih performansi za python okruženje. To je 'otvoreni' izvorni kod za analizu podataka. Pandas join i pandas merge metoda koriste se za spajanje dva podatkovna okvira u jedan podatkovni okvir. U obje metode panda, razlika je u tome što pandas funkcija “join” pridružuje okvir podataka pomoću indeksa. Dok pandas “merge” funkcija spaja dataframe korištenjem metode indeksa i stupca u kojoj sami možemo odabrati željeni stupac. Metoda spajanja panda koristi se uglavnom u usporedbi s metodom spajanja panda. Softver koji ćemo koristiti za implementaciju je softver 'spyder', koji je u okruženju python koji će nam pružiti prednosti za implementaciju koda metode pandas join method() i funkcije metode pandas merge().

Sintaksa Pandas Join() metode

“df1. pridružiti ( df2 )

'df' u gornjoj sintaksi je skraćenica od 'dataframe'. Postoje dva podatkovna okvira u sintaksi s funkcijom 'dot join', koja služi za pozivanje metode. To je pandas metoda spajanja dva podatkovna okvira. Radi pomoću indeksa za kombiniranje podatkovnih okvira u jedan.







Sintaksa metode Pandas Merge().

“df1. sjediniti ( df2 , na = 'naziv_stupca' )

Sintaksa metode spajanja pandas ima dva podatkovna okvira kao 'df1' i 'df2'. Funkcija 'dot merge' poziva metodu spajanja oba podatkovna okvira s izgledom obrnutih stupaca.



Pokrivat ćemo sljedeće načine kombiniranja dva podatkovna okvira kako bismo koristili metode panda spajanja i panda spajanja:



  • Pandas Join metoda preklapanja.
  • Pande se pridružuju metodi pomoću resetiranja indeksa.
  • Metoda spajanja pandi (stupac “lijevo i desno”).
  • Eksplicitna metoda spajanja Panda.

Stvaranje podatkovnih okvira za implementaciju Pandas Merge i Pandas Join metode

Prvo, moramo stvoriti podatkovni okvir. Za to ćemo koristiti alat 'spyder'. Nakon što ga otvorite, počnite pisati kod. Uvezite pande kao 'pd' za asocijaciju knjižnice pandi. Imamo varijable podatkovnog okvira kao 'x', 'y', 'p' i 'q odgovarajuće i 'a' s vrijednostima '1' i 'b' s vrijednošću dodijeljenom kao '2'.





Izlaz je 'df' stvoren s dodijeljenim vrijednostima. Možemo ga učiniti onoliko velikim koliko su podaci.



Stvaranje drugog podatkovnog okvira

Moramo napraviti još jedan podatkovni okvir kako bismo jasno razumjeli metode spajanja pandi i spajanja pandi. Ovdje smo kreirali 'df' isto kao gornji 'df', samo su vrijednosti dodijeljene varijablama različite. Imamo “h”, “j”, “s” i “d”, dok vrijednosti “b” pridružujemo vrijednosti “8” i “Y” vrijednosti “3”.

Izlaz prikazuje jednostavan stvoren 'df'.

Primjer # 01: Metoda spajanja pandi (preklapanje)

Sada ćemo vidjeti kako spojiti dva podatkovna okvira metodom spajanja panda. Za ovu metodu možemo odabrati stupac po vašem izboru na kojem želimo raditi iz podatkovnog okvira. Uzeli smo primjer s preklapajućim stupcem 'lijevo' od 'df', tako da to možemo popraviti pomoću 'sufiksa' kako bismo nadvladali preklapanje podataka. Ovdje se koriste varijable “x”, “z”, “v”, “d”. “p”, “o”, “l” i “y” s vrijednostima dodijeljenim kao “3”, “6”, “7” i “9”. “.join” poziva metodu, s poravnanjem postavljenim na lijevo spajanje s desnim sufiksom “df”. ”. 'Sufiks' koji se koristi u kodu je zato što u podatkovnom okviru postoje dva stupca koji imaju isti naziv koji je 'ključ' i koji se neće preklapati s podacima.

Izlaz ne prikazuje podatke koji se preklapaju s metodom spajanja dva 'df' metodom spajanja panda.

Primjer # 02: Pandas Join metoda pomoću resetiranja indeksa

U ovom primjeru zasebno ćemo specificirati stupac s parametrom 'on' koji će se koristiti kao 'ključ' u metodi spajanja koja pomaže u spajanju dva podatkovna okvira. kombinirana stvar se radi s ovim parametrom. Također, indeks jednog od dva 'df' trebao bi biti sličan da ih spoji. Slične vrste podataka ili podaci koji se koriste u istu svrhu mogu biti zajedno za obradu. Ovo će i dalje koristiti indeks, koristeći s desna. Varijable su 's', 't', 'u', 'v', 'n', 'w', 'k' i 'q'. Dodijeljene vrijednosti su “3”, “6”, “7” i “9”. 'Reset dot index' metoda je pandi za resetiranje indeksa 'df'. Indeks resetiranja postavlja sve cijele brojeve vašeg ispisa okvira podataka od 0 dok se podaci okvira podataka tamo ne produže.

Ovdje je izlaz koji se prikazuje s metodom spajanja 'ključ' indeksa pandi.

Primjer # 03: Pandas metoda spajanja (stupac 'lijevo i desno')

Metoda spajanja izvodi sličnu operaciju kao metoda spajanja panda. Obje metode služe za kombiniranje podataka na sličnom podatkovnom okviru. Metoda spajanja je svestranija i zahtijeva navođenje ključa. Također ga možemo odrediti u lijevom i desnom stupcu ovisno o radu vašeg okvira podataka. Varijable u kodu su “s”, “d”, “g”, “f”, “k”, “j”, “b” i “q”. dodijeljene vrijednosti su “9”, “5”, “6” i “7”. Vanjska implementacija 'join' se radi na oba 'df' pomoću parametra 'how' funkcije metode spajanja pandas.

Izlaz koji vidimo prikazuje spojene podatke dva podatkovna okvira. 'NaN' predstavlja 'nije broj', što znači da tamo gdje u podacima nema dodijeljenog broja, tamo se prikazuje 'NaN'.

Primjer # 04: Eksplicitna metoda spajanja

Ovdje, u ovom primjeru, metoda spajanja je uništavanje indeksa, a vrijednost indeksa se ne pretpostavlja u podatkovnom okviru. Radit ćemo ovu metodu u skladu s poslom koji treba obaviti, gdje je eksplicitna specifikacija nastavak. Spojit će podatke na temelju lijevog ili desnog indeksa s parametrom. Varijable u ovom podatkovnom okviru su “t”, “r”, “I”, “u”, “h”, “o”, “e” i “e”. Dodijeljene vrijednosti su “2”, “4”, “6” i “4”. Gore navedeni primjer metode spajanja panda s odabirom stupaca prema potrebi je najprezentativnija i najvrjednija metoda spajanja dva podatkovna okvira. Provjera na kraju retka koda je li ključ spajanja jedinstven u skupu podataka.

U donjem izlazu indeks nije prikazan bez indeksa, ali se funkcija izvodi na temelju desnog i lijevog indeksa.

Zaključak

Metode merge() i join() su metode koje su vrlo prikladne i učinkovite. Obje se ove funkcije koriste za spajanje dva odvojena okvira podataka na istom okviru podataka, ali imaju različitu upotrebu ovisno o slučaju. U ovom smo članku naučili ključne razlike između pandas metode spajanja i spajanja. Nakon izvođenja primjera i razumijevanja metode pandas spajanja, zaključit ćemo to sa spoznajom da je, ako želimo fleksibilnije spajanje u stilu baze podataka, poželjno ići s metodom pandas spajanja. S druge strane, ako želimo opsežno kombinirati podatkovni okvir s indeksom, možemo koristiti funkciju metode pandas join().