Pandas Reindex

Pandas Reindex



“U “pandama” možemo pohraniti mnogo informacija u tabelarnom obliku, koji je također poznat kao DataFrame. “Pande” nam olakšavaju metodu “DataFrame()” za konstrukciju DataFramea. DataFrame sadrži indekse, a također možemo mijenjati indekse DataFramea korištenjem funkcija 'pandas'. Metoda koju koristimo za ponovno indeksiranje DataFramea je metoda 'reindex()'. Ova metoda pomaže u mijenjanju vrijednosti indeksa retka, kao i vrijednosti indeksa stupaca. Korištenjem ove metode možemo promijeniti zadani indeks DataFramea, a također možemo promijeniti indeks koji smo postavili prilikom izrade DataFramea. Koristit ćemo metodu “reindex()” u našim “pandas” primjerima u ovom vodiču i ovdje ćemo detaljno objasniti ovaj koncept.”

Primjer # 01

Alat 'Spyder' pomaže nam u razvoju koda 'pandas' ovdje u ovom vodiču, a naš kod počinjemo s ključnom riječi 'import', koja će pomoći u uvozu funkcije 'pandas'. Stavljamo 'pande kao pd' nakon što upišemo 'uvoz'. Nakon toga stvaramo DataFrame upisivanjem “pd.DataFrame()”. Ovdje pišemo ovaj “pd” jer je “DataFrame()” metoda “pandi”. “Vrijednost_df” je naziv varijable u kojoj je DataFrame spremljen. Dodajemo 'Nasumično ime', što je naziv stupca, a 'Nasumično ime' sadrži 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander i Samuel'.







Zatim imamo 'Vrijednost_1' u koju smo umetnuli '16, 29, 24, 35, 44, 50, 69, 74 i 88'. Zatim dolazi 'Vrijednost_2', a mi smo dodali '25, 38, 42, 56, 54, 65, 78, 89 i 99'. Sada dolazi “Vrijednost_3” iu nju stavljamo “36, 48, 52, 69, 74, 75, 87, 91 i 69”. Stupac “Vrijednost_4” nalazi se nakon ovoga, gdje smo umetnuli “52, 64, 72, 88, 82, 95, 97, 21 i 39”. Posljednji stupac je ovdje stupac 'Vrijednost_5', au ovom stupcu vrijednosti koje smo dodali su '66, 78, 82, 99, 34, 45, 57, 61 i 89'. Nakon toga koristimo funkciju “print()” u koju se dodaje “Values_df”. Ispisat će se na terminalu.




Nakon što pritisnemo “Shift+Enter”, lako možemo dobiti rezultat naših kodova u aplikaciji “Spyder”. Ovdje ovaj kod vraća DataFrame sa zadanim indeksom. Sada ćemo primijeniti metodu “reindex()” za ponovno indeksiranje ovog DataFramea u “pandama”.




Funkcija 'reindex()' ovdje se koristi za ponovno indeksiranje vrijednosti indeksa retka. U gornjem DataFrameu možete vidjeti da su prikazane zadane vrijednosti indeksa retka, a sada primjenjujemo metodu 'reindex()' za ponovno indeksiranje tih indeksa retka. Postavljamo naziv DataFramea, a zatim metodu 'reindex()' u koju postavljamo vrijednosti indeksa koje želimo dodati u gornji DataFrame. Stavili smo “ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H i ind_I” u funkciju “reindex()”. Dakle, indeksi ovih redaka bit će ažurirani na DataFrameu kada izvršimo ovaj kod.






Vrijednosti indeksa retka prikazane su u ovom ishodu i možete primijetiti da DataFrame vrijednosti nisu prikazane ovdje, a pojavile su se vrijednosti 'NaN'. To je zato što nove vrijednosti indeksa ne odgovaraju prethodnim vrijednostima indeksa DataFramea. Kada se novi indeks i stari indeks ne podudaraju, tamo se prikazuje 'Nan'. Ove vrijednosti 'NaN' pojavljuju se prema zadanim postavkama kada promijenimo indeks, a on ne odgovara prethodnom indeksu.



Primjer # 02

Sada mijenjamo vrijednosti indeksa stupca za 'Value_df', koji smo prethodno stvorili u primjeru 1. Nakon ispisa 'Value_df', stavili smo varijablu 'column' i dodali joj neke vrijednosti. Dodajemo 'a_1, b_1, c_1, d_1 i e_1'. Sada želimo prilagoditi ove vrijednosti kao indeks stupaca, pa za to koristimo metodu “reindex()” i postavljamo naziv varijable “column” u koju su pohranjene nove vrijednosti indeksa stupca i također postavite “os” na “stupci” tako da će ažurirati indeks osi stupca. Stavili smo metodu “reindex()” u “print()”, tako da će se također prikazati na terminalu.


Kako smo koristili metodu 'reindex()', vrijednosti indeksa stupaca koje su prisutne u prvom DataFrameu se ažuriraju, a nove vrijednosti se dodaju u ažurirani DataFrame. Također možete primijetiti da su sve vrijednosti DataFramea pretvorene u 'NaN' jer su obje vrijednosti indeksa stupaca različite.

Primjer # 03

“Programming_data” u ovom kodu sadrži “P_Languages”, gdje smo dodali “JavaScript, CSS, Web Engineering, OOP, C#, AI, Java i JavaScript”. Zatim imamo 'Sati' u koje stavljamo '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs i 6_hrs'. Nakon toga se unosi “P_Code” i ubacujemo “11523, 12423, 12321, 11456, 11454, 12267, 13106 i 14123”. Dodamo varijablu “p_index” i stavimo “Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G i Pro_H”.

Ove vrijednosti će se koristiti kao vrijednosti indeksa redaka. Mijenjamo “Programming_data” u “Programming_df” DataFrame. Također dodajemo 'p_index' u ovaj DataFrame pomoću metode 'index'. Stavili smo “Programming_df”, a zatim metodu “index” i ovome dodijelili “p_index”. Sada se gornje vrijednosti indeksa dodaju kao vrijednosti indeksa reda u DataFrame. Ispisujemo i 'Programming_df'.

Nakon ovoga dodajemo neke nove vrijednosti indeksa u varijablu “new_index”, a to su “P_1, P_2, P_3, P_4, P_5, P_6, P_7 i P_8”. Kako želimo ažurirati vrijednosti indeksa redaka, koristimo metodu “reindex()” i stavljamo “new_index” kao parametar ove funkcije i također pohranjujemo ažurirani DataFrame u “newProgramming_df” i postavljamo “newProgramming_df” u “ print()” za prikaz.


Vrijednosti indeksa su ažurirane, a također možemo reći da smo ponovno indeksirali DataFrame koji smo izradili. Sve vrijednosti DataFramea također se pretvaraju u 'NaN' jer su obje vrijednosti indeksa različite.

Primjer # 04

Trenutno mijenjamo vrijednosti indeksa 'Programming_df' stupaca, koje smo prethodno razvili u primjeru 3. Postavljamo varijablu 'column' i umećemo nove vrijednosti u nju. “P_Code, P_Languages, Hours, and New” dodaju se varijabli “column”. Zatim ponovno koristimo metodu “reindex()” u kojoj postavljamo varijablu “column”, koja će ažurirati prethodne vrijednosti indeksa stupca i dodati te nove vrijednosti indeksa stupca u DataFrame.

Ovdje možete primijetiti da su nove vrijednosti koje smo dodali u 'stupac' iste kao što smo dodali u gornji DataFrame, ali slijed je drugačiji, tako da će promijeniti slijed stupaca i prilagoditi sve stupce kako mi spomenuto u varijabli “stupac”. Također, dodajemo još jednu vrijednost indeksa koja nije prisutna u gornjem DataFrameu, koja je ovdje 'Nova', tako da će se vrijednosti 'NaN' pojaviti u ovom stupcu.


Ovdje se mijenja redoslijed stupaca, a sve se vrijednosti pojavljuju onako kako su prisutne u izvornim stupcima DataFramea, a stupac 'Novi' u ažuriranom DataFrameu sadrži sve 'NaN' vrijednosti jer ovaj stupac nije prisutan u izvornom DataFrameu.

Zaključak

Predstavili smo ovaj vodič koji nam pomaže u detaljnom razumijevanju pojma 'pandas reindex'. Raspravljali smo o tome kako možemo ponovno indeksirati stupac DataFramea, kao i vrijednosti indeksa retka. Objasnili smo da se za to koristi funkcija 'reindex()' za 'pande'. Napravili smo različite primjere u kojima smo promijenili vrijednosti indeksa redaka DataFramea i također vrijednosti indeksa indeksa stupca DataFramea. Prikazali smo rezultate svih kodova koje smo napravili ovdje u ovom vodiču i također ih detaljno objasnili.