Pande Napunite Nan s 0

Pande Napunite Nan S 0



Znanost o podacima obično uključuje podatke koji nedostaju. Ili se može odbaciti cijeli redak ili se može dodati vrijednost kombinaciji reda i stupca. Izbacivanje retka/stupca bilo bi apsurdno jer eliminira određenu metriku za svaki redak. NaN, što znači 'Nije broj', jedan je od tipičnih načina prikazivanja vrijednosti koja nedostaje u skupu podataka. Da biste dobili željene rezultate, rukovanje NaN je vrlo važno. Dakle, saznajmo kako promijeniti NaN vrijednosti u retku ili stupcu Pandas DataFramea na 0.

Pande Ispunite NaN vrijednosti

Ako stupac u vašem podatkovnom okviru ima vrijednosti NaN ili None, možete upotrijebiti funkcije 'fillna()' ili 'replace()' da ih ispunite nulom (0).

popuniti ()







Vrijednosti NA/NaN popunjavaju se ponuđenim pristupom pomoću funkcije 'fillna()'. Može se koristiti uzimajući u obzir sljedeću sintaksu:



Ako želite ispuniti NaN vrijednosti za jedan stupac, sintaksa je sljedeća:




Kada se od vas traži da popunite NaN vrijednosti za cijeli DataFrame, sintaksa je navedena:






Zamijeniti()

Za zamjenu jednog stupca NaN vrijednosti, navedena sintaksa je sljedeća:




Dok, da bismo zamijenili NaN vrijednosti cijelog DataFramea, moramo koristiti sljedeću spomenutu sintaksu:


U ovom dijelu teksta sada ćemo istražiti i naučiti praktičnu implementaciju obje ove metode za popunjavanje NaN vrijednosti u našem Pandas DataFrameu.

Primjer 1: Ispunite NaN vrijednosti koristeći Pandas “Fillna()” metodu

Ova ilustracija demonstrira primjenu funkcije Pandas “DataFrame.fillna()” za popunjavanje NaN vrijednosti u danom DataFrameu s 0. Možete ispuniti vrijednosti koje nedostaju u jednom stupcu ili ih možete ispuniti za cijeli DataFrame. Ovdje ćemo vidjeti obje ove tehnike.

Da bismo ove strategije proveli u djelo, moramo nabaviti odgovarajuću platformu za izvođenje programa. Stoga smo odlučili koristiti alat 'Spyder'. Započeli smo naš Python kod uvozom alata 'pandas' u program jer trebamo koristiti značajku Pandas za konstrukciju DataFramea kao i za popunjavanje vrijednosti koje nedostaju u tom DataFrameu. 'pd' se koristi kao pseudonim za 'pande' u cijelom programu.

Sada imamo pristup Pandas značajkama. Prvo koristimo njegovu funkciju 'pd.DataFrame()' za generiranje našeg DataFramea. Pozvali smo ovu metodu i inicijalizirali je s tri stupca. Naslovi ovih stupaca su “M1”, “M2” i “M3”. Vrijednosti u stupcu 'M1' su '1', 'Ništa', '5', '9' i '3'. Unosi u “M2” su “Ništa”, “3”, “8”, “4” i “6”. Dok “M3” pohranjuje podatke kao “1”, “2”, “3”, “5” i “Ništa”. Potreban nam je DataFrame objekt u koji možemo pohraniti ovaj DataFrame kada se pozove metoda 'pd.DataFrame()'. Stvorili smo 'nedostajući' DataFrame objekt i dodijelili ga ishodom koji smo dobili od funkcije 'pd.DataFrame()'. Zatim smo upotrijebili Pythonovu metodu 'print()' za prikaz DataFramea na Python konzoli.


Kada pokrenemo ovaj dio koda, DataFrame s tri stupca može se vidjeti na terminalu. Ovdje možemo uočiti da sva tri stupca sadrže nulte vrijednosti.


Stvorili smo DataFrame s nekim null vrijednostima kako bismo primijenili Pandas 'fillna()' funkciju za popunjavanje vrijednosti koje nedostaju s 0. Naučimo kako to možemo učiniti.

Nakon prikaza DataFramea, pozvali smo Pandas 'fillna()' funkciju. Ovdje ćemo naučiti ispuniti vrijednosti koje nedostaju u jednom stupcu. Sintaksa za ovo već je spomenuta na početku vodiča. Naveli smo naziv DataFramea i naveli određeni naslov stupca s funkcijom '.fillna()'. Između zagrada ove metode dali smo vrijednost koja će biti stavljena na nulta mjesta. Naziv DataFrame 'nedostaje', a stupac koji smo ovdje odabrali je 'M2'. Vrijednost navedena između zagrada 'fillna()' je '0'. Na kraju, pozvali smo funkciju 'print()' za prikaz ažuriranog DataFramea.


Ovdje možete vidjeti da stupac 'M2' DataFramea sada ne sadrži nedostajuće vrijednosti jer je NaN vrijednost ispunjena s 0.


Da bismo ispunili NaN vrijednosti za cijeli DataFrame istom metodom, pozvali smo 'fillna()'. Ovo je vrlo jednostavno. Dali smo naziv DataFrame s funkcijom 'fillna()' i dodijelili vrijednost funkcije '0' između zagrada. Konačno, funkcija “print()” pokazala nam je ispunjen DataFrame.


Ovo nam daje DataFrame bez NaN vrijednosti jer su sve vrijednosti sada ponovno popunjene s 0.

Primjer 2: Ispunite NaN vrijednosti koristeći Pandas 'Replace()' metodu

Ovaj dio članka demonstrira drugu metodu za ispunjavanje NaN vrijednosti u DataFrameu. Koristit ćemo funkciju 'replace()' programa Pandas za popunjavanje vrijednosti u jednom stupcu iu cijelom DataFrameu.

Počinjemo pisati kod u alatu “Spyder”. Prvo smo uvezli potrebne biblioteke. Ovdje smo učitali biblioteku Pandas kako bismo omogućili programu Python korištenje Pandas metoda. Druga biblioteka koju smo učitali je NumPy i alias joj je 'np'. NumPy obrađuje podatke koji nedostaju pomoću metode 'replace()'.

Zatim smo generirali DataFrame koji ima tri stupca - 'šraf', 'čavlić' i 'bušilica'. Vrijednosti u svakom stupcu dane su zasebno. Stupac 'vijak' ima vrijednosti '112', '234', 'Ništa' i '650'. Stupac 'čavao' ima '123', '145', 'Ništa' i '711'. Na kraju, stupac 'drill' ima vrijednosti '312', 'Ništa', '500' i 'Ništa'. DataFrame je pohranjen u “tool” DataFrame objektu i prikazan pomoću metode “print()”.


DataFrame s četiri NaN vrijednosti u zapisu može se vidjeti na sljedećoj izlaznoj slici:


Sada koristimo Pandas 'replace()' metodu za popunjavanje null vrijednosti u jednom stupcu DataFramea. Za zadatak smo pozvali funkciju 'replace()'. Nazivu DataFramea 'alat' i stupcu 'vijak' dodali smo metodu '.replace()'. Između zagrada postavljamo vrijednost '0' za unose 'np.nan' u DataFrame. Za prikaz izlaza koristi se metoda 'print()'.


Rezultirajući DataFrame pokazuje nam prvi stupac s NaN unosima koji su zamijenjeni s 0 u stupcu 'šraf'.


Sada ćemo naučiti ispuniti vrijednosti u cijelom DataFrameu. Pozvali smo metodu 'replace()' s imenom DataFramea i dali vrijednost koju želimo zamijeniti unosima np.nan. Konačno, ispisali smo ažurirani DataFrame s funkcijom 'print()'.


To nam daje rezultirajući DataFrame bez zapisa koji nedostaju.

Zaključak

Suočavanje s unosima koji nedostaju u DataFrameu temeljno je i nužan zahtjev za smanjenje složenosti i prkosno rukovanje podacima u procesu analize podataka. Pandas nam nudi nekoliko opcija za rješavanje ovog problema. Donijeli smo dvije praktične strategije u ovom vodiču. U praksi smo primijenili obje tehnike uz pomoć alata 'Spyder' za izvođenje uzoraka kodova kako bismo vam stvari učinili malo razumljivijima i lakšima. Stjecanje znanja o ovim funkcijama izoštrit će vaše vještine Pandas.