Pandas Series u CSV

Pandas Series U Csv



Metoda “Series.to_csv()” u Pandasu daje navedeni objekt serije u zapisu vrijednosti odvojenih zarezom (csv). Ova funkcija jednostavno preuzima vrijednosti iz niza i mijenja njihov format dodavanjem zareza za odvajanje vrijednosti indeksa i stupca.

Da bismo upotrijebili ovu funkciju, moramo upotrijebiti sljedeću sintaksu:









Ovaj će vam članak pružiti dvije različite tehnike pomoću kojih ćete naučiti kako koristiti ovu metodu u python programu.



Primjer # 1: Korištenje metode Series.to_csv() za pretvaranje serije s DatetimeIndex u vrijednosti odvojene zarezima

Za izmjenu serije u CSV format, koristit ćemo funkciju 'Series.to_csv()'. Ova će ilustracija generirati niz s DatetimeIndexom i zatim ga pretvoriti u format vrijednosti odvojenih zarezima.





Za stavljanje ove metode u rad moramo imati alat koji podržava python programiranje. Za kompajliranje kodova odabran je alat “Spyder”. Da bismo napisali skriptu na njemu, prvo smo pokrenuli instalirani alat u našem sustavu. Python program treba knjižnicu za korištenje svojih metoda za postizanje traženog rezultata. Biblioteka koju smo ovdje učitali je 'Pande'. U istom retku koda, pseudonim ove biblioteke identificiran je kao 'pd'. Dakle, gdje god u programu trebamo napisati 'pande' da bismo pristupili funkciji. Umjesto toga bismo napisali 'pd'.

Prvi korak za početak koda je generiranje Pandas serije. Moramo napisati 'pd' da bismo upotrijebili metodu stvaranja serije iz pandi. Funkcija “pd.Series()” poziva se za konstruiranje niza s navedenim vrijednostima. Vrijednosti koje smo dali za seriju su “Istanbul”, “Izmir”, “Ankara”, “Ankara”, “Antalya”, “Konya” i “Bursa”. Ako želite dati naziv ovom nizu vrijednosti, to možete učiniti pomoću parametra 'name'. Ovdje smo ovaj niz vrijednosti nazvali 'Gradovi' jer sadrži imena 6 gradova. Za pohranjivanje ove serije kreiran je objekt serije 'Turska'.



Da bismo stvorili DatetimeIndex, pozvali smo metodu “pd.date_range()”. Između zagrada ove funkcije proslijedili smo 4 argumenta koji su: 'start', 'freq', 'periods' i 'tz'.

Argument 'start' uzima datum i vrijeme da bi se iz njega počelo generirati datumski raspon. Ovdje smo naveli početni datum i vrijeme kao '2022-03-02 02:30'. Parametar 'freq' klasificira učestalost za razdoblje. Dakle, dali smo mu vrijednost 'D'. Sada će stvoriti raspon datuma na dnevnoj učestalosti. Argument 'period' postavljen je na '6' što znači da će generirati datumski raspon od 6 dana. Posljednji parametar je “tz” koji određuje vremensku zonu za navedeno područje. Odredili smo vremensku zonu za “Azija/Istanbul”.

Da bismo pohranili ovaj datumski raspon, stvorili smo varijablu 'Datum i vrijeme'. Da bismo postavili DatetimeIndex, upotrijebili smo svojstvo “Series.index”. Naziv serije 'Turkey' opremljen je svojstvom '.index' i dodijeljen mu je raspon datuma i vremena pohranjen u varijabli 'Datetime'. Stoga će svojstvo “index” preuzeti vrijednosti iz varijable “Datetime” i učiniti ih popisom indeksa serije “Turkey”. Na kraju, da bismo vidjeli izlaznu seriju, upotrijebili smo metodu 'print()' i proslijedili seriju 'Turkey' kao ulaznu vrijednost za prikaz njezinog sadržaja.

Upravo smo pritisnuli opciju 'Pokreni datoteku' da izvršimo skriptu. Posljedično, možemo vidjeti niz s DatetimeIndexom koji počinje od '2022-03-02 02:30:00+03:00' i završava u '2022-03-07 02:30:00+03:00' stvarajući točku od 6 dana. Ispod niza također se spominju “Freq :D”, naziv popisa polja “Gradovi” i dtype “objekt”.

Sada ćemo naučiti pretvoriti ovu seriju koju smo upravo vidjeli na gornjoj snimci u CSV format. Za promjenu niza u vrijednosti odvojene zarezom, imamo metodu koju pruža modul pandas, a to je “Series.to_csv()”. Ova metoda uzima vrijednosti ponuđenog niza i dodaje zareze između vrijednosti stupca.

Poziva se funkcija “Series.to_csv()”. Naziv serije koju želimo pretvoriti spominje se uz metodu kao “Turkey.to_csv()”. Kako bismo sačuvali vrijednosti odvojene zarezima, stvorili smo varijablu 'Comma_Separated' i zatim stavili njezin sadržaj u izlazni prozor pozivanjem funkcije 'print()'.

Evo naše serije u csv formatu. Na snimci možemo vidjeti da su vrijednosti indeksa i serije odvojene zarezima u njima.

Primjer # 2: Korištenje metode Series.to_csv() za pretvaranje niza s NaN vrijednostima u vrijednosti odvojene zarezima

Druga tehnika za korištenje metode 'Series.to_csv()' je primjena ove metode za pretvaranje serije koja sadrži neke nulte unose u CSV format.

U početku smo uvezli potrebne pakete. 'pd' je pseudonim za pande, a 'np' pseudonim za numpy. Ovdje se učitava numpy toolkit jer ćemo napraviti neke null unose u našu seriju koristeći 'np.NaN' dok je stvaramo pomoću pandas 'pd.Series()' metode.

Funkcija “pd.Series()” poziva se za izgradnju niza pandi s ovim vrijednostima: “Nil”, “Amazon”, np.NaN, “Ganges”, “Mississippi”, “np.NaN”, “Yangtze”, “Dunav”, “Mekong”, “np.NaN” i “Volga”. Za niz je definirana ukupno 21 vrijednost od kojih 3 unosa sadrže vrijednosti 'np.NaN', što znači da 3 vrijednosti nedostaju u nizu. Svojstvo 'name' specificira naziv za ovaj niz vrijednosti kojem smo dali 'Naslove'. Svojstvo 'index' koristi se za postavljanje korisnički definiranog popisa indeksa umjesto zadanog popisa.

Ovdje želimo popis indeksa s vrijednostima “10”, “11”, “12”, “13”, “14”, “16”, “17”, “18”, “19”, “20”, i 21”. Sada će naša serija imati popis indeksa koji počinje od '10' umjesto '0'. Sada pohranite ovu seriju kako bismo je kasnije mogli koristiti u programu. Inicijalizirali smo objekt serije 'Rivers' i dodijelili smo mu izlaznu seriju generiranu pozivanjem metode 'pd.Series()'. Serija se može vidjeti izlaganjem pomoću funkcije “print()” pythona.

Renderirani izlaz na terminalu ispisao je niz čija lista indeksa počinje od 10 i završava na 21, što znači da niz ima 21 vrijednost.

Niz će se transformirati u CSV format metodom 'Series.to_csv()'.

Pozvali smo metodu “Series.to_csv()” s našom serijom “Turkey”. Stoga će ova metoda uzeti vrijednosti iz serije 'Turkey' i pretvoriti ih u format vrijednosti odvojenih zarezima. Rezultat se sprema u varijablu “Converted_csv”. I na kraju, konvertirana serija ispisuje se uz pomoć funkcije 'print()'.

Na snimci ishoda u nastavku možete vidjeti da su vrijednosti serije sada promijenjene na način da se zarez koristi za njihovo odvajanje od popisa indeksa. Štoviše, tamo gdje nedostaju vrijednosti, ispisuje se samo indeksni broj sa zarezom.

Zaključak

Modifikacija serije panda u CSV format praktičan je pristup. To se može postići korištenjem pandas funkcije “Series.to_csv()”. Ovaj je vodič u praksu uveo dvije tehnike za korištenje ove metode. U prvoj smo ilustraciji pozvali ovu metodu za pretvaranje niza s DatetimeIndexom u format vrijednosti odvojenih zarezima. Druga instanca koristila je funkciju “Series.to_csv()”   za izmjenu niza s nekim nedostajućim unosima u CSV format. Obje tehnike su praktično implementirane pomoću alata “Spyder” na Windows operativnom sustavu.