Pande čitaju tekstualnu datoteku

Pande Citaju Tekstualnu Datoteku



“U “pandama” možemo lako čitati tekstualnu datoteku uz pomoć “pandas” metode. “Pandas” nam pruža mogućnost čitanja tekstualne datoteke. “Pandas” daje različite ugrađene metode za čitanje tekstualne datoteke. Raspravljat ćemo o svim metodama u ovom vodiču zajedno sa svim parametrima ovdje i detaljno ćemo ih objasniti. Također, čitat ćemo tekstualnu datoteku u “pandas” koristeći metode “pandas” u našim kodovima ovdje.”

Metode za čitanje tekstualne datoteke u 'pandama'

U 'pandama' imamo tri metode koje nam pomažu u čitanju tekstualne datoteke. Ovdje smo također napravili neke primjere u kojima čitamo tekstualnu datoteku. Metode koje pruža 'pandas' razmatraju se u nastavku:







    • Korištenjem metode pd.read_csv().
    • Korištenjem metode pd.read_table().
    • Korištenjem metode pd.read_fwf().

Sada objašnjavamo sintaksu svih ovih metoda i također detaljno raspravljamo o parametrima svih metoda u ovom vodiču.



Sintaksa read_csv()



pd.read_csv ( 'ime datoteke.txt', ruj =' ', Zaglavlje = Ništa, imena = [ “Col_name1”, “Col_name2, “Col_name2”, ………….. ] )


Kod ove metode prvo dodajemo naziv tekstualne datoteke čije podatke želimo čitati i to je prvi parametar ove metode. Zatim postavljamo 'sep', koji je separator u ovoj metodi, i ovdje postavljamo razmak kao znak tako da će razmak smatrati separatorom. Nakon ovoga, imamo parametar zaglavlja, a koristi se vrijednost “None” ovog parametra, tako da će stvoriti zadano zaglavlje, a ako ne dodamo ovaj parametar, tada će uzeti u obzir prvi red tekstualne datoteke kao zaglavlje. U parametru “names” možemo dodati nazive stupaca koje moramo dodati kao zaglavlje.





Sintaksa read_table()

pd.read_table ( 'ime datoteke.txt' , razdjelnik = ' ' )


U ovoj metodi kao prvi parametar stavljamo naziv tekstualne datoteke. U razdjelnik, kada stavimo ' ', tada će uzeti razmak kao separator.



Sintaksa read_fwf()

pd.read_fwf ( 'ime datoteke.txt' )


Ova metoda uzima samo jedan parametar, a to je naziv tekstualne datoteke.

Sada ćemo koristiti ove metode za čitanje tekstualnih datoteka u 'pandas' kodovima i prikazivanje podataka tekstualne datoteke na terminalu.

Primjer # 01

Ovdje je aplikacija “Spyder” u kojoj smo napravili sve ove kodove koji su predstavljeni u ovom vodiču. Dolje je prikazana tekstualna datoteka čije podatke želimo čitati. Koristit ćemo metodu “read_csv()” za čitanje ove tekstualne datoteke u “pandama”.


Prvo uvozimo biblioteku “pandas” jer želimo koristiti metodu “read_csv()”, a to je metoda “pandas”. Ovoj metodi pristupamo samo kada smo uvezli biblioteku 'pandi'. Ovdje spominjemo 'pande kao pd', tako da je ovo 'pd' stavljeno uz naziv metode za korištenje. Nakon toga, ovdje kreiramo varijablu “df” koja se koristi za pohranjivanje podataka tekstualne datoteke nakon čitanja. Ovdje postavljamo metodu “pd.read_csv()” koja pomaže u čitanju tekstualne datoteke i pretvaranju podataka tekstualne datoteke u DataFrame i njihovom pohranjivanju u varijablu “df”.

Ovdje smo proslijedili naziv datoteke, koji je 'myData.txt', a zatim koristimo 'sep' i dodijelimo prazan znak ovom 'sep'. Dakle, ovaj prazni znak radi kao separator u tekstualnoj datoteci. Zatim smo upotrijebili 'print()' u nastavku, koji se koristi za ispis podataka tekstualne datoteke. Prikazat će podatke tekstualne datoteke u obrascu DataFrame.


Za izvršenje ovog koda, moramo pritisnuti 'Shift+Enter', a izlaz će se prikazati na 'Spyderovom' terminalu. Rezultat gornjeg koda prikazan je na danoj snimci zaslona i možete vidjeti da su podaci tekstualne datoteke prikazani kao DataFrame, a prvi redak naše tekstualne datoteke predstavljen je ovdje kao nazivi stupaca tog DataFramea. Također odvaja podatke tamo gdje je razmak prisutan u tekstualnoj datoteci.

Primjer # 02

Tekstna datoteka koju ćemo čitati u ovom primjeru prikazana je ovdje, a mi ćemo ponovno koristiti metodu 'read_csv()', ali s drugačijim parametrima.


Koristi se “pandas” metoda “pd.read_csv()” i ovdje prosljeđujemo tri parametra. Prvo postavljamo naziv datoteke, koji je 'Record.txt'. Drugi parametar je parametar “sep” i dodjeljuje mu prazan znak, a zatim imamo treći parametar u kojem postavljamo “header” i prilagođavamo ga na “None”, tako da će stvoriti zadano zaglavlje DataFramea kada izvršimo ovaj kod. Sve smo to spremili u varijablu “My_Record” i dodali “My_Record” u funkciju “print()” za ispis.


Svi podaci spremaju se u DataFrame i on odvaja podatke gdje je prisutan razmak u podacima tekstualne datoteke. Također, stvorio je zadano zaglavlje DataFramea ovdje jer smo prilagodili parametar 'zaglavlje' na 'Ništa'.

Primjer # 03

Prikazana je tekstualna datoteka ovog primjera, a mi ćemo još jednom upotrijebiti metodu 'read_csv()' s izmijenjenim parametrima.


U ovom kodu, četiri parametra se ovdje prosljeđuju metodi “pandas” “pd.read_csv()”. Naziv tekstualne datoteke je prvi parametar. Parametar 'sep' dobiva znak za prazninu u drugom parametru. Parametar “header” postavljen je na “None” u trećem argumentu, a kao četvrti parametar postavili smo “names” koji će se pojaviti kao nazivi stupaca DataFramea nakon čitanja tekstualne datoteke, a ti nazivi stupaca su “COL_1, COL_2, COL_3, COL_4 i COL_5”. Sve ove informacije su spremljene u varijablu “My_Record”, a “My_Record” je također dodana metodi “print()” tako da će se ispisivati ​​na terminalu.


Sve informacije tekstualne datoteke prikazane su ovdje kao DataFrame, a također razdvajaju podatke gdje su dodani razmaci u tekstualnoj datoteci. Također dodaje nazive stupaca u skladu s tim, koje smo dodali gore u kodu.

Primjer # 04

Ovo je tekstualna datoteka koju ćemo čitati u ovom primjeru korištenjem druge metode, metode “pd.read_table()”.


Ovdje se dodaje metoda “pd.read_table()” za čitanje tekstualne datoteke, a mi dodajemo “ABC.txt”, što je naziv tekstualne datoteke. Ova metoda pomaže u čitanju tekstualne datoteke, a također smo prilagodili parametar “delimiter” na znak razmaka, tako da će također raditi kao separator koji smo objasnili gore. Tada se svi podaci tekstualne datoteke spremaju u varijablu 'My_Data' i također ispisuju ovdje.


Početna linija naše tekstualne datoteke prikazana je ovdje kao nazivi stupaca DataFramea, a podaci tekstualne datoteke ispisani su kao DataFrame. Osim toga, odvaja podatke tekstualne datoteke u kojoj je prisutan razmak.

Primjer # 05

Sada tekstualna datoteka sadrži podatke koji su prikazani u nastavku. Ovaj put ćemo primijeniti “read_fwf()” i pokazati kako renderira podatke nakon čitanja tekstualne datoteke.


Kao što znamo da ova “read_fwf()” metoda uzima samo jedan parametar, a to je naziv datoteke koju želimo čitati. Ovdje dodajemo 'textfile.txt', što je naziv naše tekstualne datoteke i dodjeljujemo ovu pandas metodu varijabli 'File_Data', koja će pohraniti podatke ove tekstualne datoteke. Zatim stavljamo 'print(File_Data)' tako da ispisuje i ove podatke.


Ovdje su prikazani svi podaci tekstualne datoteke. Nije razdvojio podatke u kojima su prisutni razmaci jer u ovoj funkciji ne postoji parametar poput 'Sep' ili 'delimiter'.

Zaključak

Ovaj vodič objašnjava kako čitati tekstualnu datoteku u 'pandama' i koje se metode koriste za čitanje tekstualne datoteke u 'pandama'. Raspravljali smo o svim metodama koje nam pomažu u čitanju tekstualne datoteke u 'pandama'. Istražili smo tri različite metode 'panda' za čitanje naših tekstualnih datoteka u 'pandama' u ovom vodiču. Ovdje smo također detaljno objasnili sintaksu svih metoda kao i parametre svih metoda i pročitali mnoge tekstualne datoteke primjenom različitih metoda sa svim mogućim parametrima u ovom vodiču.