“Pandas” je izvrstan jezik za izvođenje analize podataka zbog svog sjajnog ekosustava python paketa usmjerenih na podatke. To olakšava analizu i uvođenje oba faktora. Standardna devijacija je 'tipična' devijacija izvedena iz srednje vrijednosti. Često se koristi jer vraća izvorne mjerne jedinice podatkovnog okvira. Pande su koristile std() za izračun standardne devijacije. Standardna devijacija može se izračunati iz zadanih vrijednosti koje mogu biti u podatkovnom okviru u obliku retka ili stupca. Implementirat ćemo sve moguće načine na koje se koristi standardna devijacija pandi. Za implementaciju koda koristit ćemo alat “spyder” jer je napisan u okruženju prilagođenom python-u.”
Sintaksa
“df.std ( ) ”
Sljedeća sintaksa koristi se za izračun standardne devijacije u podatkovnom okviru. 'df' u podatkovnom okviru je skraćenica od 'dataframe'. Što čini standardna devijacija? Mjeri koliko su prošireni potrebni podaci. Što su veće vrijednosti proširene, standardna devijacija bi trebala biti veća.
Povratak
Pandina standardna devijacija vraća podatkovni okvir ako je razina određena na temelju zahtjeva.
Imajte na umu da će funkcija 'std()' automatski zanemariti 'NaN' vrijednosti u 'df' dok izračunava standardnu devijaciju pande. 'NaN' se može objasniti kao 'nije broj', što znači da ne postoji vrijednost dodijeljena određenom.
Slijede metode koje će se izvoditi s primjerima standardne devijacije pandi:
-
- Pandas izračun standardne devijacije u jednom stupcu.
- Pandas izračun standardne devijacije u više stupaca.
- Pandas izračun standardne devijacije svih numeričkih stupaca.
- standardna devijacija pandi pomoću osi = 1.
- standardna devijacija pandi pomoću osi = 0.
Stvaranje podatkovnog okvira za izračun standardne devijacije u Pandas
Prvo otvorite softver 'spyder'. Sada uvezite pandas biblioteku kao pd. Stvorit ćemo podatkovni okvir koji se sastoji od tablice s rezultatima s izrazima kao što su 'x', 'y' i 'z' sa svojim točkama kao što su '22', '10', '11', '16', '12', '45'. “, “36” i “40”. Imamo njihove vrijednosti asistencija kao '8', '9', '13', '7', '22', '24', '4' i '6' također, imajući vrijednost skokova kao '17', ' 14”, “3”, 5”, “9”, “8”, “7” i “4”.
Zasloni prikazuju kreirani podatkovni okvir prema vrijednostima dodijeljenim u kodu:
Primjer # 01: Pandas izračun standardne devijacije u jednom stupcu
U ovom primjeru izračunat ćemo standardnu devijaciju jednog stupca u podatkovnom okviru panda. Podatkovni okvir ima vrijednosti tima kao 'u', 'v' i 'b' s njihovim bodovima kao '44', '33', '22', '44', '45', '88', '96 ” i “78”. Vrijednosti asistencija su '7', '8', '9', '10', '11', '14', '18' i '17' također imaju vrijednosti skokova kao '11', ' 9”, “8”, “7”, “6”, “5”, “4” i “3”. Stupac 'bodovi' odabire se iz podatkovnog okvira za izračun standardne devijacije jednog stupca.
Izlaz prikazuje standardnu devijaciju izračunatu za stupac 'bodovi':
Primjer # 02: Pandas izračun standardne devijacije u više stupaca
U ovom primjeru izvršit ćemo izračune standardne devijacije pandi u više stupaca. U ovom okviru podataka, podaci su opet sportskog semafora koji ima vrijednosti tima kao 'n', 'w' i 't' s rezultatom kao '33', '22', '66', '55', “44”, “88”, “99” i “77”. Asistencije su '9', '7', '8', '11', '16', '14', '12' i '13', a skokovi '5', '8', '1', ' 2”, “3”, “4”, “6” i “7”. Ovdje ćemo izračunati standardnu devijaciju dvaju stupaca 'bodovi' i 'skokovi' pomoću funkcije std() primijenjene na podatkovni okvir.
Kao što vidimo, rezultat pokazuje da je standardna devijacija iznosila 26,944387 u stupcu bodova odnosno 2,449490 u stupcu odskoka.
Primjer # 03: Pandas izračun standardne devijacije svih numeričkih stupaca
Sada smo naučili kako izračunati standardnu devijaciju jednog i više redaka. Što ako ne želimo navesti sve nazive stupaca u podatkovnom okviru i izračunati cijeli podatkovni okvir? To je moguće uz samo jednostavnu implementaciju funkcije pandas standardne devijacije za izračun cjelokupnog podatkovnog okvira u rezultatima. Podatkovni okvir ovdje se sastoji od 'l', 'm' i 'o' s bodovnim vrijednostima '33', '36', '79', '78', '58', '55', a dva tima postižu isti rezultat to je '25'. Asistencije su '1', '2', '3', '4', '6', '9', '5' i '7', a njihovi skokovi '14', '10', '2' , “5”, “8”, “3”, “6” i “9”. Možemo izračunati sva standardna odstupanja stupaca prema pandama u podatkovnom okviru pomoću funkcije pandas 'std()'.
Zaslon ima izračunatu standardnu devijaciju cijelog 'df' prikazanog u nastavku; također možemo primijetiti da pande nisu izračunale standardnu devijaciju prvog stupca, koji je 'tim', jer to nije numerički stupac.
Primjer # 04: Standardna devijacija pandi korištenjem osi = 0
U ovom primjeru, podatkovni okviri imaju timove sportova kao 'g', 'h' i 'k' s dodatnim podacima. Ovdje ćemo izračunati standardnu devijaciju korištenjem osi kao '0', parametra koji se koristi u standardnoj devijaciji pandi. Ovaj argument izračunava standardnu devijaciju po stupcima podatkovnog okvira.
Sljedeći izlaz prikazuje rezultate u stupcima izračunate standardne devijacije. Stupac bodova ima izračunatu standardnu devijaciju kao '24,0313062', stupac asistencija ima izračunatu standardnu devijaciju kao '2,669270', a stupac skokova izračunatu standardnu devijaciju prikazuje kao '3,943802'.
Primjer # 05: Standardna devijacija pandi korištenjem osi = 1
Ovdje ćemo koristiti parametar osi dodijeljen kao '1' za izračunavanje standardne devijacije u pandama. Kakvu razliku može napraviti os '1'? Argument osi '1' izračunava standardnu devijaciju brojčanih vrijednosti u okviru podataka po redu. Podatkovni okvir ima tri momčadi kao 's', 'd' i 'e', uz dodatak podatkovnih stupaca kreiranih kao bodovi momčadi, asistencije momčadi i skokovi momčadi. Svim uputama dodijeljene su različite vrijednosti u podatkovnom okviru. Ovaj parametar osi mijenja igru jer do vremena trebamo raditi na podacima gdje želimo da budu u stupcu plus točka izračunata za izvedenu standardnu devijaciju.
Sljedeći izlaz prikazuje standardnu devijaciju izračunatu u retku podatkovnog okvira:
Zaključak
Pandina standardna devijacija vrlo je tehnička funkcija, što je vrlo korisna funkcija jer pronalazi standardnu devijaciju pakta entuzijazma pandas podatkovnih okvira. U ovom uvodniku proučavali smo metode izračuna standardne devijacije kod pandi. Napravili smo izračune standardne devijacije u jednom stupcu i više stupaca, a također smo zajedno izračunali standardnu devijaciju cijelog podatkovnog okvira. Sve strategije dobro funkcioniraju sve dok se koriste dosljedno i sa željenim rezultatima.