Kako dobiti trenutni URL pomoću selena

How Get Current Url With Selenium



Selen je alat za testiranje preglednika, web automatizaciju i struganje weba. Tijekom rada na vašim projektima Selenium možda ćete morati znati URL stranice koju prikazuje vaš web preglednik kontroliran selenom. Ove informacije mogu biti korisne za praćenje URL -a s mjesta na kojem ste izvukli neke podatke kako biste mogli automatski ažurirati podatke pomoću neke skripte.

U ovom članku pokazat ću vam kako s Seleniumom dobiti trenutni URL preglednika. Dakle, krenimo.







Preduvjeti:

Da biste isprobali naredbe i primjere ovog članka, morate imati:



1) Linux distribucija (po mogućnosti Ubuntu) instalirana na vašem računalu.
2) Python 3 instaliran na vašem računalu.
3) PIP 3 instaliran na vašem računalu.
4) Python virtualenv paket instaliran na vašem računalu.
5) Mozilla Firefox ili Google Chrome web preglednici instalirani na vašem računalu.
6) Morate znati instalirati Firefox Gecko upravljački program ili Chrome web upravljački program.



Za ispunjavanje uvjeta 4, 5 i 6, pročitajte moj članak Uvod u selen s Pythonom 3 na Linuxhint.com.





Možete pronaći mnoge članke o drugim temama na LinuxHint.com . Svakako ih provjerite ako trebate pomoć.

Postavljanje direktorija projekta:

Da bi sve bilo organizirano, izradite novi direktorij projekta urin selena/ kako slijedi:



$mkdir -pvurin selena/vozači

Idite na urin selena/ direktorij projekta na sljedeći način:

$CDurin selena/

Napravite Python virtualno okruženje u direktoriju projekta na sljedeći način:

$virtualenv .venv

Aktivirajte virtualno okruženje na sljedeći način:

$izvor.venv/am/aktivirati

Instalirajte biblioteku Selenium Python u svoje virtualno okruženje pomoću PIP3 na sljedeći način:

$ pip3 instalirajte selen

Preuzmite i instalirajte sve potrebne web upravljačke programe u vozači/ imenik projekta. U svom sam članku objasnio postupak preuzimanja i instaliranja mrežnih upravljačkih programa Uvod u selen s Pythonom 3 . Ako vam je potrebna pomoć, tražite dalje LinuxHint.com za taj članak.

Za demonstraciju u ovom članku koristit ću web preglednik Google Chrome. Dakle, ja ću koristiti kromirani upravljač binarno sa selenom. Trebali biste koristiti vozač gekona binarni ako želite koristiti web preglednik Firefox.

Napravite Python skriptu ex01.py u direktorij vašeg projekta i upišite sljedeće redove kodova u njega.

izselenuvozwebdriver
izselen.webdriver.uobičajen.ključeve uvozKljučevi
mogućnosti=webdriver.ChromeOpcije()
mogućnosti.bezglav = Pravi
preglednik=webdriver.Krom(izvršni_put='./drivers/chromedriver',mogućnosti=mogućnosti)
preglednik.dobiti('https://duckduckgo.com/')
ispisati(preglednik.trenutni_url)
preglednik.Zatvoriti()

Kada završite, spremite ex01.py Python skripta.

Ovdje red 1 i redak uvoze sve potrebne komponente iz biblioteke selena Python.

Redak 4 stvara objekt Chromeove mogućnosti, a redak 5 omogućuje način rada bez glave za web -preglednik Chrome.

Redak 7 stvara Chrome preglednik objekt pomoću kromirani upravljač binarni iz vozači/ imenik projekta.

Redak 9 govori pregledniku da učita web stranicu duckduckgo.com.

Redak 10 ispisuje trenutni URL preglednika. Ovdje, preglednik.current_url svojstvo koristi se za pristup trenutnom URL -u preglednika.

Redak 12 zatvara preglednik.

Pokrenite Python skriptu ex01.py kako slijedi:

$ python3 ex01.py

Kao što vidite, trenutni URL ( https://duckduckgo.com ) ispisuje se na konzoli.

U ranijem primjeru posjetio sam web stranicu duckduckgo.com i ispisao trenutni URL na konzoli. Ovo vraća URL stranice koju posjećujemo. Nije baš otmjeno jer već znamo URL stranice. Potražimo sada nešto na DuckDuckGou i pokušajmo ispisati URL stranice rezultata pretraživanja na konzoli.

Napravite Python skriptu ex02.py u direktorij vašeg projekta i upišite sljedeće redove kodova u njega.

izselenuvozwebdriver
izselen.webdriver.uobičajen.ključeve uvozKljučevi
mogućnosti=webdriver.ChromeOpcije()
mogućnosti.bezglav = Pravi
preglednik=webdriver.Krom(izvršni_put='./drivers/chromedriver',mogućnosti=mogućnosti)
preglednik.dobiti('https://duckduckgo.com/')
ispisati(preglednik.trenutni_url)
searchInput=preglednik.find_element_by_id('search_form_input_homepage')
searchInput.send_ključevi('selen hq'+ Ključevi.UNESI)
ispisati(preglednik.trenutni_url)
preglednik.Zatvoriti()

Kada završite, spremite ex02.py Python skripta.

Ovdje su retci 1-10 isti kao u ex01.py . Dakle, ne objašnjavam ih opet.

Redak 12 pronalazi tekstualni okvir za pretraživanje i pohranjuje ga u searchInput promjenjiva.

Redak 13 šalje upit za pretraživanje selen hq u searchInput tekstni okvir i pritisne ključ pomoću Ključevi.ENTER .

Nakon što se stranica za pretraživanje učita, preglednik.current_url koristi se za pristup ažuriranom trenutnom URL -u.

Redak 15 ispisuje ažurirani trenutni URL na konzoli.

Redak 17 zatvara preglednik.

Pokrenite ex02.py Python skripta na sljedeći način:

$ python3 ex02.py

Kao što vidite, skripta Python ex02.py ispisuje 2 URL -a.

Prvi je URL početne stranice tražilice DuckDuckGo.

Drugi je ažurirani trenutni URL nakon pretraživanja na tražilici DuckDuckGo pomoću upita selen hq .

Zaključak:

U ovom članku sam vam pokazao kako doći do trenutnog URL -a web preglednika pomoću biblioteke Selenium Python. Sada biste svoje selenske projekte trebali učiniti zanimljivijima.