Što su popisi za indeksiranje u AWS-u?

Sto Su Popisi Za Indeksiranje U Aws U



Podaci su imali veliki utjecaj na rast tvrtki jer mnoge od njih uvelike ovise o njima kako bi putem njih dobile uvid. Metapodaci su podaci o podacima koji objašnjavaju podatke tako da se podaci mogu koristiti za dobivanje maksimalne informacije iz njih. Metapodaci sadrže informacije poput lokacije podataka, strukture sheme, vrste podataka ili stvari poput vlasnika podataka.

Ovaj će vodič objasniti alate za indeksiranje popisa u AWS-u.

Što su popisi za indeksiranje u AWS-u?

Alat za indeksiranje je komponenta AWS Glue-a koji se koristi za indeksiranje lokacije podataka i vraća te informacije natrag u katalog. Informacije koje alat za indeksiranje prikuplja mogu biti tipovi podataka podataka, struktura sheme ili drugim riječima, prikuplja metapodatke. Crawler se također može koristiti s katalogom podataka koji se koristi kada se podaci premještaju unutar Glue ekosustava dok se koriste ETL poslovi itd.









Što je Amazon Glue Service?

AWS Glue je usluga Amazon Extract Transform and Load koja korisniku omogućuje organiziranje, lociranje, premještanje i transformaciju svih podataka. AWS Glue je bez poslužitelja jer korisnik ne mora osigurati i konfigurirati poslužitelje niti upravljati životnim ciklusima. Katalog podataka i alati za indeksiranje komponente su AWS Gluea koji djeluje kao postojano spremište metapodataka:







Kako stvoriti alat za indeksiranje na AWS-u?

Da biste izradili alat za indeksiranje na AWS-u, posjetite uslugu AWS Glue s konzole za upravljanje AWS-om:



Krenite u ' Štramplice ” klikom na njezin naziv na lijevoj ploči:

Klikni na ' Stvorite alat za indeksiranje ' dugme:

Upišite naziv alata za indeksiranje i kliknite na ' Sljedeći ' dugme:

Odaberite opciju mapiranja za ljepljive tablice i kliknite na ' Dodajte izvor ” za dobivanje podataka iz:

Odaberite uslugu S3 i kliknite na ' Pregledajte S3 ” za dobivanje lokacije izvora:

Jednostavno odaberite mapu S3 i kliknite na ' Odaberite ' dugme:

Nakon što je lokacija dodana izvoru, jednostavno kliknite na ' Dodajte S3 izvor podataka ' dugme:

Klikni na ' Sljedeći ' dugme:

Klikni na ' Stvorite novu IAM ulogu ' gumb iz ' Konfigurirajte sigurnosne postavke ” odjeljak:

Unesite naziv uloge i kliknite na ' Stvoriti ' dugme:

Nakon toga jednostavno kliknite na ' Sljedeći ' dugme:

Odaberite ciljnu bazu podataka i upišite naziv koji će se koristiti za tablicu:

Zakažite alat za indeksiranje za ' Na zahtjev ' i kliknite na ' Sljedeći ' dugme:

Pregledajte konfiguraciju i kliknite na ' Stvorite alat za indeksiranje ' dugme:

Alat za indeksiranje je uspješno kreiran i može se koristiti za dohvaćanje podataka iz izvora klikom na ' Trčanje ' dugme:

To je sve o alatima za indeksiranje popisa u AWS-u.

Zaključak

ListCrawler je komponenta usluge AWS Glue koja se može koristiti za indeksiranje informacija iz izvora i povratak u katalog. Katalozi podataka i alati za indeksiranje mogu se koristiti za prikupljanje podataka kako bi se dobile informacije o podacima koji su poznati kao metapodaci. Korisnik također može stvoriti alat za indeksiranje iz AWS Gluea kako bi dobio podatke iz usluge S3 ili drugih izvora i smjestio stvorene tablice u bazu podataka. Ovaj vodič objašnjava ListCrawlere u AWS-u i kako ih izraditi.