Kako stvoriti alat za indeksiranje za dohvaćanje podataka iz S3 spremnika?

Kako Stvoriti Alat Za Indeksiranje Za Dohvacanje Podataka Iz S3 Spremnika



AWS Glue se koristi za otkrivanje podataka, integraciju podataka, indeksiranje podataka i stvaranje kataloga podataka u oblaku. Korisnik može stvoriti alat za indeksiranje iz AWS Gluea koji će indeksirati podatke iz zadanog izvora i zatim ih pohraniti u katalog podataka kako bi dobio informacije. Korisnik samo mora pokrenuti alat za indeksiranje, a sve ostalo će izvršiti alat za indeksiranje u roku od nekoliko trenutaka.

Ovaj će vodič objasniti kako stvoriti alate za indeksiranje za dohvaćanje podataka iz spremnika S3.

Kako stvoriti alat za indeksiranje za dohvaćanje podataka iz S3 spremnika?

Da biste izradili indeksiranje u AWS-u, posjetite ' AWS ljepilo ” s nadzorne ploče Amazona:









Klikni na ' Baze podataka ” iz odjeljka Katalog podataka za izradu baze podataka:







Klikni na ' Dodaj bazu podataka ” za početak konfiguracije:



Unesite naziv baze podataka i ostavite sve kako nije obavezno prije nego što kliknete na ' Stvorite bazu podataka ' dugme:

Baza podataka je uspješno kreirana:

Nakon toga jednostavno idite na ' Štramplice ” klikom na nju na lijevoj ploči:

Klikni na ' Stvorite alat za indeksiranje ' dugme:

Upišite naziv alata za indeksiranje i kliknite na ' Sljedeći ' dugme:

Klikni na ' Dodajte izvor podataka ” za odabir izvora podataka:

Kako biste provjerili put gdje su podaci pohranjeni, posjetite S3 uslugu:

Idite u S3 kantu gdje se učitavaju podaci. Korisnik može stvoriti kantu i Učitaj podaci o njemu s nadzorne ploče AWS S3:

Klikni na ' Pregledajte S3 ” za odabir putanje podataka:

Odaberite mapu koja sadrži podatke, zatim kliknite na ' Odaberite ' dugme:

S3 staza je odabrana, sada kliknite na ' Dodajte S3 izvor podataka ' dugme:

Nakon što je izvor podataka dodan, jednostavno kliknite na ' Sljedeći ' dugme:

Dodajte IAM ulogu, a zatim kliknite na ' Sljedeći ' dugme:

Unesite ciljanu bazu podataka stvorenu ranije i zatim upišite naziv za tablicu:

Odaberite raspored na zahtjev za indeksiranje i kliknite na ' Sljedeći ' dugme:

Pregledajte alat za indeksiranje i kliknite na ' Stvorite alat za indeksiranje ' dugme:

Alat za indeksiranje je uspješno kreiran, kliknite na ' Trčanje ” nakon što ga odaberete:

Trebat će nekoliko trenutaka da se alat za indeksiranje pokrene i on će dohvatiti podatke i stvoriti tablicu za pohranu podataka:

Krenite u ' Stolovi ” na Glue nadzornoj ploči:

Izaberite tablicu klikom na njen naziv:

Prikazani su detalji priče koji sadrže metapodatke dohvaćenih podataka:

Pomaknite se prema dolje na stranici i odaberite odjeljak za prikaz tablice koja sadrži podatke:

To je sve o stvaranju alata za indeksiranje za dohvaćanje podataka iz S3 spremnika.

Zaključak

Da biste izradili alat za indeksiranje za dohvaćanje podataka iz S3 spremnika, izradite bazu podataka na AWS Glueu u kojoj će indeksirani podaci biti pohranjeni. Konfigurirajte alat za indeksiranje s nadzorne ploče Glue pružanjem izvora podataka (S3 spremnik) i ciljne baze podataka. Pokrenite alat za indeksiranje i dohvatite podatke iz spremnika S3 u tablicu baze podataka kao što je ovaj vodič detaljno objasnio.