Što su tipovi podataka Amazon Redshift?

Sto Su Tipovi Podataka Amazon Redshift



Amazon Redshift je rješenje u oblaku koje nudi AWS i ispunjava svrhu skladišta podataka. Skladište podataka veliki je prostor u oblaku koji pohranjuje ogromne količine podataka. Razlika između skladišta podataka i baze podataka je u tome što prva ne pohranjuje samo trenutne podatke, već i cjelokupnu povijest podataka.

Ovaj članak će saznati više o Amazon Redshift by AWS i vrstama podataka koje ova usluga podržava.







Što je Amazon RedShift?

To je rješenje u oblaku za skladištenje podataka koje se temelji na 'PostgreSQL' . Koristi tehnologiju tzv 'Masovno paralelno procesiranje (MPP)' za obradu petabajta podataka munjevitom brzinom. To pruža jednostavno rješenje za predviđanje u stvarnom vremenu na temelju povijesnih podataka i rješenja za strujanje.



Sljedeća slika prikazuje radni mehanizam Amazon Redshift-a:







Ovo grafičko objašnjenje kako radi Amazon Redshift vrlo je jednostavno i jasno. Daje nam informacije o tome kako se podaci dohvaćaju i dalje obrađuju za generiranje rezultata i stvaranje aplikacija vođenih podacima.

Arhitektura skladišta podataka Amazon Redshifta također se može vidjeti na donjoj slici:



Sada ćemo se posvetiti upotrebi i značajkama ove usluge.

Značajke

Kao što je već spomenuto, Amazon Redshift temelji se na PostgreSQL-u i koristi tehnologiju pod nazivom Massively Parallel Processing koja mu omogućuje obradu petabajta podataka u tren oka. Stoga Redshift nudi velik broj značajki i namjena. Neke od ovih značajki su u nastavku:

  • Sigurnost podataka i šifriranje.
  • Poslovna analitika.
  • Podrška za aplikacije temeljene na podacima.
  • Prediktivna analiza.
  • Automatizirano ponavljanje zadatka.
  • Istodobno skaliranje podataka.
  • Skladištenje podataka.

Neke dodatne značajke ove usluge mogu se vidjeti na donjoj slici:

Ovo je bila većina značajki koje Redshift nudi, a sada ćemo prijeći na vrste podataka koje ova usluga podržava.

Vrste podataka

Amazon Redshift rješenje je za skladištenje podataka s velikim brojem značajki. Podržava i strukturirane i nestrukturirane tipove podataka. Budući da se temelji na PostgreSQL-u, podacima se može manipulirati putem jednostavnih SQL upita.

Sada se postavlja još jedno pitanje, tj. kako se ovi formati podataka međusobno razlikuju? Razmotrimo ova dva formata podataka.

Strukturirani podaci

Visoko formatirani tip podataka koji se lako prevodi algoritmima strojnog učenja naziva se strukturiranim podacima. SQL baza podataka radi sa strukturiranim podacima. Strukturirani podaci su u obliku tablice kao što su podaci koje koriste relacijske baze podataka

Jedan od široko korištenih SQL sustava za upravljanje bazom podataka je MYSQL. Njegova arhitektura se može vidjeti ispod na datoj slici:

Nestrukturirani podaci

Nestrukturirani podaci imaju manje uzoraka i formata kao što su podaci koji se koriste u nerelacijskim bazama podataka. MongoDB je poznata nerelacijska baza podataka. SQL upiti ne rade na nerelacijskim bazama podataka, pa se te baze podataka nazivaju i NoSQL bazama podataka.

Kao što je već spomenuto, MongoDB je nestrukturirani sustav za upravljanje bazom podataka i njegova se arhitektura može vidjeti ispod na danoj slici:

Prošli smo kroz dvije temeljne vrste podataka koje se koriste u bazama podataka, a sada ćemo se uputiti na stvarne vrste podataka koje podržava Amazon Redshift. Ove vrste podataka su:

  • Numerički podaci
  • Podaci o znakovima
  • Podaci o datumu i vremenu
  • Booleovi podaci
  • Podaci HLLSKETCH
  • SUPER podaci
  • Podaci o ZAMJENI

Razmotrimo ove vrste podataka:

Numerički podaci

Ova vrsta podataka je sama po sebi razumljiva. Podržava podatke koji su u obliku cijelih brojeva, decimala, pomičnog zareza i druge numeričke vrste podataka.

Karakteristike integer tipa podataka mogu se vidjeti na slici ispod:

Decimalni tip podataka pohranjuje podatke na temelju preciznosti korisnika. Njegove karakteristike su sljedeće:

Podaci o znakovima

Tipovi podataka CHAR i VARCHAR spadaju u kategoriju tipova podataka temeljenih na znakovima. NCHAR i NVARCHAR također su znakovni tipovi podataka. Za razliku od CHAR i VARCHAR, ove dvije vrste podataka pohranjuju Unicode znakove fiksne duljine. Pogledajmo svojstva ovih tipova podataka, kao što su:

  • CHAR, CHARACTER, NCHAR imaju raspon od 4KB.
  • VARCHAR, NVARCHAR ima raspon od 64 KB.
  • BPCHAR ima raspon od 256 bajtova.
  • TEKST ima raspon od 260 bajtova.

Podaci o datumu i vremenu

Tipovi podataka Datum i vrijeme su DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. Funkcionalne mogućnosti ovih tipova podataka su sljedeće:

  • DATE jednostavno pohranjuje kalendarske datume.
  • TIME pohranjuje vrijeme bez pozivanja na vremensku zonu. Zadano je UTC.
  • TIMETZ pohranjuje vrijeme u odnosu na vremensku zonu. To je UTC iu korisničkim tablicama iu sistemskim tablicama, prema zadanim postavkama.
  • TIMESTAMP ne uključuje samo vrijeme nego i datume. To je UTC iu korisničkim tablicama iu sistemskim tablicama, prema zadanim postavkama.
  • TIMESTAMPTZ ne uključuje samo vrijeme nego i datume. Zadano je UTC samo u korisničkim tablicama.

Booleovi podaci

Boolean tip podataka je binarni tip podataka, što znači da postoje samo dvije vrijednosti. Tablica karakteristika za Boolean tip podataka data je ispod na slici:

Podaci HLLSKETCH

Ovaj tip podataka koristi se za pohranjivanje skica. Crveni pomak može predstavljati skice u rijetkom ili gustom obliku. Skice počinju kao rijetke i postupno postaju guste kada gusti format pruža veću učinkovitost praćenjem veze.

SUPER podaci

Ova vrsta podataka bavi se nestrukturiranim podacima koji mogu biti u obliku nizova, ugniježđenih struktura ili JSON-a. Ne postoji model ili format podataka. Korisnici mogu istražiti više informacija klikom na vezu.

Podaci o ZAMJENI

Ova vrsta podataka također pohranjuje znakove. Međutim, duljina je ograničena. Amazon Redshift omogućuje pretvaranje VARBYTE podataka u bilo koji cjelobrojni ili znakovni tip podataka. Za više informacija o ovoj vrsti podataka, slijedite poveznicu u nastavku.

Ovo je sve o Amazon Redshiftu i vrstama podataka koje podržava.

Zaključak

Amazon Redshift je AWS usluga koja u svom osnovnom obliku služi u svrhu skladišta podataka, ali je vrlo moćno i funkcionalno rješenje za analitiku i predviđanje. U ovom se članku govori o Redshiftu i vrstama podataka koje podržava. Ovi tipovi podataka su ukratko objašnjeni zajedno s njihovim karakteristikama.