logo

Hvad er rødforskydning?

  • Redshift er en hurtig og kraftfuld, fuldt administreret, petabyte-skala datavarehustjeneste i skyen.
  • Kunder kan bruge Redshift for kun
    • Redshift er en hurtig og kraftfuld, fuldt administreret, petabyte-skala datavarehustjeneste i skyen.
    • Kunder kan bruge Redshift for kun $0,25 i timen uden forpligtelser eller forudgående omkostninger og skalere til en petabyte eller mere for $1.000 pr. terabyte om året.

    OLAP

    OLAP er en Online analysebehandlingssystem brugt af Rødforskydning .

    Eksempel på OLAP-transaktion:

    Antag, at vi ønsker at beregne nettooverskuddet for EMEA og Stillehavet for det digitale radioprodukt. Dette kræver at trække et stort antal poster. Følgende er de optegnelser, der kræves for at beregne en nettofortjeneste:

    • Summen af ​​radioer solgt i EMEA.
    • Summen af ​​radioer solgt i Stillehavet.
    • Enhedspris for radio i hver region.
    • Salgspris for hver radio
    • Salgspris - enhedspris

    De komplekse forespørgsler er nødvendige for at hente ovenstående poster. Data warehousing-databaser bruger forskellige typer arkitektur både fra et databaseperspektiv og infrastrukturlag.

    Redshift-konfiguration

    Rødforskydning

    Rødforskydning består af to typer knudepunkter:

      Enkelt knudepunkt Multi-node

    Enkelt node: En enkelt node gemmer op til 160 GB.

    Multi-node: Multi-node er en node, der består af mere end én node. Det er af to typer:

      Leder Node
      Det administrerer klientforbindelserne og modtager forespørgsler. En ledernode modtager forespørgslerne fra klientapplikationerne, analyserer forespørgslerne og udvikler udførelsesplanerne. Den koordinerer med den parallelle udførelse af disse planer med beregningsknuden og kombinerer de mellemliggende resultater for alle knudepunkterne og returnerer derefter det endelige resultat til klientapplikationen.Beregn node
      En beregningsknude udfører eksekveringsplanerne, og derefter sendes mellemresultater til lederknudepunktet til aggregering, før de sendes tilbage til klientapplikationen. Den kan have op til 128 beregningsknuder.

    Lad os forstå begrebet lederknude og beregne noder gennem et eksempel.

    Rødforskydning

    Redshift-varehus er en samling af computerressourcer kendt som noder, og disse noder er organiseret i en gruppe kendt som en klynge. Hver klynge kører i en Redshift Engine, som indeholder en eller flere databaser.

    Når du starter en Redshift-instans, starter den med en enkelt node på størrelse 160 GB. Når du vil vokse, kan du tilføje yderligere noder for at drage fordel af parallel behandling. Du har en ledernode, der styrer de flere noder. Leader node håndterer klientforbindelsen såvel som beregningsnoder. Den gemmer dataene i beregningsnoder og udfører forespørgslen.

    Hvorfor Redshift er 10 gange hurtigere

    Rødforskydning er 10 gange hurtigere på grund af følgende årsager:

      Søjledatalagring
      I stedet for at gemme data som en række rækker, organiserer Amazon Redshift dataene efter kolonne. Rækkebaserede systemer er ideelle til transaktionsbehandling, mens kolonnebaserede systemer er ideelle til data warehousing og analyse, hvor forespørgsler ofte involverer aggregater udført over store datasæt. Da kun de kolonner, der er involveret i forespørgslerne, behandles, og kolonnedata gemmes i et lagermedie sekventielt, kræver kolonnebaserede systemer færre I/O'er, hvilket forbedrer forespørgselsydeevnen.Avanceret komprimering
      Søjledatalagre kan komprimeres meget mere end rækkebaserede datalagre, fordi lignende data lagres sekventielt på disken. Amazon Redshift anvender flere komprimeringsteknikker og kan ofte opnå betydelig komprimering i forhold til traditionelle relationsdatalagre.
      Amazon Redshift kræver ikke indekser eller materialiserede visninger, så det kræver mindre plads end traditionelle relationelle databasesystemer. Når du indlæser data i en tom tabel, prøver Amazon Redshift automatisk dine data og vælger den mest passende komprimeringsteknik.Massivt parallel behandling
      Amazon Redshift distribuerer automatisk dataene og indlæser forespørgslen på tværs af forskellige noder. En Amazon Redshift gør det nemt at tilføje nye noder til dit datavarehus, og dette giver os mulighed for at opnå hurtigere forespørgselsydeevne, efterhånden som dit datavarehus vokser.

    Rødforskydningsfunktioner

    Funktioner af rødforskydning er angivet nedenfor:

    Rødforskydning
      Nem at konfigurere, implementere og administrere
        Automatiseret provisionering
        Redshift er enkel at sætte op og betjene. Du kan implementere et nyt datavarehus med blot et par klik i AWS-konsollen, og Redshift klargør automatisk infrastrukturen for dig. I AWS er ​​alle administrative opgaver automatiserede, såsom backup og replikering, du skal fokusere på dine data, ikke på administrationen.Automatiserede sikkerhedskopier
        Redshift sikkerhedskopierer automatisk dine data til S3. Du kan også replikere snapshots i S3 i en anden region til enhver katastrofegendannelse.
      Omkostningseffektiv
        Ingen forudgående omkostninger, betal mens du går
        Amazon Redshift er den mest omkostningseffektive datavarehustjeneste, da du kun skal betale for det, du bruger.
        Dets omkostninger starter med 0,25 USD pr. time uden forpligtelse og uden forudgående omkostninger og kan skaleres ud til 250 USD pr. terabyte pr. år.
        Amazon Redshift er den eneste datavarehustjeneste, der tilbyder On Demand-priser uden forudgående omkostninger, og den tilbyder også reserverede forekomstpriser, der sparer op til 75 % ved at give 1-3 års løbetid.Vælg din nodetype.
        Du kan vælge en af ​​de to noder for at optimere rødforskydningen.
          Tæt beregningsknude
          Tæt beregningsknude kan skabe et højtydende datavarehus ved at bruge hurtige CPU'er, en stor mængde RAM og solid-state diske.Tæt lagringsknude
          Hvis du vil reducere omkostningerne, kan du bruge Dense storage node. Det skaber et omkostningseffektivt datavarehus ved at bruge en større harddisk.
      Skaler hurtigt for at imødekomme dine behov.
        Petabyte-skala data warehousing
        Amazon Redshift skalerer automatisk noderne op eller ned efter behovsændringerne. Med blot et par klik i AWS-konsollen eller et enkelt API-kald kan du nemt ændre antallet af noder i et datavarehus.Exabyte-skala datasø-analyse
        Det er en funktion af Redshift, der giver dig mulighed for at køre forespørgslerne mod exabytes af data i Amazon S3. Amazon S3 er en sikker og omkostningseffektiv data til at gemme ubegrænset data i et åbent format.Ubegrænset samtidighed
        Det er en funktion af Redshift betyder, at flere forespørgsler kan få adgang til de samme data i Amazon S3. Det giver dig mulighed for at køre forespørgslerne på tværs af de flere noder uanset kompleksiteten af ​​en forespørgsel eller mængden af ​​data.
      Spørg din datasø
      Amazon Redshift er det eneste datavarehus, der bruges til at forespørge Amazon S3-datasøen uden at indlæse data. Dette giver fleksibilitet ved at gemme de ofte tilgåede data i Redshift og ustrukturerede eller sjældent tilgåede data i Amazon S3.Sikker
      Med et par parameterindstillinger kan du indstille Redshift til at bruge SSL til at sikre dine data. Du kan også aktivere kryptering, alle data skrevet til disken vil blive krypteret.Hurtigere ydeevne
      Amazon Redshift leverer søjleformet datalagring, komprimering og parallel behandling for at reducere mængden af ​​I/O, der er nødvendig for at udføre forespørgsler. Dette forbedrer forespørgselsydeevne.

    ,25 i timen uden forpligtelser eller forudgående omkostninger og skalere til en petabyte eller mere for .000 pr. terabyte om året.

OLAP

OLAP er en Online analysebehandlingssystem brugt af Rødforskydning .

Eksempel på OLAP-transaktion:

Antag, at vi ønsker at beregne nettooverskuddet for EMEA og Stillehavet for det digitale radioprodukt. Dette kræver at trække et stort antal poster. Følgende er de optegnelser, der kræves for at beregne en nettofortjeneste:

  • Summen af ​​radioer solgt i EMEA.
  • Summen af ​​radioer solgt i Stillehavet.
  • Enhedspris for radio i hver region.
  • Salgspris for hver radio
  • Salgspris - enhedspris

De komplekse forespørgsler er nødvendige for at hente ovenstående poster. Data warehousing-databaser bruger forskellige typer arkitektur både fra et databaseperspektiv og infrastrukturlag.

Redshift-konfiguration

Rødforskydning

Rødforskydning består af to typer knudepunkter:

    Enkelt knudepunkt Multi-node

Enkelt node: En enkelt node gemmer op til 160 GB.

Multi-node: Multi-node er en node, der består af mere end én node. Det er af to typer:

    Leder Node
    Det administrerer klientforbindelserne og modtager forespørgsler. En ledernode modtager forespørgslerne fra klientapplikationerne, analyserer forespørgslerne og udvikler udførelsesplanerne. Den koordinerer med den parallelle udførelse af disse planer med beregningsknuden og kombinerer de mellemliggende resultater for alle knudepunkterne og returnerer derefter det endelige resultat til klientapplikationen.Beregn node
    En beregningsknude udfører eksekveringsplanerne, og derefter sendes mellemresultater til lederknudepunktet til aggregering, før de sendes tilbage til klientapplikationen. Den kan have op til 128 beregningsknuder.

Lad os forstå begrebet lederknude og beregne noder gennem et eksempel.

Rødforskydning

Redshift-varehus er en samling af computerressourcer kendt som noder, og disse noder er organiseret i en gruppe kendt som en klynge. Hver klynge kører i en Redshift Engine, som indeholder en eller flere databaser.

Når du starter en Redshift-instans, starter den med en enkelt node på størrelse 160 GB. Når du vil vokse, kan du tilføje yderligere noder for at drage fordel af parallel behandling. Du har en ledernode, der styrer de flere noder. Leader node håndterer klientforbindelsen såvel som beregningsnoder. Den gemmer dataene i beregningsnoder og udfører forespørgslen.

Hvorfor Redshift er 10 gange hurtigere

Rødforskydning er 10 gange hurtigere på grund af følgende årsager:

    Søjledatalagring
    I stedet for at gemme data som en række rækker, organiserer Amazon Redshift dataene efter kolonne. Rækkebaserede systemer er ideelle til transaktionsbehandling, mens kolonnebaserede systemer er ideelle til data warehousing og analyse, hvor forespørgsler ofte involverer aggregater udført over store datasæt. Da kun de kolonner, der er involveret i forespørgslerne, behandles, og kolonnedata gemmes i et lagermedie sekventielt, kræver kolonnebaserede systemer færre I/O'er, hvilket forbedrer forespørgselsydeevnen.Avanceret komprimering
    Søjledatalagre kan komprimeres meget mere end rækkebaserede datalagre, fordi lignende data lagres sekventielt på disken. Amazon Redshift anvender flere komprimeringsteknikker og kan ofte opnå betydelig komprimering i forhold til traditionelle relationsdatalagre.
    Amazon Redshift kræver ikke indekser eller materialiserede visninger, så det kræver mindre plads end traditionelle relationelle databasesystemer. Når du indlæser data i en tom tabel, prøver Amazon Redshift automatisk dine data og vælger den mest passende komprimeringsteknik.Massivt parallel behandling
    Amazon Redshift distribuerer automatisk dataene og indlæser forespørgslen på tværs af forskellige noder. En Amazon Redshift gør det nemt at tilføje nye noder til dit datavarehus, og dette giver os mulighed for at opnå hurtigere forespørgselsydeevne, efterhånden som dit datavarehus vokser.

Rødforskydningsfunktioner

Funktioner af rødforskydning er angivet nedenfor:

sortere bunke
Rødforskydning
    Nem at konfigurere, implementere og administrere
      Automatiseret provisionering
      Redshift er enkel at sætte op og betjene. Du kan implementere et nyt datavarehus med blot et par klik i AWS-konsollen, og Redshift klargør automatisk infrastrukturen for dig. I AWS er ​​alle administrative opgaver automatiserede, såsom backup og replikering, du skal fokusere på dine data, ikke på administrationen.Automatiserede sikkerhedskopier
      Redshift sikkerhedskopierer automatisk dine data til S3. Du kan også replikere snapshots i S3 i en anden region til enhver katastrofegendannelse.
    Omkostningseffektiv
      Ingen forudgående omkostninger, betal mens du går
      Amazon Redshift er den mest omkostningseffektive datavarehustjeneste, da du kun skal betale for det, du bruger.
      Dets omkostninger starter med 0,25 USD pr. time uden forpligtelse og uden forudgående omkostninger og kan skaleres ud til 250 USD pr. terabyte pr. år.
      Amazon Redshift er den eneste datavarehustjeneste, der tilbyder On Demand-priser uden forudgående omkostninger, og den tilbyder også reserverede forekomstpriser, der sparer op til 75 % ved at give 1-3 års løbetid.Vælg din nodetype.
      Du kan vælge en af ​​de to noder for at optimere rødforskydningen.
        Tæt beregningsknude
        Tæt beregningsknude kan skabe et højtydende datavarehus ved at bruge hurtige CPU'er, en stor mængde RAM og solid-state diske.Tæt lagringsknude
        Hvis du vil reducere omkostningerne, kan du bruge Dense storage node. Det skaber et omkostningseffektivt datavarehus ved at bruge en større harddisk.
    Skaler hurtigt for at imødekomme dine behov.
      Petabyte-skala data warehousing
      Amazon Redshift skalerer automatisk noderne op eller ned efter behovsændringerne. Med blot et par klik i AWS-konsollen eller et enkelt API-kald kan du nemt ændre antallet af noder i et datavarehus.Exabyte-skala datasø-analyse
      Det er en funktion af Redshift, der giver dig mulighed for at køre forespørgslerne mod exabytes af data i Amazon S3. Amazon S3 er en sikker og omkostningseffektiv data til at gemme ubegrænset data i et åbent format.Ubegrænset samtidighed
      Det er en funktion af Redshift betyder, at flere forespørgsler kan få adgang til de samme data i Amazon S3. Det giver dig mulighed for at køre forespørgslerne på tværs af de flere noder uanset kompleksiteten af ​​en forespørgsel eller mængden af ​​data.
    Spørg din datasø
    Amazon Redshift er det eneste datavarehus, der bruges til at forespørge Amazon S3-datasøen uden at indlæse data. Dette giver fleksibilitet ved at gemme de ofte tilgåede data i Redshift og ustrukturerede eller sjældent tilgåede data i Amazon S3.Sikker
    Med et par parameterindstillinger kan du indstille Redshift til at bruge SSL til at sikre dine data. Du kan også aktivere kryptering, alle data skrevet til disken vil blive krypteret.Hurtigere ydeevne
    Amazon Redshift leverer søjleformet datalagring, komprimering og parallel behandling for at reducere mængden af ​​I/O, der er nødvendig for at udføre forespørgsler. Dette forbedrer forespørgselsydeevne.