Rekommenderas, 2024

Redaktionen

Skillnad mellan faktabord och dimensionstabell

Faktabellen och Dimensionstabellen är de viktigaste faktorerna för att skapa ett schema . En faktabordets post är en kombination av attribut från olika dimensionstabeller. Fact table hjälper användaren att analysera affärsdimensioner som hjälper honom att fatta beslut för att förbättra sin verksamhet. På andra händer hjälper dimensionstabellerna faktabord för att samla in dimensioner längs vilka åtgärderna måste vidtas.

Poängen som skiljer Faktabord och Dimensionstabellen är att dimensionstabellen innehåller attribut längs vilka åtgärder som tas i faktabordet . Det finns några andra faktorer som skapar skillnader mellan faktabord och dimensionstabell för att se dem. Låt oss ta en titt på jämförelsestabellen nedan.

Jämförelsediagram

Grunder för jämförelseFaktabladDimensionstabell
GrundläggandeFaktablad innehåller mätningen längs attributen för en dimensionstabell.Dimensionstabellen innehåller attributen längs vilken faktabord beräknar metriska.
Attribut och posterFakta tabellen innehåller mindre attribut och fler poster.Dimensionstabellen innehåller fler attribut och mindre poster.
TabellstorlekFakta tabellen växer vertikalt.Dimensionstabellen växer horisontellt.
NyckelFaktablad innehåller en primär nyckel som är en sammanfogning av primärtangenterna för alla dimensionstabeller.Varje dimensionstabell innehåller dess primära nyckel.
SkapandeFakta tabellen kan bara skapas när dimensionstabellerna är färdiga.Dimensionstabeller måste skapas först.
schemaEtt schema innehåller mindre antal faktabord.Ett schema innehåller fler antal dimensionstabeller.
attributFact table kan ha data i numeriskt såväl som textformat.Dimensionstabellen innehåller alltid attribut i textformat.

Definition av faktablad

En faktatabell är en tabell som innehåller mätningar utöver egenskaperna hos dimensionstabellerna. Det kan innehålla informationen på lägsta möjliga nivå. En del faktabord innehåller bara sammanfattande data, som kallas Aggregated Fact Table . Faktabordet innehåller nästan datumdämpad data. Låt oss diskutera egenskaperna hos en faktabord.

Sammansatt nyckel
Faktablad innehåller sammansatt nyckel som är sammanlänkning av primära nycklar för alla dimensionstabeller. Faktabordets sammanförda nyckel måste unikt identifiera raden i en faktabord.

Datakorn
Datakorn visar hur djupt mätningarna faktiskt har lagrats. Datakorren måste vara på möjligast högsta nivå.

Additiva åtgärder
Attribut av faktabordet kan vara fullständigt additiv eller semiadditiv . Helt additiva åtgärder är de som lätt kan summeras för alla dimensioner i faktabordet. Exempelvis quantity_ordered, är ett attribut som kan sammanfattas för alla dimensioner. Som vi kan ta ut totalt antal kvantiteter, för en viss kund, region, datum, varumärke etc. Halvtillsatsåtgärder är de som kan summeras längs vissa dimensioner av faktabordet men inte alla dimensioner. Liksom, balansbeloppet kan inte sammanfattas över tidsdimensionen eftersom det ändras över tiden.

Glesdata
Ibland ser vi faktiskt tabellen som har attribut med nullåtgärder . Till exempel kan det inte finnas någon order på en semester. Så attribut för detta datum kommer att ha nullåtgärder. Vi behöver inte lagra åtgärd för sådana typer av dokument eftersom det inte ger någon information.

Degenererade dimensioner
Ibland kan du komma över några dimensioner faktiskt tabell, som inte alls är additiv. Till exempel ordernummer, kund_id, kan du inte lägga till dessa typer av dimensioner. Men i fall måste du hitta order gjord av en viss kund i denna månad. då behöver du customer_id för att relatera din sökning. Dessa typer om attribut eller dimensioner av faktabord kallas Degenerated Dimension .

Definition av dimensionstabell

Dimensionstabell är en nyckelkomponent för Start Schema. En dimensionstabell innehåller de attribut som representerar dimensioner, längs vilka mätningen faktiskt tas i bruk. Vidare kommer vi att diskutera några egenskaper hos en dimensionstabell.

Attribut och nycklar
Varje dimensionstabell måste ha en primär nyckel som unikt identifierar varje post i tabellen. Det observeras allmänt att dimensionstabellen innehåller många attribut. Det verkar därför vara brett, dvs när du skapar en dimensionstabell hittar du den sprida sig horisontellt .

Attributvärden
Värdena för attributen i dimensionstabellen är sällan numeriska. De flesta gånger hittar du värdena i attribut i textformat . Till exempel produktnamn, varumärke, kategori, underkategori etc.

Förhållande mellan attribut
Ofta kan du observera att attributen du stöter på i en dimensionstabell inte är direkt relaterade. Liksom, Product_brand måste inte göra något med package_date men fortfarande kan båda vara attributen för produktdimensionstabellen.

Normalisering
Dimensionstabellen ska inte normaliseras . Detta beror på att normalisering av ett bord skulle skapa många mellanliggande tabeller. När en fråga hämtar ett attribut från dimensionstabellen och återställer mätningar utöver det för faktabordet måste frågan gå igenom de mellanliggande tabellerna som blir ineffektiva. Dimensionerstabellerna är därför inte normaliserade.

Borra ner, rulla upp
Attribut av dimensionstabellen gör att du kan få detaljerna antingen genom att gå från högre nivå av aggregerade attribut till lägre nivåattribut. Till exempel, om du vill hitta den totala försäljningen i en region så kan du borra ner för att hitta försäljning med stat, stad, zip. Du kan till och med rulla upp för att hitta den totala försäljningen först med zip, sedan efter stad och sedan state.

Multipel hierarki
Ofta har dimensionstabellen flera hierarkier. Till exempel har vi en produktdimensionstabell för en avdelningsaffär. Nu har vi två avdelningar för marknadsföring och redovisning.

Marknadsavdelningen kommer att drill ner bland attribut av produktdimensionstabellen i en viss hierarki för att få mätningar för faktabordet.

På andra händer kommer redovisningsavdelningen att drill ner bland attributen för produktdimensionstabellen i den olika hierarkin för att få mätningar för faktabordet.

Dimensionstabellen måste därför ha flera hierarkier eller aggregeringsnivåer för attribut för att låta användaren borra ner i någon av de flera hierarkierna.

Uppgifter
Även om en dimensionstabell har för många attribut, har den färre poster.

Viktiga skillnader mellan faktabord och dimensionstabell

  1. Faktablad innehåller mätning längs dimensionen / attributen för en dimensionstabell.
  2. Fakta tabellen innehåller fler poster och mindre attribut jämfört med dimensionstabellen medan dimensionstabellen innehåller fler attribut och färre poster.
  3. Tabellstorleken på faktabordet växer vertikalt medan tabellstorleken på dimensionstabellen växer horisontellt.
  4. Varje dimensionstabell innehåller en primär nyckel för att identifiera varje post i tabellen medan faktabordet innehåller sammanlänkad nyckel som är en kombination av alla primära nycklar för alla dimensionstabeller.
  5. Dimensionstabellen måste spelas in före skapandet av faktabordet.
  6. Ett schema innehåller färre faktabord men mer dimensionstabeller.
  7. Attribut i själva verket är numeriska såväl som textliga, men attribut på dimensionstabell har endast textliga attribut.

Slutsats:

Båda är lika viktiga för skapande av schema, men dimensionstabellen måste spelas in före faktabordet. Eftersom det är omöjligt att skapa faktabord med ut dimensioner.

Top