Relational and Dimensional Modeling
Beskrivelse
Datamodeller er strukturer, hvori forretningens data kan registreres/opsamles og efterfølgende analyseres. Tankegangen bag de to modeller er særdeles anvendelig for BI udviklere, dataanalytikere, rapportdesignere, programmører og app-udviklere samt Database Administratorer (DBA). Kurset er ikke produktspecifikt, og henvender sig til brugere af f.eks Microsoft SQL Server, Power BI, Excel PowerPivot, Analysis Services, Oracle, IBM Db2, PostgreSQL, MySQL, MariaDB, Targit, Qlik m.fl.
Kurset starter med at give en grundig introduktion til tankegang samt centrale begreber i Relational Modeling. Vi arbejder med overgangen fra forretningens virkelighed til at registrere/udvælge relevante data i en data model. Tankegangen og spørgsmål, der stilles undervejs, er helt centrale for en vellykket database model.
Den relationelle datamodel ligger bag de 'klassiske SQL databaser', og er den mest udbredte datamodel i SQL Database servere.
Den dimensionelle data model anvendes til analyse og præsentation af data, ofte fra flere kildesystemer. Kurset giver en grundig introduktion til de 4 faser i design af en Dimensional Model. Herunder overgangen fra interview runder til en færdig model. Mange faldgruber kan undgås ved at have kendskab til den bagvedliggende tankegang, og det bliver markant nemmere at oversætte slutbrugeres krav og ønsker til en levende og anvendelig datamodel.
Dimensionelle Modeller benyttes især på to områder: Data Warehouses / Data Marts hhv rapportering, f.eks Power BI, Excel Power Pivot, Targit, Tableau og Qlik. Microsoft benytter den dimensionelle datamodel i begge varianter af Analysis Services (Multidimensional og Tabular edition).
En godt gennemtænkt Database Model er en vigtig forudsætning for at få teknisk assistance til at implementere den fysiske database, herunder kommunikationen med eksterne konsulenter. Dette gælder såvel den relationelle som den dimensionelle datamodel.
Kurset henvender sig til kursister, der ønsker:
- At få styr på de centrale begreber og tankegang i de to data modeller.
- At kunne ”afkode” og navigere i eksisterende databaser i forretningen og oversætte fra en eksisterende database til forretningens sprog.
- At kunne tale 'database sprog', altså 'oversætte' frem og tilbage mellem Forretningen og Database-modellen, herunder mere præcist kunne formulere ønsker om ændringer til intern IT-afdeling. Dette er desuden en stor fordel når der søges information på nettet!
- At kvalificere samarbejdet med eksterne konsulenter inden for udvikling og Business Intelligence og blive mere præcis i at formulere forretningens ønsker.
- At kunne stille mere kvalificerede spørgsmål til konsulenternes tankegang, strategier og dokumentation.
Der indgår mange eksempler, modeksempler og øvelser gennem kurset.
Moduloversigt
- Modul 1Relational data modeling - Entiteter og roller
Entiteter - udgangspunktet for designet
- Identificere Entiteterne i forretningens virkelighed - mange eksempler
4 typer af entiteter - hvornår de bruges, hvordan de identificeres
Identifikation af Entiteter
- Primary keys ( primære nøgler ) - hvorfor de er vigtige at have styr på
- Surrogate Keys - hvad er deres funktion, hvornår de oprettes
Attributter
- Nullbarhed - NULLs i databaser - betydning og anvendelse
Uniqueness
- Hvornår uniqueness er væsentligt i et database design
- Hvornår rækker i tabeller er unikke - hvornår de ikke er
Roller
- Håndtering af Roller i database designet
- Forhold mellem Roller og tabeller
Foreign Keys ( fremmede nøgler )
- Pointen bag Foreign Keys
- Sammensatte nøgler
Binære relationer - når to Entiteter spiller en Rolle sammen
- 1-til-mange , mange-til-mange og én-til-én relationerne
- Hvordan binære Roller implementeres
Sammensatte Roller - når mere end to Entiteter spiller en Rolle sammen
- Hvordan disse Roller implementeres
Check constraints
- Hvad kan de, hvornår benyttes de?
- Modul 2Relational data modeling - Normalisering
Data redundans - hvad er pointen
1, 2 hhv. normalform
Hvad normalisering tilbyder - med mange eksempler
TIlvalg af denormalisering
- Modul 3Relational data modeling - Implementering
Database server vs klient
4-part naming og punktum-notation
Krav til tabeller
Godt at vide om tabbeller
Godt at vide om datatyper
Eksempler på forskellig SQL syntax til at oprette tabeller
- Modul 4Dimensional data modeling
Forskellen til et relationelt design
- Dimensioner og Facts
- Data Warehouses
De fire trin i Dimensional Modeling
- Fra rapportbehov i forretningen til Dimensionel Model
- Best practices om Dimensionelle Modeller
- Løbende eksempler undervejs
Dimensions tabeller
- De tre typer nøgler: Natural/Business Key , Dimension Primary Key , Dimension Key
- Nullbarhed
- Hierarkier
- Denormalisering
- Outriggers
- Best practices med eksempler undervejs
Mange-til-Mange relationer
- Metoder til at håndtere mange-til-mange relationer
- Eksempler undervejs
Fact tabellerne
- Fact Keys
- Nullbarhed
- Uniqueness
Fact tabellerne - de tre hovedtyper
- Transactional fact table
- Periodic fact table
- Accumulating fact table
- Forholdet mellem Fact tabel typerne
- Løbende eksempler undervejs
ETL processen - Extract, Transform, Load
- Tankegangen bag at befolke den dimensionelle model
Slowly Changing Dimensions ( SCD )
- Registrere historiske ændringer af attributter
- Introduktion af SCD type 0 + 1 + 2 + 3 + 6
- Supernatural Keys
- De 4 Keys i SCD - hvordan og hvornår de er unikke
- Overvejelser som skal med i designet af ETL processen, for at indfri kravene til at implementere SCD
- Eksempler på SCD undervejs
Er du i tvivl?
Det ligger os meget på sinde, at du finder det kursusforløb, der skaber størst værdi for dig og din arbejdsplads. Tag fat i vores kursusrådgivere, de sidder klar til at hjælpe dig!