• Cursus Statistiek 2020-2021
  • Woord vooraf
  • Links
  • 1 Inleiding
    • 1.1 De Wetenschappelijke Methode
    • 1.2 Boutade: met statistiek kan je alles bewijzen
    • 1.3 Opzet van de cursus
    • 1.4 Case study: oksel microbiome
      • 1.4.1 Experimenteel design (proefopzet)
      • 1.4.2 Data exploratie en beschrijvende statistiek
      • 1.4.3 Statistische Besluitvorming
    • 1.5 Case Study II: Verschil in lengte tussen vrouwen en mannen
      • 1.5.1 Experiment
      • 1.5.2 Herhaal het experiment
      • 1.5.3 Herhaal het experiment opnieuw
      • 1.5.4 Samenvatting
      • 1.5.5 Controle van beslissingsfouten
      • 1.5.6 Conclusies
    • 1.6 Case study: Salk vaccin
      • 1.6.1 NFIP Study
      • 1.6.2 Confounding
      • 1.6.3 Salk Study
    • 1.7 Rol van Statistiek
  • 2 Belangrijke concepten & conventies
    • 2.1 Inleiding
    • 2.2 Variabelen
    • 2.3 Populatie
    • 2.4 Toevalsveranderlijken (of toevallige veranderlijken)
    • 2.5 Beschrijven van de populatie
      • 2.5.1 Intermezzo probabiliteitstheorie
      • 2.5.2 Standardisatie
      • 2.5.3 Achtergrond Normale verdeling
    • 2.6 Steekproef
    • 2.7 NHANES: Gender
    • 2.8 NHANES: Lengte
      • 2.8.1 Empirische distributie
      • 2.8.2 Normale benadering
      • 2.8.3 Referentie intervallen
      • 2.8.4 Conclusions
    • 2.9 Statistieken
    • 2.10 Conventie
    • 2.11 Code voor dit hoofdstuk
  • 3 Studiedesign
    • 3.1 Inleiding
    • 3.2 Steekproefdesigns
      • 3.2.1 Replicatie
    • 3.3 Experimentele studies
      • 3.3.1 De Salk Vaccin Veldstudie
      • 3.3.2 Gerandomiseerde gecontroleerde studies
      • 3.3.3 Parallelle designs
      • 3.3.4 Cross-over designs
      • 3.3.5 Factoriële designs
      • 3.3.6 Quasi-experimentele designs
    • 3.4 Observationele studies
    • 3.5 Prospectieve studies
    • 3.6 Retrospectieve studies
    • 3.7 Niet-gecontroleerde studies
      • 3.7.1 Pre-test/Post-test studies
      • 3.7.2 Cross-sectionele surveys
  • 4 Data exploratie en beschrijvende statistiek
    • 4.1 Inleiding
    • 4.2 Univariate beschrijving van de variabelen
    • 4.3 Samenvattingsmaten voor continue variabelen
      • 4.3.1 Maten voor de centrale ligging
      • 4.3.2 Spreidingsmaten
    • 4.4 De Normale benadering van gegevens
      • 4.4.1 QQ-plots
    • 4.5 Samenvattingsmaten voor categorische variabelen
      • 4.5.1 Prospectieve studies en lukrake steekproeven
      • 4.5.2 Retrospectieve studies
      • 4.5.3 Rates versus risico’s
    • 4.6 Associaties tussen twee variabelen
      • 4.6.1 Associatie tussen twee kwalitatieve variabelen
      • 4.6.2 Associatie tussen één kwalitatieve en één continue variabele
    • 4.7 Associatie tussen twee continue variabelen
      • 4.7.1 Covariantie en Correlatie
      • 4.7.2 Pearson Correlatie
      • 4.7.3 Verschillende groottes van correlatie
      • 4.7.4 Spearman correlatie
    • 4.8 Onvolledige gegevens
    • 4.9 Clips over de code in dit hoofdstuk
  • 5 Statistische besluitvorming
    • 5.1 Inleiding
    • 5.2 Captopril voorbeeld
      • 5.2.1 Proefopzet
      • 5.2.2 Data Exploratie & Beschrijvende Statistiek
      • 5.2.3 Schatten
    • 5.3 Puntschatters: het steekproefgemiddelde
      • 5.3.1 Overzicht
      • 5.3.2 Het steekproefgemiddelde is onvertekend
      • 5.3.3 Imprecisie/standard error
      • 5.3.4 Verdeling van het steekproefgemiddelde
    • 5.4 Intervalschatters
      • 5.4.1 Gekende variantie op de metingen
      • 5.4.2 Ongekende variantie op de metingen
      • 5.4.3 Interpretatie van betrouwbaarheidsintervallen
      • 5.4.4 Wat rapporteren?
    • 5.5 Principe van Hypothesetoetsen (via one sample t-test)
      • 5.5.1 Introductie d.m.v. captopril voorbeeld
      • 5.5.2 Hypotheses
      • 5.5.3 Test-statistiek
      • 5.5.4 De p-waarde
      • 5.5.5 Kritieke waarde
      • 5.5.6 Beslissingsfouten
      • 5.5.7 Conclusies Captopril voorbeeld.
      • 5.5.8 Eenzijdig of tweezijdig toetsen?
    • 5.6 Geclusterde metingen
      • 5.6.1 Captopril
    • 5.7 Two-sample t-test
      • 5.7.1 Notatie
      • 5.7.2 Oksel-voorbeeld
    • 5.8 Aannames
      • 5.8.1 Nagaan van de veronderstelling van Normaliteit
      • 5.8.2 Nagaan van homoscedasticiteit
    • 5.9 Wat rapporteren?
      • 5.9.1 Reden 1: Relatie toetsen en betrouwbaarheidsintervallen
      • 5.9.2 Reden 2: Statistische significantie versus wetenschappelijke relevantie
    • 5.10 Equivalentie-intervallen
  • 6 Enkelvoudige lineaire regressie
    • 6.1 Inleiding
      • 6.1.1 Borstkanker dataset
      • 6.1.2 Data exploratie
      • 6.1.3 Model
    • 6.2 Lineaire regressie
    • 6.3 Parameterschatting
    • 6.4 Statistische besluitvorming
    • 6.5 Nagaan van modelveronderstellingen
      • 6.5.1 Lineariteit
      • 6.5.2 Veronderstelling van homoscedasticiteit (gelijkheid van variantie)
      • 6.5.3 Veronderstelling van normaliteit
    • 6.6 Afwijkingen van Modelveronderstellingen
    • 6.7 Besluitvorming over gemiddelde uitkomst
    • 6.8 Predictie-intervallen
      • 6.8.1 NHANES voorbeeld
    • 6.9 Kwadratensommen en Anova-tabel
      • 6.9.1 Determinatie-coëfficiënt
      • 6.9.2 F-Testen in het enkelvoudig lineair regressiemodel
      • 6.9.3 Anova Tabel
    • 6.10 Dummy variabelen
  • 7 Variantie analyse
    • 7.1 Inleiding
      • 7.1.1 Prostacycline voorbeeld
      • 7.1.2 Model
    • 7.2 Variantie-analyse
      • 7.2.1 Model
      • 7.2.2 Kwadratensommen en Anova
      • 7.2.3 Anova-test
      • 7.2.4 Anova Tabel
    • 7.3 Post hoc analyse: Meervoudig Vergelijken van Gemiddelden
      • 7.3.1 Naïeve methode
      • 7.3.2 Family-wise error rate
    • 7.4 Conclusies: Prostacycline Voorbeeld
  • 8 Niet-parametrische statistiek
    • 8.1 Inleiding
    • 8.2 Vergelijken van twee groepen
      • 8.2.1 Cholestorol voorbeeld
      • 8.2.2 Permutatietesten
      • 8.2.3 Rank Testen
      • 8.2.4 Wilcoxon-Mann-Whitney Test
      • 8.2.5 Conclusie Cholestorol Voorbeeld
    • 8.3 Vergelijken van \(g\) Behandelingen
      • 8.3.1 DMH Voorbeeld
      • 8.3.2 Kruskal-Wallis Rank Test
  • 9 Categorische data analyse
    • 9.1 Inleiding
    • 9.2 Toetsen voor een proportie
      • 9.2.1 Asymptotisch Betrouwbaarheidsinterval
      • 9.2.2 Asymptotische Test
      • 9.2.3 Binomiale test
      • 9.2.4 Conclusie
    • 9.3 Toets voor associatie tussen 2 kwalitatieve variabelen
      • 9.3.1 Gepaarde gegevens
      • 9.3.2 Ongepaarde gegevens
      • 9.3.3 De Pearson Chi-kwadraat test voor ongepaarde gegevens
    • 9.4 Logistische regressie
      • 9.4.1 Categorische predictor
      • 9.4.2 Continue predictor
  • 10 Algemeen lineair model
    • 10.1 Inleiding
      • 10.1.1 Prostaatkanker dataset
    • 10.2 Het additieve meervoudig lineaire regressie model
      • 10.2.1 Statistisch model
    • 10.3 Besluitvorming in regressiemodellen
    • 10.4 Nagaan van modelveronderstellingen
      • 10.4.1 Lineariteit
      • 10.4.2 Homoscedasticiteit
      • 10.4.3 Normaliteit
    • 10.5 Het niet-additieve meervoudig lineair regressiemodel
      • 10.5.1 Interactie tussen continue variabele en factor variabele
      • 10.5.2 Interactie tussen twee continue variabelen
    • 10.6 ANOVA Tabel
      • 10.6.1 SSTot, SSR en SSE
      • 10.6.2 Extra Kwadratensommen
      • 10.6.3 Type I Kwadratensommen
      • 10.6.4 Type III Kwadratensommen
    • 10.7 Regressiediagnostieken
      • 10.7.1 Multicollineariteit
      • 10.7.2 Invloedrijke observaties
      • 10.7.3 Cook’s distance
    • 10.8 Constrasten
      • 10.8.1 NHANES voorbeeld
      • 10.8.2 Model
      • 10.8.3 Besluitvorming
  • 11 References
  • Published with bookdown

Cursus Statistiek 2020-2021

Links

  • De volledig interactieve versie van deze cursus is beschikbaar op https://dodona.ugent.be/nl/courses/374/

  • Een html versie van de cursus is beschikbaar op https://statomics.github.io/sbc20/ waardoor alle voorbeelden en code in deze cursus makkelijk in R kunnen worden gereproduceerd, wat handig kan zijn wanneer je zelf r-markdown scripts ontwikkeld.

  • Een pdf versie van de cursus is beschikbaar op https://statomics.github.io/sbc20/Statistiek_2020_2021.pdf

  • Voor een introductie tot R en Data Visualisatie raden we de eerste twee delen aan van het ebook https://rafalab.github.io/dsbook/ aan van prof. Raphael Irizarry. Volledig interactieve Dodona cursussen van deze twee delen vind je terug op Statistiek Introductie tot R: https://dodona.ugent.be/nl/courses/375/ en Statistiek: Data Exploration and Visualisation in R: https://dodona.ugent.be/nl/courses/376/.