• Cursus Statistiek 2019-2020
  • Woord vooraf
  • Links
  • 1 Inleiding
    • 1.1 De Wetenschappelijke Methode
    • 1.2 Voorbeeld: Horizon - Homeopathy the test
      • 1.2.1 Wetenschappelijke hypothese (fragmenten 1-2: 0’00’‘-6’00’‘& 7’40’‘-11’30’’)
      • 1.2.2 Onderzoek dient reproduceerbaar te zijn. Wat ging er fout? (Fragment: 14’50”-18’56”)
      • 1.2.3 The ultimate test - proefopzet (Fragment 31’00-39’30’’)
      • 1.2.4 The ultimate test - data analyse (Fragment 39’30-43’00’’)
      • 1.2.5 Mogelijke fouten
  • 2 Belangrijke concepten & conventies
    • 2.1 Variabelen
    • 2.2 Populatie
    • 2.3 Toevalsveranderlijken (of toevallige veranderlijken)
    • 2.4 Beschrijven van de populatie
    • 2.5 Steekproef
    • 2.6 Schatten van de verdeling in de populatie
    • 2.7 Statistieken
  • 3 Studiedesign
    • 3.1 Inleiding
    • 3.2 Steekproefdesigns
      • 3.2.1 Replicatie
    • 3.3 Experimentele studies
      • 3.3.1 De Salk Vaccin Veldstudie
      • 3.3.2 Gerandomiseerd gecontroleerde studies
      • 3.3.3 Parallelle designs
      • 3.3.4 Cross-over designs
      • 3.3.5 Factoriële designs
      • 3.3.6 Quasi-experimentele designs
    • 3.4 Observationele studies
    • 3.5 Prospectieve studies
    • 3.6 Retrospectieve studies
    • 3.7 Niet-gecontroleerde studies
      • 3.7.1 Pre-test/Post-test studies
      • 3.7.2 Cross-sectionele surveys
  • 4 Data exploratie en beschrijvende statistiek
    • 4.1 Inleiding
    • 4.2 Univariate beschrijving van de variabelen
    • 4.3 Samenvattingsmaten voor continue variabelen
      • 4.3.1 Maten voor de centrale ligging
      • 4.3.2 Spreidingsmaten
    • 4.4 De Normale benadering van gegevens
      • 4.4.1 Bepalen van oppervlaktes onder de Normale curve
      • 4.4.2 QQ-plots
    • 4.5 Samenvattingsmaten voor categorische variabelen
      • 4.5.1 Prospectieve studies en lukrake steekproeven
      • 4.5.2 Retrospectieve studies
      • 4.5.3 Rates versus risico’s
    • 4.6 Associaties tussen twee variabelen
      • 4.6.1 Associatie tussen twee kwalitatieve variabelen
      • 4.6.2 Associatie tussen één kwalitatieve en één continue variabele
      • 4.6.3 Associatie tussen twee continue variabelen
    • 4.7 Onvolledige gegevens
  • 5 Statistische besluitvorming
    • 5.1 Inleiding
    • 5.2 Captopril voorbeeld
      • 5.2.1 Proefopzet
      • 5.2.2 Data Exploratie & Beschrijvende Statistiek
      • 5.2.3 Schatten
    • 5.3 Puntschatters: het steekproefgemiddelde
      • 5.3.1 Het steekproefgemiddelde is onvertekend
      • 5.3.2 Imprecisie/standard error
      • 5.3.3 Verdeling van het steekproefgemiddelde
    • 5.4 Intervalschatters
      • 5.4.1 Gekende variantie op de metingen
      • 5.4.2 Ongekende variantie op de metingen
      • 5.4.3 Interpretatie van betrouwbaarheidsintervallen
      • 5.4.4 Wat rapporteren?
    • 5.5 Principe van Hypothesetoetsen (via one sample t-test)
      • 5.5.1 Hypotheses
      • 5.5.2 Test-statistiek
      • 5.5.3 De p-waarde
      • 5.5.4 Kritieke waarde
      • 5.5.5 Beslissingsfouten
      • 5.5.6 Conclusies Captopril voorbeeld.
      • 5.5.7 Eenzijdig of tweezijdig toetsen?
    • 5.6 Two-sample t-test
      • 5.6.1 Oksel-voorbeeld
    • 5.7 Aannames
      • 5.7.1 Nagaan van de veronderstelling van Normaliteit
      • 5.7.2 Nagaan van homoscedasticiteit
    • 5.8 Wat rapporteren?
      • 5.8.1 Reden 1: Relatie toetsen en betrouwbaarheidsintervallen
      • 5.8.2 Reden 2: Statistische significantie versus wetenschappelijke relevantie
    • 5.9 Equivalentie-intervallen
  • 6 Enkelvoudige lineaire regressie
    • 6.1 Inleiding
      • 6.1.1 Borstkanker dataset
      • 6.1.2 Data exploratie
      • 6.1.3 Model
    • 6.2 Lineaire regressie
    • 6.3 Parameterschatting
    • 6.4 Statistische besluitvorming
    • 6.5 Nagaan van modelveronderstellingen
      • 6.5.1 Lineariteit
      • 6.5.2 Veronderstelling van homoscedasticiteit (gelijkheid van variantie)
      • 6.5.3 Veronderstelling van normaliteit
    • 6.6 Afwijkingen van Modelveronderstellingen
    • 6.7 Besluitvorming over gemiddelde uitkomst
    • 6.8 Predictie-intervallen
    • 6.9 Kwadratensommen en Anova-tabel
      • 6.9.1 Determinatie-coëfficiënt
      • 6.9.2 F-Testen in het enkelvoudig lineair regressiemodel
      • 6.9.3 Anova Tabel
    • 6.10 Dummy variabelen
  • 7 Variantie analyse
    • 7.1 Inleiding
      • 7.1.1 Prostacycline voorbeeld
      • 7.1.2 Model
    • 7.2 Variantie-analyse
      • 7.2.1 Model
      • 7.2.2 Kwadratensommen en Anova
      • 7.2.3 Anova-test
      • 7.2.4 Anova Tabel
    • 7.3 Post hoc analyse: Meervoudig Vergelijken van Gemiddelden
      • 7.3.1 Naïeve methode
      • 7.3.2 Family-wise error rate
    • 7.4 Conclusies: Prostacycline Voorbeeld
  • 8 Niet-parametrische statistiek
    • 8.1 Inleiding
    • 8.2 Vergelijken van twee groepen
      • 8.2.1 Cholestorol voorbeeld
      • 8.2.2 Permutatietesten
      • 8.2.3 Rank Testen
      • 8.2.4 Wilcoxon-Mann-Whitney Test
      • 8.2.5 Conclusie Cholestorol Voorbeeld
    • 8.3 Vergelijken van \(g\) Behandelingen
      • 8.3.1 DMH Voorbeeld
      • 8.3.2 Permutatietest
      • 8.3.3 Kruskal-Wallis Rank Test
  • 9 Categorische data analyse
    • 9.1 Inleiding
    • 9.2 Toetsen voor een proportie
      • 9.2.1 Binomiale test
      • 9.2.2 Betrouwbaarheidsinterval op een proportie
      • 9.2.3 Conclusie
    • 9.3 Toets voor associatie tussen 2 kwalitatieve variabelen
      • 9.3.1 Gepaarde gegevens
      • 9.3.2 Ongepaarde gegevens
      • 9.3.3 De Pearson Chi-kwadraat test voor ongepaarde gegevens
    • 9.4 Logistische regressie
      • 9.4.1 Categorische predictor
      • 9.4.2 Continue predictor
  • 10 Algemeen lineair model
    • 10.1 Inleiding
      • 10.1.1 Prostaatkanker dataset
    • 10.2 Het additieve meervoudig lineaire regressie model
      • 10.2.1 Statistisch model
    • 10.3 Besluitvorming in regressiemodellen
    • 10.4 Nagaan van modelveronderstellingen
      • 10.4.1 Lineariteit
      • 10.4.2 Homoscedasticiteit
      • 10.4.3 Normaliteit
    • 10.5 Het niet-additieve meervoudig lineair regressiemodel
      • 10.5.1 Interactie tussen twee continue variabelen
      • 10.5.2 Interactie tussen continue variabele en factor variabele
    • 10.6 ANOVA Tabel
      • 10.6.1 SSTot, SSR en SSE
      • 10.6.2 Extra Kwadratensommen
      • 10.6.3 Type I Kwadratensommen
      • 10.6.4 Type III Kwadratensommen
    • 10.7 Regressiediagnostieken
      • 10.7.1 Multicollineariteit
      • 10.7.2 Invloedrijke observaties
      • 10.7.3 Cook’s distance
  • 11 Modelselectie
    • 11.1 Inleiding
    • 11.2 Modelselectie op basis van hypothesetesten
      • 11.2.1 Voorwaartse modelselectie
      • 11.2.2 Achterwaartse modelselectie
      • 11.2.3 Stapsgewijze modelselectie
      • 11.2.4 Opmerkingen
    • 11.3 Modelselectie voor predictie
      • 11.3.1 Inleiding
      • 11.3.2 Selectie-criterium
      • 11.3.3 Alternatieve criteria
  • Published with bookdown

Cursus Statistiek 2019-2020

Links

  • Een html versie van de cursus is beschikbaar op https://statomics.github.io/statistiekCursusNotas/ waardoor alle voorbeelden en code in deze cursus makkelijk in R kunnen worden gereproduceerd, wat handig kan zijn wanneer je zelf r-markdown scripts ontwikkeld.
  • Een pdf versie van de cursus is beschikbaar op https://statomics.github.io/statistiekCursusNotas/Statistiek_2019_2020.pdf
  • Alle datasets zijn beschikbaar op https://statomics.github.io/statistiekCursusNotas/data.zip