1 Introduction

Researchers assessed the effect of spinal nerve ligation (SNL) on the transcriptome of rats. In this experiment, transcriptome profiling occurred at two weeks and two months after treatment, for both the SNL group and a control group. Two biological replicates are used for every treatment - time combination. The researchers are interested in early and late effects and in genes for which the effect changes over time.

file="http://bowtie-bio.sourceforge.net/recount/ExpressionSets/hammer_eset.RData"
load(url(file))
hammer.eset

## ExpressionSet (storageMode: lockedEnvironment)
## assayData: 29516 features, 8 samples 
##   element names: exprs 
## protocolData: none
## phenoData
##   sampleNames: SRX020102 SRX020103 ... SRX020098-101 (8 total)
##   varLabels: sample.id num.tech.reps ... Time (5 total)
##   varMetadata: labelDescription
## featureData
##   featureNames: ENSRNOG00000000001 ENSRNOG00000000007 ...
##     ENSRNOG00000045521 (29516 total)
##   fvarLabels: gene
##   fvarMetadata: labelDescription
## experimentData: use 'experimentData(object)'
## Annotation:

pData(hammer.eset)

##                   sample.id num.tech.reps protocol         strain     Time
## SRX020102         SRX020102             1  control Sprague Dawley 2 months
## SRX020103         SRX020103             2  control Sprague Dawley 2 months
## SRX020104         SRX020104             1   L5 SNL Sprague Dawley 2 months
## SRX020105         SRX020105             2   L5 SNL Sprague Dawley  2months
## SRX020091-3     SRX020091-3             1  control Sprague Dawley  2 weeks
## SRX020088-90   SRX020088-90             2  control Sprague Dawley  2 weeks
## SRX020094-7     SRX020094-7             1   L5 SNL Sprague Dawley  2 weeks
## SRX020098-101 SRX020098-101             2   L5 SNL Sprague Dawley  2 weeks

library(tidyverse)
pData(hammer.eset)

##                   sample.id num.tech.reps protocol         strain     Time
## SRX020102         SRX020102             1  control Sprague Dawley 2 months
## SRX020103         SRX020103             2  control Sprague Dawley 2 months
## SRX020104         SRX020104             1   L5 SNL Sprague Dawley 2 months
## SRX020105         SRX020105             2   L5 SNL Sprague Dawley  2months
## SRX020091-3     SRX020091-3             1  control Sprague Dawley  2 weeks
## SRX020088-90   SRX020088-90             2  control Sprague Dawley  2 weeks
## SRX020094-7     SRX020094-7             1   L5 SNL Sprague Dawley  2 weeks
## SRX020098-101 SRX020098-101             2   L5 SNL Sprague Dawley  2 weeks

hammer.eset %>% exprs %>% head

##                    SRX020102 SRX020103 SRX020104 SRX020105 SRX020091-3
## ENSRNOG00000000001         2         4        18        24           7
## ENSRNOG00000000007         4         1         3         1           5
## ENSRNOG00000000008         0         1         4         2           0
## ENSRNOG00000000009         0         0         0         0           0
## ENSRNOG00000000010        19        10        19        13          50
## ENSRNOG00000000012         7         5         1         0          31
##                    SRX020088-90 SRX020094-7 SRX020098-101
## ENSRNOG00000000001            4          93            77
## ENSRNOG00000000007            4           9             4
## ENSRNOG00000000008            5           2             6
## ENSRNOG00000000009            0           0             0
## ENSRNOG00000000010           57          45            58
## ENSRNOG00000000012           26          12             9

#Design

pData(hammer.eset)$time<-factor(rep(c("2m","2w"),each=4),levels = c("2w","2m"))
levels(pData(hammer.eset)$protocol)<-c("c","snl")

#Setup DESEQ2 object

ds_matrix <- DESeqDataSetFromMatrix(countData = exprs(hammer.eset),
colData = pData(hammer.eset),
design = ~ time*protocol)

2 Data exploration

With DESeq2 we can first do a variance stabilizing transformation before we make a principal component plot.

vsd <- DESeq2::vst(ds_matrix)
plotPCA(vsd, intgroup = c("protocol","time"))

3 DE-analysis

As we have already specified an experimental design when we created the DESeqDataSet, we can run the differential expression pipeline on the raw counts with a single call to the function DESeq. We can also plot the estimated dispersions.

ds_matrix <- DESeq(ds_matrix)

## estimating size factors

## estimating dispersions

## gene-wise dispersion estimates

## mean-dispersion relationship

## final dispersion estimates

## fitting model and testing

plotDispEsts(ds_matrix)

3.1 Tests

The researchers are interested in an effect of the treatment at the early time point, the late timepoint and the treatment \(\times\) time interaction.

The following model is used at the gene-level to model the read count for gene \(g\) of mouse \(i\).

\[ \left\{ \begin{array}{lcl} y_{ig} &\sim& NB(\mu_{ig},\phi_g)\\ E[y_{ig}\vert \mathbf{x}_{ig}]&=&\mu_{ig}\\ log(\mu_{ig})&=&\eta_{ig}\\ \eta_{ig}&=&\beta_0 + \beta_{snl} x_{snl,i} + \beta_{t2m}x_{t2m,i} + \beta_\text{snl,t2m} x_{snl,i}x_{t2m,i} + \log N_i \end{array}\right. \]

with \(x_{snl,i}\) a dummy variable that is 1 if a mouse had the spinal nerve ligation and is 0 otherwise, \(x_{t2m,i}\) a dummy variable that 1 one if the mouse was sacrificed after 2 months and 0 otherwise and \(\log{N}_i\) a normalisation offset to correct for sequencing depth. Note, that \(\beta_{snl}\) is the main effect for spinal nerve ligation, and corresponds to the average log fold change between treated and control mice after two weeks. The interaction \(\beta_\text{snl,t2m}\) can be interpreted as the average change in log FC between treated and control mouse at the late and early timepoint. The researchers are also interested in a third contrast: the effect of the treatment at the late time point.

\[ \log \text{FC}^\text{2 months}_\text{snl-c}= \beta_{snl}+\beta_{snl,t2m}\]

Below we implement the contrasts related to each of these research questions. Is the gene DE at the early, the late timepoint and does the average log FC due to the treatment change over time?

L <- matrix(0,nrow=3,ncol=length(resultsNames(ds_matrix)))
colnames(L)<-resultsNames(ds_matrix)
rownames(L)<-c("early","late","interaction")
L[1,3]<-1
L[2,3:4]<-1
L[3,4]<-1
L

##             Intercept time_2m_vs_2w protocol_snl_vs_c time2m.protocolsnl
## early               0             0                 1                  0
## late                0             0                 1                  1
## interaction         0             0                 0                  1

results<-apply(L,1,function(fit,contrast) results(fit, contrast=contrast),fit=ds_matrix)
head(results$early)

## log2 fold change (MLE): 0,0,+1,0 
## Wald test p-value: 0,0,+1,0 
## DataFrame with 6 rows and 6 columns
##                     baseMean log2FoldChange     lfcSE       stat      pvalue
##                    <numeric>      <numeric> <numeric>  <numeric>   <numeric>
## ENSRNOG00000000001  21.30379      3.4443323  0.628648  5.4789518 4.27853e-08
## ENSRNOG00000000007   3.54819      0.0225496  1.210865  0.0186227 9.85142e-01
## ENSRNOG00000000008   2.51440      0.1769457  1.594707  0.1109582 9.11650e-01
## ENSRNOG00000000009   0.00000             NA        NA         NA          NA
## ENSRNOG00000000010  28.34019     -0.5587330  0.433262 -1.2895959 1.97191e-01
## ENSRNOG00000000012   8.63308     -1.9463854  0.754139 -2.5809382 9.85322e-03
##                           padj
##                      <numeric>
## ENSRNOG00000000001 3.87848e-07
## ENSRNOG00000000007 9.91760e-01
## ENSRNOG00000000008 9.50078e-01
## ENSRNOG00000000009          NA
## ENSRNOG00000000010 3.42469e-01
## ENSRNOG00000000012 2.92929e-02

The first column, baseMean, is a just the average of the normalized count values, dividing by size factors, taken over all samples in the DESeqDataSet. The remaining four columns refer to a specific contrast.

The column log2FoldChange is the effect size estimate. This value is reported on a logarithmic scale to base 2: for example, a log2 fold change of 1.5 means that the gene???s expression is increased by a multiplicative factor of \(2^{1.5} \approx 2.82\).

Of course, this estimate has an uncertainty associated with it, which is available in the column lfcSE, the standard error estimate for the log2 fold change estimate. Results of a hypothesis test for the contrast is also provided and is reported as a p value, and it is found in the column pvalue.

DESeq2 uses the Benjamini-Hochberg (BH) False Discovery Rate adjustment (Benjamini and Hochberg 1995) as implemented in the base R p.adjust function to correct for multiple testing. These values, called the BH-adjusted p values, are given in the column padj of the res object from DESeq2.

Sometimes a subset of the p values in results will be NA (“not available”"). This is DESeq2’ss way of reporting that all counts for this gene were zero, and hence no test was applied. In addition, p values can be assigned NA if the gene was excluded from analysis because it contained an extreme count outlier. For more information, see the outlier detection section of the DESeq2 vignette.

Note, that if you want to test one specific parameter you can also provide the name of the parameter. E.g. “resultsNames(ds_matrix)[3]” is protocol_snl_vs_c the main effect for SNL vs C i.e. the log2FC at the early timepoint. By default the results function assesses the null hypothesis that parameter associated with the last column of the design matrix equals 0 using a Wald test. Here, this is the treatment x time interaction.

head(results(ds_matrix))

## log2 fold change (MLE): time2m.protocolsnl 
## Wald test p-value: time2m.protocolsnl 
## DataFrame with 6 rows and 6 columns
##                     baseMean log2FoldChange     lfcSE      stat    pvalue
##                    <numeric>      <numeric> <numeric> <numeric> <numeric>
## ENSRNOG00000000001  21.30379      -0.757198  0.991742 -0.763503  0.445164
## ENSRNOG00000000007   3.54819      -0.412976  1.866957 -0.221203  0.824934
## ENSRNOG00000000008   2.51440       2.283639  2.597285  0.879241  0.379271
## ENSRNOG00000000009   0.00000             NA        NA        NA        NA
## ENSRNOG00000000010  28.34019       0.608656  0.687997  0.884678  0.376330
## ENSRNOG00000000012   8.63308      -1.739701  1.799136 -0.966965  0.333562
##                         padj
##                    <numeric>
## ENSRNOG00000000001        NA
## ENSRNOG00000000007        NA
## ENSRNOG00000000008        NA
## ENSRNOG00000000009        NA
## ENSRNOG00000000010        NA
## ENSRNOG00000000012        NA

head(results(ds_matrix,name=resultsNames(ds_matrix)[3]))

## log2 fold change (MLE): protocol snl vs c 
## Wald test p-value: protocol snl vs c 
## DataFrame with 6 rows and 6 columns
##                     baseMean log2FoldChange     lfcSE       stat      pvalue
##                    <numeric>      <numeric> <numeric>  <numeric>   <numeric>
## ENSRNOG00000000001  21.30379      3.4443323  0.628648  5.4789518 4.27853e-08
## ENSRNOG00000000007   3.54819      0.0225496  1.210865  0.0186227 9.85142e-01
## ENSRNOG00000000008   2.51440      0.1769457  1.594707  0.1109582 9.11650e-01
## ENSRNOG00000000009   0.00000             NA        NA         NA          NA
## ENSRNOG00000000010  28.34019     -0.5587330  0.433262 -1.2895959 1.97191e-01
## ENSRNOG00000000012   8.63308     -1.9463854  0.754139 -2.5809382 9.85322e-03
##                           padj
##                      <numeric>
## ENSRNOG00000000001 3.87848e-07
## ENSRNOG00000000007 9.91760e-01
## ENSRNOG00000000008 9.50078e-01
## ENSRNOG00000000009          NA
## ENSRNOG00000000010 3.42469e-01
## ENSRNOG00000000012 2.92929e-02

3.2 Evaluate Results

3.2.1 Results early

summary(results$early)

## 
## out of 18635 with nonzero total read count
## adjusted p-value < 0.1
## LFC > 0 (up)       : 3224, 17%
## LFC < 0 (down)     : 3271, 18%
## outliers [1]       : 0, 0%
## low counts [2]     : 3152, 17%
## (mean count < 1)
## [1] see 'cooksCutoff' argument of ?results
## [2] see 'independentFiltering' argument of ?results

hist(results$early$pvalue,xlab="p-value")

volcanoEarly<- ggplot(results$early %>% as.data.frame,aes(x=log2FoldChange,y=-log10(pvalue),color=padj<0.05)) + geom_point() + scale_color_manual(values=c("black","red")) + ggtitle(paste("contrast","early"))
print(volcanoEarly)

## Warning: Removed 14033 rows containing missing values (geom_point).

plotMA(results$early)

mat <- assay(vsd)[head(order(results$early$padj), 30), ]
pheatmap(mat)

3.2.2 Results late

summary(results$late)

## 
## out of 18635 with nonzero total read count
## adjusted p-value < 0.1
## LFC > 0 (up)       : 3110, 17%
## LFC < 0 (down)     : 3282, 18%
## outliers [1]       : 0, 0%
## low counts [2]     : 3502, 19%
## (mean count < 2)
## [1] see 'cooksCutoff' argument of ?results
## [2] see 'independentFiltering' argument of ?results

hist(results$late$pvalue,xlab="p-value")

volcanoLate<- ggplot(results$late %>% as.data.frame,aes(x=log2FoldChange,y=-log10(pvalue),color=padj<0.05)) + geom_point() + scale_color_manual(values=c("black","red")) + ggtitle(paste("contrast","late"))
print(volcanoLate)

## Warning: Removed 14383 rows containing missing values (geom_point).

plotMA(results$late)

mat <- assay(vsd)[head(order(results$late$padj), 30), ]
pheatmap(mat)

3.2.3 Results interaction

summary(results$interaction)

## 
## out of 18635 with nonzero total read count
## adjusted p-value < 0.1
## LFC > 0 (up)       : 11, 0.059%
## LFC < 0 (down)     : 16, 0.086%
## outliers [1]       : 0, 0%
## low counts [2]     : 12606, 68%
## (mean count < 263)
## [1] see 'cooksCutoff' argument of ?results
## [2] see 'independentFiltering' argument of ?results

hist(results$interaction$pvalue,xlab="p-value")

volcanoInter<- ggplot(results$interaction %>% as.data.frame,aes(x=log2FoldChange,y=-log10(pvalue),color=padj<0.05)) + geom_point() + scale_color_manual(values=c("black","red")) + ggtitle(paste("contrast","interaction"))
print(volcanoInter)

## Warning: Removed 23487 rows containing missing values (geom_point).

plotMA(results$interaction)

mat <- assay(vsd)[head(order(results$interaction$padj), sum(results$interaction$padj<0.05,na.rm=TRUE)), ]
pheatmap(mat)

3.2.4 Plot count data of individual genes

DESeq2 allows a straightforward way of plotting the raw or normalised counts for a gene.

plotCounts(ds_matrix, gene = "ENSRNOG00000002419", intgroup = c("protocol","time"),
normalized = TRUE, transform = FALSE)

3.3 Remarks

There are very many DE genes according to the SNL treatment at the early and late timepoint.
Issues with the design?
There are very few interactions significant. Can you explain this?

4 Assess p-values

If you use Wald tests in DESeq2 you already have z statistics.

tibble(z = results$early$stat) %>%
  ggplot(aes(x=z)) +
  geom_histogram(aes(y = ..density..), color = "black") +
  stat_function(fun = dnorm,
      args = list(
    mean = 0,
    sd=1)
  )

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

## Warning: Removed 10881 rows containing non-finite values (stat_bin).

LS0tCnRpdGxlOiAiSGFtbWVyIERhdGFzZXQgd2l0aCBERVNlcTIiCmF1dGhvcjogIkxpZXZlbiBDbGVtZW50IgpkYXRlOiAic3RhdE9taWNzLCBHaGVudCBVbml2ZXJzaXR5IChodHRwczovL3N0YXRvbWljcy5naXRodWIuaW8pIgpvdXRwdXQ6CiAgICBodG1sX2RvY3VtZW50OgogICAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCiAgICAgIHRoZW1lOiBjb3NtbwogICAgICB0b2M6IHRydWUKICAgICAgdG9jX2Zsb2F0OiB0cnVlCiAgICAgIGhpZ2hsaWdodDogdGFuZ28KICAgICAgbnVtYmVyX3NlY3Rpb25zOiB0cnVlCi0tLQoKCmBgYHtyLGVjaG89RkFMU0V9CmxpYnJhcnkoREVTZXEyKQpsaWJyYXJ5KGdwbG90cykKbGlicmFyeShwaGVhdG1hcCkKbGlicmFyeShSQ29sb3JCcmV3ZXIpCmBgYAoKIyBJbnRyb2R1Y3Rpb24KClJlc2VhcmNoZXJzIGFzc2Vzc2VkIHRoZSBlZmZlY3Qgb2Ygc3BpbmFsIG5lcnZlIGxpZ2F0aW9uIChTTkwpIG9uIHRoZSB0cmFuc2NyaXB0b21lIG9mIHJhdHMuIEluIHRoaXMgZXhwZXJpbWVudCwgdHJhbnNjcmlwdG9tZSBwcm9maWxpbmcgb2NjdXJyZWQgYXQgdHdvIHdlZWtzIGFuZCB0d28gbW9udGhzIGFmdGVyIHRyZWF0bWVudCwgZm9yIGJvdGggdGhlIFNOTCBncm91cCBhbmQgYSBjb250cm9sIGdyb3VwLiBUd28gYmlvbG9naWNhbCByZXBsaWNhdGVzIGFyZSB1c2VkIGZvciBldmVyeSB0cmVhdG1lbnQgLSB0aW1lIGNvbWJpbmF0aW9uLiBUaGUgcmVzZWFyY2hlcnMgYXJlIGludGVyZXN0ZWQgaW4gZWFybHkgYW5kIGxhdGUgZWZmZWN0cyBhbmQgaW4gZ2VuZXMgZm9yIHdoaWNoIHRoZSBlZmZlY3QgY2hhbmdlcyBvdmVyIHRpbWUuCgpgYGB7cn0KZmlsZT0iaHR0cDovL2Jvd3RpZS1iaW8uc291cmNlZm9yZ2UubmV0L3JlY291bnQvRXhwcmVzc2lvblNldHMvaGFtbWVyX2VzZXQuUkRhdGEiCmxvYWQodXJsKGZpbGUpKQpoYW1tZXIuZXNldApgYGAKCmBgYHtyfQpwRGF0YShoYW1tZXIuZXNldCkKYGBgYAoKYGBge3J9CmxpYnJhcnkodGlkeXZlcnNlKQpwRGF0YShoYW1tZXIuZXNldCkKaGFtbWVyLmVzZXQgJT4lIGV4cHJzICU+JSBoZWFkCmBgYAoKI0Rlc2lnbgoKYGBge3J9CnBEYXRhKGhhbW1lci5lc2V0KSR0aW1lPC1mYWN0b3IocmVwKGMoIjJtIiwiMnciKSxlYWNoPTQpLGxldmVscyA9IGMoIjJ3IiwiMm0iKSkKbGV2ZWxzKHBEYXRhKGhhbW1lci5lc2V0KSRwcm90b2NvbCk8LWMoImMiLCJzbmwiKQpgYGAKCiNTZXR1cCBERVNFUTIgb2JqZWN0CmBgYHtyfQpkc19tYXRyaXggPC0gREVTZXFEYXRhU2V0RnJvbU1hdHJpeChjb3VudERhdGEgPSBleHBycyhoYW1tZXIuZXNldCksCmNvbERhdGEgPSBwRGF0YShoYW1tZXIuZXNldCksCmRlc2lnbiA9IH4gdGltZSpwcm90b2NvbCkKYGBgCgojIERhdGEgZXhwbG9yYXRpb24KCldpdGggREVTZXEyIHdlIGNhbiBmaXJzdCBkbyBhIHZhcmlhbmNlIHN0YWJpbGl6aW5nIHRyYW5zZm9ybWF0aW9uIGJlZm9yZSB3ZSBtYWtlIGEgcHJpbmNpcGFsIGNvbXBvbmVudCBwbG90LgoKYGBge3J9CnZzZCA8LSBERVNlcTI6OnZzdChkc19tYXRyaXgpCnBsb3RQQ0EodnNkLCBpbnRncm91cCA9IGMoInByb3RvY29sIiwidGltZSIpKQpgYGAKCiMgREUtYW5hbHlzaXMKCkFzIHdlIGhhdmUgYWxyZWFkeSBzcGVjaWZpZWQgYW4gZXhwZXJpbWVudGFsIGRlc2lnbiB3aGVuIHdlIGNyZWF0ZWQgdGhlIERFU2VxRGF0YVNldCwgd2UgY2FuIHJ1biB0aGUgZGlmZmVyZW50aWFsIGV4cHJlc3Npb24gcGlwZWxpbmUgb24gdGhlIHJhdyBjb3VudHMgd2l0aCBhIHNpbmdsZSBjYWxsIHRvIHRoZSBmdW5jdGlvbiBERVNlcS4gV2UgY2FuIGFsc28gcGxvdCB0aGUgZXN0aW1hdGVkIGRpc3BlcnNpb25zLgoKYGBge3J9CmRzX21hdHJpeCA8LSBERVNlcShkc19tYXRyaXgpCnBsb3REaXNwRXN0cyhkc19tYXRyaXgpCmBgYAoKIyMgVGVzdHMKClRoZSByZXNlYXJjaGVycyBhcmUgaW50ZXJlc3RlZCBpbiBhbiBlZmZlY3Qgb2YgdGhlIHRyZWF0bWVudCBhdCB0aGUgZWFybHkgdGltZSBwb2ludCwgdGhlIGxhdGUgdGltZXBvaW50IGFuZCB0aGUgdHJlYXRtZW50ICRcdGltZXMkIHRpbWUgaW50ZXJhY3Rpb24uCgpUaGUgZm9sbG93aW5nIG1vZGVsIGlzIHVzZWQgYXQgdGhlIGdlbmUtbGV2ZWwgdG8gbW9kZWwgdGhlIHJlYWQgY291bnQgZm9yIGdlbmUgJGckIG9mIG1vdXNlICRpJC4KCiQkClxsZWZ0XHsKXGJlZ2lue2FycmF5fXtsY2x9Cnlfe2lnfSAmXHNpbSYgTkIoXG11X3tpZ30sXHBoaV9nKVxcCkVbeV97aWd9XHZlcnQgXG1hdGhiZnt4fV97aWd9XSY9JlxtdV97aWd9XFwKbG9nKFxtdV97aWd9KSY9JlxldGFfe2lnfVxcClxldGFfe2lnfSY9JlxiZXRhXzAgKyBcYmV0YV97c25sfSB4X3tzbmwsaX0gKyBcYmV0YV97dDJtfXhfe3QybSxpfSArIFxiZXRhX1x0ZXh0e3NubCx0Mm19IHhfe3NubCxpfXhfe3QybSxpfSArIFxsb2cgTl9pClxlbmR7YXJyYXl9XHJpZ2h0LgokJAoKd2l0aCAkeF97c25sLGl9JCBhIGR1bW15IHZhcmlhYmxlIHRoYXQgaXMgMSBpZiBhIG1vdXNlIGhhZCB0aGUgc3BpbmFsIG5lcnZlIGxpZ2F0aW9uIGFuZCBpcyAwIG90aGVyd2lzZSwgJHhfe3QybSxpfSQgYSBkdW1teSB2YXJpYWJsZSB0aGF0IDEgb25lIGlmIHRoZSBtb3VzZSB3YXMgc2FjcmlmaWNlZCBhZnRlciAyIG1vbnRocyBhbmQgMCBvdGhlcndpc2UgYW5kICRcbG9ne059X2kkIGEgbm9ybWFsaXNhdGlvbiBvZmZzZXQgdG8gY29ycmVjdCBmb3Igc2VxdWVuY2luZyBkZXB0aC4gTm90ZSwgdGhhdCAkXGJldGFfe3NubH0kIGlzIHRoZSBtYWluIGVmZmVjdCBmb3Igc3BpbmFsIG5lcnZlIGxpZ2F0aW9uLCBhbmQgY29ycmVzcG9uZHMgdG8gdGhlIGF2ZXJhZ2UgbG9nIGZvbGQgY2hhbmdlIGJldHdlZW4gdHJlYXRlZCBhbmQgY29udHJvbCBtaWNlIGFmdGVyIHR3byB3ZWVrcy4gVGhlIGludGVyYWN0aW9uICAkXGJldGFfXHRleHR7c25sLHQybX0kIGNhbiBiZSBpbnRlcnByZXRlZCBhcyB0aGUgYXZlcmFnZSBjaGFuZ2UgaW4gbG9nIEZDIGJldHdlZW4gdHJlYXRlZCBhbmQgY29udHJvbCBtb3VzZSBhdCB0aGUgbGF0ZSBhbmQgZWFybHkgdGltZXBvaW50LiBUaGUgcmVzZWFyY2hlcnMgYXJlIGFsc28gaW50ZXJlc3RlZCBpbiBhIHRoaXJkIGNvbnRyYXN0OiB0aGUgZWZmZWN0IG9mIHRoZSB0cmVhdG1lbnQgYXQgdGhlIGxhdGUgdGltZSBwb2ludC4KCiQkIFxsb2cgXHRleHR7RkN9Xlx0ZXh0ezIgbW9udGhzfV9cdGV4dHtzbmwtY309IFxiZXRhX3tzbmx9K1xiZXRhX3tzbmwsdDJtfSQkCgpCZWxvdyB3ZSBpbXBsZW1lbnQgdGhlIGNvbnRyYXN0cyByZWxhdGVkIHRvIGVhY2ggb2YgdGhlc2UgcmVzZWFyY2ggcXVlc3Rpb25zLiBJcyB0aGUgZ2VuZSBERSBhdCB0aGUgZWFybHksIHRoZSBsYXRlIHRpbWVwb2ludCBhbmQgZG9lcyB0aGUgYXZlcmFnZSBsb2cgRkMgZHVlIHRvIHRoZSB0cmVhdG1lbnQgY2hhbmdlIG92ZXIgdGltZT8KCgpgYGB7cn0KTCA8LSBtYXRyaXgoMCxucm93PTMsbmNvbD1sZW5ndGgocmVzdWx0c05hbWVzKGRzX21hdHJpeCkpKQpjb2xuYW1lcyhMKTwtcmVzdWx0c05hbWVzKGRzX21hdHJpeCkKcm93bmFtZXMoTCk8LWMoImVhcmx5IiwibGF0ZSIsImludGVyYWN0aW9uIikKTFsxLDNdPC0xCkxbMiwzOjRdPC0xCkxbMyw0XTwtMQpMCgpyZXN1bHRzPC1hcHBseShMLDEsZnVuY3Rpb24oZml0LGNvbnRyYXN0KSByZXN1bHRzKGZpdCwgY29udHJhc3Q9Y29udHJhc3QpLGZpdD1kc19tYXRyaXgpCmhlYWQocmVzdWx0cyRlYXJseSkKYGBgCgpUaGUgZmlyc3QgY29sdW1uLCBiYXNlTWVhbiwgaXMgYSBqdXN0IHRoZSBhdmVyYWdlIG9mIHRoZSBub3JtYWxpemVkIGNvdW50IHZhbHVlcywgZGl2aWRpbmcgYnkgc2l6ZSBmYWN0b3JzLCB0YWtlbiBvdmVyIGFsbCBzYW1wbGVzIGluIHRoZSBERVNlcURhdGFTZXQuIFRoZSByZW1haW5pbmcgZm91ciBjb2x1bW5zIHJlZmVyIHRvIGEgc3BlY2lmaWMgY29udHJhc3QuCgpUaGUgY29sdW1uIGxvZzJGb2xkQ2hhbmdlIGlzIHRoZSBlZmZlY3Qgc2l6ZSBlc3RpbWF0ZS4gVGhpcyB2YWx1ZSBpcyByZXBvcnRlZCBvbiBhIGxvZ2FyaXRobWljIHNjYWxlIHRvIGJhc2UgMjogZm9yIGV4YW1wbGUsIGEgbG9nMiBmb2xkIGNoYW5nZSBvZiAxLjUgbWVhbnMgdGhhdCB0aGUgZ2VuZT8/P3MgZXhwcmVzc2lvbiBpcyBpbmNyZWFzZWQgYnkgYSBtdWx0aXBsaWNhdGl2ZSBmYWN0b3Igb2YgXCgyXnsxLjV9IFxhcHByb3ggMi44MlwpLgoKT2YgY291cnNlLCB0aGlzIGVzdGltYXRlIGhhcyBhbiB1bmNlcnRhaW50eSBhc3NvY2lhdGVkIHdpdGggaXQsIHdoaWNoIGlzIGF2YWlsYWJsZSBpbiB0aGUgY29sdW1uIGxmY1NFLCB0aGUgc3RhbmRhcmQgZXJyb3IgZXN0aW1hdGUgZm9yIHRoZSBsb2cyIGZvbGQgY2hhbmdlIGVzdGltYXRlLiBSZXN1bHRzIG9mIGEgaHlwb3RoZXNpcyB0ZXN0IGZvciB0aGUgY29udHJhc3QgaXMgYWxzbyBwcm92aWRlZCBhbmQgaXMgcmVwb3J0ZWQgYXMgYSBwIHZhbHVlLCBhbmQgaXQgaXMgZm91bmQgaW4gdGhlIGNvbHVtbiBwdmFsdWUuCgpERVNlcTIgdXNlcyB0aGUgQmVuamFtaW5pLUhvY2hiZXJnIChCSCkgRmFsc2UgRGlzY292ZXJ5IFJhdGUgYWRqdXN0bWVudCAoQmVuamFtaW5pIGFuZCBIb2NoYmVyZyAxOTk1KSBhcyBpbXBsZW1lbnRlZCBpbiB0aGUgYmFzZSBSIHAuYWRqdXN0IGZ1bmN0aW9uIHRvIGNvcnJlY3QgZm9yIG11bHRpcGxlIHRlc3RpbmcuIFRoZXNlIHZhbHVlcywgY2FsbGVkIHRoZSBCSC1hZGp1c3RlZCBwIHZhbHVlcywgYXJlIGdpdmVuIGluIHRoZSBjb2x1bW4gcGFkaiBvZiB0aGUgcmVzIG9iamVjdCBmcm9tIERFU2VxMi4KClNvbWV0aW1lcyBhIHN1YnNldCBvZiB0aGUgcCB2YWx1ZXMgaW4gcmVzdWx0cyB3aWxsIGJlIE5BICgibm90IGF2YWlsYWJsZSIiKS4gVGhpcyBpcyBERVNlcTInc3Mgd2F5IG9mIHJlcG9ydGluZyB0aGF0IGFsbCBjb3VudHMgZm9yIHRoaXMgZ2VuZSB3ZXJlIHplcm8sIGFuZCBoZW5jZSBubyB0ZXN0IHdhcyBhcHBsaWVkLiBJbiBhZGRpdGlvbiwgcCB2YWx1ZXMgY2FuIGJlIGFzc2lnbmVkIE5BIGlmIHRoZSBnZW5lIHdhcyBleGNsdWRlZCBmcm9tIGFuYWx5c2lzIGJlY2F1c2UgaXQgY29udGFpbmVkIGFuIGV4dHJlbWUgY291bnQgb3V0bGllci4gRm9yIG1vcmUgaW5mb3JtYXRpb24sIHNlZSB0aGUgb3V0bGllciBkZXRlY3Rpb24gc2VjdGlvbiBvZiB0aGUgREVTZXEyIHZpZ25ldHRlLgoKTm90ZSwgdGhhdCBpZiB5b3Ugd2FudCB0byB0ZXN0IG9uZSBzcGVjaWZpYyBwYXJhbWV0ZXIgeW91IGNhbiBhbHNvIHByb3ZpZGUgdGhlIG5hbWUgb2YgdGhlIHBhcmFtZXRlci4gRS5nLiAicmVzdWx0c05hbWVzKGRzX21hdHJpeClbM10iIGlzIGByIHJlc3VsdHNOYW1lcyhkc19tYXRyaXgpWzNdYCB0aGUgbWFpbiBlZmZlY3QgZm9yIFNOTCB2cyBDIGkuZS4gdGhlIGxvZzJGQyBhdCB0aGUgZWFybHkgdGltZXBvaW50LgpCeSBkZWZhdWx0IHRoZSByZXN1bHRzIGZ1bmN0aW9uIGFzc2Vzc2VzIHRoZSBudWxsIGh5cG90aGVzaXMgdGhhdCBwYXJhbWV0ZXIgYXNzb2NpYXRlZCB3aXRoIHRoZSBsYXN0IGNvbHVtbiBvZiB0aGUgZGVzaWduIG1hdHJpeCBlcXVhbHMgMCB1c2luZyBhIFdhbGQgdGVzdC4KSGVyZSwgdGhpcyBpcyB0aGUgdHJlYXRtZW50IHggdGltZSBpbnRlcmFjdGlvbi4KCmBgYHtyfQpoZWFkKHJlc3VsdHMoZHNfbWF0cml4KSkKaGVhZChyZXN1bHRzKGRzX21hdHJpeCxuYW1lPXJlc3VsdHNOYW1lcyhkc19tYXRyaXgpWzNdKSkKYGBgCgoKCiMjIEV2YWx1YXRlIFJlc3VsdHMKIyMjIFJlc3VsdHMgZWFybHkKYGBge3J9CnN1bW1hcnkocmVzdWx0cyRlYXJseSkKaGlzdChyZXN1bHRzJGVhcmx5JHB2YWx1ZSx4bGFiPSJwLXZhbHVlIikKCnZvbGNhbm9FYXJseTwtIGdncGxvdChyZXN1bHRzJGVhcmx5ICU+JSBhcy5kYXRhLmZyYW1lLGFlcyh4PWxvZzJGb2xkQ2hhbmdlLHk9LWxvZzEwKHB2YWx1ZSksY29sb3I9cGFkajwwLjA1KSkgKyBnZW9tX3BvaW50KCkgKyBzY2FsZV9jb2xvcl9tYW51YWwodmFsdWVzPWMoImJsYWNrIiwicmVkIikpICsgZ2d0aXRsZShwYXN0ZSgiY29udHJhc3QiLCJlYXJseSIpKQpwcmludCh2b2xjYW5vRWFybHkpCgpwbG90TUEocmVzdWx0cyRlYXJseSkKbWF0IDwtIGFzc2F5KHZzZClbaGVhZChvcmRlcihyZXN1bHRzJGVhcmx5JHBhZGopLCAzMCksIF0KcGhlYXRtYXAobWF0KQpgYGAKCgojIyMgUmVzdWx0cyBsYXRlCmBgYHtyfQpzdW1tYXJ5KHJlc3VsdHMkbGF0ZSkKaGlzdChyZXN1bHRzJGxhdGUkcHZhbHVlLHhsYWI9InAtdmFsdWUiKQoKdm9sY2Fub0xhdGU8LSBnZ3Bsb3QocmVzdWx0cyRsYXRlICU+JSBhcy5kYXRhLmZyYW1lLGFlcyh4PWxvZzJGb2xkQ2hhbmdlLHk9LWxvZzEwKHB2YWx1ZSksY29sb3I9cGFkajwwLjA1KSkgKyBnZW9tX3BvaW50KCkgKyBzY2FsZV9jb2xvcl9tYW51YWwodmFsdWVzPWMoImJsYWNrIiwicmVkIikpICsgZ2d0aXRsZShwYXN0ZSgiY29udHJhc3QiLCJsYXRlIikpCnByaW50KHZvbGNhbm9MYXRlKQoKcGxvdE1BKHJlc3VsdHMkbGF0ZSkKbWF0IDwtIGFzc2F5KHZzZClbaGVhZChvcmRlcihyZXN1bHRzJGxhdGUkcGFkaiksIDMwKSwgXQpwaGVhdG1hcChtYXQpCmBgYAoKIyMjIFJlc3VsdHMgaW50ZXJhY3Rpb24KCmBgYHtyfQpzdW1tYXJ5KHJlc3VsdHMkaW50ZXJhY3Rpb24pCmhpc3QocmVzdWx0cyRpbnRlcmFjdGlvbiRwdmFsdWUseGxhYj0icC12YWx1ZSIpCgp2b2xjYW5vSW50ZXI8LSBnZ3Bsb3QocmVzdWx0cyRpbnRlcmFjdGlvbiAlPiUgYXMuZGF0YS5mcmFtZSxhZXMoeD1sb2cyRm9sZENoYW5nZSx5PS1sb2cxMChwdmFsdWUpLGNvbG9yPXBhZGo8MC4wNSkpICsgZ2VvbV9wb2ludCgpICsgc2NhbGVfY29sb3JfbWFudWFsKHZhbHVlcz1jKCJibGFjayIsInJlZCIpKSArIGdndGl0bGUocGFzdGUoImNvbnRyYXN0IiwiaW50ZXJhY3Rpb24iKSkKcHJpbnQodm9sY2Fub0ludGVyKQoKcGxvdE1BKHJlc3VsdHMkaW50ZXJhY3Rpb24pCm1hdCA8LSBhc3NheSh2c2QpW2hlYWQob3JkZXIocmVzdWx0cyRpbnRlcmFjdGlvbiRwYWRqKSwgc3VtKHJlc3VsdHMkaW50ZXJhY3Rpb24kcGFkajwwLjA1LG5hLnJtPVRSVUUpKSwgXQpwaGVhdG1hcChtYXQpCmBgYAoKIyMjIFBsb3QgY291bnQgZGF0YSBvZiBpbmRpdmlkdWFsIGdlbmVzCgpERVNlcTIgYWxsb3dzIGEgc3RyYWlnaHRmb3J3YXJkIHdheSBvZiBwbG90dGluZyB0aGUgcmF3IG9yIG5vcm1hbGlzZWQgY291bnRzIGZvciBhIGdlbmUuCgpgYGB7cn0KcGxvdENvdW50cyhkc19tYXRyaXgsIGdlbmUgPSAiRU5TUk5PRzAwMDAwMDAyNDE5IiwgaW50Z3JvdXAgPSBjKCJwcm90b2NvbCIsInRpbWUiKSwKbm9ybWFsaXplZCA9IFRSVUUsIHRyYW5zZm9ybSA9IEZBTFNFKQpgYGAKCgoKIyMgUmVtYXJrcwoKLSBUaGVyZSBhcmUgdmVyeSBtYW55IERFIGdlbmVzIGFjY29yZGluZyB0byB0aGUgU05MIHRyZWF0bWVudCBhdCB0aGUgZWFybHkgYW5kIGxhdGUgdGltZXBvaW50LgoKLSBJc3N1ZXMgd2l0aCB0aGUgZGVzaWduPwoKLSBUaGVyZSBhcmUgdmVyeSBmZXcgaW50ZXJhY3Rpb25zIHNpZ25pZmljYW50LiBDYW4geW91IGV4cGxhaW4gdGhpcz8KCgojIEFzc2VzcyBwLXZhbHVlcwoKSWYgeW91IHVzZSBXYWxkIHRlc3RzIGluIERFU2VxMiB5b3UgYWxyZWFkeSBoYXZlIHogc3RhdGlzdGljcy4KCmBgYHtyfQp0aWJibGUoeiA9IHJlc3VsdHMkZWFybHkkc3RhdCkgJT4lCiAgZ2dwbG90KGFlcyh4PXopKSArCiAgZ2VvbV9oaXN0b2dyYW0oYWVzKHkgPSAuLmRlbnNpdHkuLiksIGNvbG9yID0gImJsYWNrIikgKwogIHN0YXRfZnVuY3Rpb24oZnVuID0gZG5vcm0sCiAgICAgIGFyZ3MgPSBsaXN0KAogICAgbWVhbiA9IDAsCiAgICBzZD0xKQogICkKYGBgCg==

Hammer Dataset with DESeq2

Lieven Clement

statOmics, Ghent University (https://statomics.github.io)