1 Background

After fertilization but prior to the onset of zygotic transcription, the C. elegans zygote cleaves asymmetrically to create the anterior AB and posterior P1 blastomeres, each of which goes on to generate distinct cell lineages. To understand how patterns of RNA inheritance and abundance arise after this first asymmetric cell division, we pooled hand-dissected AB and P1 blastomeres and performed RNA-seq (Study GSE59943).

The information which connects the sample information from GEO with the SRA run id is downloaded from SRA using the Send to: File button.

2 Preprocessing

2.1 Download Data

We used the info in the downloaded SraAccList.txt file to download the SRA files. We used the system function to invoke aan OS command. xargs can converts each line of a file into an argument.

The fasterq-dump function will then download and convert each corresponding sra file from the SRA archive to a fastq file.

The fasterq-dump is a tool from the sra-tools suite that can be used to download sra files and to convert them into the fastq format.

system("xargs fasterq-dump -p < SraAccList.txt")

For illustration purposes we will download subsampled fastq files from the course github site.

url <- "https://github.com/statOmics/SGA/archive/refs/heads/elegansFastq.zip"
destFile <- "elegansFastq.zip"

download.file(url, destFile)

unzip(destFile, exdir = "./", overwrite = TRUE)

if (file.exists(destFile)) {
  #Delete file if it exists
  file.remove(destFile)
}

## [1] TRUE

2.2 Assess Read Quality

Assess the fastq files with fastQC.

2.3 Align data

2.3.1 Input file for hisat aligner

We will make the input file for the hisat aligner that will be called through the QUASAR package.

fastqFiles <- list.files(path = "SGA-elegansFastq",full.names = TRUE, pattern = "fastq")

samples <- fastqFiles |>
    substr(start=18,stop=27) 
fileInfo <- tibble(FileName=fastqFiles,SampleName=samples)
fileInfo

## # A tibble: 6 × 2
##   FileName                                SampleName
##   <chr>                                   <chr>     
## 1 SGA-elegansFastq/SRR1532959sub.fastq.gz SRR1532959
## 2 SGA-elegansFastq/SRR1532960sub.fastq.gz SRR1532960
## 3 SGA-elegansFastq/SRR1532961sub.fastq.gz SRR1532961
## 4 SGA-elegansFastq/SRR1532962sub.fastq.gz SRR1532962
## 5 SGA-elegansFastq/SRR1532963sub.fastq.gz SRR1532963
## 6 SGA-elegansFastq/SRR1532964sub.fastq.gz SRR1532964

We write the fileInfo to disk

write_tsv(fileInfo,file="fastQfiles.txt")

2.3.2 Download C. elegans genome and gff3 file

slide courtesy Charlotte Soneson

urlGenome <- "https://ftp.ensembl.org/pub/release-108/fasta/caenorhabditis_elegans/dna/Caenorhabditis_elegans.WBcel235.dna.toplevel.fa.gz"
genomeDestFile <- "Caenorhabditis_elegans.WBcel235.dna.toplevel.fa.gz"
urlGff <- "https://ftp.ensembl.org/pub/release-108/gff3/caenorhabditis_elegans/Caenorhabditis_elegans.WBcel235.108.gff3.gz"
gffDestFile <- "Caenorhabditis_elegans.WBcel235.108.gff3.gz"

download.file(url = urlGenome ,
              destfile = genomeDestFile)
download.file(url = urlGff,
              destfile = gffDestFile)
gunzip(genomeDestFile, overwrite = TRUE, remove=TRUE)
gunzip(gffDestFile, overwrite = TRUE, remove=TRUE)
list.files()

##  [1] "AhlmannEltze2021.pdf"                           
##  [2] "backgroundProteomicsDataAnalysis.pdf"           
##  [3] "Caenorhabditis_elegans.WBcel235.108.gff3"       
##  [4] "Caenorhabditis_elegans.WBcel235.dna.toplevel.fa"
##  [5] "elegansAlignmentCountTable.html"                
##  [6] "elegansAlignmentCountTable.Rmd"                 
##  [7] "fastQfiles.txt"                                 
##  [8] "Genome Res.-2008-Marioni-1509-17.pdf"           
##  [9] "illumina_sequencing_introduction.pdf"           
## [10] "intro.pdf"                                      
## [11] "martens_proteomics_bioinformatics.pdf"          
## [12] "proteomics_data_analysis.pdf"                   
## [13] "SGA-elegansFastq"                               
## [14] "stagewiseTesting.pdf"

2.3.3 Align reads using QuasR and RHisat package

We are aligning RNA-seq reads and have to use a gap aware alignment modus. We therefore use the argument splicedAlignment = TRUE
The project is a single-end sequencing project! So we use the argument paired = "no".

suppressPackageStartupMessages({
    library(QuasR)
    library(Rhisat2)
})
sampleFile <- "fastQfiles.txt"
genomeFile <- "Caenorhabditis_elegans.WBcel235.dna.toplevel.fa"    
projElegans <- qAlign(
    sampleFile = sampleFile, 
    genome = genomeFile,
    splicedAlignment = TRUE, 
    aligner = "Rhisat2",
    paired="no")

## Creating .fai file for: /Users/lclement/Dropbox/statOmics/SGA/docs/Caenorhabditis_elegans.WBcel235.dna.toplevel.fa

## alignment files missing - need to:

##     create alignment index for the genome

##     create 6 genomic alignment(s)

## Creating an Rhisat2 index for /Users/lclement/Dropbox/statOmics/SGA/docs/Caenorhabditis_elegans.WBcel235.dna.toplevel.fa

## Finished creating index

## Testing the compute nodes...OK
## Loading QuasR on the compute nodes...preparing to run on 1 nodes...done
## Available cores:
## lievens-MacBook-Pro.local: 1
## Performing genomic alignments for 6 samples. See progress in the log file:
## /Users/lclement/Dropbox/statOmics/SGA/docs/QuasR_log_de5935c6c78.txt
## Genomic alignments have been created successfully

2.4 Make count table

2.4.1 Convert gff file into database

The gff3 file contains information on the position of features, e.g. exons and genes, along the chromosome.

suppressPackageStartupMessages({
library(GenomicFeatures)
library(Rsamtools)
})
annotFile <- "Caenorhabditis_elegans.WBcel235.108.gff3"

#chrLen <- scanFaIndex(genomeFile)

#chrominfo <- data.frame(chrom = as.character(seqnames(chrLen)),
#                        length = width(chrLen),
#                        is_circular = rep(FALSE, length(chrLen)))

txdb <- makeTxDbFromGFF(file = annotFile,
                        dataSource = "Ensembl",
                        organism = "Caenorhabditis elegans")

## Import genomic features from the file as a GRanges object ... OK
## Prepare the 'metadata' data frame ... OK
## Make the TxDb object ...

## Warning in .extract_exons_from_GRanges(exon_IDX, gr, mcols0, tx_IDX, feature = "exon", : 15639 exons couldn't be linked to a transcript so were dropped (showing
##   only the first 6):
##   seqid  start    end strand   ID         Name               Parent Parent_type
## 1     I  31523  31543      + <NA>  Y74C9A.7.e1  transcript:Y74C9A.7        <NA>
## 2     I  32415  32435      + <NA>  Y74C9A.8.e1  transcript:Y74C9A.8        <NA>
## 3     I 115656 115676      - <NA> F53G12.14.e1 transcript:F53G12.14        <NA>
## 4     I 272603 272623      - <NA>   C53D5.8.e1   transcript:C53D5.8        <NA>
## 5     I 272607 272627      - <NA>   C53D5.7.e1   transcript:C53D5.7        <NA>
## 6     I 463304 463324      + <NA>   W04C9.7.e1   transcript:W04C9.7        <NA>

## OK

2.4.2 Make Gene Count table

With the qCount function we can count the overlap between the aligned reads and the genomic features of interest.

geneCounts <- qCount(projElegans, txdb, reportLevel = "gene")

## extracting gene regions from TxDb...done
## counting alignments...done
## collapsing counts by query name...done

head(geneCounts)

##                width SRR1532959 SRR1532960 SRR1532961 SRR1532962 SRR1532963
## WBGene00000001  1806        109         57        135         67        202
## WBGene00000002  1739          0          0          0          0          1
## WBGene00000003  1738          1          3          4          4          3
## WBGene00000004  2027          3          2          2          1          3
## WBGene00000005  1821          0          0          0          0          0
## WBGene00000006  1937          0          0          0          0          0
##                SRR1532964
## WBGene00000001        147
## WBGene00000002          1
## WBGene00000003          6
## WBGene00000004          5
## WBGene00000005          0
## WBGene00000006          0

Save count table for future use.

write.csv(as.data.frame(geneCounts),file = "elegansCountTable.csv")

3 Session Info

With respect to reproducibility, it is highly recommended to include a session info in your script so that readers of your output can see your particular setup of R.

sessionInfo()

## R version 4.2.0 (2022-04-22)
## Platform: aarch64-apple-darwin20 (64-bit)
## Running under: macOS Big Sur 11.6
## 
## Matrix products: default
## BLAS:   /Library/Frameworks/R.framework/Versions/4.2-arm64/Resources/lib/libRblas.0.dylib
## LAPACK: /Library/Frameworks/R.framework/Versions/4.2-arm64/Resources/lib/libRlapack.dylib
## 
## locale:
## [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
## 
## attached base packages:
## [1] stats4    parallel  stats     graphics  grDevices utils     datasets 
## [8] methods   base     
## 
## other attached packages:
##  [1] Rsamtools_2.12.0       Biostrings_2.64.0      XVector_0.36.0        
##  [4] GenomicFeatures_1.48.3 AnnotationDbi_1.58.0   Biobase_2.56.0        
##  [7] Rhisat2_1.13.1         QuasR_1.36.0           Rbowtie_1.36.0        
## [10] GenomicRanges_1.48.0   GenomeInfoDb_1.32.2    IRanges_2.30.0        
## [13] S4Vectors_0.34.0       BiocGenerics_0.42.0    R.utils_2.11.0        
## [16] R.oo_1.24.0            R.methodsS3_1.8.1      forcats_0.5.1         
## [19] stringr_1.4.1          dplyr_1.0.9            purrr_0.3.4           
## [22] readr_2.1.2            tidyr_1.2.0            tibble_3.1.7          
## [25] ggplot2_3.3.6          tidyverse_1.3.2       
## 
## loaded via a namespace (and not attached):
##   [1] googledrive_2.0.0           colorspace_2.0-3           
##   [3] deldir_1.0-6                hwriter_1.3.2.1            
##   [5] rjson_0.2.21                ellipsis_0.3.2             
##   [7] fs_1.5.2                    rstudioapi_0.13            
##   [9] bit64_4.0.5                 fansi_1.0.3                
##  [11] lubridate_1.8.0             xml2_1.3.3                 
##  [13] cachem_1.0.6                knitr_1.40.1               
##  [15] jsonlite_1.8.0              broom_0.8.0                
##  [17] dbplyr_2.1.1                png_0.1-7                  
##  [19] SGSeq_1.30.0                compiler_4.2.0             
##  [21] httr_1.4.3                  backports_1.4.1            
##  [23] assertthat_0.2.1            Matrix_1.4-1               
##  [25] fastmap_1.1.0               gargle_1.2.0               
##  [27] cli_3.3.0                   prettyunits_1.1.1          
##  [29] htmltools_0.5.2             tools_4.2.0                
##  [31] igraph_1.3.2                gtable_0.3.0               
##  [33] glue_1.6.2                  GenomeInfoDbData_1.2.8     
##  [35] rappdirs_0.3.3              ShortRead_1.54.0           
##  [37] Rcpp_1.0.8.3                cellranger_1.1.0           
##  [39] jquerylib_0.1.4             vctrs_0.4.1                
##  [41] rtracklayer_1.56.0          xfun_0.33                  
##  [43] rvest_1.0.2                 lifecycle_1.0.1            
##  [45] restfulr_0.0.13             XML_3.99-0.9               
##  [47] googlesheets4_1.0.0         zlibbioc_1.42.0            
##  [49] scales_1.2.0                vroom_1.5.7                
##  [51] BSgenome_1.64.0             VariantAnnotation_1.42.1   
##  [53] hms_1.1.1                   MatrixGenerics_1.8.0       
##  [55] SummarizedExperiment_1.26.1 RColorBrewer_1.1-3         
##  [57] curl_4.3.2                  yaml_2.3.5                 
##  [59] memoise_2.0.1               sass_0.4.1                 
##  [61] biomaRt_2.52.0              latticeExtra_0.6-30        
##  [63] stringi_1.7.8               RSQLite_2.2.14             
##  [65] highr_0.9                   BiocIO_1.6.0               
##  [67] filelock_1.0.2              BiocParallel_1.30.2        
##  [69] GenomicFiles_1.32.1         rlang_1.0.2                
##  [71] pkgconfig_2.0.3             bitops_1.0-7               
##  [73] matrixStats_0.62.0          evaluate_0.16              
##  [75] lattice_0.20-45             GenomicAlignments_1.32.0   
##  [77] bit_4.0.4                   tidyselect_1.1.2           
##  [79] magrittr_2.0.3              R6_2.5.1                   
##  [81] generics_0.1.2              RUnit_0.4.32               
##  [83] DelayedArray_0.22.0         DBI_1.1.2                  
##  [85] pillar_1.7.0                haven_2.5.0                
##  [87] withr_2.5.0                 KEGGREST_1.36.0            
##  [89] RCurl_1.98-1.6              modelr_0.1.8               
##  [91] crayon_1.5.1                interp_1.1-3               
##  [93] utf8_1.2.2                  BiocFileCache_2.4.0        
##  [95] tzdb_0.3.0                  rmarkdown_2.14             
##  [97] jpeg_0.1-9                  progress_1.2.2             
##  [99] grid_4.2.0                  readxl_1.4.0               
## [101] blob_1.2.3                  reprex_2.0.1               
## [103] digest_0.6.29               munsell_0.5.0              
## [105] bslib_0.3.1

LS0tCnRpdGxlOiAiRWxlZ2FuczogUmVhZCBBbGlnbm1lbnQgYW5kIENvdW50IFRhYmxlIHdpdGggUWF1c1IgYW5kIFJoaXNhdDIiCmF1dGhvcjogIkxpZXZlbiBDbGVtZW50IgpkYXRlOiAic3RhdE9taWNzLCBHaGVudCBVbml2ZXJzaXR5IChodHRwczovL3N0YXRvbWljcy5naXRodWIuaW8pIgpvdXRwdXQ6CiAgICBodG1sX2RvY3VtZW50OgogICAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCiAgICAgIHRoZW1lOiBmbGF0bHkKICAgICAgdG9jOiB0cnVlCiAgICAgIHRvY19mbG9hdDogdHJ1ZQogICAgICBoaWdobGlnaHQ6IHRhbmdvCiAgICAgIG51bWJlcl9zZWN0aW9uczogdHJ1ZQpsaW5rY29sb3I6IGJsdWUKdXJsY29sb3I6IGJsdWUKY2l0ZWNvbG9yOiBibHVlCi0tLQoKYGBge3IsIGVjaG89RkFMU0V9CnN1cHByZXNzUGFja2FnZVN0YXJ0dXBNZXNzYWdlcyh7CiAgbGlicmFyeSh0aWR5dmVyc2UpCiAgbGlicmFyeShSLnV0aWxzKQp9KQpgYGAKIyBCYWNrZ3JvdW5kIAoKQWZ0ZXIgZmVydGlsaXphdGlvbiBidXQgcHJpb3IgdG8gdGhlIG9uc2V0IG9mIHp5Z290aWMgdHJhbnNjcmlwdGlvbiwgdGhlIEMuIGVsZWdhbnMgenlnb3RlIGNsZWF2ZXMgYXN5bW1ldHJpY2FsbHkgdG8gY3JlYXRlIHRoZSBhbnRlcmlvciBBQiBhbmQgcG9zdGVyaW9yIFAxIGJsYXN0b21lcmVzLCBlYWNoIG9mIHdoaWNoIGdvZXMgb24gdG8gZ2VuZXJhdGUgZGlzdGluY3QgY2VsbCBsaW5lYWdlcy4gVG8gdW5kZXJzdGFuZCBob3cgcGF0dGVybnMgb2YgUk5BIGluaGVyaXRhbmNlIGFuZCBhYnVuZGFuY2UgYXJpc2UgYWZ0ZXIgdGhpcyBmaXJzdCBhc3ltbWV0cmljIGNlbGwgZGl2aXNpb24sIHdlIHBvb2xlZCBoYW5kLWRpc3NlY3RlZCBBQiBhbmQgUDEgYmxhc3RvbWVyZXMgYW5kIHBlcmZvcm1lZCBSTkEtc2VxIChTdHVkeSBbR1NFNTk5NDNdKGh0dHBzOi8vd3d3Lm5jYmkubmxtLm5paC5nb3YvZ2VvL3F1ZXJ5L2FjYy5jZ2k/YWNjPUdTRTU5OTQzKSkuCgoKVGhlIGluZm9ybWF0aW9uIHdoaWNoIGNvbm5lY3RzIHRoZSBzYW1wbGUgaW5mb3JtYXRpb24gZnJvbSBHRU8gd2l0aCB0aGUgU1JBIHJ1biBpZCBpcyBkb3dubG9hZGVkIGZyb20gW1NSQV0oaHR0cHM6Ly93d3cubmNiaS5ubG0ubmloLmdvdi9zcmE/dGVybT1TUlAwNDUxMTApIHVzaW5nIHRoZSBTZW5kIHRvOiBGaWxlIGJ1dHRvbi4KCiFbXShodHRwczovL3Jhdy5naXRodWJ1c2VyY29udGVudC5jb20vc3RhdE9taWNzL1NHQS9tYXN0ZXIvaW1hZ2VzX3NlcXVlbmNpbmcvZWxlZ2Fuc19HU0U1OTk0My5wbmcpCgohW10oaHR0cHM6Ly9yYXcuZ2l0aHVidXNlcmNvbnRlbnQuY29tL3N0YXRPbWljcy9TR0EvbWFzdGVyL2ltYWdlc19zZXF1ZW5jaW5nL2VsZWdhbnNfc3JhQWNjZXNzaW9ucy5wbmcpCgojIFByZXByb2Nlc3NpbmcgCgojIyBEb3dubG9hZCBEYXRhIAoKV2UgdXNlZCB0aGUgaW5mbyBpbiB0aGUgZG93bmxvYWRlZCBTcmFBY2NMaXN0LnR4dCBmaWxlIHRvIGRvd25sb2FkIHRoZSBTUkEgZmlsZXMuIApXZSB1c2VkIHRoZSBzeXN0ZW0gZnVuY3Rpb24gdG8gaW52b2tlIGFhbiBPUyBjb21tYW5kLiB4YXJncyBjYW4gY29udmVydHMgZWFjaCBsaW5lIG9mIGEgZmlsZSBpbnRvIGFuIGFyZ3VtZW50LiAKClRoZSBmYXN0ZXJxLWR1bXAgZnVuY3Rpb24gd2lsbCB0aGVuIGRvd25sb2FkIGFuZCBjb252ZXJ0IGVhY2ggY29ycmVzcG9uZGluZyBzcmEgZmlsZSBmcm9tIHRoZSBTUkEgYXJjaGl2ZSB0byBhIGZhc3RxIGZpbGUuIAoKVGhlIGZhc3RlcnEtZHVtcCBpcyBhIHRvb2wgZnJvbSB0aGUgW3NyYS10b29sc10oaHR0cHM6Ly9naXRodWIuY29tL25jYmkvc3JhLXRvb2xzKSBzdWl0ZSB0aGF0IGNhbiBiZSB1c2VkIHRvIGRvd25sb2FkIHNyYSBmaWxlcyBhbmQgdG8gY29udmVydCB0aGVtIGludG8gdGhlIGZhc3RxIGZvcm1hdC4gCgpgYGAKc3lzdGVtKCJ4YXJncyBmYXN0ZXJxLWR1bXAgLXAgPCBTcmFBY2NMaXN0LnR4dCIpCmBgYAoKRm9yIGlsbHVzdHJhdGlvbiBwdXJwb3NlcyB3ZSB3aWxsIGRvd25sb2FkIHN1YnNhbXBsZWQgZmFzdHEgZmlsZXMgZnJvbSB0aGUgY291cnNlIGdpdGh1YiBzaXRlLiAKCgpgYGB7cn0KdXJsIDwtICJodHRwczovL2dpdGh1Yi5jb20vc3RhdE9taWNzL1NHQS9hcmNoaXZlL3JlZnMvaGVhZHMvZWxlZ2Fuc0Zhc3RxLnppcCIKZGVzdEZpbGUgPC0gImVsZWdhbnNGYXN0cS56aXAiCgpkb3dubG9hZC5maWxlKHVybCwgZGVzdEZpbGUpCgp1bnppcChkZXN0RmlsZSwgZXhkaXIgPSAiLi8iLCBvdmVyd3JpdGUgPSBUUlVFKQoKaWYgKGZpbGUuZXhpc3RzKGRlc3RGaWxlKSkgewogICNEZWxldGUgZmlsZSBpZiBpdCBleGlzdHMKICBmaWxlLnJlbW92ZShkZXN0RmlsZSkKfQpgYGAKCiMjIEFzc2VzcyBSZWFkIFF1YWxpdHkgCgpBc3Nlc3MgdGhlIGZhc3RxIGZpbGVzIHdpdGggW2Zhc3RRQ10oaHR0cHM6Ly93d3cuYmlvaW5mb3JtYXRpY3MuYmFicmFoYW0uYWMudWsvcHJvamVjdHMvZmFzdHFjLykuIAoKIyMgQWxpZ24gZGF0YQoKIyMjIElucHV0IGZpbGUgZm9yIGhpc2F0IGFsaWduZXIKCldlIHdpbGwgbWFrZSB0aGUgaW5wdXQgZmlsZSBmb3IgdGhlIGhpc2F0IGFsaWduZXIgdGhhdCB3aWxsIGJlIGNhbGxlZCB0aHJvdWdoIHRoZSBRVUFTQVIgcGFja2FnZS4gCgpgYGB7cn0KZmFzdHFGaWxlcyA8LSBsaXN0LmZpbGVzKHBhdGggPSAiU0dBLWVsZWdhbnNGYXN0cSIsZnVsbC5uYW1lcyA9IFRSVUUsIHBhdHRlcm4gPSAiZmFzdHEiKQoKc2FtcGxlcyA8LSBmYXN0cUZpbGVzIHw+CiAgICBzdWJzdHIoc3RhcnQ9MTgsc3RvcD0yNykgCmZpbGVJbmZvIDwtIHRpYmJsZShGaWxlTmFtZT1mYXN0cUZpbGVzLFNhbXBsZU5hbWU9c2FtcGxlcykKZmlsZUluZm8KYGBgCgpXZSB3cml0ZSB0aGUgZmlsZUluZm8gdG8gZGlzayAKCmBgYHtyfQp3cml0ZV90c3YoZmlsZUluZm8sZmlsZT0iZmFzdFFmaWxlcy50eHQiKQpgYGAKCiMjIyBEb3dubG9hZCBDLiBlbGVnYW5zIGdlbm9tZSBhbmQgZ2ZmMyBmaWxlIAoKYGBge3IgcmVmR2Vub21lLCBlY2hvPUZBTFNFLCBmaWcuY2FwPSJzbGlkZSBjb3VydGVzeSBDaGFybG90dGUgU29uZXNvbiIsIG91dC53aWR0aD0nMTAwJSd9CmtuaXRyOjppbmNsdWRlX2dyYXBoaWNzKCJodHRwczovL3Jhdy5naXRodWJ1c2VyY29udGVudC5jb20vc3RhdE9taWNzL1NHQS9tYXN0ZXIvaW1hZ2VzX3NlcXVlbmNpbmcvaHVtYW5SZWZlcmVuY2VHZW5vbWVfZmlnLnBuZyIpCmBgYAoKCmBgYHtyIHJlZlRyYW5zY3JpcHRvbWUsIGVjaG89RkFMU0UsIGZpZy5jYXA9InNsaWRlIGNvdXJ0ZXN5IENoYXJsb3R0ZSBTb25lc29uIiwgb3V0LndpZHRoPScxMDAlJ30Ka25pdHI6OmluY2x1ZGVfZ3JhcGhpY3MoImh0dHBzOi8vcmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbS9zdGF0T21pY3MvU0dBL21hc3Rlci9pbWFnZXNfc2VxdWVuY2luZy9odW1hblJlZmVyZW5jZVRyYW5zY3JpcHRvbWVfZmlnLnBuZyIpCmBgYAoKYGBge3J9CnVybEdlbm9tZSA8LSAiaHR0cHM6Ly9mdHAuZW5zZW1ibC5vcmcvcHViL3JlbGVhc2UtMTA4L2Zhc3RhL2NhZW5vcmhhYmRpdGlzX2VsZWdhbnMvZG5hL0NhZW5vcmhhYmRpdGlzX2VsZWdhbnMuV0JjZWwyMzUuZG5hLnRvcGxldmVsLmZhLmd6IgpnZW5vbWVEZXN0RmlsZSA8LSAiQ2Flbm9yaGFiZGl0aXNfZWxlZ2Fucy5XQmNlbDIzNS5kbmEudG9wbGV2ZWwuZmEuZ3oiCnVybEdmZiA8LSAiaHR0cHM6Ly9mdHAuZW5zZW1ibC5vcmcvcHViL3JlbGVhc2UtMTA4L2dmZjMvY2Flbm9yaGFiZGl0aXNfZWxlZ2Fucy9DYWVub3JoYWJkaXRpc19lbGVnYW5zLldCY2VsMjM1LjEwOC5nZmYzLmd6IgpnZmZEZXN0RmlsZSA8LSAiQ2Flbm9yaGFiZGl0aXNfZWxlZ2Fucy5XQmNlbDIzNS4xMDguZ2ZmMy5neiIKCmRvd25sb2FkLmZpbGUodXJsID0gdXJsR2Vub21lICwKICAgICAgICAgICAgICBkZXN0ZmlsZSA9IGdlbm9tZURlc3RGaWxlKQpkb3dubG9hZC5maWxlKHVybCA9IHVybEdmZiwKICAgICAgICAgICAgICBkZXN0ZmlsZSA9IGdmZkRlc3RGaWxlKQpndW56aXAoZ2Vub21lRGVzdEZpbGUsIG92ZXJ3cml0ZSA9IFRSVUUsIHJlbW92ZT1UUlVFKQpndW56aXAoZ2ZmRGVzdEZpbGUsIG92ZXJ3cml0ZSA9IFRSVUUsIHJlbW92ZT1UUlVFKQpsaXN0LmZpbGVzKCkKYGBgCgojIyMgQWxpZ24gcmVhZHMgdXNpbmcgUXVhc1IgYW5kIFJIaXNhdCBwYWNrYWdlCgotIFdlIGFyZSBhbGlnbmluZyBSTkEtc2VxIHJlYWRzIGFuZCBoYXZlIHRvIHVzZSBhIGdhcCBhd2FyZSBhbGlnbm1lbnQgbW9kdXMuIFdlIHRoZXJlZm9yZSB1c2UgdGhlIGFyZ3VtZW50IGBzcGxpY2VkQWxpZ25tZW50ID0gVFJVRWAKCi0gVGhlIHByb2plY3QgaXMgYSBzaW5nbGUtZW5kIHNlcXVlbmNpbmcgcHJvamVjdCEgU28gd2UgdXNlIHRoZSBhcmd1bWVudCBgcGFpcmVkID0gIm5vImAuCgpgYGB7cn0Kc3VwcHJlc3NQYWNrYWdlU3RhcnR1cE1lc3NhZ2VzKHsKICAgIGxpYnJhcnkoUXVhc1IpCiAgICBsaWJyYXJ5KFJoaXNhdDIpCn0pCnNhbXBsZUZpbGUgPC0gImZhc3RRZmlsZXMudHh0IgpnZW5vbWVGaWxlIDwtICJDYWVub3JoYWJkaXRpc19lbGVnYW5zLldCY2VsMjM1LmRuYS50b3BsZXZlbC5mYSIgICAgCnByb2pFbGVnYW5zIDwtIHFBbGlnbigKICAgIHNhbXBsZUZpbGUgPSBzYW1wbGVGaWxlLCAKICAgIGdlbm9tZSA9IGdlbm9tZUZpbGUsCiAgICBzcGxpY2VkQWxpZ25tZW50ID0gVFJVRSwgCiAgICBhbGlnbmVyID0gIlJoaXNhdDIiLAogICAgcGFpcmVkPSJubyIpCmBgYAoKIyMgTWFrZSBjb3VudCB0YWJsZQoKIyMjIENvbnZlcnQgZ2ZmIGZpbGUgaW50byBkYXRhYmFzZQoKVGhlIGdmZjMgZmlsZSBjb250YWlucyBpbmZvcm1hdGlvbiBvbiB0aGUgcG9zaXRpb24gb2YgZmVhdHVyZXMsIGUuZy4gZXhvbnMgYW5kIGdlbmVzLCBhbG9uZyB0aGUgY2hyb21vc29tZS4gCgpgYGB7cn0Kc3VwcHJlc3NQYWNrYWdlU3RhcnR1cE1lc3NhZ2VzKHsKbGlicmFyeShHZW5vbWljRmVhdHVyZXMpCmxpYnJhcnkoUnNhbXRvb2xzKQp9KQphbm5vdEZpbGUgPC0gIkNhZW5vcmhhYmRpdGlzX2VsZWdhbnMuV0JjZWwyMzUuMTA4LmdmZjMiCgojY2hyTGVuIDwtIHNjYW5GYUluZGV4KGdlbm9tZUZpbGUpCgojY2hyb21pbmZvIDwtIGRhdGEuZnJhbWUoY2hyb20gPSBhcy5jaGFyYWN0ZXIoc2VxbmFtZXMoY2hyTGVuKSksCiMgICAgICAgICAgICAgICAgICAgICAgICBsZW5ndGggPSB3aWR0aChjaHJMZW4pLAojICAgICAgICAgICAgICAgICAgICAgICAgaXNfY2lyY3VsYXIgPSByZXAoRkFMU0UsIGxlbmd0aChjaHJMZW4pKSkKCnR4ZGIgPC0gbWFrZVR4RGJGcm9tR0ZGKGZpbGUgPSBhbm5vdEZpbGUsCiAgICAgICAgICAgICAgICAgICAgICAgIGRhdGFTb3VyY2UgPSAiRW5zZW1ibCIsCiAgICAgICAgICAgICAgICAgICAgICAgIG9yZ2FuaXNtID0gIkNhZW5vcmhhYmRpdGlzIGVsZWdhbnMiKQpgYGAKCiMjIyBNYWtlIEdlbmUgQ291bnQgdGFibGUgCgpXaXRoIHRoZSBxQ291bnQgZnVuY3Rpb24gd2UgY2FuIGNvdW50IHRoZSBvdmVybGFwIGJldHdlZW4gdGhlIGFsaWduZWQgcmVhZHMgYW5kIHRoZSBnZW5vbWljIGZlYXR1cmVzIG9mIGludGVyZXN0LiAKCmBgYHtyfQpnZW5lQ291bnRzIDwtIHFDb3VudChwcm9qRWxlZ2FucywgdHhkYiwgcmVwb3J0TGV2ZWwgPSAiZ2VuZSIpCmhlYWQoZ2VuZUNvdW50cykKYGBgCgpTYXZlIGNvdW50IHRhYmxlIGZvciBmdXR1cmUgdXNlLiAKCmBgYHtyfQp3cml0ZS5jc3YoYXMuZGF0YS5mcmFtZShnZW5lQ291bnRzKSxmaWxlID0gImVsZWdhbnNDb3VudFRhYmxlLmNzdiIpCmBgYAoKCiMgU2Vzc2lvbiBJbmZvCgpXaXRoIHJlc3BlY3QgdG8gcmVwcm9kdWNpYmlsaXR5LCBpdCBpcyBoaWdobHkgcmVjb21tZW5kZWQgdG8gaW5jbHVkZSBhIHNlc3Npb24gaW5mbyBpbiB5b3VyIHNjcmlwdCBzbyB0aGF0IHJlYWRlcnMgb2YgeW91ciBvdXRwdXQgY2FuIHNlZSB5b3VyIHBhcnRpY3VsYXIgc2V0dXAgb2YgUi4gCgpgYGB7cn0Kc2Vzc2lvbkluZm8oKQpgYGAKCg==

Elegans: Read Alignment and Count Table with QausR and Rhisat2

Lieven Clement

statOmics, Ghent University (https://statomics.github.io)