MetaCentrum: novinky infrastruktury

MetaCentrum: novinky infrastruktury

Aktuální informace o novinkách infrastruktur MetaCentrum a CERIT-SC.

Stručné shrnutí novinek:


A nyní detailněji:

1. Amber:
- zakoupili jsme licenci nejnovější verze nástroje pokrývajícího široké spektrum metod výpočetní chemie, využitelnou všemi uživateli MetaCentra
- připravili jsme moduly podporující jak sériové/distribuované výpočty (modul "amber-14"), tak výpočty na grafických procesorech (GPU - modul "amber-14-gpu")
- obě varianty jsou pro maximální efektivitu kompilovány Intel kompilátorem s podporou Intel MKL knihoven
- více viz https://wiki.metacentrum.cz/wiki/Amber


2. GALAXY:
- Galaxy (viz http://galaxyproject.org/ ) je webová platforma pro jednoduchou a transparentní realizaci bioinformatických výpočtů
- připravili jsme vlastní Galaxy instanci, která podporuje vícero bioinformatických nástrojů (např. bfast, blast, bowtie2, bwa, cuff tools, fastx and fastqc tools, fastqc, mosaik, muscle, repeatexplorer, rsem, samtools, tophat2 atp.)
- (další nástroje lze doplnit na požádání)
- výpočty, sestavené v rámci webového rozhraní Galaxy, jsou poté prováděny skrze standardní gridové úlohy
- bližší informace viz https://wiki.metacentrum.cz/wiki/Galaxy_application , přímý přístup na portál skrze https://galaxy.metacentrum.cz (standardní uživatelské jméno a heslo)


3. Projektové adresáře:
- prosíme, ozvěte se nám, pokud ve svých domovských adresářích udržujete objemná data centrálně instalovaných aplikací (např. databáze SW), které nebylo vhodné umisťovat na AFS -- přesuneme je do projektových adresářů
- tyto můžete využít i pro sdílení dat Vašeho projektu -- tato data budou umístěna mimo Vaše domovské adresáře v /storage/projects/MUJPROJEKT
- podpora sdílení dat může být realizována vytvořením vlastní skupiny uživatelů, viz předchozí novinka


4. Hands-on školící seminář:
- připravujeme hands-on školící seminář pro efektivní využívání služeb infrastruktur MetaCentra a CERIT-SC
- předpokládané konání bude v termínu 4.-15.8. (v závislosti na výsledku hlasování), konat se bude v Praze (v budoucnu i v dalších městech)
- více informací a registrační formulář naleznete na https://www.surveymonkey.com/s/MetaSeminar-Praha


5. Nově instalované/upgradované aplikace:

Komerční software:

1. Amber
   - zakoupena licence nejnovější verze 14 programu Amber, viz výše
2. Geneious
   - upgrade na verzi 7.1.5


Volně dostupný software:
* blast+ (ver. 2.2.29)
   - a program that compares nucleotide or protein sequences to sequence databases and calculates the statistical significance of matches
* bowtie2 (ver. 2.2.3)
   - Bowtie 2 is an ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences.
* cellprofiler (ver. 2.1.0)
   - an open-source software designed to enable biologists to quantitatively measure phenotypes from thousands of (cell/non-cell) images automatically
* cuda (ver. 6.0)
   - CUDA Toolkit 6.0 (libraries, compiler, tools, samples)
* diyabc (ver. 2.0.4)
   - user-friendly approach to Approximate Bayesian Computation for inference on population history using molecular markers
* eddypro (ver. 20140509)
   - a powerful software application for processing eddy covariance data
* fsl (ver. 5.0.6)
   - a comprehensive library of analysis tools for FMRI, MRI and DTI brain imaging data
* gerp (ver. 05-2011)
   - GERP identifies constrained elements in multiple alignments by quantifying
* gpaw (ver. 0.10, Python 2.6+2.7, Intel+GCC variants)
   - density-functional theory (DFT) Python code based on the projector-augmented wave (PAW) method and the atomic simulation environment (ASE)
* gromacs (ver. 4.6.5)
   - a program package enabling to define minimalization of energy of system and dynamic behaviour of molecular systems
* hdf5 (ver. 1.8.12-gcc-serial)
   - data model, library, and file format for storing and managing data.
* htseq (ver. 0.6.1)
   - a Python package that provides infrastructure to process data from high-throughput sequencing assays
* infernal (ver. 1.1, GCC+Intel+PGI variants)
   - search sequence databases for homologs of structural RNA sequences
* mono (ver. 3.4.0)
   - open-source .NET implementation allowing to run C# applications
* openfoam (ver. 2.3.0)
   - a free, open source CFD software package
* phylobayes (ver. mpi-1.5a)
   - Bayesian Markov chain Monte Carlo (MCMC) sampler for phylogenetic inference
* phyml (ver. 3.0-mpi)
   - estimates maximum likelihood phylogenies from alignments of nucleotide or amino acid sequences
* picard (ver. 1.80 + 1.100)
   - a set of tools (in Java) for working with next generation sequencing data in the BAM format
* qt (ver. 4.8.5)
   - cross-platform application and UI framework
* R (ver. 3.1.0)
   - a software environment for statistical computing and graphics
* rpy (ver. 1.0.3)
   - python wrapper for R
* rpy2 (ver. 2.4.2)
   - python wrapper for R
* rsem (ver. 1.2.8)
   - package for estimating gene and isoform expression levels from RNA-Seq data
* soapalign (ver. 2.21)
   - The new program features in super fast and accurate alignment for huge amounts of short reads generated by Illumina/Solexa Genome Analyzer.
* soapdenovo (ver. trans-1.04)
   - de novo transcriptome assembler basing on the SOAPdenovo framework
* spades (ver. 3.1.0)
   - St. Petersburg genome assembler. It is intended for both standard (multicell) and single-cell MDA bacteria assemblies.
* stacks (ver. 1.19)
   - a software pipeline for building loci from short-read sequences
* tablet (ver. 1.14)
   - a lightweight, high-performance graphical viewer for next generation sequence assemblies and alignments
* tassel (ver. 3.0)
   - TASSEL has multiple functions, including associati on study, evaluating evolutionary relationships, analysis of linkage disequilibrium, principal component analysis, cluster analysis, missing data imputation and data visualization
* tcltk (ver. 8.5)
   - powerful but easy to learn dynamic programming language and graphical user interface toolkit
* tophat (ver. 2.0.12)
   - TopHat is a fast splice junction mapper for RNA-Seq reads.
* trinotate (ver. 201407)
   - comprehensive annotation suite designed for automatic functional annotation of transcriptomes, particularly de novo assembled transcriptomes, from model or non-model organisms
* wgs (ver. 8.1)
   - whole-genome shotgun (WGS) assembler for the reconstruction of genomic DNA sequence from WGS sequencing data


S přáním úspěšných výpočtů
Tom Rebok,
MetaCentrum + CERIT-SC.


Tom Rebok, 28. 7. 2014