La composante “Calcul et Bio-Informatique” est une initiative de mutualisation des ressources informatiques dédiées au calcul et à la bioinformatique au sein de l’ISE-M. Elle est l’un des deux leviers du service Informatique de l’ISE-M à côté de la composante réseau et bureautique.
L’architecture informatique et les services offerts aux chercheurs de l’ISE-M reposent sur une infrastructure à base de Linux, de logiciels open source, de bases de données biologiques et de ressources matérielles variées.
Ce service se veut, également, être un lieu de transfert et de partage de compétences à la fois dans le cadre de formations de l’UM et intra-ISE-M.
En parallèle à ce service, l’ISE-M met à disposition de la communauté des chercheurs en biodiversité du labex CeMEB, la plate-forme bioinformatique MBB (http://mbb.univ-montp2.fr).
Le service “Calcul et Bio-Informatique” met également, de manière plus large, à la disposition de la communauté scientifique les productions des chercheurs de l’ISE-M en logiciels, code sources et bases de données dans les domaines de la génétique des populations et de la phylogénie (à travers la plate-forme MBB http://mbb.univ-montp2.fr).
Les ressources matérielles:
- Ouvertes au labex CeMEB
- 1 cluster de calcul pour la plate-forme MBB ( caractéristiques résumées ),
- 4 machines réservables pour la plate-forme MBB (ayant chacune 64 cœurs et 512Go de RAM),
- 1 serveur Web MBB pour la soumission de job via un navigateur sur le cluster MBB
- 1 serveur rstudio (8 coeurs, 384 Go RAM),
- Plusieurs serveurs de stockage (NAS) dédiés aux services précédents,
- 3 serveurs GPU réservables équipés respectivement d’une tesla K20m, de 4 Titan Xp et de 3 Titan Xp,
- Ouvertes uniquement à l’ISE-M
- 1 cluster de calcul ISE-M ( caractéristiques )
- Plusieurs serveurs de stockage supplémentaires (dont 1 NAS d’environ 100To et un système de 1.5Po) et de partage (ex: ftp://ngsisem.mbb.univ-montp2.fr/)
- Des serveurs et services Web (notamment des applications
Shiny
),
- Un nouveau service de Workflows bioinformatiques pouvant s’exécuter sur un 6 machines totalisant plus de 200 coeurs et plus de 1.5To de RAM.
Des dizaines d’outils logiciels :
- Les compilateurs : gcc, g++ , g77 , mpicc , mpiCC , mpif77,
- Les outils Bio-Info : HMMER , NCBI BLAST , ClustalW , EMBOSS , Glimmer , Fasta , MrBayes , Phylip , T_Coffee , MPI-Blast , GROMACS , Bioperl , Biopython , Phyml , PAML, Bio++, MACSE, DNAbushmeat, structure, multi_k_structure…
- R avec de nombreux packages,
- SGE (sun grid engine) pour la répartition de charge et la gestion des queues de calcul,
- Ganglia pour le monitoring des ressources des clusters (CPU, RAM, …),
- SaltStack pour la gestion des serveurs accompagné de FAI pour le déploiement des machines.
- De nombreux outils d’aide aux développements de conteneurs (
Wicopa
(source, demo), RPACIB
(source, demo), de workflows bioinformatiques (WAW
source, portail, Wapps
), etc…