Parallélisation d'un outil d'analyse génomique

Par Mathieu Canuel-Ross et Charles Coulombe

De nos jours, la génération de données en grande quantité se fait de plus en plus fréquente dans le domaine scientifique, par exemple, en biologie, dans le cas des techniques de séquençage à haut débit ou encore lors de l’analyse de phénomènes physiques. De plus, les technologies, qui évoluent très rapidement, nous permettent de traiter de plus grands bassins de données. La programmation concurrente et parallèle s’intègre bien dans ces domaines, permettant de traiter plus efficacement de grands lots de données. Bien que de plus en plus répandues, les architectures parallèles sont limitées par certaines contraintes matérielles telles que la quantité de processeurs et la quantité de coeurs d’un processeur qui sont nettement inférieures à la quantité de données que ces architectures sont appelées à traiter. C’est pourquoi, dans le cadre du cours IFT630, nous avons décidé de mettre à profit les notions de programmation parallèle et les outils vus à ce jour pour optimiser un outil d’analyse de données génomiques.

 

Lire la suite...