Avec le séquençage de nouvelle génération et d’autres technologies à haut débit qui révolutionnent la recherche en sciences de la vie et en santé, le traitement et l’interprétation des données, plutôt que leur production, sont devenus le principal facteur limitant la découverte et l’innovation. Les grands centres de génomique, et de plus en plus de petits laboratoires de recherche, sont confrontés à d’importants défis en matière d’analyse de données. Le Centre canadien de génomique computationnelle (C3G) offre des services d’analyse bioinformatique et de calcul haute performance à la communauté de recherche en sciences de la vie.
Depuis 2018, le C3G collabore avec l’Institut du cancer Rosalind et Morris Goodman (GCI) pour mettre en place et exploiter une plateforme bioinformatique au sein du GCI. Les analyses moléculaires à haut débit offrent un aperçu sans précédent de la biologie et de la pathogenèse du cancer, avec un impact potentiel sur le diagnostic et le choix des traitements. La plateforme soutient de nombreux chercheurs du GCI dans l’analyse, la visualisation et l’interprétation d’un large éventail de données « omiques » (notamment la génomique, la transcriptomique, l’épigénomique, la protéomique et la métabolomique).
Notre pipeline WGS comprend les différentes étapes de traitement des données, depuis les séquences brutes (fichiers FASTQ) jusqu’aux fichiers de rapport de variants. Nous utilisons une combinaison d’outils d’appel de variants pour identifier les variants mononucléotidiques (SNV), les insertions/délétions (INDEL) et les variants structuraux (SV) à haute confiance dans les paires tumeur-tissu sain. La liste des variants est annotée avec différents types d’informations, telles que les gènes/transcrits affectés, la localisation génomique, la conséquence/l’effet et les variants connus issus de bases de données cliniques (par exemple, ClinVar et CIViC). Notre pipeline fournit également des informations sur les variations du nombre de copies (CNV), la ploïdie, la (in)stabilité des microsatellites, la charge mutationnelle tumorale et d’autres signatures mutationnelles. Nous continuons d’améliorer notre approche d’analyse WGS en intégrant et en testant de nouveaux jeux de données et outils de référence afin d’accroître le débit et la précision de la procédure WGS.
Le séquençage d’ARN en masse (RNA-seq) est l’une des techniques les plus couramment utilisées en recherche sur le cancer. Notre pipeline d’analyse RNA-seq vise à identifier les gènes ou isoformes différentiellement exprimés (signatures), ainsi qu’à détecter les fusions de gènes. Le séquençage d’ARN unicellulaire (scRNA-Seq) est un outil puissant pour analyser l’hétérogénéité transcriptomique intratumorale (masquée dans l’analyse en masse). Notre pipeline d’analyse scRNA-seq vise à distinguer les cellules néoplasiques des cellules non néoplasiques, à identifier les sous-populations et états transcriptionnels distincts susceptibles de favoriser la tumorigénèse, et à réaliser une inférence de trajectoire pour révéler les changements dynamiques d’expression génique.
Publié le : 10 mai 2022