Pleins feux sur la recherche: stratégies de séquençage optimales pour la détection des variants du génome humain

Vous planifiez un projet de séquençage? Une étude récente publiée dans Genome Biology propose un cadre pratique pour choisir les bonnes technologies selon votre budget et vos objectifs de recherche.

Identifier avec précision chaque variation génétique du génome humain est essentiel, tant pour la recherche que pour les applications cliniques. Cette étude de Genome Biology réunit l’expertise du Centre canadien de génomique computationnelle (C3G), Robert Eveleigh, Jose Hector Galvez, Mathieu Bourgey et Guillaume Bourque, et du Laboratoire des technologies génomiques avancées, Sarah Reiling et Jiannis Ragoussis, afin d’évaluer les plateformes de séquençage et les approches de détection de variants les plus récentes, pour les petites comme pour les grandes classes de variations.

Méthodologie

En utilisant l’échantillon de référence Genome in a Bottle (GIAB) HG002, l’équipe a comparé de façon systématique les technologies à courtes lectures (SRS; Illumina, MGI) et à longues lectures (LRS; PacBio Sequel/Revio, ONT R9/R10), en se basant sur les points de référence Telomere-to-Telomere (T2T) et Clinically Medically Relevant Genes (CMRG). L’étude a couvert plusieurs profondeurs de séquençage, contextes génomiques et pipelines bioinformatiques.

Résultats

Les résultats confirment que le choix de la plateforme et du flux de travail (ou workflow) doit être guidé par les objectifs de recherche.
Les technologies SRS sont excellentes pour détecter les petites variantes dans les régions bien cartographiées, alors que les LRS, en particulier PacBio Revio, offrent une précision supérieure pour les variants structuraux et les petites variantes dans les régions complexes ou répétitives. De plus, elles atteignent un plateau de précision à des profondeurs de séquençage beaucoup plus faibles (20–45×) que les courtes lectures (>60×).

Bien que le SRS demeure un choix économique et efficace pour le génotypage à haut débit, le LRS permet la résolution nécessaire aux applications cliniques dans les zones génomiques difficiles.

Pour en savoir plus

Pour rester à jour sur les nouveaux algorithmes, technologies et pratiques d’évaluation comparative, le C3G maintient aussi un tableau de bord interactif!

Lire l’article complet

Tableau de bord d’évaluation des SNV du C3G

GenPipes en profondeur : explorer une solution logicielle du C3G pour la recherche en sciences de la vie

Découvrez l’une des solutions logicielles du C3G, sa raison d’être, ses forces, ses nouveautés et la façon dont elle continue de soutenir la communauté des sciences de la vie.

Qu’estce que GenPipes ?

Les pipelines GenPipes offrent des analyses génomiques de haute qualité, optimisées pour les environnements de calcul haute performance (HPC) et infonuagiques. Il s’agit d’une plateforme open‑source (LGPL), basée sur Python, pour gérer les flux de travail (ou workflow) de séquençage de nouvelle génération (NGS). GenPipes est largement adopté dans le domaine des sciences de la vie. Il sert les professionnels de la bio-informatique, les étudiants et les chercheurs travaillant sur un large éventail d’analyses génomiques, et offre une documentation complète expliquant en détail chaque pipeline ainsi que ses résultats pour les utilisateurs.

Qu’estce qui distingue GenPipes des autres plateformes d’analyse ou systèmes de gestion de workflows ?

GenPipes se démarque par sa flexibilité, son évolutivité et sa grande facilité d’utilisation. La plateforme s’adapte rapidement à de nouveaux systèmes, prend en charge plusieurs ordonnanceurs de tâches et types de déploiement, et propose un vaste ensemble de pipelines prêts à l’emploi. Son intégration avec l’Alliance de recherche numérique du Canada la rend particulièrement attrayante pour les chercheurs canadiens.

GenPipes offre également une faible barrière d’entrée : les utilisateurs n’ont pas à installer de logiciels, à gérer des génomes de référence ou à configurer des ressources informatiques, ce qui leur permet de lancer leurs analyses rapidement et avec confiance !

Quels sont les pipelines de GenPipes les plus utilisés ?

Les pipelines les plus populaires sont ChIPSeq, RNASeq et DNASeq. Le pipeline DNASeq prend en charge plusieurs protocoles, ce qui le rend adapté autant aux analyses génomiques complètes standard qu’aux workflows jumelés pour la génomique du cancer.

Les pipelines génèrent plusieurs rapports et fichiers standards, tels que des BAM, des VCF, des appels de pics (peak‑calls) et des matrices d’expression.

GenPipes offretil des fonctionnalités pour aider les étudiants et les chercheurs débutants ?

Oui! Pour rendre GenPipes encore plus accessible aux nouveaux utilisateurs, nous avons développé un nouvel outil appelé le GenPipes Wizard, avec l’aide d’une excellente stagiaire du C3G, Alexa Li Kim Wa.

Le Wizard est un assistant interactif qui aide les utilisateurs à :

  • Identifier rapidement le pipeline le mieux adapté à leurs données
  • Générer automatiquement la bonne commande pour lancer leur analyse

Quelle est la version la plus récente de GenPipes ?

Nous améliorons continuellement GenPipes en fonction des commentaires des utilisateurs et de nos propres tests internes. La mise à jour majeure de l’an dernier, la version v6.1.0, a introduit de nouveaux pipelines et retiré un outil qui n’était plus utilisé.

Notre plus récente version est une mise à jour mineure, axée sur la correction de petits bogues découverts lors des tests ou signalés par des utilisateurs. Cliquez ici pour en savoir plus sur notre dernière version : v.6.1.1.

Si vous souhaitez contribuer aux futures améliorations, nous vous invitons à nous écrire : 

pipelines@computationalgenomics.ca

*Important pour les utilisateurs : Vous devriez toujours vérifier si une version est majeure, intermédiaire ou mineure. Les versions majeures peuvent briser la rétrocompatibilité (un facteur clé pour les projets de longue durée qui nécessitent des résultats comparables). Toutes les versions précédentes de GenPipes demeurent disponibles sous forme de modules, permettant de répéter une analyse avec une version antérieure au besoin.*

Abonnez‑vous à notre infolettre pour rester à jour sur les dernières versions logicielles et les services offerts par le C3G !

Plateforme bioinformatique C3G

Le Centre canadien de génomique computationnelle (C3G) offre des services d’analyse bioinformatique et de calcul haute performance à la communauté de recherche en sciences de la vie.

Continue reading

Anesthesia-related Tweets during COVID-19

Twitter has become a social media nexus for the sharing of information, and in an Anesthesia & Analgesia Journal article published in April 2021, members of C3G’s Toronto Node at SickKids examined the way Twitter was used to share anesthesia-related information during the COVID-19 pandemic.

Continue reading

Common bioinformatics software maintained by C3G

Close up 3D view of a DNA helix

There is a huge library of common bioinformatics software available on Compute Canada resources via the modules maintained by C3G staff and distributed via the CernVM-File System (CVMFS). Despite the breadth of the C3G CVMFS library, there may be times when using the provided software isn’t ideal.

Continue reading