L'identification précise des anomalies d'épissage génétique représente un enjeu majeur en génétique constitutionnelle, car environ 15 à 30 % des variants délétères responsables de maladies héréditaires entraînent des modifications dans l'épissage des gènes. Cet article explore le concept de "service DPNI Evry", en le reliant aux avancées dans la compréhension de l'épissage, aux outils bioinformatiques de prédiction, et aux approches de séquençage d'ARN utilisées pour l'analyse des variants et leur impact sur l'épissage.

Introduction à l'Épissage et son Importance

L'épissage est un mécanisme essentiel par lequel les pré-ARNm sont transformés en ARNm matures. Ce processus implique la suppression des introns (séquences non codantes) et la jonction des exons (séquences codantes) pour former un ARNm continu qui sera traduit en protéine. Les variations génétiques, en particulier les variants mono-nucléotidiques (SNVs), peuvent perturber ce processus et conduire à des anomalies d'épissage.

On estime que 50 % des variants pathogènes ou probablement pathogènes ont un effet sur le mécanisme d’épissage. Dans la base de données HGMD (variants pathogènes publiés), seuls 10% des variants ont un effet sur l’épissage (n=29207). Les raisons de cette différence résident très probablement dans notre capacité récente à identifier des variations introniques profondes par l’utilisation facilitée du génome complet et dans le manque de prédictions bioinformatiques fiables pour certaines catégories de variants.

Les Défis de la Prédiction de l'Épissage

Plusieurs éléments codés dans l’ADN sont responsables de la bonne reconnaissance par la machinerie d’épissage des limites exon-intron telles que le site d’épissage canonique incluant le site donneur (5’) et accepteur (3’). Les variations dans ces régions peuvent altérer considérablement le mécanisme d'épissage, provoquant par exemple un saut d'exon ou une intégration totale ou partielle d'intron. Ces régions ont été très bien caractérisées et leurs prédictions sont fiables. D'autres régions, plus difficiles à reconnaître comme le point de branchement ou les éléments de régulation d'épissage tels que les enhancer introniques/exoniques (ISE et ESE) ou les silencer (ISS et ESS), sont plus complexes à prédire.

Plusieurs outils bioinformatiques ont été développés au fil du temps, allant d'outils plus anciens tels que MaxEntScan ou plus récents tels que SpliceAI à certains outils dédiés comme Branchpointer pour les points de branchement, et enfin des agrégateurs d’outils tels que SPiP. Plusieurs comparaisons d’outils ont déjà été rapportées sur des gènes en particulier mais rarement de manière compréhensive.

Lire aussi: Pédiatrie : Lons-le-Saunier

Évaluation des Outils de Prédiction de l'Épissage

Pour évaluer la performance des outils de prédiction, un jeu de données a été constitué à partir de variants pathogènes ou possiblement pathogènes extraits de HGMD (n=29 207) et ClinVar (n=17 251) et de variants bénins ou possiblement bénins extraits de ClinVar (n=176 959) et gnomAD v2 (28 538 des génomes et 121 504 des exomes, avec une fréquence allélique > 3%). Au total, 638 219 variants non redondants sont considérés dont 41 341 pathogènes et 596 878 comme bénins.

L'ensemble de données a été utilisé pour évaluer 7 programmes dont MaxEntScan, MMSplice, NNSplice, SPiP, SpliceAI (2 paramétrages), SQUIRLS, SSF-like. D’autres algorithmes ou score sont encore en cours de traitement (par exemple CADD). Les résultats de cette étude sont exprimés sous la forme de courbes ROC et l'analyse de l’aire sous la courbe (AUC) révèlent des performances proches pour les sites consensus et des différences notables avec 3 outils plus performants pour les autres types de variants (SpliceAI, SQUIRLS et SPiP).

L'Importance du Séquençage d'ARN (RNA-Seq)

Bien que ces 15 dernières années aient vu le séquençage d’ARN à haut débit remplacer progressivement les puces transcriptomiques, l’informativité supplémentaire de cette technique concernant l’épissage reste à exploiter en clinique. Le séquençage d’ARN (RNAseq) est un outil indispensable pour l’évaluation fonctionnelle post-génomique de certains variants (intronique ou non) affectant l’épissage. Son utilisation est parfois rendue difficile en cas de gène dont l’expression est limitée à un tissu spécifique et peu accessible comme c’est le cas du tissu rénal.

Dans ce contexte, des approches de séquençage d’ARN basées sur la capture d’ADN complémentaire issu de tissus d’intérêt des patients ont été développées. Cette approche pouvant être réalisée avant ou en parallèle des études génomique permet la mise en évidence de nombreux évènements d’épissage.

Applications du RNA-Seq en Diagnostic

Le RNASeq développé dans notre laboratoire a deux objectifs principaux : offrir une analyse complémentaire aux patients pour lesquels le diagnostic reste suspect malgré des tests constitutionnels négatifs, et aider à interpréter les variants de classe 3 en recherchant leurs conséquences fonctionnelles sur l'épissage. Notre panel de 160 gènes d'intérêt en oncologie, médecine interne et neurologie est analysé avec l’ARN extrait à partir de de tubes Paxgene.

Lire aussi: Calcul des trimestres de retraite

Plusieurs exemples illustrent l’utilité du séquençage de panels ARN réalisés sur prélèvements sanguins pour aider à classer les VSI avec un effet sur l’épissage prédit. Le séquençage à haut débit de l’ARN (RNA-seq) constitue une approche de validation fonctionnelle complémentaire à celle du séquençage de l’ADN. Il permet la mise en évidence de jonctions aberrantes suite à un épissage alternatif ou à la présence de gènes de fusion, la détection de variants mais aussi l’expression différentielle des gènes.

SAMI : Un Pipeline pour l'Analyse de l'Épissage

C’est dans cette optique que nous avons développé SAMI (Splicing Analysis with Molecular Indexes), un pipeline Nextflow capable d’identifier et représenter graphiquement de tels événements en prenant en charge l’analyse complète d’un séquençage d’ARN à haut débit (contrôles qualités, déduplication basée sur les UMI, alignement, quantification de l’expression, détection des événements d’épissage aberrants et fusions de gènes). Appliqué à un contrôle commercial séquencé sur un premier panel de 17.6 kb dédié au cancer de poumon, SAMI a été en mesure de détecter 13/13 sauts de l’exon 14 de MET et 12/13 sauts d’exons 2-7 correspondant au variant EGFRvIII. L’application de SAMI et d’un outil équivalent (SpliceLauncher) à un troisième panel de 1.12 Mb fait l’objet d’une seconde soumission indépendante.

RNA-Seq Ciblé pour l'Étude de Maladies Rénales

Dans cette étude, nous appliquons une technologie de RNAseq ciblé par capture d’un panel de 228 gènes impliqués dans les maladies rénales monogéniques, à différents tissus (rein, sang, fibroblastes et urines) issus de patients présentant un variant affectant l’épissage identifié préalablement. Nous avons pu étudier plusieurs échantillons pour chaque tissu. En moyenne, 11 176 reads s’alignaient sur les jonctions exons-exons identifiées (soit environ 354 reads/jonction) assurant une profondeur de lecture moyenne suffisante à l’interprétation des évènements d’épissage. Dans ce travail, nous montrons que l’étude de l’ARN total issu de différents tissus permet l’interprétation fonctionnelle des variants ayant un effet sur l’épissage.

Analyse des Variants de Signification Incertaine (VSI)

Les analyses de routine par panel de gènes permettent désormais d’identifier les variants pathogènes dans les gènes cliniquement pertinents en oncogénétique. Cependant, de nombreux variants de signification incertaine (VSI) sont également mis en évidence, dont une grande partie pourrait avoir un impact sur la transcription et l’épissage des ARNm. Plusieurs logiciels tentent de prédire l'impact des variants sur l'épissage et permettent ainsi de sélectionner les variants pour lesquels il est important d'étudier l'effet sur les transcrits.

Notre étude présente ainsi l’analyse de 53 VSI par capture et séquençage ciblé d’un panel de 38 gènes, sur des ARN totaux extraits d’échantillons sanguins de patients. Sur les 57 VSI analysés par panel ARN, 23 variants (40%) ont montré une modification partielle ou totale des transcrits (effet sur l’épissage ou duplication d’exon en tandem). Treize variants (23%) ont pu être classés comme pathogènes ou probablement pathogènes. Sur les 34 VSI sans impact observé sur l’épissage, 21 (62%) ont pu être classés probablement neutres.

Lire aussi: Service militaire et retraite : comprendre la bonification

Approche Combinée du Séquençage d'ARN Messager Ciblé et Total

Nous avons mis en place dans notre laboratoire de neurogénétique moléculaire une double approche qualitative du séquençage de l’ARN messager ciblé et total dans un contexte de caractérisation de variants de signification incertaine ayant un impact prédit sur l’épissage et mis en évidence préalablement en DNA-seq panel, exome et aussi en Génome (plateformes nationales SeqOIA et AURAGEN). Les ARNs sont extraits à partir de cellules lymphocytaires (Tube Paxgene) ou de fibroblastes (Biopsie de peau), et plus rarement à partir de tissu fœtal (Muscle, Poumon) selon l’expression du gène d’intérêt. Pour l’analyse mRNA ciblée, nous capturons par la suite 250 gènes impliqués dans nos pathologies d’intérêt (maladies congénitales ou très précoces du cervelet et du tronc cérébral, et mouvements anormaux à début pédiatrique).

Importance de la Mutagenèse Dirigée

La mutagenèse dirigée consiste à introduire des mutations (insertions, délétions et substitutions) spécifiques et ciblées au niveau d’un ADN plasmidique double brin. La mutagenèse dirigée est un processus in vitro qui utilise des amorces oligonucléotidiques spécifiquement conçues pour créer la mutation désirée dans un plasmide.

Ce kit est conçu pour la réalisation rapide et efficace d’insertions, de délétions et de substitutions au niveau d’un ADN plasmidique double brin. Première étape : amplification exponentielle à l’aide d’amorces standards et d’un master mix contenant Q5 Hot Start High-Fidelity DNA Polymerase. Deuxième étape : incubation avec un mélange d’enzymes unique contenant une kinase, une ligase et DpnI, permettant la circularisation rapide du produit de PCR et l’élimination de l’ADN matrice.

tags: #service #dpni #evry #c'est #quoi

Articles populaires: