LogoLogo

Fawal, Nizar. Automatic annotation of multigene families, the case of peroxidases

Fawal, Nizar (2013). Automatic annotation of multigene families, the case of peroxidases.

[img]
Preview
PDF (L'auteur ne souhaite pas la mise en ligne de sa thèse. L'exemplaire papier peut être consulté ou emprunté à la BU Sciences de Toulouse) - nécessite un logiciel de visualisation PDF comme GSview, Xpdf or Adobe Acrobat Reader
139Kb

Résumé en francais

Une famille de gènes est un groupe de gènes homologues, partageant un ancêtre commun, et ayant des similarités au niveau de leurs séquences et de leurs fonctions. Mon équipe d'accueil, Evolution et Expression des Peroxydases, s'intéresse particulièrement à l'annotation de la superfamille des peroxydases. Les peroxydases sont des enzymes universelles du monde vivant qui catalysent des réactions d'oxydo-réduction impliquant la réduction d'un peroxyde d'hydrogène et l'oxydation d'un substrat, variable d'une classe de peroxydase à une autre. Avec la baisse du coût et du temps nécessaire au séquençage de nouveaux génomes, maintenir une annotation manuelle experte est devenu illusoire. Aussi, pour gérer ce flux croissant de données d'une manière fiable, la première étape était de mettre à jour notre base de données des peroxydases, la PeroxiBase. Dans cette optique, plusieurs outils et pipelines ont été mis en place pour faciliter et accélérer la procédure d'annotation des peroxydases tout en maintenant une haute qualité d'annotations. Tout d'abord, deux pipelines automatiques, " proteome_filter " et " EST_filter ", pour l'annotation des familles multigéniques ont été développés. Ils se basent sur une recherche par homologie à l'aide d'un BLAST dans le but d'identifier les séquences appartenant à la superfamille des peroxydases à partir du protéome ou des données d'ESTs. De plus, GECA, un logiciel pour comparer l'organisation en exon/intron et ainsi détecter les variations de structures de gènes a été développé. Par ailleurs, cette information sur les structures de gènes peut être utilisée aussi pour valider l'annotation des membres des familles multigéniques. Ces outils ont été testés dans le cadre des ligninases. Le choix de cette famille est justifié par l'annotation massive des génomes des champignons en raison de l'intérêt industriel accru pour les ligninases. Ces enzymes appartiennent à la famille des peroxydases de classe II qui se trouve essentiellement chez les champignons où ils sont responsables de la dégradation de la lignine (polymère présent dans la paroi des plantes terrestres). Bénéficiant d'une base de données experte sur les peroxydases, j'ai entrepris des études sur ces enzymes pour les classer et analyser leur évolution. En parallèle, je me suis impliqué dans des projets annexes comme la construction d'un pipeline pour avoir une analyse phylogénétique complète et une étude de l'évolution de huit familles de gènes chez l'Eucalyptus.

Sous la direction du :
Directeur de thèse
Dunand, Christophe
Mathe, Catherine
Ecole doctorale:Sciences écologiques, vétérinaires, agronomiques et bioingénieries (SEVAB)
laboratoire/Unité de recherche :Laboratoire de Recherche en Sciences Végétales (LRSV), UMR 5546
Mots-clés libres :Comparative genomics - Phylogenomics - Multigene families - Peroxidases - Automatics annotations
Sujets :Sciences de la terre
Déposé le :08 Sep 2014 11:00