Skip to content

L'essor des technologies à haut débit — séquençage nouvelle génération de l'ADN et de l'ARN, puces à ADN, spectrométrie de masse appliquée à la protéomique — produit des volumes de données considérables qui ouvrent l'étude globale des états physiologiques et pathologiques. Si l'analyse des niveaux d'expression génique révèle des profils propres à certains types cellulaires et leurs variations au cours du développement ou de la maladie, les approches protéomiques interrogent l'ensemble du répertoire protéique d'un organisme et mettent en lumière les interactions entre protéines impliquées dans des fonctions cellulaires variées. Or les processus biologiques sont par nature multidimensionnels, articulant plusieurs niveaux d'information : des gènes codant pour plusieurs protéines, elles-mêmes engagées dans de multiples voies et susceptibles de modifications post-traductionnelles complexes. Interpréter de tels jeux de données de grande dimension de façon rapide et efficace constitue un véritable défi.

C'est à cette difficulté que répond le logiciel ClueGO, une application développée pour l'environnement Cytoscape, conçue pour extraire l'information biologique fonctionnelle représentative à partir de longues listes de gènes ou de protéines. L'analyse d'enrichissement fonctionnel s'appuie sur les données publiques les plus récentes, issues de multiples ressources d'annotation et d'ontologie auxquelles le logiciel accède automatiquement, parmi lesquelles la Gene Ontology, ainsi que des bases de voies métaboliques et de signalisation telles que KEGG, Reactome ou WikiPathways. Des paramétrages prédéfinis facilitent la sélection des termes pertinents et simplifient la conduite de l'analyse, y compris pour des utilisateurs non spécialistes de la bio-informatique.

Les résultats sont restitués sous forme de réseaux dans lesquels les termes de la Gene Ontology et les voies biologiques sont regroupés selon leur rôle fonctionnel, offrant une lecture synthétique de l'information sous-jacente à de grandes listes de molécules. ClueGO prend désormais en charge de nombreuses espèces, et d'autres organismes peuvent être ajoutés à la demande. Le logiciel peut en outre être combiné à l'application CluePedia, qui permet de visualiser les interactions protéine-protéine au sein d'une même voie ou entre plusieurs voies. L'article décrit un flux de travail type appliqué à un jeu de données volumineux et répond aux questions fréquemment soulevées par les utilisateurs du logiciel.

Les auteurs rappellent que l'intégration de données transcriptomiques et protéomiques peut éclairer des facettes nouvelles des fonctions biologiques et cellulaires, contribuant à l'identification de cibles thérapeutiques et de biomarqueurs prédictifs pour une meilleure classification des maladies. Ils soulignent également que la qualité de ces analyses dépend de l'actualité des annotations utilisées, un point déterminant pour la fiabilité des enrichissements fonctionnels.