Les complexes macromoléculaires, ces assemblages stables formés de plusieurs chaînes polypeptidiques, constituent les machineries qui pilotent et régulent une grande partie des processus cellulaires. Ils rapprochent des molécules engagées dans une même fonction, structurent des régions désordonnées des protéines ou créent de nouveaux sites de liaison aux interfaces entre sous-unités. Or, jusqu'à présent, les catalogues spécifiques de ces complexes étaient soit irrégulièrement maintenus, soit constitués entrée par entrée à partir d'articles isolés plutôt que d'un savoir consolidé. Le Complex Portal a été développé pour combler ce manque : il s'agit d'une base de données encyclopédique, entièrement curée manuellement, qui répertorie la composition, la topologie et la fonction des complexes macromoléculaires connus chez plusieurs organismes modèles, en les reliant à des ressources spécialisées comme wwPDB, EMDB et Reactome.
Depuis la précédente mise à jour de 2019, la couverture s'est nettement étoffée. Les auteurs ont produit une première ébauche du complexome d'Escherichia coli, tout en maintenant et enrichissant celui de Saccharomyces cerevisiae à mesure que de nouvelles données expérimentales identifient des assemblages inédits. En réponse à la pandémie de SARS-CoV-2, plus de quarante complexes de coronavirus ont été ajoutés. Le complexome humain dépasse désormais 1100 complexes, dont environ 200 servent de cibles à des protéines virales ou participent au système immunitaire. À la date de la version 241 (octobre 2021), 3572 complexes issus de 26 espèces avaient été curés.
Sur le plan des outils, l'affichage des caractéristiques protéiques dans ComplexViewer a été amélioré afin de présenter plusieurs propriétés simultanément et de visualiser les liens entre participants de sous-complexes ; le tableau des participants adopte désormais un code couleur cohérent avec les nœuds du visualiseur. Le format ComplexTab s'est doté d'une colonne dédiée aux seuls identifiants UniProt. Les collaborations communautaires se sont également étendues : contribution à une analyse à grande échelle des cofacteurs de transcription putatifs, développement d'un robot peuplant Wikidata avec le contenu curé du Complex Portal pour le rendre accessible aux outils du web sémantique, et intégration des entrées comme nouvelle ontologie dans l'application ClueGO de Cytoscape pour les analyses d'enrichissement. Cette intégration à Wikidata, initiée lors d'un hackathon dédié au COVID-19, a permis de relier directement les identifiants des complexes aux projets WikiPathways et COVID-19 Disease Map.
Enfin, la licence des données est passée en CC0 afin de favoriser leur réutilisation. Les travaux se concentrent désormais sur l'achèvement d'une première version du complexome humain, avec une attention particulière portée aux complexes du système immunitaire, et sur le développement de pipelines d'import depuis PDBe pour accélérer la curation. Les auteurs invitent les utilisateurs à transmettre leurs retours et leurs demandes de curation via la page de support.