Vos parents vous l’ont dit petit, il ne faut pas jouer avec ses selles. Pourtant, c’est ce à quoi vous convient des chercheurs grâce à une application ludique, rapide – et très hygiénique – qui ne contaminera pas votre téléphone.
Pour jouer à Colony B, rien de plus simple: il suffit d’entourer du doigt, sur l’écran, des groupes de points composant des casse-têtes uniques, fruit de la proximité microbienne des personnes dont elles sont issues. Chaque point figure un profil de bactéries spécifique trouvé dans un échantillon de selles analysé par le laboratoire.
Votre petit geste du doigt formera donc des groupes similaires de colonies bactériennes issues du rectum de milliers de personnes. « L’implication des gens apporte une aide appréciable autour d’un problème crucial pour de nombreux chercheurs : lier les habitudes de vie, les bactéries et les problèmes de santé », résume Jérôme Waldispühl, professeur associé de l’École de sciences informatiques de l’université McGill.
Après le succès de Phylo, qui associait puzzles et maladies génétiques, ce nouveau jeu de l’équipe du Laboratoire de science informatique et biologie allie plaisir de jouer et science citoyenne sur un support que tout le monde, ou presque, a dans la poche. Lancée il y a moins d’un mois dans sa version pour Apple, la version bêta de Colony B a déjà engrangé 900 000 données, livrées par 150 participants, pour un total de 22 000 casse-têtes (puzzles) utilisables pour la recherche.
Colony B s’inscrit dans un projet scientifique plus large, celui d’American Gut qui vise à corréler les colonies microbiennes logées dans l’intestin au mode de vie de leurs porteurs – alimentation, habitat, loisirs, etc. – et à leur état de santé. Dans cet ensemble de participants aux profils bactériens différents, il s’agit d’établir des similarités entre les groupes.
Nous sommes porteurs d’une diversité fantastique de bactéries – 90% de nos cellules seraient des colonies bactériennes. Le défi s’avère donc de taille, pour les chercheurs : vouloir constituer des regroupements cohérents à partir des grandes masses de données collectées grâce au projet américain.
« Ces dizaines de milliers de profils bactériens différents ne peuvent être triés à l’aide de simples algorithmes de visualisation, bien loin d’être aussi performants que la vision humaine. Avec ce problème, nous atteignons les limites de la machine », relève le professeur Waldispühl.
Place à l’intuition
De plus, le partitionnement des données (clustering) constitue un défi pour l’ordinateur. Il doit répondre à une question ouverte, ce qui est difficile à modéliser. D’où l’idée de faire appel à l’intuition humaine : « un individu n’aura aucun mal à choisir intuitivement des groupes de points dans une distribution spatiale », soutient Jérôme Waldispühl.
Bien sûr, les réponses diffèrent parfois d’un individu à l’autre – une personne pourra même se tromper, sans pour autant compromettre les résultats – et seules les réponses communes seront retenues. Plus que de nuire au jeu, les erreurs apprennent donc aux chercheurs à améliorer les programmes d’apprentissage des machines, car les divergences dans les réponses les aideraient à créer des filtres et à estimer le niveau de difficulté de la figure de points.
Ce cheminement imprévisible vers la « vérité » constitue la base de l’apprentissage non supervisé (supervised learning) des ordinateurs. « Nous en sommes à une collaboration personne-machine, ce qui s’illustre bien dans le jeu », avoue le chercheur. En plus d’apporter un coup de pouce appréciable à la recherche en sciences de la santé.