Cette première alerte, elle avait été sonnée le 30 décembre 2019: ce jour-là, un message sur un forum spécialisé en maladies virales prévenait d’un « avis d’urgence sur le traitement d’une pneumonie de cause inconnue » émis par le Comité municipal de santé de la ville de Wuhan. Sachant qu’il faut compter plusieurs jours entre le moment où une personne est contaminée et celui où ses symptômes peuvent nécessiter une hospitalisation, et sachant aussi que seule une fraction des cas nécessitent une hospitalisation, on pouvait en déduire que l’épidémie avait commencé à se répandre au début de décembre 2019.

Mais d’un simple point de vue statistique, il était également possible que le virus ait circulé depuis quelques semaines de plus: les premiers contaminés auraient pu ne transmettre le virus qu’a une petite poignée de gens; les cas de « pneumonie atypique » auraient pu être trop rares pour être détectés comme anormaux.

Dès lors, l’autre voie devient l’analyse des montagnes de données accumulées sur cette pandémie depuis 18 mois. Dans un article pré-publié (ce qui signifie qu’il n’a pas encore été révisé par d’autres experts du domaine) le 24 juin, une équipe de trois chercheurs en biologie et en écologie explique avoir construit un modèle basé sur les dates de déclaration des cas de COVID-19 dans plus de 200 pays et territoires. « Nos résultats suggèrent que le virus a émergé en Chine entre le début d’octobre et la mi-novembre 2019 », la date avec le plus haut degré de probabilité étant le 17 novembre.

La même méthode pourrait en théorie s’appliquer aux premiers cas dans certains des premiers pays touchés. Ainsi, le modèle des auteurs pointe le 7 janvier 2020 comme date « la plus probable » du premier cas en Thaïlande, ce qui correspond, à une journée près, au premier cas officiellement enregistré. Par contre, leur modèle pointe le 19 janvier 2020 pour la France, alors qu’une ré-analyse des dossiers médicaux publiée en juin 2020 avait identifié un patient qui, hospitalisé le 27 décembre 2019, pourrait avoir été porteur du coronavirus. Que ce soit confirmé ou pas, ils admettent l’existence d’une marge d’erreur dans leurs calculs, soulignant que leur exercice est avant tout une première : l’utilisation de ce type de modèle mathématique sert surtout aux biologistes de la conservation qui tentent d’identifier, sur la base des dates des plus récentes observations, les espèces les plus à risque de disparaître à brève échéance, voire qui sont déjà disparues. Autant il est généralement impossible de savoir qu’une observation d’un animal a été « la dernière », autant il est difficile de mettre le doigt sur « le premier cas » d’une nouvelle maladie infectieuse. D’où cette proposition d’y aller de manière indirecte.

Ce travail de déduction pourrait se raffiner dans le futur, au fur et à mesure que des pays auront le temps de ré-analyser leurs dossiers médicaux de décembre 2019 et janvier 2020, ou de ré-analyser des données plus « exotiques », comme celles, en Italie, des échantillons d’eaux d’égouts récoltés en décembre 2019. Et si la méthode se raffine, elle pourrait peut-être aussi servir à pointer plus vite l’origine d’un virus… la prochaine fois.