Comment BlueDot, un algorithme dopé à l’IA, a été le premier à détecter le coronavirus chinois

Le coronavirus apparu en Chine fait la une depuis les annonces de l’OMS. Mais c’est un algorithme développé par la société canadienne BlueDot qui a détecté l’émergence de l’épidémie dix jours plus tôt grâce à la collecte massive de données en ligne.

Qui a le premier lancé l’alerte concernant le coronavirus ? Ce n’est pas l’Organisation Mondiale de la Santé (OMS), qui a dégainé l’information le 9 janvier, ni même le Centre américain pour le contrôle et la prévention des maladies (CDC) avec de premiers bulletins d’informations le 6 janvier. Le magazine américain Wired rapporte qu’une société canadienne, baptisée BlueDot, en a informé ses clients dès le 31 décembre dernier. Fondée en 2014 par un ancien médecin, BlueDot a développé un algorithme basé sur l’intelligence artificielle, lui permettant de « suivre, contextualiser et anticiper les risques de maladies infectieuses »

La collecte d’une myriade de signaux faibles

Mais comment cette solution fonctionne-t-elle ? “Si les maladies se propagent rapidement, les connaissances peuvent se propager encore plus rapidement”. Cette citation, que l’on retrouve sur le site de l’entreprise, est au cœur de son fonctionnement. Si on emploie volontiers un terme comme «algorithme dopé à l’intelligence artificielle», l’outil développé par BlueDot pourrait s’apparenter à un agglomérat d’informations, un flux RSS personnalisé, censé recueillir une myriade de signaux faibles, avec au bout de la chaîne un épidémiologiste – bien humain – chargé de tirer la sonnette d’alarme s’il le faut. 

L’outil de BlueDot est ainsi relativement simple à comprendre, du moins dans les grandes lignes. Grâce au big data et au machine learning, BlueDot peut capturer et analyser des données issues de 65 langues. Cela peut comprendre des messages postés sur des forums en ligne ou des blogs, des informations télévisées, des articles sur le web, des recherches de symptômes sur des moteurs de recherche, et évidemment des déclarations officielles ainsi que des bulletins de santé concernant de nouvelles pathologies animales ou végétales. Lorsque suffisamment de signaux sont accumulés, des épidémiologistes sont chargés de confirmer les conclusions de la machine avant qu’un rapport soit envoyé aux gouvernements, aux entreprises et aux clients de l’entreprise.

Google avait déjà tenté le coup

BlueDot est également en mesure de « prédire » la trajectoire des maladies. Dans le cas du coronavirus, l’entreprise a par exemple annoncé son arrivée à Bangkok ou à Tokyo, ce qui semble évidemment logique d’un point de vue géographique. Plus étonnant, dans le cas du virus Zika, elle avait prévu son arrivée en Floride avec presque 6 mois d’avance. L’entreprise explique s’appuyer sur la plate-forme ATPCO, qui compile des données des compagnies aériennes. Un certain flou entoure cependant la nature des données fournies par cette outil. 

Si les récents succès de BlueDot lui valent pour le moment sa petite renommée, l’entreprise n’est pas la seule à avoir conçu un algorithme permettant de suivre l’évolution des maladies. Google s’y est essayé auparavant avec Google Flu Trends avant que l’outil ne disparaisse en 2013… après avoir largement sous-estimé l’impact d’une grippe saisonnière.