Une base de données insolite mise en vente

Un utilisateur de Reddit, Ill_Car_7351, a récemment proposé à la vente une base de données insolite sur le subreddit r/DHExchange, dédié à l'échange de grandes quantités de données. Intitulé « 150k images de selles », ce post annonce la vente d'un ensemble de 150 000 images de selles collectées via une application d'IA.

Ces images proviennent de 25 000 utilisateurs ayant utilisé l'application PoopCheck, développée par la société Soft All Things. L'application utilise l'intelligence artificielle pour analyser les selles selon l'échelle de Bristol, une méthode de classification des matières fécales en sept types distincts, allant des selles dures et fragmentées aux diarrhées liquides.

Comment ces données ont-elles été collectées ?

PoopCheck propose aux utilisateurs de photographier leurs selles et d'uploader les images pour obtenir une « note quotidienne de santé intestinale ». L'application analyse la consistance, la couleur, la forme et d'autres caractéristiques, puis fournit des recommandations personnalisées. Les utilisateurs ont également la possibilité de partager leurs images dans une communauté en ligne, où ils peuvent discuter avec d'autres membres et recevoir des commentaires.

Sur cette plateforme, certains posts affichent des titres évocateurs comme « Comme de la pâte à modeler » ou « Préoccupé », reflétant des inquiétudes liées à des problèmes digestifs. Les échanges incluent parfois des discussions sur des maladies graves, comme des suspicions de parasites ou de cancer du côlon, avec des recommandations de traitements non validés.

Une vente controversée

Le créateur de la base de données justifie sa vente en invoquant la rareté et la valeur potentielle de ces données pour la recherche médicale ou l'entraînement d'algorithmes d'IA. Il a déclaré : « Je possède plus de 150 000 images de selles étiquetées et classées, provenant d'environ 25 000 personnes. Je sais qu'il y a une réelle valeur dans ces données, difficile à obtenir, utile pour l'apprentissage automatique ou des études sur le cancer. Mais je ne sais pas comment les monétiser. »

Les réactions des internautes ont été majoritairement négatives. Certains ont exprimé leur dégoût, comme un utilisateur écrivant : « Quand j'avais 5 ans, mon professeur m'a appris à lire. Je regrette maintenant. » D'autres ont demandé comment supprimer leurs données personnelles de la base.

Enjeux éthiques et protection des données

Cette affaire soulève des questions majeures sur la collecte et l'exploitation des données médicales sensibles. Bien que les utilisateurs aient consenti à partager leurs images, la vente de ces données à des tiers interroge sur le respect de la vie privée et la sécurité des informations personnelles.

Les applications de santé, même celles utilisant l'IA, doivent garantir une protection rigoureuse des données de leurs utilisateurs. La vente de bases de données médicales sans consentement explicite des personnes concernées pourrait constituer une violation des réglementations en vigueur, comme le RGPD en Europe.

Que devient PoopCheck aujourd'hui ?

L'application PoopCheck reste disponible sur les stores, mais son créateur n'a pas précisé si la vente de la base de données avait abouti. Les utilisateurs sont invités à vérifier les politiques de confidentialité des applications qu'ils utilisent et à être vigilants quant à l'utilisation de leurs données personnelles.

« Je possède plus de 150 000 images de selles étiquetées et classées, provenant d'environ 25 000 personnes. Je sais qu'il y a une réelle valeur dans ces données, difficile à obtenir, utile pour l'apprentissage automatique ou des études sur le cancer. Mais je ne sais pas comment les monétiser. »

— Ill_Car_7351, créateur de la base de données
Source : 404 Media