Des données internes transformées en trésor pour les startups en difficulté

La fermeture d’une startup ne signifie pas la fin de ses revenus. Selon un rapport de Forbes, certaines entreprises en faillite monétisent leurs données internes en les vendant à des sociétés spécialisées en intelligence artificielle (IA) comme données d’entraînement. Une pratique lucrative qui génère des centaines de milliers de dollars.

Shanna Johnson, ancienne PDG de Cielo24, une entreprise de logiciels aujourd’hui disparue, a confirmé au média avoir vendu l’intégralité de ses archives Slack, emails internes et tickets Jira pour des « centaines de milliers de dollars ».

Un marché en plein essor

SimpleClosure, une plateforme aidant les entreprises à fermer leurs portes, a révélé une demande croissante de la part des laboratoires d’IA pour ces données professionnelles. Face à cet engouement, l’entreprise a lancé un outil dédié permettant aux sociétés de vendre leurs communications internes – des archives Slack aux échanges par email – aux laboratoires d’IA.

En un an, SimpleClosure affirme avoir traité 100 transactions de ce type, avec des paiements allant de 10 000 à 100 000 dollars.

Des risques majeurs pour la vie privée

Cette pratique soulève des préoccupations majeures en matière de confidentialité. Même anonymisées, ces données peuvent contenir des informations personnelles identifiables, notamment pour les employés ayant passé des années au sein de l’entreprise.

« Les enjeux en matière de vie privée sont considérables », déclare Marc Rotenberg, fondateur du Center for AI and Digital Policy. « La confidentialité des employés reste une préoccupation majeure, d’autant plus que ces outils de messagerie interne comme Slack sont devenus indispensables. Ce ne sont pas des données génériques : ce sont des personnes identifiables. »

L’IA au cœur des tensions en entreprise

L’essor de l’IA dans les milieux professionnels suscite des résistances. Une enquête Gallup révèle que les craintes éthiques et les risques pour la vie privée figurent parmi les principales raisons pour lesquelles certains salariés refusent d’utiliser des outils d’IA au travail.

Les inquiétudes ne se limitent pas à l’IA : selon une étude Checkr de 2024, près de la moitié des 3 000 répondants seraient prêts à accepter une baisse de salaire pour éviter que leur employeur ne surveille leur activité en ligne.

Un nouveau modèle économique pour l’entraînement des IA

Les modèles de langage actuels s’appuient sur des données publiques (articles, livres, publications sur les réseaux sociaux). Cependant, les modèles agentiques avancés – capables de prendre des décisions autonomes – nécessitent des ensembles de données plus complexes : documents internes, emails, FAQ, etc.

Cette demande croissante a donné naissance à de nouveaux acteurs. AfterQuery, un laboratoire de recherche basé à San Francisco, développe des « mondes numériques de bureau » que les laboratoires d’IA achètent pour entraîner leurs agents à naviguer dans des environnements professionnels et résoudre des problèmes concrets. Des échanges Slack planifiant des afterworks aux emails résolvant des bugs techniques, ces données deviennent des actifs précieux dans l’économie de l’entraînement des IA.

Vers un futur où nos agents IA gèrent nos tâches quotidiennes ?

À terme, ces transactions pourraient permettre aux IA de prendre en charge des tâches aussi variées que l’organisation d’événements ou la rédaction d’emails. Un scénario qui repose sur le « cimetière » de startups ayant échoué, mais dont les données continuent de servir… à d’autres entreprises.