В мире технологических стартапов появилась новая бизнес-модель: компании, закрывающиеся или переживающие неудачи, продают цифровые активы, включая переписки сотрудников в Slack и электронные письма, для обучения моделей искусственного интеллекта. По данным Forbes, такие сделки становятся всё более распространёнными, так как качественные данные для обучения ИИ становятся дефицитными на фоне активного использования интернет-контента для этих целей.

Особую ценность представляют данные из корпоративных мессенджеров, таких как Slack. Они позволяют создавать реалистичные симуляции рабочей среды — так называемые «тренажёры для обучения ИИ» (reinforcement learning gyms, или RL gyms). Эти среды помогают обучать ИИ-агентов, которые должны выполнять рабочие задачи. Как отмечает Али Ансари, основатель компании micro1, занимающейся созданием таких симуляций, «компании осознают, что для точного тестирования моделей необходим шум реальных рабочих условий».

Спрос на такие данные настолько высок, что Anthropic рассматривает возможность инвестировать до $1 млрд в создание RL gyms в этом году. Несколько стартапов, таких как Prime Intellect и Fleet, уже оцениваются в сумму, сопоставимую с этой цифрой.

Бизнес на продаже цифровых активов бывших компаний процветает. Так, SimpleClosure, позиционирующая себя как «TurboTax для закрытия бизнеса», запустила инструмент Asset Hub, который позволяет обанкротившимся компаниям продавать архивы Slack, электронные письма и кодовые базы. По словам генерального директора Дори Йоны, за последний год компания заключила почти 100 сделок, вернув основателям более $1 млн. Перед продажей данные якобы анонимизируются, однако эксперты сомневаются в эффективности такой процедуры.

Возникают этические и правовые вопросы. Марк Ротенберг, основатель Центра по политике в области искусственного интеллекта и цифровой политики, подчёркивает: «Проблемы конфиденциальности здесь весьма значительны. Работники стали настолько зависимы от внутренних мессенджеров, как Slack, что их личные данные не могут считаться полностью обезличенными».

Эксперты также сомневаются в эффективности анонимизации данных. Если она выполнена некачественно, покупатели могут восстановить личности сотрудников, что создаёт риски нарушения их прав. Таким образом, новый рынок данных для ИИ вызывает не только экономический интерес, но и серьёзные этические дискуссии.

Источник: Futurism