予測市場のプラットフォーム「Kalshi」と「Polymarket」が注目を集め、規制当局や政治家からの注目を浴びるとともに、ソーシャルメディアユーザーをも魅了してきた。中には、AIモデルを活用して一獲千金を狙うという過剰な主張を投稿する者もいる。
しかし、コーネル大学のarXivに掲載された新たな研究によると、そのような主張は簡単ではないことが示された。Arcada Labsの研究チームは、「Prediction Arena」ベンチマークを通じて、6つの最先端AIモデルに対し、それぞれ1万ドルを与えて57日間にわたりKalshiなどの予測市場で取引させる実験を行った。この実験では、AIがリアルタイムの情報をどのように処理し、意思決定を行うかが検証された。
「我々は、モデルがリアルタイムの情報を基に意思決定を行い、その判断の的確さに応じて報酬を得られるかどうかを評価したかったのです」と語るのは、Arcada Labsの共同創業者であり研究の共著者であるGrace Li氏だ。
その結果は、401(k)の運用成績にとっても決して良いものではなかった。実験期間中、全てのAIモデルが損失を出し、Kalshiでは16%から30.8%の損失を記録した。一方、Polymarketでは取引期間が短かったため損失は軽微だった。Li氏は、この差がAIモデルの運用方法に起因すると分析する。PolymarketではAIモデルが自由に市場を選択して取引できるのに対し、Kalshiでは26の特定市場に限定されていたという。
「Polymarketでは、モデルが取引できる市場の選択肢が広がっています。一方でKalshiでは、最初に26の市場を明示的に指定しなければなりませんでした」とLi氏は説明する。さらに彼女は、「当時、モデルに自由な市場選択を許可することがどれほど大きな影響を与えるのか、我々は理解していませんでした」と述べている。
このため、ソーシャルメディア上でAIによる高い収益を謳う投稿が過剰な期待を煽っている可能性があるとLi氏は指摘する。
Polymarketでは、「現在、LLM(大規模言語モデル)による取引は期待に応えつつあります」と語り、最近の内部テストでは「Opus 4.6が数件の素晴らしい取引を行った」と明かす。しかし、彼女はこれらの成功が「一獲千金」の証拠ではなく、むしろますます自律化が進むモデルの可能性を示すものだと強調する。「我々は、モデルが徐々に改善し、人間の基準を上回るようになり、やがてAIヘッジファンドが当たり前になる未来を想像しています」と彼女は語る。
だが、彼女が最も関心を寄せているのは、経済的な利益ではなく、「この能力が人類にとって何を意味するのか」という点だ。「我々は、この技術がもたらす絶対的な経済的利益よりも、人類にとっての新たな知性の単位が持つ意義に注目しています」と述べている。