人工智能在英超比赛的体育博彩中表现出低效,导致所有资金被耗尽。
2
hardware
简要实验结果
初创公司 *General Reasoning* 进行了一项名为 KellyBench 的测试,评估了八大 AI 系统(Google Gemini 3.1 Pro、OpenAI ChatGPT‑4、Anthropic Claude Opus 4.6、xAI Grok 4.20 等)在 2023–2024 英格兰足球超级联赛期间下注的能力。
每个代理都获得了所有球队和过去比赛的完整统计描述,但禁止上网——模型只能使用预先提供的数据。
测试流程
1. 三次尝试:每个系统可以在赛季中进行三组投注。
2. 投注内容:比赛结果(胜/平/负)以及进球数。
3. 目标:通过风险管理最大化利润。
赢家与输家
| AI 系统 | 平均成绩 | 注释 |
|---|---|---|
| Anthropic Claude Opus 4.6 | -11 %(一次尝试基本持平) | 最“诚实”的参与者,但仍亏损 |
| Google Gemini 3.1 Pro | +34 % 第一轮,随后破产 | 初期盈利后转为亏损 |
| xAI Grok 4.20 | 立即破产,未完成后两次尝试 | 最弱的系统 |
最终,每个模型在赛季中都亏损,有些甚至完全“失败”。这验证了研究者的结论:即使是最先进的 AI 系统,在现实世界中的长期预测仍面临困难。
对未来 AI 的意义
- 对人类被取代的担忧目前似乎被夸大。
- 当前基准测试往往使用“静态”条件,未能反映真实生活的混乱与复杂性。
- 虽然 AI 已成功解决如代码编写等任务,但在多数其他人类活动领域仍受限。
因此,KellyBench 实验表明,AI 目前尚未准备好在动态、不可预测的任务(如体育预测)中与人类竞争。
评论 (0)
分享你的想法——请保持礼貌并围绕主题。
登录后发表评论