人工智能在英超比赛的体育博彩中表现出低效，导致所有资金被耗尽。

17.04.2026 2 hardware

简要实验结果

初创公司 *General Reasoning* 进行了一项名为 KellyBench 的测试，评估了八大 AI 系统（Google Gemini 3.1 Pro、OpenAI ChatGPT‑4、Anthropic Claude Opus 4.6、xAI Grok 4.20 等）在 2023–2024 英格兰足球超级联赛期间下注的能力。

每个代理都获得了所有球队和过去比赛的完整统计描述，但禁止上网——模型只能使用预先提供的数据。

测试流程

1. 三次尝试：每个系统可以在赛季中进行三组投注。
2. 投注内容：比赛结果（胜/平/负）以及进球数。
3. 目标：通过风险管理最大化利润。

赢家与输家

AI 系统	平均成绩	注释
Anthropic Claude Opus 4.6	-11 %（一次尝试基本持平）	最“诚实”的参与者，但仍亏损
Google Gemini 3.1 Pro	+34 % 第一轮，随后破产	初期盈利后转为亏损
xAI Grok 4.20	立即破产，未完成后两次尝试	最弱的系统

最终，每个模型在赛季中都亏损，有些甚至完全“失败”。这验证了研究者的结论：即使是最先进的 AI 系统，在现实世界中的长期预测仍面临困难。

对未来 AI 的意义

- 对人类被取代的担忧目前似乎被夸大。
- 当前基准测试往往使用“静态”条件，未能反映真实生活的混乱与复杂性。
- 虽然 AI 已成功解决如代码编写等任务，但在多数其他人类活动领域仍受限。

人工智能在英超比赛的体育博彩中表现出低效，导致所有资金被耗尽。

Related news

苹果汽车可能会是这样的：法拉利展示了由乔尼姆·艾夫设计的电动汽车Luce的内饰。

销量超过800万份，但前作的记录仍未能被打破

特斯拉发起了一场针对在禁止使用自动驾驶功能地区的“欺骗性”激活方法的活动。

在未来五年，德尔（Dell）董事会估计，由于人工智能的兴起，对内存的需求将增长超过六百倍。

评论 (0)

登录后发表评论