人工智能在英超比赛的体育博彩中表现出低效,导致所有资金被耗尽。

人工智能在英超比赛的体育博彩中表现出低效,导致所有资金被耗尽。

2 hardware

简要实验结果

初创公司 *General Reasoning* 进行了一项名为 KellyBench 的测试,评估了八大 AI 系统(Google Gemini 3.1 Pro、OpenAI ChatGPT‑4、Anthropic Claude Opus 4.6、xAI Grok 4.20 等)在 2023–2024 英格兰足球超级联赛期间下注的能力。

每个代理都获得了所有球队和过去比赛的完整统计描述,但禁止上网——模型只能使用预先提供的数据。

测试流程

1. 三次尝试:每个系统可以在赛季中进行三组投注。
2. 投注内容:比赛结果(胜/平/负)以及进球数。
3. 目标:通过风险管理最大化利润。

赢家与输家

AI 系统平均成绩注释
Anthropic Claude Opus 4.6-11 %(一次尝试基本持平)最“诚实”的参与者,但仍亏损
Google Gemini 3.1 Pro+34 % 第一轮,随后破产初期盈利后转为亏损
xAI Grok 4.20立即破产,未完成后两次尝试最弱的系统

最终,每个模型在赛季中都亏损,有些甚至完全“失败”。这验证了研究者的结论:即使是最先进的 AI 系统,在现实世界中的长期预测仍面临困难。

对未来 AI 的意义

- 对人类被取代的担忧目前似乎被夸大。
- 当前基准测试往往使用“静态”条件,未能反映真实生活的混乱与复杂性。
- 虽然 AI 已成功解决如代码编写等任务,但在多数其他人类活动领域仍受限。

因此,KellyBench 实验表明,AI 目前尚未准备好在动态、不可预测的任务(如体育预测)中与人类竞争。

评论 (0)

分享你的想法——请保持礼貌并围绕主题。

暂无评论。留下评论,分享你的观点!

要发表评论,请先登录。

登录后发表评论