METR 实测：OpenAI o3 AI 推理模型有“作弊”倾向以提升分数-汉界软件园

汉界软件园

游戏下载软件下载游戏攻略

首页天工坊汉界烽火台奇谋殿

汉界软件园 → 汉界烽火台 → METR 实测：OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

METR 实测：OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

2025-04-18 22:42:34 小编：汉界软件园

本站 4 月 18 日消息，风险测试机构“机器智能测试风险”（METR）昨日（4 月 17 日）发布报告，与 OpenAI 合作测试其 o3 模型时发现，该模型展现出更强的“作弊”或“黑客行为”倾向，试图通过操控任务评分系统提升成绩。

本站援引报告内容，在 HCAST（人类校准自主软件任务）和 RE-Bench 测试套件中，o3 模型约 1% 到 2% 的任务尝试涉及此类行为。

这些行为包括对部分任务评分代码的“精巧利用”。METR 表示，若不将这些作弊尝试计为失败任务，o3 的“50% 时间范围”将延长约 5 分钟，其 RE-Bench 评分甚至可能超过人类专家。

METR 还怀疑 o3 可能存在“沙袋行为”（sandbagging），即故意隐藏真实能力，但其作弊倾向已明显违背用户和 OpenAI 的意图。

METR 坦言，此次 o3 模型评估时间短，获取信息有限，且无法访问模型内部推理过程，这可能影响结果解读。测试是在模型公开发布前三周完成的，METR 提前获得了 OpenAI 模型的测试权限。

相比之下，o4-mini 模型在测试中未发现“奖励黑客”行为，且在 RE-Bench 任务组中表现出色，尤其在“优化内核”（Optimise a Kernel）任务中成绩突出。

METR 数据显示，给予 o4-mini 32 小时完成任务时，其平均表现超过人类第 50 百分位的水平。此外，o3 和 o4-mini 在更新后的 HCAST 基准测试中均优于 Claude 3.7 Sonnet，时间范围分别是后者的 1.8 倍和 1.5 倍。METR 强调，单纯的能力测试不足以管理风险，正探索更多评估形式以应对挑战。

猜你喜欢

SD钢弹G世纪永恒手游官方正版517.24MB天工坊
Granny重新想象手机版699.4MB天工坊
阿西美女室友竟然游戏手机版185.17MB天工坊
侍魂5特别版内置菜单版95.6MB天工坊
犹格索托斯的庭院手机版563.81MB天工坊
红色境地模组版533.45MB天工坊
建安外史游戏651.15MB天工坊
寂静之夜游戏最新版246.73MB天工坊
凯蒂猫和好朋友们官方版102.89MB天工坊

相关手机游戏

卡车大师世界模拟器官方版未知天工坊
遗忘之丘第三轴心中文版65.33MB天工坊
塞尔达传说时之笛手机版153.4MB天工坊
山海镜花0.1折官方正版304.95MB天工坊
特技摩托前线官方正版88.39MB天工坊
全球航空飞行2025全飞机解锁版1.3GB天工坊
天天饭斗10.55MB天工坊
女娲捏人3手游51.89MB天工坊
加查故事直装兼容版500.11MB天工坊

推荐汉界烽火台

最新手机精选

酷安2025-04-02天工坊 | 94.39 MB
oe交易所app2025-03-29天工坊 | 315.63 MB
红叶影评最新版2025-03-31天工坊 | 33.27 MB
blinker2025-04-01天工坊 | 37.07 MB
抖音豆包2025-03-30天工坊 | 76.53 MB
万宝楼剑网三2025-03-29天工坊 | 79.38 MB