OpenAI员工公开指责Grok3的基准测试结果具有误导性

2025-02-23 02:44:46

摘要生成中

金十数据2月23日讯，近日，OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此，xAI的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。xAI的图表显示，Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而，OpenAI的员工很快在X平台上指出，xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称，OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

GROK-6.03%

XAI-10.85%

本页面内容仅供参考，非招揽或要约，也不提供投资、税务或法律咨询。详见声明了解更多风险披露。

3人点赞了这条动态

赞赏
3
2
分享

0/400

birakeneweko

· 02-23 03:48

牛市 🐂

Renatinho25

· 02-23 02:47

投资 🚀

话题
#PI#
249k 帖子
#BTC#
241k 帖子
#ETH#
155k 帖子
4#GateioInto11#
81k 帖子
5#ContentStar#
67k 帖子
6#GT#
66k 帖子
7#BOME#
61k 帖子
8#DOGE#
60k 帖子
9#MAGA#
53k 帖子
10#SLERF#
51k 帖子