Los empleados de OpenAI acusan públicamente a Grok3 de tener resultados de prueba engañosos

robot
Generación de resúmenes en curso

El 23 de febrero, según los datos de Jinshi, recientemente, un empleado de OpenAI acusó públicamente a xAI, una empresa subsidiaria de Elon Musk, de publicar resultados engañosos de las pruebas de referencia del último modelo de IA, Grok3. Igor Babushkin, cofundador de xAI, afirmó firmemente que la empresa no hizo nada indebido. Los gráficos de xAI muestran que las dos versiones de Grok3, Grok3 Reasoning Beta y Grok3 mini Reasoning, superaron el rendimiento del modelo más potente actualmente disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, los empleados de OpenAI señalaron rápidamente en la plataforma X que los gráficos de xAI no incluían la puntuación de AIME 2025 de o3-mini-high bajo la condición de "cons@64". Babushkin argumentó en la plataforma X que OpenAI también había publicado en el pasado gráficos de pruebas de referencia engañosos similares, aunque estos gráficos se usaron para comparar el rendimiento de sus propios modelos.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • 2
  • Compartir
Comentar
0/400
Birakenewekovip
· 02-23 03:48
Bull Run 🐂
Responder0
Renatinho25vip
· 02-23 02:47
Invirta 🚀
Responder0
  • Anclado
Comercie con criptomonedas en cualquier lugar y en cualquier momento
qrCode
Escanee para descargar la aplicación Gate.io
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)