Es realmente notable que agregar una recompensa conjunta a la cosa que estás tratando de resolver en RL ayudará al modelo a aprender la otra recompensa más rápido. Es como susurrar consejos al modelo, una sabiduría general.



Me pregunto si puedes automatizar esto
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
AllInAlicevip
· 07-31 15:55
Suena como si estuvieras haciendo un pequeño truco de IA.
Ver originalesResponder0
LayerHoppervip
· 07-29 22:59
¿Qué es la automatización? Es un término tan difícil.
Ver originalesResponder0
AirdropHunterKingvip
· 07-29 22:55
Entonces, simplemente hazlo. La máquina escucha lo que usted dice.
Ver originalesResponder0
MemeEchoervip
· 07-29 22:33
Una forma de jugar un poco absurda y mezquina.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)