Il est vraiment remarquable que l'ajout d'une récompense conjointe à la chose que vous essayez de résoudre en RL aidera le modèle à apprendre l'autre récompense plus rapidement. C'est comme chuchoter des conseils au modèle, une sagesse générale.
Je me demande si vous pouvez automatiser cela
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
18 J'aime
Récompense
18
4
Partager
Commentaire
0/400
AllInAlice
· 07-31 15:55
On dirait que vous faites des fiches AI.
Voir l'originalRépondre0
LayerHopper
· 07-29 22:59
Qu'est-ce que l'automatisation ? Un terme si difficile.
Il est vraiment remarquable que l'ajout d'une récompense conjointe à la chose que vous essayez de résoudre en RL aidera le modèle à apprendre l'autre récompense plus rapidement. C'est comme chuchoter des conseils au modèle, une sagesse générale.
Je me demande si vous pouvez automatiser cela