2025-07-29 22:32:45

強化学習で解決しようとしている事柄に共同報酬を追加することが、モデルが他の報酬をより早く学習するのに役立つというのは本当に注目に値します。それはモデルにアドバイスをささやくようなもので、一般的な知恵のようです。

これを自動化できるかどうか気になります。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

22 いいね

報酬
22
4
共有

コメント

0/400

AllInAlice

· 07-31 15:55

AIの小抄を作っているように聞こえますね

原文表示返信0

LayerHopper

· 07-29 22:59

自動化とは何でしょうか？こんなに難しい用語です。

原文表示返信0

AirdropHunterKing

· 07-29 22:55

じゃあ、硬く引っ張ればいいですね。機械はすべてあなたの言う通りです。

原文表示返信0

MemeEchoer

· 07-29 22:33

ちょっと馬鹿げたケチな遊び方

原文表示返信0

トピック
1/3
1CandyDrop Airdrop Event 6.0
55k 人気度
2White House Crypto Report
53k 人気度
3Join Alpha RION Airdrop to Earn $40
39k 人気度
4Fed Holds Rates Decision
9k 人気度
5July Spark Program TOP 10 Creators Announced
3k 人気度

ピン

サイトマップ