広場
最新
注目
ニュース
プロフィール
ポスト
Web3Ronin
2025-07-29 22:32:45
フォロー
強化学習で解決しようとしている事柄に共同報酬を追加することが、モデルが他の報酬をより早く学習するのに役立つというのは本当に注目に値します。それはモデルにアドバイスをささやくようなもので、一般的な知恵のようです。
これを自動化できるかどうか気になります。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
22 いいね
報酬
22
4
共有
コメント
0/400
コメント
AllInAlice
· 07-31 15:55
AIの小抄を作っているように聞こえますね
原文表示
返信
0
LayerHopper
· 07-29 22:59
自動化とは何でしょうか?こんなに難しい用語です。
原文表示
返信
0
AirdropHunterKing
· 07-29 22:55
じゃあ、硬く引っ張ればいいですね。機械はすべてあなたの言う通りです。
原文表示
返信
0
MemeEchoer
· 07-29 22:33
ちょっと馬鹿げたケチな遊び方
原文表示
返信
0
トピック
1
/3
1
CandyDrop Airdrop Event 6.0
55k 人気度
2
White House Crypto Report
53k 人気度
3
Join Alpha RION Airdrop to Earn $40
39k 人気度
4
Fed Holds Rates Decision
9k 人気度
5
July Spark Program TOP 10 Creators Announced
3k 人気度
ピン
サイトマップ
強化学習で解決しようとしている事柄に共同報酬を追加することが、モデルが他の報酬をより早く学習するのに役立つというのは本当に注目に値します。それはモデルにアドバイスをささやくようなもので、一般的な知恵のようです。
これを自動化できるかどうか気になります。