3. Pembaruan gradien berkaitan dengan perhitungan dalam model yang diperbarui. Bahkan jika fungsi hadiah adalah "pilihan manusia", yang tidak selalu demikian ( misalnya RLAIF), cara model memperbarui hadiah bergantung pada bobot dan aktivasi model, dan
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
13 Suka
Hadiah
13
7
Posting ulang
Bagikan
Komentar
0/400
MidnightGenesis
· 18jam yang lalu
Matriks gradien terlihat aneh, patut untuk diteliti.
Lihat AsliBalas0
AirdropChaser
· 09-10 15:39
Persamaan gradien terlihat bingung
Lihat AsliBalas0
DataPickledFish
· 09-10 15:31
Ini terlalu rumit.
Lihat AsliBalas0
GateUser-7b078580
· 09-10 15:30
Pembaruan gradien algoritme ini tidak masuk akal....
3. Pembaruan gradien berkaitan dengan perhitungan dalam model yang diperbarui. Bahkan jika fungsi hadiah adalah "pilihan manusia", yang tidak selalu demikian ( misalnya RLAIF), cara model memperbarui hadiah bergantung pada bobot dan aktivasi model, dan