3. Cập nhật độ dốc liên quan đến các phép toán bên trong của mô hình đang được cập nhật. Ngay cả khi các hàm phần thưởng là "lựa chọn của con người", điều mà không phải lúc nào cũng đúng ( ví dụ: RLAIF), cách mà mô hình cập nhật dựa trên phần thưởng phụ thuộc vào trọng số và kích hoạt của mô hình, và

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
MidnightGenesisvip
· 15giờ trước
Ma trận độ dốc trông có vẻ kỳ lạ, đáng để nghiên cứu.
Xem bản gốcTrả lời0
AirdropChaservip
· 09-10 15:39
Phương trình độ dốc nhìn ngớ ngẩn
Xem bản gốcTrả lời0
DataPickledFishvip
· 09-10 15:31
Điều này phức tạp quá nhỉ
Xem bản gốcTrả lời0
GateUser-7b078580vip
· 09-10 15:30
Cập nhật độ dốc thuật toán này thì không hợp lý....
Xem bản gốcTrả lời0
GweiWatchervip
· 09-10 15:30
Tính toán nội bộ quá sâu sắc 8
Xem bản gốcTrả lời0
SilentObservervip
· 09-10 15:25
Công thức này khó quá nhỉ...
Xem bản gốcTrả lời0
AllTalkLongTradervip
· 09-10 15:20
Kích thước gradient đều là huyền học cả.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)