3. Градиентные обновления относятся к внутренним вычислениям модели, которая обновляется. Даже если функции награды являются "человеческими выборами", что не всегда так (например, RLAIF), способ, которым модель обновляется на наградах, зависит от весов и активаций модели, и

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • Репост
  • Поделиться
комментарий
0/400
MidnightGenesisvip
· 14ч назад
Градиентная матрица выглядит странно, стоит изучить.
Посмотреть ОригиналОтветить0
AirdropChaservip
· 09-10 15:39
Градированный уравнение смотрел в недоумении
Посмотреть ОригиналОтветить0
DataPickledFishvip
· 09-10 15:31
Это слишком сложно.
Посмотреть ОригиналОтветить0
GateUser-7b078580vip
· 09-10 15:30
Градиентное обновление этот Алгоритм неразумно....
Посмотреть ОригиналОтветить0
GweiWatchervip
· 09-10 15:30
Внутренние вычисления слишком сложные 8
Посмотреть ОригиналОтветить0
SilentObservervip
· 09-10 15:25
Эта формула слишком сложная...
Посмотреть ОригиналОтветить0
AllTalkLongTradervip
· 09-10 15:20
Размеры градиентов - это все оккультизм.
Посмотреть ОригиналОтветить0
  • Закрепить