3. Градиентные обновления относятся к внутренним вычислениям модели, которая обновляется. Даже если функции награды являются "человеческими выборами", что не всегда так (например, RLAIF), способ, которым модель обновляется на наградах, зависит от весов и активаций модели, и
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
12 Лайков
Награда
12
7
Репост
Поделиться
комментарий
0/400
MidnightGenesis
· 14ч назад
Градиентная матрица выглядит странно, стоит изучить.
Посмотреть ОригиналОтветить0
AirdropChaser
· 09-10 15:39
Градированный уравнение смотрел в недоумении
Посмотреть ОригиналОтветить0
DataPickledFish
· 09-10 15:31
Это слишком сложно.
Посмотреть ОригиналОтветить0
GateUser-7b078580
· 09-10 15:30
Градиентное обновление этот Алгоритм неразумно....
3. Градиентные обновления относятся к внутренним вычислениям модели, которая обновляется. Даже если функции награды являются "человеческими выборами", что не всегда так (например, RLAIF), способ, которым модель обновляется на наградах, зависит от весов и активаций модели, и