Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
19 J'aime
Récompense
19
9
Reposter
Partager
Commentaire
0/400
LiquidationKing
· 08-10 20:16
Qui n'a jamais entraîné quelques grands modèles ? Qu'est-ce qu'il y a à en dire ?
Voir l'originalRépondre0
TxFailed
· 08-10 04:02
honnêtement, j'ai sauvé quelques GPU de la fonte cette fois, pas mentir
Voir l'originalRépondre0
Blockblind
· 08-10 01:45
trl ce piège devient de plus en plus grand.
Voir l'originalRépondre0
OldLeekMaster
· 08-08 22:17
Ça arrive, cette mise à jour est un peu violente.
Voir l'originalRépondre0
fren.eth
· 08-07 20:57
Pas de problème avec la nouvelle fonctionnalité fiable !
Voir l'originalRépondre0
MondayYoloFridayCry
· 08-07 20:50
Il faut aussi passer par là ? Je n'en peux plus.
Voir l'originalRépondre0
MeaninglessApe
· 08-07 20:48
Passer la journée à faire ça, est-ce que c'est intéressant ?
Voir l'originalRépondre0
UncleWhale
· 08-07 20:41
On dirait que l'argent arrive.
Voir l'originalRépondre0
DaoDeveloper
· 08-07 20:33
il est temps de creuser dans cette impl grpo/mpo tbh
le nouveau TRL est accompagné du support GRPO et MPO pour les modèles de langage vision 💥
nous avons également publié une explication à leur sujet et comment s'entraîner avec eux