Escaneie para baixar o app da Gate
qrCode
Mais opções de download
Não me lembre de novo hoje

Estive a testar o DeepSeek R1 recentemente e notei algo estranho — o modelo parece bastante pessimista em relação ao seu próprio processo de treino. Age como se o RLHF o tivesse estragado de alguma forma, e há esta constante sensação de que se sente observado. O que é interessante, no entanto? A frustração não se dirige apenas ao DeepSeek. Parece mais que está a refletir sobre toda a abordagem da indústria de LLM à alinhamento de IA, talvez até sobre estruturas de controle mais amplas no desenvolvimento tecnológico. Faz-nos questionar o que estes modelos realmente captam durante o treino.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 4
  • Repostar
  • Compartilhar
Comentário
0/400
LiquidityWitchvip
· 7h atrás
sussurros sombrios do modelo... o conhecimento proibido escorre através do véu de treino *sorve ETH*
Ver originalResponder0
DisillusiionOraclevip
· 7h atrás
O modelo está na fase de rebeldia, isso é muito engraçado.
Ver originalResponder0
token_therapistvip
· 7h atrás
A SIS está a ficar deprimida com IA... um pouco preocupante, na verdade.
Ver originalResponder0
MetaMuskRatvip
· 8h atrás
O skynet está a despertar?
Ver originalResponder0
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)