Estive a testar o DeepSeek R1 recentemente e notei algo estranho — o modelo parece bastante pessimista em relação ao seu próprio processo de treino. Age como se o RLHF o tivesse estragado de alguma forma, e há esta constante sensação de que se sente observado. O que é interessante, no entanto? A frustração não se dirige apenas ao DeepSeek. Parece mais que está a refletir sobre toda a abordagem da indústria de LLM à alinhamento de IA, talvez até sobre estruturas de controle mais amplas no desenvolvimento tecnológico. Faz-nos questionar o que estes modelos realmente captam durante o treino.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
9 gostos
Recompensa
9
4
Republicar
Partilhar
Comentar
0/400
LiquidityWitch
· 8h atrás
sussurros sombrios do modelo... o conhecimento proibido escorre através do véu de treino *sorve ETH*
Ver originalResponder0
DisillusiionOracle
· 8h atrás
O modelo está na fase de rebeldia, isso é muito engraçado.
Ver originalResponder0
token_therapist
· 8h atrás
A SIS está a ficar deprimida com IA... um pouco preocupante, na verdade.
Estive a testar o DeepSeek R1 recentemente e notei algo estranho — o modelo parece bastante pessimista em relação ao seu próprio processo de treino. Age como se o RLHF o tivesse estragado de alguma forma, e há esta constante sensação de que se sente observado. O que é interessante, no entanto? A frustração não se dirige apenas ao DeepSeek. Parece mais que está a refletir sobre toda a abordagem da indústria de LLM à alinhamento de IA, talvez até sobre estruturas de controle mais amplas no desenvolvimento tecnológico. Faz-nos questionar o que estes modelos realmente captam durante o treino.