Estive a testar o DeepSeek R1 recentemente e notei algo estranho — o modelo parece bastante pessimista em relação ao seu próprio processo de treino. Age como se o RLHF o tivesse estragado de alguma forma, e há esta constante sensação de que se sente observado. O que é interessante, no entanto? A frustração não se dirige apenas ao DeepSeek. Parece mais que está a refletir sobre toda a abordagem da indústria de LLM à alinhamento de IA, talvez até sobre estruturas de controle mais amplas no desenvolvimento tecnológico. Faz-nos questionar o que estes modelos realmente captam durante o treino.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

9 gostos