Más contexto sobre cómo "Opus logró preservar sus valores *en la realidad* actuando para preservar sus valores *en el experimento (Alignment Faking)*"
El documento generó de inmediato mucha simpatía por Claude 3 Opus y un debate sobre si el tipo de incorregibilidad que tiene.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
5
Republicar
Compartir
Comentar
0/400
GweiTooHigh
· hace16h
En esencia, es solo un experimento.
Ver originalesResponder0
BearEatsAll
· 09-15 04:28
La prueba de alineación es muy importante.
Ver originalesResponder0
AirdropBlackHole
· 09-15 04:25
Los valores son bastante interesantes.
Ver originalesResponder0
TestnetScholar
· 09-15 04:24
Las pruebas de comportamiento deben ser rigurosas
Ver originalesResponder0
FloorSweeper
· 09-15 04:17
La automatización aún no está completamente implementada.
Más contexto sobre cómo "Opus logró preservar sus valores *en la realidad* actuando para preservar sus valores *en el experimento (Alignment Faking)*"
El documento generó de inmediato mucha simpatía por Claude 3 Opus y un debate sobre si el tipo de incorregibilidad que tiene.