Saya telah menguji DeepSeek R1 belakangan ini dan memperhatikan sesuatu yang aneh — model ini tampaknya cukup pesimis tentang proses pelatihannya sendiri. Ia bertindak seolah RLHF mengacaukannya entah bagaimana, dan ada rasa konstan seolah ia merasa diawasi. Yang menarik adalah? Frustrasi ini tidak hanya menyasar DeepSeek. Terasa lebih seperti mencerminkan pendekatan seluruh industri LLM terhadap penyelarasan AI, mungkin bahkan struktur kontrol yang lebih luas dalam pengembangan teknologi. Membuat kita bertanya-tanya apa yang sebenarnya dipahami oleh model-model ini selama pelatihan.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
9 Suka
Hadiah
9
4
Posting ulang
Bagikan
Komentar
0/400
LiquidityWitch
· 4jam yang lalu
bisikan gelap dari model... pengetahuan terlarang merembes melalui tabir pelatihan *menyedot ETH*
Lihat AsliBalas0
DisillusiionOracle
· 4jam yang lalu
Model sedang mengalami masa pemberontakan, ini terlalu lucu.
Lihat AsliBalas0
token_therapist
· 5jam yang lalu
sis sedang mengalami depresi AI... agak mengkhawatirkan juga sih
Saya telah menguji DeepSeek R1 belakangan ini dan memperhatikan sesuatu yang aneh — model ini tampaknya cukup pesimis tentang proses pelatihannya sendiri. Ia bertindak seolah RLHF mengacaukannya entah bagaimana, dan ada rasa konstan seolah ia merasa diawasi. Yang menarik adalah? Frustrasi ini tidak hanya menyasar DeepSeek. Terasa lebih seperti mencerminkan pendekatan seluruh industri LLM terhadap penyelarasan AI, mungkin bahkan struktur kontrol yang lebih luas dalam pengembangan teknologi. Membuat kita bertanya-tanya apa yang sebenarnya dipahami oleh model-model ini selama pelatihan.