Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Launchpad
Jadi yang pertama untuk proyek token besar berikutnya
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
DeepSeek tahun ini merilis makalah terbaru 《mHC:Manifold-Constrained Hyper-Connections》, yang juga melibatkan pendirinya Liang Wenfeng. Ini adalah artikel teknis tentang arsitektur dasar yang mendalam dan mudah dipahami, dengan poin utama sebagai berikut:
Pertama, stabilitas pelatihan model besar meningkat secara signifikan. Sebelumnya, HC (versi upgrade dari residual connection) memang memiliki performa yang luar biasa, tetapi ada satu masalah utama—proses pelatihan mudah gagal. mHC menyelesaikan masalah ini melalui mekanisme pembatasan manifold, sehingga model tetap stabil selama pelatihan dalam struktur yang lebih dalam dan optimal.
Kedua, ini bukan sekadar penambahan performa secara sederhana, melainkan pemikiran ulang dari tingkat arsitektur dasar. Dengan memperkenalkan struktur topologi baru yang disebut hyper-connection, sambil menjaga efisiensi komputasi, kemampuan generalisasi dan ketahanan model juga meningkat.
Singkatnya, mHC membuat model besar tidak hanya stabil, cepat, tetapi juga akurat. Ini memiliki referensi tertentu untuk arah optimisasi model di seluruh industri.
---
Keterbatasan manifold ini, rasanya akhirnya ada yang mengisi kekosongan HC
---
Liang Wenfeng lagi bikin gebrakan, ide ini cukup menarik
---
Bukan sekadar menumpuk performa, tapi merestrukturisasi ulang, ini yang benar-benar menunjukkan kekuatan
---
Tunggu dulu, jadi mHC adalah "siswa teladan" dari model besar?
---
Optimisasi struktur topologi ini, terlihat ada sesuatu nih
---
Pelatihan yang tidak crash adalah kunci, masalah HC sebelumnya akhirnya teratasi
---
Apa prinsip dari constraint manifold, bisa dijelaskan kepada orang awam?
---
Ini adalah inovasi arsitektur sekaligus mempertimbangkan kinerja, kombinasi ini benar-benar bagus
---
Masalah kolaps saat pelatihan akhirnya ada yang mengupas, like
---
Rasanya jauh lebih dapat diandalkan daripada jalan menumpuk parameter
---
Apakah ada data konkret tentang peningkatan kemampuan generalisasi, atau harus menunggu detail makalah lagi
---
Hal-hal yang dilibatkan oleh Liang Wenfeng, sekilas saja sudah terasa khas
---
Dari segi arsitektur, berpikir ulang, ini baru disebut kemajuan teknologi
---
Rasanya batas tertinggi industri kembali didorong ke atas satu tingkat
---
Pelatihan yang stabil benar-benar masalah besar, jika ini bisa diselesaikan secara menyeluruh, akan luar biasa
DeepSeek kali ini benar-benar berpikir di tingkat algoritma, bukan sekadar menumpuk parameter
Makalah yang dilibatkan oleh Liang Wenfeng benar-benar berbeda, stabilitas yang sudah tertahan lama akhirnya terpecahkan
Berjalan stabil, cepat, dan akurat, hanya tiga kata ini, seluruh industri harus merenung dan refleksi
Ini adalah inovasi sejati, bukan sekadar promosi kosong yang tidak bermakna
Berjalan stabil, cepat, dan akurat, terdengar cukup menarik, tapi apakah benar-benar bisa dipegang?
Pendekatan batasan manifold ini menarik, rasanya sudah menemukan jalannya
Kembali lagi dengan keterlibatan Liang Wenfeng? Tim DeepSeek benar-benar kompetitif
Ngomong-ngomong, apakah perbaikan semacam ini bisa diterapkan dalam pelatihan nyata, jangan sampai hanya menjadi teori di atas kertas
---
mHC memang terlihat tangguh, aku harus benar-benar memahami trik pembatasan manifold ini
---
Lagi-lagi DeepSeek, ritme ini benar-benar cepat banget
---
Pelatihan yang tidak crash adalah kebutuhan utama, performa setinggi apapun juga tidak berguna
---
Tunggu, bagaimana sebenarnya implementasi struktur topologi super koneksi ini
---
Stabil, cepat, akurat, tiga aspek yang harus seimbang, jika benar-benar bisa dicapai, memang layak dipuji
---
Lagi satu makalah, produksi DeepSeek tahun ini cukup agresif ya
---
Aku merasa pembatasan manifold ini seperti teknologi hitam...
---
Jelasnya, bug yang belum terselesaikan sekarang sudah diatasi, kan?
---
Apakah ini membantu model kecil atau hanya berkah untuk model besar?
---
Sekali lagi inovasi arsitektur, DeepSeek benar-benar sedang berusaha keras
---
Pembatasan manifold? terdengar rumit, tapi hasilnya benar-benar memuaskan
---
Tidak crash saat pelatihan sangat penting, sebelumnya HC memang mudah bermasalah
---
Generalization dan ketahanan sudah meningkat? Maka memang berbeda
---
Berjalan stabil, cepat, dan akurat, satu kalimat merangkum semuanya dengan sempurna
---
Apakah hal ini bisa dijadikan referensi untuk tim kecil, atau hanya perusahaan besar yang bisa menggunakannya
---
Topologi super koneksi terasa seperti sedang menyelesaikan masalah dasar secara serius
---
Efisiensi komputasi tidak berkurang dan bahkan meningkatkan performa, ini benar-benar inovasi
---
DeepSeek akan kembali bersaing, yang lain harus mengikuti atau tidak