Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
DeepSeek năm mới đã phát hành bài báo mới nhất 《mHC:Manifold-Constrained Hyper-Connections》, sáng lập viên Liang Wenfeng cũng tham gia. Đây là một bài viết kỹ thuật về kiến trúc nền tảng sâu sắc, điểm nổi bật chính như sau:
Trước tiên, độ ổn định của huấn luyện mô hình lớn được nâng cao rõ rệt. Trước đây, HC (kết nối residual nâng cấp) có hiệu suất thực sự ấn tượng, nhưng tồn tại một điểm đau — quá trình huấn luyện dễ bị sập, mHC giải quyết vấn đề này bằng cơ chế ràng buộc đa dạng hình học, giúp mô hình duy trì ổn định trong tối ưu hóa cấu trúc sâu hơn.
Thứ hai, đây không chỉ là sự tích tụ hiệu suất đơn thuần, mà là suy nghĩ lại từ cấp độ kiến trúc nền tảng. Bằng cách giới thiệu cấu trúc topo mới của siêu kết nối, đồng thời duy trì hiệu quả tính toán, khả năng tổng quát và độ bền của mô hình đều được nâng cao.
Nói đơn giản, mHC chính là giúp mô hình lớn vừa chạy ổn định, vừa chạy nhanh, vừa chính xác. Điều này có ý nghĩa tham khảo nhất định cho hướng tối ưu hóa mô hình của toàn ngành.
---
Hệ thống ràng buộc manifold, cảm giác cuối cùng cũng có người điền vào chỗ trống của HC
---
Liang Wenfeng lại đang làm chuyện này, ý tưởng này có chút thú vị
---
Không phải là xếp chồng hiệu năng, mà là tái cấu trúc, đó mới là thực lực cứng
---
Chờ đã, nói như vậy mHC chính là "học sinh giỏi ba tốt" của mô hình lớn?
---
Trong tối ưu hóa cấu trúc topo, trông có vẻ có chút gì đó
---
Huấn luyện không bị sụp đổ mới là con đường đúng, vấn đề của HC trước đó cuối cùng cũng đã được giải quyết
---
Nguyên lý của hạn chế đa dạng hình dạng, có thể giải thích cho người bình thường không?
---
Vừa đổi mới kiến trúc, vừa cân nhắc hiệu suất, bộ combo này thực sự chơi tốt
---
Vấn đề sụp đổ trong huấn luyện cuối cùng cũng có người giải quyết, thích!
---
Cảm giác đây còn đáng tin cậy hơn việc tăng cường tham số
---
Có dữ liệu cụ thể về việc nâng cao khả năng tổng quát không, hay lại phải chờ chi tiết của bài báo?
---
Những thứ do Lương Văn Phong tham gia, nhìn sơ qua cũng có cảm giác đặc biệt
---
Từ góc độ kiến trúc, suy nghĩ lại, đó mới gọi là tiến bộ công nghệ
---
Cảm giác giới trong ngành lại đẩy giới hạn lên một tầm cao mới
---
Huấn luyện ổn định thật sự là vấn đề lớn, nếu có thể giải quyết triệt để thì quá tuyệt vời
DeepSeek lần này thực sự đã nghĩ đến thuật toán, không chỉ đơn thuần là tăng tham số
Bài báo có sự tham gia của Liang Wenfeng thật sự khác biệt, về mặt ổn định đã mất bao lâu cuối cùng cũng phá vỡ được
Chạy ổn định nhanh chính xác, chỉ cần ba từ này, toàn ngành nên tự kiểm điểm lại
Đây mới là đổi mới thực sự, không phải những lời tuyên truyền sáo rỗng đó
Chạy ổn định, chạy nhanh, chạy chính xác, nghe có vẻ hấp dẫn, nhưng thực sự có thể giữ vững không?
Ý tưởng về ràng buộc đa dạng hình học rất thú vị, cảm giác đã tìm ra hướng đi
Lại là Lương Văn Phong tham gia? Đám người DeepSeek thật sự rất cạnh tranh
Nói về việc cải tiến này có thể áp dụng vào thực tế huấn luyện không, đừng lại thành lý thuyết suông trên giấy tờ nữa
---
mHC trông thực sự tàn nhẫn, và tôi phải hiểu thủ thuật ràng buộc đa dạng
---
Lại là DeepSeek, nhịp điệu này thực sự nhanh một cách lố bịch
---
Đào tạo là thực sự cần thiết, cho dù hiệu suất có mạnh đến đâu
---
Chờ đã, cấu trúc liên kết siêu kết nối được thực hiện cụ thể như thế nào?
---
Ổn định, nhanh chóng và gần như ba ngôi, nếu bạn thực sự có thể làm điều đó, nó thực sự đáng để khoe khoang
---
Một bài báo khác, sản lượng của DeepSeek năm nay hơi khốc liệt
---
Làm thế nào để các ràng buộc đa dạng giống như một công nghệ đen...
---
Nói một cách thẳng thắn, lỗi chưa được giải quyết bây giờ đã được giải quyết
---
Điều này có hữu ích cho các mô hình nhỏ hay nó chỉ là tin tốt cho các mô hình lớn?
---
Lại là đổi mới kiến trúc, DeepSeek thực sự đang nỗ lực
---
Hạn chế hình dạng? Nghe có vẻ cao siêu, nhưng hiệu quả thật sự rất tuyệt
---
Không bị sụp đổ trong quá trình huấn luyện là điểm cực kỳ quan trọng, trước đây HC thực sự dễ gặp vấn đề
---
Phạm vi tổng quát và khả năng chống chịu đều được nâng cao? Thật sự khác biệt rồi
---
Chạy ổn định, chạy nhanh, chính xác, một câu tổng kết thật tuyệt vời ha
---
Điều này có thể tham khảo cho nhóm nhỏ không, hay chỉ các tập đoàn lớn mới dùng được
---
Về mặt kết nối siêu liên kết, cảm giác như đang thực sự giải quyết vấn đề nền tảng
---
Hiệu quả tính toán không giảm mà còn nâng cao hiệu suất, đây mới là đổi mới thực sự
---
DeepSeek lại chuẩn bị cạnh tranh rồi, các hãng khác có theo kịp không