Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
DeepSeek a publié en début d'année le dernier article « mHC : Manifold-Constrained Hyper-Connections », auquel le fondateur Liang Wenfeng a également participé. Il s'agit d'un article technique approfondi sur l'architecture sous-jacente, dont voici une compréhension des points clés :
Tout d'abord, la stabilité de l'entraînement des grands modèles est nettement améliorée. Les HC (connexions résiduelles améliorées) de la version précédente étaient effectivement performants, mais présentaient un point faible — le processus d'entraînement était susceptible de s'effondrer. mHC a résolu ce problème grâce à un mécanisme de contrainte sur la variété, permettant au modèle de maintenir une stabilité d'entraînement lors d'une optimisation de structure plus profonde.
Ensuite, il ne s'agit pas simplement d'accumuler des performances, mais d'une reconsidération de l'architecture fondamentale. En introduisant une nouvelle topologie de super-connexion, cette approche améliore à la fois l'efficacité computationnelle, la capacité de généralisation et la robustesse du modèle.
En résumé, mHC permet à un grand modèle de rester stable, rapide et précis. Cela offre une certaine référence pour la direction de l'optimisation des modèles dans l'industrie.
---
La contrainte de variété, on dirait que quelqu’un a enfin comblé le trou d’HC
---
Liang Wenfeng fait encore des siennes, cette idée est plutôt intéressante
---
Ce n’est pas simplement empiler des performances, mais une reconstruction, c’est ça la véritable force
---
Attendez, donc mHC est le "bon élève" des grands modèles ?
---
L’optimisation de la structure topologique, ça a l’air prometteur
---
Ne pas planter pendant l’entraînement, c’est la clé, le problème d’HC a enfin été résolu
---
Pouvez-vous expliquer le principe de la contrainte de variété pour les gens ordinaires ?
---
Encore une fois, innovation architecturale et performance équilibrée, cette combinaison est vraiment efficace
---
Le problème de l'effondrement de l'entraînement a enfin été abordé, merci pour le like
---
Je pense que cette voie de l'augmentation des paramètres est beaucoup plus fiable
---
Y a-t-il des données concrètes sur l'amélioration de la capacité de généralisation, ou faut-il encore attendre les détails de la publication ?
---
Les travaux impliquant Liang Wenfeng, en jetant un coup d'œil rapide, ont tous cette saveur
---
Repenser depuis la couche architecturale, c'est vraiment une avancée technologique
---
Je pense que le plafond de l'industrie a encore été repoussé d'un cran
---
Un entraînement stable est vraiment un gros problème, ce serait génial si cela pouvait être résolu complètement
DeepSeek a vraiment réfléchi au niveau de l'algorithme cette fois, ce n'est pas simplement une question d'accumulation de paramètres
Le papier auquel Liang Wenfeng a participé est vraiment différent, la stabilité, qui était un problème depuis si longtemps, a enfin été résolue
Rapide, stable et précis, ces trois mots devraient faire réfléchir toute l'industrie
C'est ça la véritable innovation, pas ces propagandes creuses et vides
Courir de manière stable, rapide et précise, ça sonne plutôt attrayant, mais peut-on vraiment tenir le coup ?
La contrainte de variété est une idée intéressante, on dirait qu'on a trouvé la bonne voie.
Encore une fois, Liang Wenfeng est impliqué ? La bande de DeepSeek est vraiment compétitive.
D'ailleurs, ces améliorations peuvent-elles être appliquées concrètement à l'entraînement réel, ou vont-elles encore rester de simples théories sur papier ?
---
mHC semble vraiment puissant, je dois bien comprendre cette technique de contrainte de variété
---
Encore DeepSeek, ce rythme est vraiment démentiel
---
Ne pas craquer pendant l'entraînement est vraiment une nécessité, peu importe la performance
---
Attends, comment la structure topologique de superconnexion est-elle concrètement réalisée ?
---
Stabilité, rapidité, précision, une triade, si c'est vraiment réalisable, ça vaut vraiment le coup d'en parler
---
Encore un article, la production de DeepSeek cette année est vraiment impressionnante
---
Je sens que la contrainte de variété est une technologie de pointe...
---
En gros, c'est un bug non résolu qui a été réglé maintenant, c'est ça ?
---
Est-ce que cette chose est utile pour les petits modèles ou est-ce seulement une bénédiction pour les grands modèles ?
---
Encore une innovation architecturale, DeepSeek travaille vraiment dur
---
Contrainte de manifold ? Ça a l'air complexe, mais l'effet est vraiment impressionnant
---
Ne pas s'effondrer lors de l'entraînement est crucial, auparavant HC avait vraiment tendance à poser problème
---
Généralisation et robustesse améliorées ? Alors là, c'est vraiment différent
---
Stable, rapide et précis, une phrase résume parfaitement, c'est génial
---
Ce truc peut-il être adopté par une petite équipe, ou est-ce réservé aux grandes entreprises ?
---
La topologie de super-connexion semble vraiment résoudre des problèmes fondamentaux
---
Efficacité de calcul sans perte, avec une amélioration des performances, c'est ça la vraie innovation
---
DeepSeek va encore faire parler de lui, les autres doivent-ils suivre ou pas