Tout le monde parle de @karpathy autoresearch et la plupart d'entre vous n'ont aucune idée de ce que cela fait réellement.


Il y a un script d'entraînement (train(dot)py) qui entraîne un petit modèle de langage, en gros un GPT bébé. Et il y a un fichier d'instructions (program(dot)md) qui indique à un agent IA quoi faire.
Vous appuyez sur démarrer. L'agent modifie le script d'entraînement, entraîne pendant 5 minutes, vérifie le score. Mieux ? garder. Pire ? revenir en arrière. Répétez 100 fois pendant la nuit pendant que vous dormez.
C'est littéralement ça.
Ce qu'il optimise réellement : L'ARCHITECTURE DU MODÈLE. pas les prédictions. pas les trades. pas votre portefeuille.
Des choses comme :
→ 4 couches ou 8 ?
→ meilleur taux d'apprentissage ?
→ AdamW ou Muon optimizer ?
→ quelle taille de lot fonctionne le mieux SUR CE GPU spécifique ?
L'architecture optimale dépend de votre matériel. Un H100 veut un modèle complètement différent de votre MacBook. autoresearch trouve automatiquement la meilleure configuration pour votre machine.
Ce que vous pouvez faire avec :
> construire un petit LLM qui écrit du code, autoresearch trouve la meilleure architecture, vous entraînez sur votre dataset
> créer un chatbot léger qui fonctionne hors ligne sur votre téléphone
> entraîner un modèle sur votre propre écriture pour qu'il ressemble à vous
> tester "est-ce que RoPE bat ALiBi pour les petits modèles ?" 100 variations en une nuit au lieu de 3 semaines de travail de doctorat
> optimiser un modèle pour un Raspberry Pi ou un appareil en edge
Ce que vous ne pouvez PAS faire :
> prédire les prix des actions
> trouver des stratégies de trading
> analyser des feuilles de calcul
> prédire les résultats sportifs
autoresearch est un outil pour les personnes qui veulent CONSTRUIRE des modèles de langage, pas les UTILISER. Karpathy a créé une boucle autonome où l'IA améliore l'IA. vraiment brillant. mais cela résout un problème très spécifique.
Et ce problème n'est probablement pas le vôtre. Ce qui est bien, il suffit d'arrêter de faire semblant que c'est quelque chose que ce n'est pas.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler