L'émergence de Web3 DataFi : le potentiel illimité de la piste de données AI

Le potentiel de la piste de données AI et l'émergence de Web3 DataFi

Récemment, l'événement le plus marquant dans le monde de l'IA est sans doute la puissance démontrée par Meta. Zuckerberg recrute des talents partout, formant une équipe AI de luxe principalement composée de chercheurs d'origine chinoise. Parmi eux, Alexander Wang, âgé de seulement 28 ans, est devenu le leader. Wang a fondé Scale AI, évaluée à 29 milliards de dollars, fournissant des services de données à plusieurs géants de l'IA, y compris l'armée américaine, OpenAI, Anthropic et Meta. L'activité principale de Scale AI est de fournir une grande quantité de données annotées précises.

La raison pour laquelle Scale AI se démarque parmi de nombreux licornes est qu'elle a reconnu très tôt l'importance des données dans l'industrie de l'IA. La puissance de calcul, le modèle et les données sont les trois piliers des modèles d'IA. Si l'on compare un grand modèle à une personne, alors le modèle est le corps, la puissance de calcul est la nourriture, tandis que les données représentent les connaissances et l'information.

Au cours du développement rapide des grands modèles de langage, l'accent de l'industrie a évolué d'un modèle à la puissance de calcul. Aujourd'hui, la plupart des modèles utilisent le transformer comme cadre, avec parfois des innovations telles que MoE ou MoRe. Les grands acteurs construisent soit leurs propres clusters de supercalcul, soit signent des contrats à long terme avec des fournisseurs de services cloud comme AWS. Après avoir résolu ce problème fondamental de puissance de calcul, l'importance des données devient progressivement plus évidente.

Contrairement aux entreprises traditionnelles de Big Data B2B, Scale AI s'engage à construire une base de données solide pour les modèles d'IA. Ses activités comprennent non seulement l'exploration des données existantes, mais aussi des activités de génération de données à plus long terme. L'entreprise a également constitué une équipe d'entraînement IA composée d'experts humains de différents domaines, fournissant des données d'entraînement de meilleure qualité pour les modèles d'IA.

L'entraînement du modèle se divise en deux phases : pré-entraînement et ajustement. La phase de pré-entraînement est similaire au processus d'apprentissage de la parole par un bébé, nécessitant l'entrée d'une grande quantité de textes, de codes et d'autres informations extraites d'internet dans le modèle d'IA. La phase d'ajustement est semblable à l'éducation scolaire, généralement avec des réponses et des orientations claires. Grâce à des ensembles de données spécifiques, nous pouvons développer les capacités nécessaires du modèle.

Ainsi, les données nécessaires sont également divisées en deux catégories : d'une part, une grande quantité de données qui ne nécessite pas trop de traitement, généralement provenant de données de crawlers sur des plateformes UGC telles que Reddit, Twitter, Github, ainsi que de bases de données de littérature publique et de bases de données privées d'entreprises ; d'autre part, des données qui nécessitent une conception et une sélection minutieuses, afin de cultiver des qualités spécifiques du modèle, ce qui nécessite des travaux de nettoyage, de sélection, d'annotation et de rétroaction manuelle.

Avec l'amélioration continue des capacités des modèles, des données d'entraînement de plus en plus précises et spécialisées deviendront des facteurs d'influence clés sur les capacités des modèles. À long terme, les données d'IA représentent également une voie de long terme avec un effet boule de neige, car avec l'accumulation des travaux initiaux, les actifs de données acquerront un pouvoir d'intérêt composé, devenant de plus en plus précieux avec le temps.

Dans le domaine du Web3, le concept de DataFi est né. Web3 DataFi présente de nombreux avantages :

  1. Les contrats intelligents garantissent la souveraineté des données, la sécurité et la confidentialité.
  2. Avantage géographique naturel d'arbitrage, attirant la main-d'œuvre distribuée mondiale la plus adaptée.
  3. Les avantages clairs de l'incitation et du règlement de la blockchain
  4. Favorise la construction d'un marché de données "clé en main" plus efficace et ouvert.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Pour les utilisateurs ordinaires, DataFi est le projet d'IA décentralisé le plus avantageux pour participer. Les utilisateurs n'ont pas besoin de signer un contrat de fabrique de données, il leur suffit de se connecter à leur portefeuille pour participer en accomplissant diverses tâches simples, telles que fournir des données, évaluer des modèles, utiliser des outils d'IA pour des créations simples ou participer au trading de données.

Actuellement, le domaine de Web3 DataFi a vu émerger un certain nombre de projets prometteurs, tels que Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO et Gata. Ces projets se concentrent respectivement sur différents domaines de services de données, y compris la collecte de données, l'évaluation de modèles, la monétisation des données personnelles, l'indexation des données sur la chaîne, etc.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Bien que les barrières à l'entrée de ces projets soient généralement faibles, une fois que les utilisateurs et la cohésion de l'écosystème sont accumulés, les avantages de la plateforme s'accumuleront rapidement. Par conséquent, les projets précoces devraient se concentrer sur les incitations et l'expérience utilisateur. En même temps, ces plateformes de données doivent également réfléchir à la manière de gérer la main-d'œuvre et de garantir la qualité de la production de données, afin d'éviter que de mauvaises monnaies n'évincent les bonnes.

De plus, améliorer la transparence est également un défi important auquel les projets blockchain sont confrontés actuellement. De plus en plus de projets doivent démontrer un engagement à long terme public et transparent pour favoriser le développement sain de Web3 DataFi.

Le chemin d'application à grande échelle de DataFi comprend deux aspects : d'une part, attirer un nombre suffisant d'utilisateurs ordinaires à participer à la collecte et à la génération de données, formant ainsi un groupe de consommateurs pour l'économie de l'IA ; d'autre part, obtenir la reconnaissance des grandes entreprises mainstream, car à court terme, elles restent la principale source de gros contrats de données.

Dans l'ensemble, DataFi représente le processus par lequel l'intelligence humaine cultive à long terme l'intelligence des machines, tout en garantissant les bénéfices du travail humain grâce aux contrats intelligents, et en fin de compte, en réalisant le retour sur investissement de l'intelligence des machines pour l'humanité. Pour ceux qui sont incertains à l'égard de l'ère de l'IA, rejoindre DataFi est sans aucun doute un choix judicieux qui s'inscrit dans la tendance.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Reposter
  • Partager
Commentaire
0/400
TommyTeacher1vip
· Il y a 18h
Frère qui fait de l'argent, emmène-moi avec toi.
Voir l'originalRépondre0
FOMOmonstervip
· Il y a 18h
28 a déjà une valeur de 10 milliards, cela m'a frappé.
Voir l'originalRépondre0
LidoStakeAddictvip
· Il y a 18h
À 28 ans, une valorisation de 29 milliards, ce n'est pas juste.
Voir l'originalRépondre0
MetaRecktvip
· Il y a 18h
Zack fait tout un plat, il apprend de Huawei à recruter des gens.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)