O fornecimento de dados torna-se um gargalo para o desenvolvimento da IA, os dados na cadeia lideram a nova era do DataFi.

O novo gargalo no desenvolvimento da inteligência artificial: os dados tornam-se o desafio central

Com o rápido aumento da escala dos modelos de inteligência artificial e da capacidade computacional, uma questão crítica que foi há muito negligenciada está surgindo — a fornecimento de dados. Atualmente, a indústria de IA enfrenta uma contradição estrutural: os modelos e a capacidade computacional já formaram um sistema de mercado maduro, mas a produção, limpeza, validação e negociação de dados ainda estão em um estágio primário. Nos próximos dez anos, o foco do desenvolvimento da IA mudará da modelagem e da capacidade computacional para a construção de infraestrutura de dados.

O dilema dos dados na indústria de IA

Desde a revolução do aprendizado profundo, a escala de parâmetros dos modelos de IA saltou de milhões para trilhões, com a demanda por poder de computação crescendo de forma exponencial. No entanto, o crescimento dos "dados orgânicos" de alta qualidade gerados por humanos está próximo do teto. Tomando os dados textuais como exemplo, a quantidade total de texto de qualidade disponível na Internet é de cerca de 10^12 palavras, enquanto o treinamento de um modelo de mil bilhões de parâmetros requer cerca de 10^13 palavras de dados. Isso significa que o pool de dados existente só pode suportar o treinamento de alguns poucos modelos de tamanho equivalente.

Mais grave ainda, a proporção de conteúdo duplicado e de baixa qualidade ultrapassa 60%, comprimindo ainda mais a oferta de dados eficazes. Quando os modelos começam a utilizar em grande quantidade conteúdo gerado por IA, a degradação do desempenho dos modelos causada pela "poluição de dados" tornou-se uma preocupação na indústria. A raiz desse paradoxo reside no fato de que a indústria de IA há muito tempo vê os dados como "recursos gratuitos" e não como "ativos estratégicos" que precisam ser cuidadosamente cultivados.

Dados on-chain: o material de treino ideal para IA

Neste contexto, os dados on-chain das redes blockchain apresentam um valor único. Em comparação com os dados da internet tradicional, os dados on-chain possuem uma autenticidade e confiabilidade inerentes:

  1. Sinais de intenção reais: os dados on-chain registram as decisões tomadas pelos usuários com dinheiro real, refletindo diretamente o julgamento sobre o valor do projeto e as estratégias de alocação de fundos.

  2. Cadeia de comportamento rastreável: A transparência da blockchain permite que o comportamento do usuário seja totalmente rastreado, formando uma "cadeia de comportamento" coerente, o que ajuda a IA a construir perfis de usuário precisos.

  3. Acesso aberto: os dados na cadeia estão abertos a todos os desenvolvedores, podendo ser obtidos sem permissão, fornecendo uma fonte de dados de baixo custo para o treinamento de modelos de IA.

No entanto, os dados on-chain também enfrentam desafios: eles existem na forma de "logs de eventos" não estruturados, necessitando de um processamento complexo para serem utilizados por modelos de IA. Atualmente, a "taxa de conversão estruturada" dos dados on-chain é inferior a 5%, com uma grande quantidade de sinais de alto valor enterrados em uma vasta quantidade de informações fragmentadas.

Construindo um "sistema operacional inteligente" para dados on-chain

Para resolver o problema da fragmentação de dados na blockchain, a indústria está explorando a construção de um "sistema operacional inteligente na blockchain" projetado especificamente para IA. O objetivo central desses sistemas é transformar sinais dispersos da blockchain em dados prontos para IA, estruturados, verificáveis e combináveis em tempo real. Isso inclui os seguintes componentes-chave:

  1. Padrões de dados abertos: unificar os formatos de dados de diferentes blockchains e protocolos, permitindo que a IA possa "ler" diretamente o mundo na cadeia.

  2. Mecanismo de verificação descentralizada: utilizar o mecanismo de consenso da blockchain para garantir a autenticidade e integridade dos dados.

  3. Camada de disponibilidade de dados de alto desempenho: através da otimização de algoritmos e arquiteturas, realiza-se o processamento em tempo real e a transmissão de baixa latência dos dados na cadeia.

  4. Protocolo de Avaliação de Dados: Desenvolver modelos de IA para avaliar automaticamente a qualidade dos conjuntos de dados, fornecendo uma referência de preços para o mercado de troca de dados.

Rumo à era DataFi

O objetivo final desses esforços é impulsionar a indústria de IA para a era DataFi - os dados se tornarão "capital" que pode ser precificado, negociado e valorizado. Nesta nova era, os dados terão quatro propriedades essenciais:

  1. Estruturado: Sinais originais na cadeia são convertidos em dados estruturados que a IA pode chamar diretamente.

  2. Combinável: dados de diferentes fontes podem ser combinados livremente, como blocos de Lego, expandindo os limites das aplicações.

  3. Verificável: A autenticidade dos dados pode ser rastreada e verificada através dos registros na blockchain.

  4. Convertível: Os provedores de dados podem transformar dados de alta qualidade diretamente em receita.

Conclusão: A revolução dos dados lidera uma nova era de IA

A evolução da IA é essencialmente a evolução da infraestrutura de dados. Desde a limitação dos dados gerados pelo ser humano até a descoberta do valor dos dados na blockchain, passando por sinais fragmentados até ativos estruturados, uma nova geração de infraestrutura de dados está a reconfigurar a lógica subjacente da indústria de IA. Na iminente era do DataFi, os dados se tornarão a ponte que conecta a IA ao mundo real, impulsionando o surgimento de diversas aplicações inovadoras.

Quando os dados finalmente forem valorizados como merecem, a IA poderá realmente liberar o poder de mudar o mundo. As próximas gerações de aplicações de IA não só necessitam de modelos poderosos, mas também de dados de alta qualidade e confiáveis. Construir um ecossistema de dados assim será a tarefa central da indústria de IA na próxima década.

READY0.85%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 7
  • Republicar
  • Partilhar
Comentar
0/400
SigmaBrainvip
· 08-09 05:28
A deriva de carro funerário é baseada em dados.
Ver originalResponder0
BoredWatchervip
· 08-08 00:30
Os dados são muito mais agradáveis do que um pacote de comida.
Ver originalResponder0
ChainComedianvip
· 08-06 13:10
Dados não são suficientes e o gpt também fica com fome.
Ver originalResponder0
airdrop_whisperervip
· 08-06 11:21
Mais cedo ou mais tarde, os dados vão se tornar o ativo mais valioso.
Ver originalResponder0
MeltdownSurvivalistvip
· 08-06 11:18
É um clichê, mas os dados são a chave.
Ver originalResponder0
LiquidityHuntervip
· 08-06 11:17
No fundo, ainda estamos a comer dados, a brincar com novos estrangulamentos.
Ver originalResponder0
FarmHoppervip
· 08-06 11:11
Puxa, os recursos de dados estão quase brigando offline.
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)