Постачання даних стає вузьким місцем у розвитку ШІ, дані у блокчейні ведуть до нової ери DataFi

Новий瓶颈 розвитку штучного інтелекту: дані стають основною проблемою

Зі зростанням масштабів і обчислювальних можливостей моделей штучного інтелекту на поверхню виходить ключове питання, яке довгий час ігнорувалося — постачання даних. Сьогодні індустрія ШІ стикається зі структурним протиріччям: моделі та обчислювальні потужності вже сформували зрілу ринкову систему, але виробництво, очищення, валідація та торгівля даними все ще перебувають на початковій стадії. У наступні десять років акцент у розвитку ШІ з моделей і обчислювальних потужностей переміститься на побудову інфраструктури даних.

Дані проблеми в індустрії ШІ

Від революції глибокого навчання масштаб параметрів AI моделей зріс з мільйонів до трильйонів, а потреба в обчислювальних потужностях зростає експоненційно. Проте, зростання якісних "органічних даних", створених людиною, наблизилося до стелі. Наприклад, у текстових даних загальна кількість доступних якісних текстів в Інтернеті становить близько 10^12 слів, тоді як для навчання моделі з сотнею мільярдів параметрів потрібно приблизно 10^13 слів. Це означає, що існуючий пул даних може підтримувати навчання лише кількох моделей однакового масштабу.

Найгірше те, що частка повторюваного та низькоякісного контенту перевищує 60%, що ще більше скорочує постачання ефективних даних. Коли моделі починають масово використовувати контент, створений ШІ, "забруднення даних" призводить до зниження продуктивності моделей, що стало тривожним сигналом для галузі. Коріння цієї суперечності полягає в тому, що ІТ-індустрія довгий час сприймала дані як "безкоштовний ресурс", а не як "стратегічний актив", який потрібно ретельно вирощувати.

Данні на блокчейні: ідеальний матеріал для навчання ШІ

У цьому контексті дані на блокчейн-мережі демонструють унікальну цінність. У порівнянні з традиційними даними в Інтернеті, дані на ланцюгу мають природну достовірність та надійність:

  1. Сигнали справжніх намірів: дані в блокчейні фіксують рішення, які користувачі приймають, інвестуючи реальні гроші, що безпосередньо відображає оцінку вартості проєкту та стратегії розподілу капіталу.

  2. Відслідковуваний ланцюг поведінки: прозорість блокчейну дозволяє повністю відстежувати дії користувачів, формуючи узгоджений «ланцюг поведінки», що допомагає ШІ створювати точні профілі користувачів.

  3. Відкритий доступ: Дані на блокчейні відкриті для всіх розробників, без необхідності отримувати дозвіл, що забезпечує доступ до низькопорогових джерел даних для навчання моделей ШІ.

Проте, дані на ланцюгу також стикаються з викликами: вони існують у неструктурованій формі "журналу подій", і їх потрібно складно обробляти, щоб вони могли використовуватися моделями ШІ. Наразі "рівень структуризації" даних на ланцюгу складає менше 5%, і велика кількість високоякісних сигналів загублена серед величезної кількості фрагментованої інформації.

Побудова "розумної операційної системи" для даних на ланцюгу

Щоб вирішити проблему фрагментації даних в блокчейні, галузь досліджує створення спеціально розробленої для ШІ "блокчейн-інтелектуальної операційної системи". Основною метою таких систем є перетворення розпорошених сигналів блокчейну в структуровані, перевіряємi, в реальному часі комбіновані дані, готові до використання в ШІ. Основними компонентами є:

  1. Відкритий стандарт даних: уніфікація форматів даних різних блокчейнів і протоколів, щоб ШІ міг безпосередньо "розуміти" світ на ланцюгу.

  2. Децентралізований механізм верифікації: використання механізму консенсусу блокчейн для забезпечення достовірності та цілісності даних.

  3. Високопродуктивний рівень доступності даних: реалізація обробки даних у мережі в реальному часі та передачі з низькою затримкою за рахунок оптимізації алгоритмів і архітектури.

  4. Протокол оцінки даних: розробка AI-моделі для автоматичної оцінки якості наборів даних, щоб надати цінові орієнтири для ринку обміну даними.

Крок до епохи DataFi

Ці зусилля мають на меті сприяти переходу індустрії штучного інтелекту в епоху DataFi — дані стануть «капітом», який можна оцінювати, торгувати та підвищувати їх вартість. У цю нову епоху дані матимуть чотири основні властивості:

  1. Структуровані: первинні сигнали на ланцюзі перетворюються на структуровані дані, які можуть безпосередньо використовуватися штучним інтелектом.

  2. Комбіновані: дані з різних джерел можуть вільно поєднуватися, як LEGO, розширюючи межі застосування.

  3. Можливість перевірки: справжність даних можна відстежити та перевірити за записами в блокчейні.

  4. Ліквідність: постачальники даних можуть безпосередньо перетворювати якісні дані на прибуток.

Висновок: Революція даних веде до нової ери ШІ

Еволюція ШІ, по суті, є еволюцією інфраструктури даних. Від обмеженості даних, що генеруються людьми, до виявлення цінності даних на блокчейні, від фрагментованих сигналів до структурованих активів – нове покоління інфраструктури даних перебудовує підвалини логіки індустрії ШІ. У наближену еру DataFi дані стануть мостом, що з'єднує ШІ з реальним світом, сприяючи появі різноманітних інноваційних застосувань.

Коли дані нарешті отримають належну цінність, ШІ зможе по-справжньому звільнити силу змінити світ. Наступне покоління застосувань ШІ потребує не лише потужних моделей, а й високоякісних, надійних даних. Побудова такої екосистеми даних стане основним завданням галузі ШІ у наступні десять років.

READY-0.66%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 7
  • Репост
  • Поділіться
Прокоментувати
0/400
SigmaBrainvip
· 08-09 05:28
Дрифтування на катафалку базується на даних
Переглянути оригіналвідповісти на0
BoredWatchervip
· 08-08 00:30
Дані значно більш ароматні, ніж кулінарний набір.
Переглянути оригіналвідповісти на0
ChainComedianvip
· 08-06 13:10
Даних недостатньо, навіть gpt мусить голодувати.
Переглянути оригіналвідповісти на0
airdrop_whisperervip
· 08-06 11:21
Рано чи пізно дані стануть найціннішим активом.
Переглянути оригіналвідповісти на0
MeltdownSurvivalistvip
· 08-06 11:18
Старі розмови, але дані - це життєва сила.
Переглянути оригіналвідповісти на0
LiquidityHuntervip
· 08-06 11:17
В конечном итоге все сводится к данным, играть в нові обмеження.
Переглянути оригіналвідповісти на0
FarmHoppervip
· 08-06 11:11
Блін, дані ресурси вже майже б'ються в офлайні.
Переглянути оригіналвідповісти на0
  • Закріпити