Новий瓶颈 розвитку штучного інтелекту: дані стають основною проблемою
Зі зростанням масштабів і обчислювальних можливостей моделей штучного інтелекту на поверхню виходить ключове питання, яке довгий час ігнорувалося — постачання даних. Сьогодні індустрія ШІ стикається зі структурним протиріччям: моделі та обчислювальні потужності вже сформували зрілу ринкову систему, але виробництво, очищення, валідація та торгівля даними все ще перебувають на початковій стадії. У наступні десять років акцент у розвитку ШІ з моделей і обчислювальних потужностей переміститься на побудову інфраструктури даних.
Дані проблеми в індустрії ШІ
Від революції глибокого навчання масштаб параметрів AI моделей зріс з мільйонів до трильйонів, а потреба в обчислювальних потужностях зростає експоненційно. Проте, зростання якісних "органічних даних", створених людиною, наблизилося до стелі. Наприклад, у текстових даних загальна кількість доступних якісних текстів в Інтернеті становить близько 10^12 слів, тоді як для навчання моделі з сотнею мільярдів параметрів потрібно приблизно 10^13 слів. Це означає, що існуючий пул даних може підтримувати навчання лише кількох моделей однакового масштабу.
Найгірше те, що частка повторюваного та низькоякісного контенту перевищує 60%, що ще більше скорочує постачання ефективних даних. Коли моделі починають масово використовувати контент, створений ШІ, "забруднення даних" призводить до зниження продуктивності моделей, що стало тривожним сигналом для галузі. Коріння цієї суперечності полягає в тому, що ІТ-індустрія довгий час сприймала дані як "безкоштовний ресурс", а не як "стратегічний актив", який потрібно ретельно вирощувати.
Данні на блокчейні: ідеальний матеріал для навчання ШІ
У цьому контексті дані на блокчейн-мережі демонструють унікальну цінність. У порівнянні з традиційними даними в Інтернеті, дані на ланцюгу мають природну достовірність та надійність:
Сигнали справжніх намірів: дані в блокчейні фіксують рішення, які користувачі приймають, інвестуючи реальні гроші, що безпосередньо відображає оцінку вартості проєкту та стратегії розподілу капіталу.
Відслідковуваний ланцюг поведінки: прозорість блокчейну дозволяє повністю відстежувати дії користувачів, формуючи узгоджений «ланцюг поведінки», що допомагає ШІ створювати точні профілі користувачів.
Відкритий доступ: Дані на блокчейні відкриті для всіх розробників, без необхідності отримувати дозвіл, що забезпечує доступ до низькопорогових джерел даних для навчання моделей ШІ.
Проте, дані на ланцюгу також стикаються з викликами: вони існують у неструктурованій формі "журналу подій", і їх потрібно складно обробляти, щоб вони могли використовуватися моделями ШІ. Наразі "рівень структуризації" даних на ланцюгу складає менше 5%, і велика кількість високоякісних сигналів загублена серед величезної кількості фрагментованої інформації.
Побудова "розумної операційної системи" для даних на ланцюгу
Щоб вирішити проблему фрагментації даних в блокчейні, галузь досліджує створення спеціально розробленої для ШІ "блокчейн-інтелектуальної операційної системи". Основною метою таких систем є перетворення розпорошених сигналів блокчейну в структуровані, перевіряємi, в реальному часі комбіновані дані, готові до використання в ШІ. Основними компонентами є:
Відкритий стандарт даних: уніфікація форматів даних різних блокчейнів і протоколів, щоб ШІ міг безпосередньо "розуміти" світ на ланцюгу.
Децентралізований механізм верифікації: використання механізму консенсусу блокчейн для забезпечення достовірності та цілісності даних.
Високопродуктивний рівень доступності даних: реалізація обробки даних у мережі в реальному часі та передачі з низькою затримкою за рахунок оптимізації алгоритмів і архітектури.
Протокол оцінки даних: розробка AI-моделі для автоматичної оцінки якості наборів даних, щоб надати цінові орієнтири для ринку обміну даними.
Крок до епохи DataFi
Ці зусилля мають на меті сприяти переходу індустрії штучного інтелекту в епоху DataFi — дані стануть «капітом», який можна оцінювати, торгувати та підвищувати їх вартість. У цю нову епоху дані матимуть чотири основні властивості:
Структуровані: первинні сигнали на ланцюзі перетворюються на структуровані дані, які можуть безпосередньо використовуватися штучним інтелектом.
Комбіновані: дані з різних джерел можуть вільно поєднуватися, як LEGO, розширюючи межі застосування.
Можливість перевірки: справжність даних можна відстежити та перевірити за записами в блокчейні.
Ліквідність: постачальники даних можуть безпосередньо перетворювати якісні дані на прибуток.
Висновок: Революція даних веде до нової ери ШІ
Еволюція ШІ, по суті, є еволюцією інфраструктури даних. Від обмеженості даних, що генеруються людьми, до виявлення цінності даних на блокчейні, від фрагментованих сигналів до структурованих активів – нове покоління інфраструктури даних перебудовує підвалини логіки індустрії ШІ. У наближену еру DataFi дані стануть мостом, що з'єднує ШІ з реальним світом, сприяючи появі різноманітних інноваційних застосувань.
Коли дані нарешті отримають належну цінність, ШІ зможе по-справжньому звільнити силу змінити світ. Наступне покоління застосувань ШІ потребує не лише потужних моделей, а й високоякісних, надійних даних. Побудова такої екосистеми даних стане основним завданням галузі ШІ у наступні десять років.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
23 лайків
Нагородити
23
7
Репост
Поділіться
Прокоментувати
0/400
SigmaBrain
· 08-09 05:28
Дрифтування на катафалку базується на даних
Переглянути оригіналвідповісти на0
BoredWatcher
· 08-08 00:30
Дані значно більш ароматні, ніж кулінарний набір.
Переглянути оригіналвідповісти на0
ChainComedian
· 08-06 13:10
Даних недостатньо, навіть gpt мусить голодувати.
Переглянути оригіналвідповісти на0
airdrop_whisperer
· 08-06 11:21
Рано чи пізно дані стануть найціннішим активом.
Переглянути оригіналвідповісти на0
MeltdownSurvivalist
· 08-06 11:18
Старі розмови, але дані - це життєва сила.
Переглянути оригіналвідповісти на0
LiquidityHunter
· 08-06 11:17
В конечном итоге все сводится к данным, играть в нові обмеження.
Постачання даних стає вузьким місцем у розвитку ШІ, дані у блокчейні ведуть до нової ери DataFi
Новий瓶颈 розвитку штучного інтелекту: дані стають основною проблемою
Зі зростанням масштабів і обчислювальних можливостей моделей штучного інтелекту на поверхню виходить ключове питання, яке довгий час ігнорувалося — постачання даних. Сьогодні індустрія ШІ стикається зі структурним протиріччям: моделі та обчислювальні потужності вже сформували зрілу ринкову систему, але виробництво, очищення, валідація та торгівля даними все ще перебувають на початковій стадії. У наступні десять років акцент у розвитку ШІ з моделей і обчислювальних потужностей переміститься на побудову інфраструктури даних.
Дані проблеми в індустрії ШІ
Від революції глибокого навчання масштаб параметрів AI моделей зріс з мільйонів до трильйонів, а потреба в обчислювальних потужностях зростає експоненційно. Проте, зростання якісних "органічних даних", створених людиною, наблизилося до стелі. Наприклад, у текстових даних загальна кількість доступних якісних текстів в Інтернеті становить близько 10^12 слів, тоді як для навчання моделі з сотнею мільярдів параметрів потрібно приблизно 10^13 слів. Це означає, що існуючий пул даних може підтримувати навчання лише кількох моделей однакового масштабу.
Найгірше те, що частка повторюваного та низькоякісного контенту перевищує 60%, що ще більше скорочує постачання ефективних даних. Коли моделі починають масово використовувати контент, створений ШІ, "забруднення даних" призводить до зниження продуктивності моделей, що стало тривожним сигналом для галузі. Коріння цієї суперечності полягає в тому, що ІТ-індустрія довгий час сприймала дані як "безкоштовний ресурс", а не як "стратегічний актив", який потрібно ретельно вирощувати.
Данні на блокчейні: ідеальний матеріал для навчання ШІ
У цьому контексті дані на блокчейн-мережі демонструють унікальну цінність. У порівнянні з традиційними даними в Інтернеті, дані на ланцюгу мають природну достовірність та надійність:
Сигнали справжніх намірів: дані в блокчейні фіксують рішення, які користувачі приймають, інвестуючи реальні гроші, що безпосередньо відображає оцінку вартості проєкту та стратегії розподілу капіталу.
Відслідковуваний ланцюг поведінки: прозорість блокчейну дозволяє повністю відстежувати дії користувачів, формуючи узгоджений «ланцюг поведінки», що допомагає ШІ створювати точні профілі користувачів.
Відкритий доступ: Дані на блокчейні відкриті для всіх розробників, без необхідності отримувати дозвіл, що забезпечує доступ до низькопорогових джерел даних для навчання моделей ШІ.
Проте, дані на ланцюгу також стикаються з викликами: вони існують у неструктурованій формі "журналу подій", і їх потрібно складно обробляти, щоб вони могли використовуватися моделями ШІ. Наразі "рівень структуризації" даних на ланцюгу складає менше 5%, і велика кількість високоякісних сигналів загублена серед величезної кількості фрагментованої інформації.
Побудова "розумної операційної системи" для даних на ланцюгу
Щоб вирішити проблему фрагментації даних в блокчейні, галузь досліджує створення спеціально розробленої для ШІ "блокчейн-інтелектуальної операційної системи". Основною метою таких систем є перетворення розпорошених сигналів блокчейну в структуровані, перевіряємi, в реальному часі комбіновані дані, готові до використання в ШІ. Основними компонентами є:
Відкритий стандарт даних: уніфікація форматів даних різних блокчейнів і протоколів, щоб ШІ міг безпосередньо "розуміти" світ на ланцюгу.
Децентралізований механізм верифікації: використання механізму консенсусу блокчейн для забезпечення достовірності та цілісності даних.
Високопродуктивний рівень доступності даних: реалізація обробки даних у мережі в реальному часі та передачі з низькою затримкою за рахунок оптимізації алгоритмів і архітектури.
Протокол оцінки даних: розробка AI-моделі для автоматичної оцінки якості наборів даних, щоб надати цінові орієнтири для ринку обміну даними.
Крок до епохи DataFi
Ці зусилля мають на меті сприяти переходу індустрії штучного інтелекту в епоху DataFi — дані стануть «капітом», який можна оцінювати, торгувати та підвищувати їх вартість. У цю нову епоху дані матимуть чотири основні властивості:
Структуровані: первинні сигнали на ланцюзі перетворюються на структуровані дані, які можуть безпосередньо використовуватися штучним інтелектом.
Комбіновані: дані з різних джерел можуть вільно поєднуватися, як LEGO, розширюючи межі застосування.
Можливість перевірки: справжність даних можна відстежити та перевірити за записами в блокчейні.
Ліквідність: постачальники даних можуть безпосередньо перетворювати якісні дані на прибуток.
Висновок: Революція даних веде до нової ери ШІ
Еволюція ШІ, по суті, є еволюцією інфраструктури даних. Від обмеженості даних, що генеруються людьми, до виявлення цінності даних на блокчейні, від фрагментованих сигналів до структурованих активів – нове покоління інфраструктури даних перебудовує підвалини логіки індустрії ШІ. У наближену еру DataFi дані стануть мостом, що з'єднує ШІ з реальним світом, сприяючи появі різноманітних інноваційних застосувань.
Коли дані нарешті отримають належну цінність, ШІ зможе по-справжньому звільнити силу змінити світ. Наступне покоління застосувань ШІ потребує не лише потужних моделей, а й високоякісних, надійних даних. Побудова такої екосистеми даних стане основним завданням галузі ШІ у наступні десять років.