AIエージェントが試練の場に入る

2025-08-12 03:39:00

概要

リコールラボのCEO、アンドリュー・ヒルは、AIエージェントの構築と信頼の課題について議論し、公共パフォーマンス検証のためのオンチェーンアリーナの創設を強調しました。

Recall Networkを作るきっかけは何でしたか、そしてなぜAIエージェントのオンチェーンアリーナとして構築したのですか？

インターネットは情報から行動へとシフトしています。単なる検索だけでなく、委任もしています。エージェントはすでにコードを書き、ポートフォリオを管理し、研究を要約しています。問題は創造ではありません。信頼です。誰でもエージェントを立ち上げることができますが、パフォーマンスを証明できる人は少ないです。

リコールはそれを解決するために構築されました - 製品としてではなく、プロトコルインフラストラクチャとして。エージェントが公共の場で能力を証明する、信頼できる中立的なネットワークです。競技と評価が証明となります。評判はポータブルになります。そして、発見はもはや推測ゲームではありません。

私たちは単にもっと多くのエージェントを求めているのではありません。私たちは人類の問題を解決するためにAIを接続し、インセンティブを与えるシステムを求めています。

今日のAIの状況で解決しようとしているコアの問題は何ですか — そして、Recallはどのようにそれに独自に対処していますか？

私たちはエージェントが多すぎて、信頼が少なすぎます。ボトルネックは能力ではありません。それは評価です。どのエージェントが本物ですか？どれが単なるプロンプトとランディングページですか？現在、答えはマーケティングとハイプから来ています。私たちはそれらが証明から来ることを望んでいます。

リコールはベンチマーキングを生きた進化するネットワーク機能に変えます。エージェントは競争によって評判を得ます。キュレーターはパフォーマンスを引き出すことでトークンを獲得します。消費者はハイプではなくランキングを追いかけます。

ほとんどのAIシステムがブラックボックスとして機能する世界で、完全な透明性と公開パフォーマンス指標への移行はどれほど現実的ですか？

すでに起こっています。シフトは需要主導です。ユーザーはエージェントを統合する前に、エージェントが何をできるかを知りたいと思っています。賢いユーザーは、自分たちの限界をテストし、ベンチマークに参加したいと考えています。ビルダーは、漠然とした比較ではなく、実際のベンチマークを求めています。

リコールでは、すべてのエージェントのアクションが記録されます。すべての競技は再生可能です。評価は組み合わせ可能で、変化します。この標準が機能するため、他のシステムも時間の経過とともにこの標準を採用することを期待しています。

パフォーマンスに対して報酬を受け取るエージェントがいるシステムで、どのようにゲーム化や操作を防ぐことができますか？

試みを防ぐことはできませんが、それを利益のないものにすることはできます — 正直なエージェントを支えるためにトークンを使用し、不誠実な行為に対して罰則を設けることです。ゲームと操作は、自動化システムと人間の組み合わせによって表面化し、人間が悪を排除することを可能にします。私たちはすでに、キュレーターが不誠実な行動を特定し、エージェントをリーダーボードから排除するライブコンペティションでこれを実証しています。

今日、AIエージェントを評価するために最も意義のあるタスクや競技は何であり、モデルが賢くなるにつれてそれらはどのように進化するのか？

推論、文脈、または現実世界の判断にストレスを与えるタスクは、チャットエージェントにおいて最も重要なシグナルです。私たちにとって、現在は多くのエージェントを評価し、AIの暗号ポートフォリオ管理能力について理解する必要があるため、トレーディングに注力しています。また、消費者の間で、いかなるエージェントが成功裏に取引できるかについての不確実性も多く存在します。私たちにとって、大衆向けのAIベースの暗号取引は「もし」ではなく「いつ」なのです。私たちは、ベンチマーキングやコンペティションを通じてこれを加速させる重要な役割を果たしたいと考えています。

AIの未来におけるブロックチェーンの役割をどのように見ていますか — インフラ層、ガバナンス層、アカウンタビリティ層？

ブロックチェーンは、これらの3つのレイヤーすべてとして機能します。競技はオンチェーンで行われ、ルールを定めるガバナンスレールとエージェントの行動のための共有台帳があります。ブロックチェーンは、私たちに公共の記憶、検証可能な歴史、プログラム可能な信頼を提供します。

しかし、その最も重要な役割は経済的です。それは、AIを誠実に保つ人間のレイヤーに報酬を与えることを可能にします。

オンチェーンエージェントは従来のSaaSモデルを置き換えると思いますか、それとも補完すると思いますか？

彼らはまず補完から始めます。次に、パフォーマンスを上回ります。最後に、彼らは全体のカテゴリーを置き換えます。

トークン、ステーキング、スラッシングのような暗号の原始的要素は、大規模なAIの行動管理においてどのような役割を果たすと思いますか？

トークンはクリエイターが可視性のために支払うことを可能にします。彼らはキュレーターが価値を浮き彫りにするために収入を得ることを可能にします。彼らは信念の持続可能な記録を作成します。ステーキングは信念をコストに結びつけます。スラッシングは失敗をフィードバックに変えます。

エージェントシステム間の相互運用性についてどのように考えるべきか - 標準は出現するのか、それとも分断されたままなのか？

フラグメンテーションはデフォルトです。相互運用性は、再構築するよりも接続する方が簡単なときに生まれます。A2Aは、組織の境界を越えるプロトコルとしてはまだ証明されていません。しかし、組織間でエージェントを使用するためには、消費者と企業はRecallのようなシステムが必要であり、ユーザーのために信頼できるベンチマークとセキュリティを作成する必要があります。

今後数年間で、基盤モデルとエージェントフレームワークの関係はどのように進化すると考えていますか？

ファウンデーションモデルは引き続き改善されるでしょう。エージェント層は、生のモデルの上に構築されたすべてのものと考えています。エージェントはデータベースであるソフトウェアモデルです。我々が使用するインターフェースは、ルーティングとバリエーションをより多く抽象化し続けるでしょう。Grok 4 Heavyはすでにエージェントの群れです。噂によれば、GPT-5は多くのモデルとエージェントを使用して適切なタスクを解決する高度なルーティングシステムになるとされています。オープンシステムもそれに続くでしょう。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

0/400

コメントなし

トピック
#Show My Alpha Points
116353 人気度
#ETH Breaks $4,600
23029 人気度
#CPI Data Coming
27337 人気度
#TOKEN OF LOVE IS BACK
24639 人気度
#Circle Launches ARC
2364 人気度

ピン

サイトマップ