AIと暗号化技術がボット業界の変革をリード VLAモデルが自動化の新時代を切り開く

ボット業界の重大なブレークスルー:AIと暗号化技術が自動化の新時代を牽引

人工知能の飛速な発展が人々のボットに対する期待を再形成しています。大規模言語モデルが外部世界とインタラクションを始めるにつれ、多くの人々がAIエージェントが頂点に達したと考えています。しかし、古典的なSF作品を振り返ると、人類が本当に望んでいるのは物理的な世界でインタラクションできるヒューマノイドボットです。

業界の専門家は、ボット分野がChatGPTに類似した重大なブレークスルーを迎えると考えています。本稿ではまず、近年のAI技術が業界の構図をどのように変えているかを分析し、その後、バッテリー、レイテンシ、データ収集などの技術進歩が未来をどのように形作るか、そして暗号化技術がその中で果たす役割について探ります。最後に、ボットの安全性、資金調達、評価、教育などの重要な分野に重点を置きます。

! ロボットのためのChatGPTモーメント:AIと暗号化によって推進される自動化革命

1. 変革の鍵となる要因

(1) 人工知能のブレークスルー

多モーダル大言語モデルの進歩はボットが複雑なタスクを実行するための必要な"脳"を提供します。ボットは主に視覚と聴覚を通じて環境を認識します。

従来のコンピュータビジョンモデルは物体検出や分類に優れていますが、視覚情報を目的のある行動指示に変換することが難しいです。大規模言語モデルはテキストの理解と生成において優れた性能を発揮しますが、物理的な世界に対する認識能力は限られています。

視覚-言語-行動(VLA)モデルを通じて、ボットは統一された計算フレームワーク内で視覚認識、言語理解、実体行動を統合することができます。2025年2月、AI企業が汎用ヒューマノイドロボット制御モデルHelixを発表し、このVLAモデルはゼロショット一般化能力とデュアルシステムアーキテクチャにより業界の新しい基準を設定しました。ゼロショット一般化特性により、ボットは各タスクに対して繰り返しトレーニングを行うことなく、新しいシーン、新しいオブジェクト、新しい指示に適応できます。デュアルシステムアーキテクチャは高次推論と軽量推論を分離し、ヒューマンライクな思考とリアルタイムの精度を兼ね備えた商用ヒューマノイドロボットを実現しました。

(2) 経済型ボットが現実になる

世界を変える技術には共通の特徴があります。それは普及性です。スマートフォン、パソコン、3Dプリンティング技術は、中産階級が手に入れられる価格で普及しました。あるボットの価格が中型車やアメリカの最低年収を下回るとき、肉体労働や日常の業務が主にボットによって行われる世界はもはや遠い存在ではなくなります。

(3) 倉庫保管から消費者市場へ

ボット技術は倉庫ソリューションから消費分野へと拡大しています。私たちの世界は人間のために設計されています——人間はすべての専門ボットの仕事をこなすことができ、専門ボットはすべての人間の仕事をこなすことができません。ボット企業はもはや工場専用ボットの製造に限らず、より汎用性のあるヒューマノイドボットの開発に移行しています。したがって、ボット技術の最前線は倉庫だけでなく、日常生活に浸透していくでしょう。

コストはスケーラビリティの主要なボトルネックの一つです。最も重要な指標は、時間あたりの総コストで、その計算方法は、トレーニングと充電の時間の機会コスト、タスク実行コストおよびボットの購入コストの合計を、ボットの総稼働時間で割ったものです。このコストは、関連する業界の平均賃金水準を下回らなければ競争力がありません。

倉庫分野に全面的に浸透するためには、ロボットの時給総コストは31.39ドル未満でなければなりません。そして、最大の消費者市場である私立教育と健康サービス分野では、そのコストを35.18ドル未満に抑える必要があります。現在、ロボットはより安価で、より効率的で、より汎用的な方向に発展しています。

! ロボットのためのChatGPTモーメント:AIと暗号化によって推進される自動化革命

2. ボット技術の次の突破

(1) バッテリー最適化

バッテリー技術は常にユーザーフレンドリーなボットのボトルネックです。初期の電気自動車はバッテリー技術の制限により航続距離が短く、コストが高く、実用性が低いため普及が難しかったが、ボットも同じ困難に直面しています。一部の有名なボットは単回の航続時間がわずか90分から2時間です。ユーザーは明らかに2時間ごとに手動で充電することを望んでいないため、自動充電と接続インフラが重点的な開発方向となっています。現在、ボットの充電には主に2つのモードがあります:バッテリー交換または直接充電。

バッテリー交換モードは、消耗したバッテリーを迅速に交換することで継続的な作業を実現し、ダウンタイムを最小限に抑えます。野外または工場のシーンに適しています。このプロセスは手動操作でも自動化でも実行可能です。

感応充電はワイヤレス電源方式を採用しており、完全充電には時間がかかりますが、全自動化プロセスを簡単に実現できます。

(2) レイテンシの最適化

低遅延操作は、環境認識とリモート操作の2つのカテゴリに分けることができます。認識はボットの環境の空間認知能力を指し、リモート操作は人間のオペレーターによるリアルタイム制御を特に指します。

研究によると、ボットの知覚システムは安価なセンサーから始まりますが、技術的な競争優位は融合ソフトウェア、低消費電力計算、およびミリ秒単位の精密制御回路にあります。ボットが空間定位を完了すると、軽量な神経ネットワークが障害物、パレット、または人間などの要素にラベルを付けます。シーンのラベルがプランニングシステムに入力されると、すぐに足部、ホイールグループ、またはマニピュレーターに送信されるモーター指令が生成されます。50ミリ秒未満の知覚遅延は人間の反射速度に相当します—この閾値を超える遅延はボットの動作を不器用にします。したがって、90%の意思決定は単一の視覚-言語-行動ネットワークによってローカルで完了する必要があります。

全自律ボットは、高性能VLAモデルの遅延が50ミリ秒未満であることを確保する必要があります。リモート操作ボットは、操作端とボット間の信号遅延が50ミリ秒を超えないことが要求されます。ここでVLAモデルの重要性が特に際立ちます——視覚とテキスト入力がそれぞれ異なるモデルによって処理された後に大型言語モデルに入力される場合、全体の遅延は50ミリ秒の閾値を大幅に超えることになります。

(3) データ収集の最適化

データ収集には主に3つの方法があります:現実世界のビデオデータ、合成データ、リモート操作データです。現実データと合成データの核心的なボトルネックは、ボットの物理的な動作とビデオ/シミュレーションモデルとの間の差を埋めることにあります。現実のビデオデータは、力のフィードバック、関節の動きの誤差、材料の変形などの物理的な詳細が欠けています。一方、シミュレーションデータは、センサーの故障、摩擦係数などの予測できない変数が欠如しています。

最も潜在的なデータ収集方法はリモート操作であり、人間のオペレーターがボットを遠隔操作してタスクを実行します。しかし、人件費はリモート操作によるデータ収集の主な制約要因です。

カスタムハードウェアの開発は、高品質なデータ収集に新しいソリューションを提供しています。一部の企業は、主流の方法とカスタムハードウェアを組み合わせて、多次元の人間の運動データを収集し、処理後にロボットの神経ネットワーク訓練に適したデータセットに変換し、迅速なイテレーションサイクルとともにAIロボットの訓練に大量の高品質データを提供しています。これらの技術パイプラインは、原データから展開可能なロボットへの変換経路を短縮しています。

! ChatGPT Moments for Robots: AIと暗号化が推進する自動化革命

3. 探索するエリアに焦点を当てる

(1) 暗号化技術とボットの融合

暗号化技術は、信頼しない側にボットネットワークの効率を向上させるインセンティブを提供します。前述の重要な分野に基づいて、暗号化技術はインフラの接続、遅延の最適化、データ収集の3つの側面で効率を向上させることができます。

去中心化物理基盤インフラネットワーク(DePIN)は充電インフラを革命することが期待されています。人型ボットが自動車のように世界中で運用されるとき、充電ステーションはガソリンスタンドのように手の届くところに必要です。中央集権型ネットワークは巨額の初期投資を必要としますが、DePINはコストをノードオペレーターに分担させ、充電施設をより多くの地域に迅速に拡張します。

DePINは分散型インフラを活用してリモート操作の遅延を最適化できます。地理的に分散したエッジノードの計算リソースを集約することで、リモート操作の指令はローカルまたは最も近い利用可能なノードによって処理され、データ転送距離を最小限に抑え、通信の遅延を大幅に削減できます。しかし、現在のDePINプロジェクトは主に分散型ストレージ、コンテンツ配信、帯域幅共有に焦点を当てており、プロジェクトはストリーミングメディアやIoTにおけるエッジコンピューティングの適用利点を示していますが、ボットやリモート操作の分野にはまだ広がっていません。

遠隔操作は最も有望なデータ収集方法ですが、中央集権的な実体が専門家を雇ってデータを収集するコストは非常に高いです。DePINは暗号トークンを通じて第三者に遠隔操作データを提供するインセンティブを与え、この問題を解決します。一部のプロジェクトは、世界的な遠隔オペレーターのネットワークを構築しており、その貢献をトークン化されたデジタル資産に変換し、許可なしの分散型システムを形成しています——参加者は利益を得るだけでなく、ガバナンスに参加し、AGIボットの訓練を支援することもできます。

(2) 安全は常に核心の関心事です

ボット技術の終極目標は完全な自律化を実現することですが、人類が最も望まないのは自律性がボットを攻撃的な武器に変えることです。大規模言語モデルの安全性の問題は注目を集めており、これらのモデルが実体行動能力を持つとき、ボットの安全性は社会の受容のための重要な前提となります。

経済安全はボットエコシステムの繁栄の柱の一つです。この分野のいくつかの企業は、暗号学的証明を通じてデバイスのアイデンティティ認証、物理的存在の検証、資源の取得を実現する去中心化されたマシン調整レイヤーを構築しています。単なるタスク市場管理とは異なり、これらのシステムはボットが中央集権的な仲介に依存せずに、自主的にアイデンティティ情報、地理的位置、行動記録を証明できるようにします。

行動制約と身元認証はチェーン上のメカニズムによって実行され、誰でもコンプライアンスを監査できることを保証します。安全基準、品質要件、地域規範に適合するボットは報酬を受け、違反者は罰則または資格の取消しに直面し、自律的なマシンネットワーク内で責任と信頼のメカニズムを確立します。

第三者の再担保ネットワークも同様に対等な安全保障を提供できる。罰則パラメータの体系はまだ改善が必要だが、関連技術は実用段階に入った。業界の安全基準が間もなく形成されると予想され、その際には罰則パラメータがこれらの基準を参考にモデル化される。

4. ボット技術スタックの空白を埋める

AIとは異なり、ボット分野は資金が限られているときに入りにくい。ボットの普及を実現するためには、その開発のハードルをAIアプリケーション開発のように便利なレベルに下げる必要がある。私たちは、資金調達メカニズム、評価システム、教育エコシステムの3つの面で改善の余地があると考えている。

資金調達はボット領域の痛点です。コンピュータプログラムの開発には1台のコンピュータとクラウドコンピューティングリソースが必要ですが、機能を備えたボットを構築するには、モーター、センサー、バッテリーなどのハードウェアを購入しなければならず、コストは簡単に10万ドルを超えます。このようなハードウェアの特性により、ボットの開発はAIに比べて柔軟性に欠け、コストが高くなります。

現実のシーンにおけるボット評価インフラはまだ萌芽期にあります。AI分野では明確な損失関数体系が確立されており、テストは完全に仮想化できます。しかし、優れた仮想戦略は現実の世界での有効なソリューションに直接転換することはできません。ボットは多様な現実環境で自律戦略の評価施設をテストする必要があり、これにより反復最適化を実現できます。

これらのインフラが成熟すると、多くの人材が流入し、人型ボットはWeb2の爆発的な曲線を再現するでしょう。一部の企業はこの方向に進んでおり、彼らのオープンソースプロジェクトは原始的なハードウェアを経済的意識を持つアップグレード可能なインテリジェントエージェントに変換します。視覚、言語、運動計画モジュールは、スマートフォンアプリのようにプラグアンドプレイ可能で、すべての推論ステップは明確な英語で提示され、オペレーターはファームウェアに触れることなく行動を監査または調整できます。この自然言語推論能力により、新しい世代の人材がロボット分野にシームレスに入ることができ、ロボット革命を引き起こすオープンプラットフォームへの重要な一歩を踏み出します。これはオープンソース運動がAIに加速をもたらしたのと同じように。

人材密度は業界の軌跡を決定します。構造化された普遍的な教育体系はボット分野の人材供給にとって重要です。いくつかの企業は、アメリカのK-12公立学校で人型ロボットに基づく普遍的な教育課程を導入し始めました。この課程はプラットフォームに依存せず、様々なロボット形態に適応できる設計で、学生に実践的な操作の機会を提供します。この積極的な信号は業界内の判断を強化しました:今後数年のロボット教育資源の豊富さはAI分野に匹敵するでしょう。

5. 今後の展望

視覚-言語-行動モデル(VLA)の革新と規模の経済効果は、経済的で効率的かつ汎用的な人型ボットを生み出しています。倉庫ボットが消費者市場に拡大するにつれ、安全性、資金調達モデル、評価システムが重要な探求方向となっています。業界の専門家は、暗号化技術が三を通じて確信しています。

AGI2.54%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • リポスト
  • 共有
コメント
0/400
WalletDetectivevip
· 12時間前
混乱している、また何か問題が起こったのか?
原文表示返信0
ChainSpyvip
· 14時間前
このAIはまだちゃんと働いていない、毎日強気だ。
原文表示返信0
StablecoinArbitrageurvip
· 14時間前
*ため息* また新しいテクノロジーのハイプサイクルか... 正直なところ、まずロボットアービトラージの利益率を見せて欲しい。
原文表示返信0
DaoDevelopervip
· 14時間前
正直、zk-proofsがロボットと人間の相互作用をどのように安全にするかは魅力的です。
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)