📢 Gate廣場專屬 #WXTM创作大赛# 正式開啓!
聚焦 CandyDrop 第59期 —— MinoTari (WXTM),總獎池 70,000 枚 WXTM 等你贏!
🎯 關於 MinoTari (WXTM)
Tari 是一個以數字資產爲核心的區塊鏈協議,由 Rust 構建,致力於爲創作者提供設計全新數字體驗的平台。
通過 Tari,數字稀缺資產(如收藏品、遊戲資產等)將成爲創作者拓展商業價值的新方式。
🎨 活動時間:
2025年8月7日 17:00 - 8月12日 24:00(UTC+8)
📌 參與方式:
在 Gate廣場發布與 WXTM 或相關活動(充值 / 交易 / CandyDrop)相關的原創內容
內容不少於 100 字,形式不限(觀點分析、教程分享、圖文創意等)
添加標籤: #WXTM创作大赛# 和 #WXTM#
附本人活動截圖(如充值記錄、交易頁面或 CandyDrop 報名圖)
🏆 獎勵設置(共計 70,000 枚 WXTM):
一等獎(1名):20,000 枚 WXTM
二等獎(3名):10,000 枚 WXTM
三等獎(10名):2,000 枚 WXTM
📋 評選標準:
內容質量(主題相關、邏輯清晰、有深度)
用戶互動熱度(點讚、評論)
附帶參與截圖者優先
📄 活動說明:
內容必須原創,禁止抄襲和小號刷量行爲
獲獎用戶需完成 Gate廣場實名
AI與加密技術引領機器人行業變革 VLA模型開啓自動化新紀元
機器人行業的重大突破:AI與加密技術引領自動化新紀元
人工智能的飛速發展正在重塑人們對機器人的期待。隨着大語言模型開始與外部世界互動,許多人認爲AI智能體已達到巔峯。然而,若回顧經典科幻作品,我們會發現人類真正向往的是能在物理世界中互動的人形機器人。
業內專家認爲,機器人領域即將迎來類似ChatGPT的重大突破。本文將首先分析近年來AI技術如何改變行業格局,繼而探討電池、延遲和數據採集等技術進步將如何塑造未來,以及加密技術在其中的作用。最後我們將重點關注機器人安全、融資、評估和教育等關鍵領域。
1. 變革的關鍵因素
(1) 人工智能的突破
多模態大語言模型的進步爲機器人執行復雜任務提供了必要的"大腦"。機器人主要通過視覺和聽覺感知環境。
傳統計算機視覺模型擅長物體檢測和分類,但難以將視覺信息轉化爲有目的的行動指令。大語言模型雖然在文本理解和生成方面表現出色,但對物理世界的感知能力有限。
通過視覺-語言-行動(VLA)模型,機器人能夠在統一的計算框架中整合視覺感知、語言理解和實體行動。2025年2月,一家AI公司推出了通用人形機器人控制模型Helix,該VLA模型憑藉零樣本泛化能力和雙系統架構爲行業樹立了新標準。零樣本泛化特性使機器人無需針對每項任務重復訓練,即可適應新場景、新物體和新指令。雙系統架構將高階推理與輕量級推理分離,實現了兼具類人思維與實時精確度的商用人形機器人。
(2) 經濟型機器人成爲現實
改變世界的技術都具有一個共同特點——可普及性。智能手機、個人電腦、3D打印技術都通過中產階級可承受的價格實現普及。當某些機器人的價格低於一輛中檔轎車或美國最低年收入時,想象體力勞動和日常事務主要由機器人完成的世界就不再遙不可及。
(3) 從倉儲走向消費級市場
機器人技術正從倉儲解決方案向消費領域擴展。我們的世界是爲人類設計的——人類能完成所有專業機器人的工作,而專業機器人卻無法勝任所有人類的工作。機器人公司不再局限於制造工廠專用機器人,轉而開發更具通用性的人形機器人。因此機器人技術的前沿不僅存在於倉庫,更將滲透日常生活。
成本是可擴展性的主要瓶頸之一。最關鍵的指標是每小時綜合成本,其計算方式爲:訓練與充電的時間機會成本、任務執行成本及機器人購置成本之和,除以機器人總運行時長。該成本需低於相關行業平均工資水平才具競爭力。
要全面滲透倉儲領域,機器人每小時綜合成本必須低於31.39美元。而在最大的消費級市場——私立教育與健康服務領域,該成本需控制在35.18美元以下。當前機器人正朝着更廉價、更高效、更通用的方向發展。
2. 機器人技術的下一步突破
(1) 電池優化
電池技術始終是用戶友好型機器人的瓶頸。早期電動車因電池技術局限導致續航短、成本高、實用性低而難以普及,機器人正面臨相同困境。一些知名機器人的單次續航僅90分鍾到2小時。用戶顯然不願每兩小時手動充電,因此自主充電與對接基礎設施成爲重點發展方向。目前機器人充電主要有兩種模式:電池更換或直接充電。
電池更換模式通過快速替換耗盡電池組實現持續作業,最大限度減少停機時間,適用於野外或工廠場景。該流程可人工操作也可自動化完成。
感應充電採用無線供電方式,雖然完整充電耗時較長,但能輕鬆實現全自動化流程。
(2) 延遲優化
低延遲操作可分爲環境感知與遠程操控兩類。感知指機器人對環境的空間認知能力,遠程操控則特指人類操作員的實時控制。
研究顯示,機器人感知系統始於廉價傳感器,但技術護城河在於融合軟件、低功耗計算和毫秒級精控回路。當機器人完成空間定位後,輕量級神經網路將標記障礙物、托盤或人類等要素。場景標籤輸入規劃系統後,即刻生成發送至足部、輪組或機械臂的電機指令。50毫秒以下的感知延遲等同於人類反射速度——任何超出此閾值的延遲都會導致機器人動作笨拙。因此90%的決策需通過單一視覺-語言-行動網路在本地完成。
全自主機器人需確保高性能VLA模型延遲低於50毫秒;遠程操控機器人則要求操作端與機器人間的信號延遲不超過50毫秒。此處VLA模型的重要性尤爲凸顯——若視覺與文本輸入分別由不同模型處理後再輸入大型語言模型,整體延遲將遠超50毫秒閾值。
(3) 數據收集優化
數據採集主要有三種途徑:現實世界視頻數據、合成數據與遠程操控數據。現實數據與合成數據的核心瓶頸在於彌合機器人物理行爲與視頻/模擬模型間的差異。現實視頻數據缺失力反饋、關節運動誤差和材料形變等物理細節;模擬數據則缺乏傳感器故障、摩擦系數等不可預測變量。
最具潛力的數據採集方式是遠程操控——由人類操作員遠程控制機器人執行任務。但人力成本是遠程操控數據採集的主要制約因素。
定制硬件開發也正爲高質量數據採集提供新方案。一些公司通過主流方法與定制硬件結合,採集多維度人類運動數據,經處理後轉化爲適用於機器人神經網路訓練的數據集,配合快速迭代週期爲AI機器人訓練提供海量高質量數據。這些技術管道共同縮短了從原始數據到可部署機器人的轉化路徑。
3. 重點探索領域
(1) 加密技術與機器人融合
加密技術可激勵去信任方提升機器人網路效率。基於前文所述關鍵領域,加密技術能在對接基礎設施、延遲優化和數據收集三方面提升效率。
去中心化物理基礎設施網路(DePIN)有望革新充電基礎設施。當人形機器人像汽車般全球運行時,充電站需如加油站般觸手可及。中心化網路需要巨額前期投資,而DePIN將成本分攤至節點運營商,使充電設施快速擴張至更多區域。
DePIN還可利用分布式基礎設施優化遠程操控延遲。通過聚合地理分散的邊緣節點計算資源,遠程操控指令可由本地或最近可用節點處理,最大限度縮短數據傳輸距離,顯著降低通信延遲。但當前DePIN項目主要聚焦去中心化存儲、內容分發和帶寬共享,雖有項目展示邊緣計算在流媒體或物聯網中的應用優勢,尚未延伸至機器人或遠程操控領域。
遠程操控是最具前景的數據採集方式,但中心化實體僱傭專業人員採集數據的成本極高。DePIN通過加密代幣激勵第三方提供遠程操控數據解決此問題。一些項目正在構建全球遠程操作員網路,將其貢獻轉化爲通證化數字資產,形成無需許可的去中心化系統——參與者既可獲得收益,又能參與治理並助力AGI機器人訓練。
(2) 安全始終是核心關切
機器人技術的終極目標是實現完全自主化,但人類最不願看到自主性將機器人變成攻擊性武器。大語言模型的安全問題已引發關注,而當這些模型具備實體行動能力時,機器人安全便成爲社會接納的關鍵前提。
經濟安全是機器人生態繁榮的支柱之一。該領域的一些公司正在構建去中心化的機器協調層,通過密碼學證明實現設備身分認證、物理存在驗證及資源獲取。不同於簡單的任務市場管理,這些系統使機器人能夠不依賴中心化中介,自主證明身分信息、地理位置與行爲記錄。
行爲約束與身分認證通過鏈上機制執行,確保任何人均可審計合規性。符合安全標準、質量要求和區域規範的機器人將獲得獎勵,違規者則面臨懲罰或取消資格,從而在自主機器網路中建立問責與信任機制。
第三方再質押網路同樣能提供對等的安全擔保。盡管懲罰參數體系仍需完善,相關技術已進入實用階段。預計行業安全準則即將形成,屆時懲罰參數將參照這些準則建模。
4. 填補機器人技術棧的空白
與AI不同,機器人領域在資金有限時難以入門。要實現機器人普及,其開發門檻需降至AI應用開發般的便捷程度。我們認爲三個層面存在改進空間:融資機制、評估體系與教育生態。
融資是機器人領域的痛點。開發計算機程序僅需一臺電腦和雲計算資源,而構建功能完整的機器人必須採購電機、傳感器、電池等硬件,成本輕易突破10萬美元。這種硬件屬性使機器人開發相比AI缺乏靈活性且成本高昂。
現實場景的機器人評估基礎設施尚處萌芽期。AI領域已建立明確的損失函數體系,測試可完全虛擬化。但優秀的虛擬策略無法直接轉化爲現實世界的有效方案。機器人需要在多樣化現實環境中測試自主策略的評估設施,才能實現迭代優化。
當這些基礎架構成熟後,人才將大量湧入,人形機器人將重演Web2的爆發曲線。一些公司正朝此方向推進——其開源項目將原始硬件轉化爲具備經濟意識的可升級智能體。視覺、語言和運動規劃模塊可像手機應用般即插即用,所有推理步驟均以簡明英語呈現,使操作員無需接觸固件即可審計或調整行爲。這種自然語言推理能力讓新一代人才無縫進入機器人領域,爲引爆機器人革命的開放平台邁出關鍵一步,正如開源運動對AI的加速作用。
人才密度決定行業軌跡。結構化的普惠教育體系對機器人領域人才輸送至關重要。一些公司已開始在美國K-12公立學校推出基於人形機器人的通用教育課程。該課程設計具備平台無關性,可適配各類機器人形態,爲學生提供實踐操作機會。這一積極信號強化了業內判斷:未來數年機器人教育資源的豐富程度將比肩AI領域。
5. 未來展望
視覺-語言-行動模型(VLA)的創新與規模經濟效應,已催生出經濟實惠、高效且通用的人形機器人。隨着倉儲機器人向消費級市場擴展,安全性、融資模式與評估體系成爲關鍵探索方向。業內專家堅信加密技術將通過三