#OpenAIReleasesGPT-5.5 OpenAI 推出 GPT-5.5:代理智能新時代引領「超級應用」雄心



舊金山 – 在一個令人驚訝的舉動中,重塑人工智能競爭格局,OpenAI 正式推出了 GPT-5.5。

在 GPT-5.4 發布僅六週後,新模型——代號「Spud」——不僅僅是一次增量升級。OpenAI 總裁 Greg Brockman 描述它為「一種用於實際工作的新型智能」,標誌著從對話聊天機器人到自主「代理」系統的根本轉變,這些系統能夠在無需手把手指導的情況下執行複雜的多步任務。

專注於「行動」,而非僅僅是「聊天」

與前代產品不同,GPT-5.5 被設計為一個代理運行時系統。它旨在規劃、執行、驗證並在數位工具(如代碼解釋器、瀏覽器和辦公軟體)中反覆迭代,以最小的監督完成任務。

早期測試者指出其「概念清晰度」和持久性有顯著提升。在一個值得注意的案例中,該模型在20分鐘內成功將一個包含數百個前端變更的複雜分支合併到一個修改過的主分支中——這是之前的模型未能完成的任務。

基準測試與定價

性能提升立竿見影。在測試複雜命令行工作流程的 Terminal-Bench 2.0 中,GPT-5.5 得分 82.7%,超越了 Claude Opus 4.7 的 69.4%。在知識工作方面,GDPval 得分達到 84.9%,領先。

然而,這種強大也伴隨著高昂的成本。OpenAI 將價格翻倍:標準版 GPT-5.5 的價格為每百萬輸入標記 **$5 美元**,每百萬輸出標記 $30 美元,而 GPT-5.5 Pro (則用於重度任務),價格為 30/180 美元。OpenAI 解釋說,這是因為該模型在完成任務時「使用的標記數明顯較少」,從而降低了總擁有成本。

「超級應用」策略與安全性

此次推出是 CEO Sam Altman 建立 AI「超級應用」策略的基石,旨在將 ChatGPT、Codex 和 AI 瀏覽器整合到一個企業工作平台中。

鑑於其能力,OpenAI 將 GPT-5.5 歸入「高」風險類別,指出它可能放大現有的濫用途徑。公司在推出前進行了廣泛的紅隊測試和外部安全測試。
查看原文
post-image
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 5
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
discovery
· 5小時前
直達月球 🌕
查看原文回復0
discovery
· 5小時前
2026 GOGOGO 👊
回復0
Sheen crypto
· 6小時前
LFG 🔥
回復0
Sheen crypto
· 6小時前
2026 GOGOGO 👊
回復0
Sheen crypto
· 6小時前
直達月球 🌕
查看原文回復0