ChatGPT Images 2.0怎麼用?實測牛肉麵菜單、雜誌封面、多國語言科普效果

robot
摘要生成中

OpenAI推出ChatGPT Images 2.0生圖工具,主打強大的複雜排版與多語系文字(包含中文)處理能力,本文將全面介紹Images 2.0功能、特色、免費與付費方案功能,還有實測生成結果。

ChatGPT Images 2.0是什麼?主要功能、特色告訴你!

能與 Gemini Nano Banana 2 較量的 AI 生圖工具來了?OpenAI 宣布推出 ChatGPT Images 2.0,由全新的 GPT Image 2 模型驅動,主打優秀的圖像應該具備選擇、排列與揭示資訊的能力,以下是 ChatGPT Images 2.0 的 3 大特色:

強大的排版與多語系文字處理

首先一個比較明顯的特色是,ChatGPT Images 2.0 大幅提升的排版與多語系文字處理能力。

外媒《Techcrunch》指出,以前的 AI 圖像生成工具多半採用擴散模型,在拼寫文字方面經常遇到困難,ChatGPT Images 2.0 能精準呈現微小文字、圖示與使用者介面等細節。

OpenAI 表示,Images 2.0 在處理非拉丁字母的語言上有顯著的進步,包含中文、日文、韓文、印地文與孟加拉文等,都能以極高的清晰度生成在圖像中。

圖源:OpenAI ChatGPT Images 2.0官方生成範例

全新思考能力與聯網搜尋

除了排版與多語系文字處理能力外,ChatGPT Images 2.0 還提供全新的思考能力,可以透過即時搜尋網路資訊來協助生成圖像。該模型的知識庫更新至 2025 年 12 月,有助於生成涉及近期事件的內容。

圖源:OpenAI ChatGPT Images 2.0官方生成範例

支援 2K 解析度與多樣化長寬比

ChatGPT Images 2.0 支援高達 2K 解析度的圖像生成,並提供更廣泛的長寬比選擇,從寬幅的 3:1 到長幅的 1:3 皆涵蓋在內。

OpenAI 研究負責人陳博遠(Boyuan Chen)表示,Images 2.0 架構已經過全面改版,屬於一種通用模型,只需透過簡單的文字提示,就能處理 3D 風格的視角轉換與複雜的空間推理。

ChatGPT Images 2.0免費、付費方案用戶功能

一分錢一分貨?ChatGPT Images 2.0 不同層級的付費使用者,能解鎖的功能也不同,整理如下:

  • 免費用戶: 目前可以使用基礎的 ImageGen 2.0 模型來執行標準的圖像生成任務。基礎版本已經包含許多核心升級,例如更好的指令遵循能力、更強大的文字渲染效果、多語系支援以及更多元的長寬比選項。
  • **ChatGPT Plus、Business 與 Enterprise 用戶: **這些付費用戶可以啟用全新的思考模型。在該模式下,聊天機器人的圖像生成器會運用網路搜尋資訊,根據用戶上傳的檔案建立視覺解說圖,並在實際生成圖像前預先進行結構推理。單次最多可同時生成 8 張圖像,且能確保每個場景中的角色、物件與風格保持一致。
  • **Pro 用戶:**這些用戶將獲得更進階的 ImageGen Pro 模型存取權限。雖然 OpenAI 尚未提供 Pro 與思考功能之間精確的差異細節,但企業用戶可將思考功能視為實質的功能升級,適用於需要事實根據、轉換內部文件為解說圖,或是需要在多項資產中保持視覺一致性的任務。
  • API 開發人員: 現在能整合 gpt-image-2 模型,並支援高解析度與靈活的長寬比設定。

ChatGPT Images 2.0 實測:菜單、雜誌、解釋圖表等

ChatGPT Images 2.0 的實際表現,是否符合 OpenAI 的宣傳呢?我們來實測一下。

實測牛肉麵店菜單

《加密城市》編輯使用 ChatGPT 免費方案實測,製作一份台灣牛肉麵料理菜單,提示詞只簡單說明:「幫我生成一張主打台灣牛肉麵料理的菜單,菜單上面要使用繁體中文,呈現出每道菜的名稱、價格、圖像資訊。」

以下是生成結果:

圖源:ChatGPT Images 2.0生成

以免費方案能生成出來的內容來說,乍看起來還算不錯,只不過細看仍會發現 Images 2.0 在處理筆畫比較複雜的繁體中文字時,仍會出現書寫錯誤的問題,也許付費方案生成結果會更好。

另外生成結果算是有趨近於台北牛肉麵價格,而且還可以內用免費加麵一次。

不過如果你的菜單要印出來,在印刷實務上,將 ChatGPT Images 2.0 提供的圖檔,轉化成向量檔(如 EPS、Adobe illustrator 的 .ai 檔、PDF),並使用 CMYK 色調,是最適合印刷的,印刷廠雖也可能接受 JPG 與 PNG 檔案,但若你對印刷成果有很大的要求,會較難調整成你要的樣子。

實測科技雜誌封面

接下來實測科幻雜誌封面,這次《加密城市》測試處理複雜排版的效果,提示詞為:「幫我生成一張以繁體中文製作的科技雜誌封面,雜誌名稱是「加密城市」,主題為「區塊鏈與 AI 的交匯」,這個封面要有標題、卷號、條碼上方的顯示期限日期,所有文字都要呈現出清晰且專業的對齊效果。」

以下是生成結果:

圖源:ChatGPT Images 2.0生成

這個測試結果跟上面的類似,都是乍看不錯但細看在處理複雜筆畫的中文時仍有缺失,另外封面字體與台灣字體商 Justfont 的「金萱體」蠻像的,不曉得是否有取得授權。

這樣的疑惑,《加密城市》也曾在 Nano Banana Pro 推出時提出過。

  • **相關報導:**Nano Banana Pro實測:中文字有進步!但動畫、字型侵權疑慮也浮現

實測多國語言解釋性圖表

《加密城市》測試了一張地震發生原因的繁體中文、日文、韓文圖表,複雜多國語言文字有大致渲染成功。在排版方面有根據語言不同,使用不同的顏色區分,雖然細看一樣有部分複雜筆畫的中文、漢字或韓文有模糊的問題。

以下是生成結果:

圖源:ChatGPT Images 2.0生成

Images 2.0可保持角色物件一致性,解決繁瑣流程

另外,Images 2.0 也像 Nano Banana 2 一樣擁有可編輯性,只要點擊生成圖像左下方的「編輯」就可開始操作,可保持角色與物件一致性,讓生成漫畫頁面、社群媒體圖文系列或房屋各房間的設計平面圖變得更加容易。

ChatGPT Images 產品負責人 Adele Li 表示,這項功能解決了以往用戶必須逐一生成單張圖片並手動拼接的繁瑣流程,讓創作者可以輕鬆打造具備相同視覺基因的兒童繪本或品牌行銷活動素材。

此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言