ChatGPT Images 2.0圖像生成模型現已上架,在真實程度及文字生成更進步。
OpenAI發布了ChatGPT Images 2.0,這款模型能夠處理複雜的視覺任務,並產生精準且可立即使用的影像。在詳細指令執行、物件放置與關聯、以及密集文字渲染方面更進步,並支援寬高比高達3:1和1:3的圖像,擁有出色的構圖能力和視覺美感,使最終效果更接近精心設計,支援多種語言。雖然模型現已開放,但香港暫時需要VPN才可使用。
生成圖像更真實
Images 2.0是具備思考能力的圖像模型,可以搜尋網路以獲取即時訊息,根據一個提示創建多個不同的圖像,並對其輸出結果進行雙重檢查,在準確性、資訊時效性、一致性和視覺連貫性至關重要的情況下生成圖像。
Images 2.0為影像創作帶來了精準度和保真度,能夠構思更複雜的圖像,遵循指令並保留所需細節,甚至可增添真實感的微小瑕疵,在紋理、光線、構圖和細節方面更加一致,高達2K的分辨率呈現。實試只需簡單幾句指令,已可生成出真實圖像,由人物、資訊圖、宣傳海報等均可精準表達。
文字資料更準確
更強大的多語言理解能力,尤其在日語、韓語、中文等,可以產生具有非英語文字的圖像,不僅渲染正確,而且語言流暢連貫。產生視覺上連貫一致的輸出內容,並將語言本身融入設計之中,例如海報、說明文字、圖表和漫畫。實試生成中文、日文均沒有火星文,而且文字可閱,相當強大。
而且資訊亦正確未有AI幻覺虛構事實,將更貼近時代的世界認知融入圖像創作,其知識更新截止時間設定為2025年12月,從而輸出更具相關性和語境準確性的圖像,對於解釋性圖像、地圖、教育圖表和視覺摘要等輸出形式尤其重要。














