1

熱搜:

熱門行情

最近搜尋

全部刪除

ChatGPT文生圖功能重大升級:準確生成文字 商用邊界大幅拓展

鉅亨網編譯鍾詠翔
ChatGPT上線多年後愈發雞肋的圖像生成功能,終於迎來歷史性升級。(圖:Shutterstock)
ChatGPT上線多年後愈發雞肋的圖像生成功能,終於迎來歷史性升級。(圖:Shutterstock)

ChatGPT 上線多年後愈發雞肋的圖像生成功能,終於迎來歷史性升級。

OpenAI 執行長奧爾特曼周二(25 日)在直播活動中表示,正式推出基於 GPT-4o 模型的原生圖像生成功能——模型直接從文本提示生成圖像,不再調用獨立 DALL-E 文生圖模型。

從周二開始,基於 GPT‑4o 的圖像生成功能向所有免費和付費用戶推出,未來幾周內開發者能通過 API 調用這項功能。

ChatGPT 運用 GPT-4o 多模態能力,在圖像生成時能更加精確遵循指示,更精確渲染圖像上的文字。

ChatGPT 於 2022 年底上線,最初只能進行文字聊天。大約一年後,OpenAI 發布第三代圖像生成模型 DALL-E 3,並集成到 ChatGPT,但兩者一直是互相獨立的系統。

在新鮮感過去後,AI 圖像生成器「理解提示詞能力差」,特別是「無法準確生成圖片中的文字」,嚴重阻礙這項功能在教育、職場等領域的應用。

隨著今年阿里巴巴 (09988-HK) (BABA-US) 、Google 先後推出能準確生成文字的文生圖模型,OpenAI 終於補上這個短板。

OpenAI 在周二演示中展示了新一代 ChatGPT 的圖像功能升級到何種程度。

首先,ChatGPT 已經能夠大致準確地按照提示詞,生成圖像中的文本。在演示中,AI 成功按照要求生成一整頁的講話文本,沒出現錯別字。

奧爾特曼感慨,能在圖像生成功能中完美呈現文字本不應該是那麼令人讚嘆的事情,但他們卻等了這麼久。

從官方給出的更多示例來看,不管是生成黑板板書,還是印刷體、展示科學常識的繪圖,ChatGPT 在生成圖像文字領域終於從完全不能用,達到接近商用的程度。

同時,ChatGPT 的圖像編輯功能,也變得更加有用。

在演示中,兩名研究人員與奧爾特曼合影,然後要求 ChatGPT 將合照轉化為動畫畫風。

結合 GPT-4o 的知識庫和終於能把字寫清楚的能力,ChatGPT 也能通過簡單的提示詞,生成有關相對論的漫畫彩圖。

說到漫畫,現在 ChatGPT 也能根據漫畫草稿,一鍵生成上完色成品,也支援上傳圖片更換漫畫裡的主要角色。

從商業應用方面來講,現在模型也能根據用戶上傳的照片和卡片模板,自定義組合生成新的卡片,並按照要求展示圖片和文字。

GPT‑4o 也可以根據聊天上下文的基礎來生成圖片和文字,所以生成的一系列圖像將具有一致性,這對設計遊戲角色而言相當重要。

加權指數
  • 563
  • 254
  • 91

21,298.22

+18.05++0.08%

櫃買指數
  • 463
  • 228
  • 68

237.38

+1.6++0.68%

電子指數
  • 271
  • 91
  • 32

1,145.67

-0.61-0.05%

金融指數
  • 25
  • 12
  • 11

2,109.23

+8.61++0.41%

非金電指
  • 306
  • 167
  • 58

14,173.28

+52.76++0.37%

Yes club ad
Yes club ad

相關貼文

left arrow
right arrow

活動講座

cookies

為優化網站服務,鉅亨網使用Cookie來改善使用者體驗。當您繼續使用本網站即表示您同意Cookies政策與隱私權政策