今天小編分享的科學經驗:GPT-4o影像生成今起免費!奧特曼坐鎮緊急發布,指令遵循/文本控制表現驚豔,歡迎閱讀。
OpenAI 全量開放 GPT-4o影像生成能力,這回免費用戶第一時間上車!
即日起在 ChatGPT 和 Sora 中,向所有 Plus、Pro、Team 和免費用戶推出。
一夜之間,各種實測結果刷屏。最驚豔的莫過于對文本的處理能力。
比如,4o 可以 100% 還原文字内容,且指定文字擺放位置。
男人右手舉着 "a few",左手舉着 "words"
還能像連續劇一樣,一邊準确生成文字,一邊變換人物動作。
仔細對比兩張圖,第一張白板中的男人倒影和第二張圖也對應上了。
昨晚 OpenAI突然宣布要開個小直播發布,這回奧特曼出現了(前情:GPT-4.5 發布時他由于帶娃沒來)。
直播中展示了各種玩法,比如制作梗圖、文本渲染、多輪互動生成和指令遵循等。
直接現場咔嚓一張自拍,然後立馬轉成動漫風格。
順帶官方玩梗制作 meme 圖,要求在圖片中添加 "feel the agi"。(沒錯,生成時還知道将小寫換成更符合的大寫)
現在,打開 ChatGPT,即可嘗試這些能力。
實測生成速度很快(大約十幾秒一張),但普通用戶每天僅有 3 次體驗機會。
API 預計将在未來幾周内逐步推出。
這波主打一個美觀又實用
我們終于邁向了這種真正集成的多模态模型。
按照官方介紹,作為多模态模型的 4o 現在終于補齊了一塊重要拼圖——圖片生成。
而且主打一個美觀和實用兩手抓。
話不多說,我們直接來看其能力更新的具體表現。
各項能力大更新
首先,OpenAI 表示 4o 現在能精确融合符号和圖片了。
比如直接給一段文字,然後生成一張制作精美的菜單:
而且支持在多輪對話中逐步調整圖片内容和風格。
類似下面這樣,提供一張貓貓原圖,然後一步步創建一個遊戲角色:
此外還非常注重細節,官方稱 4o 可以處理多達 10-20 個不同的物體,而其他模型一般在處理 5-8 個物體時就會遇到困難。
除了上述,4o 在生成真實影像方面也表現出色。
連現實版 " 照貓畫虎 " 也有了 ( doge):
網友實測 ing
看完官方宣傳效果,網友們也趕緊來了一波實測 ~
經典梗圖第一時間申請出戰,畫面還真毫無違和感 hhh。
甚至,復現同款書寫圖也是不在話下:
One More Thing
話說最近這兩天也過于熱鬧了,DeepSeek、OpenAI 和谷歌幾乎同台開戰。
值得一提的是,昨晚 11 點(北京時間)OpenAI 突然宣布将有小發布,而 DeepSeek 剛剛發布了 DeepSeek-v3-0324 的官方技術報告。
不知道是不是被 DS 逼出來的新發布呢?(doge)
參考鏈接:
[ 1 ] https://openai.com/index/introducing-4o-image-generation/
[ 2 ] https://x.com/chatgpt21/status/1904683763914674208
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
最後一周!2025 年值得關注的 AIGC 企業產品 報名即将截止
下一個 AI" 國產之光 " 将會是誰?歡迎申報獎項!
本次評選結果将于 4 月 16 日中國 AIGC 產業峰會上公布。
一鍵星标
科技前沿進展每日見