今天小編分享的互聯網經驗:第一個吃到DeepSeek紅利的AI影像產品出現了?,歡迎閱讀。
文 | 白鲸出海
普通用戶到底需要什麼?
在 R1 推理模型大火之後,全民接力集成 DeepSeek,有矽基流動這樣的大模型雲服務平台、有騰訊元寶這樣的 Chatbot,甚至微信這樣的頂流。但是,AI 圖片類產品卻鮮少有接入 DeepSeek R1 的新聞,而從 DeepSeek-R1 發布到 Krea 宣布上線新功能僅僅 10 天,這個反應應該是影像產品中最快的。
用 DeepSeek 降低門檻,Krea 率先 " 吃螃蟹 "
在 Krea 之前,集成了 Chatbot 的生圖和改圖功能已經存在,最典型如 ChatGPT,但用過的讀者應該有一些感受,雖然疊加了 Chatbot 理解用戶意圖的步驟,但不論是生圖還是改圖,效果都不盡如人意。(可見下文案例對比)
而 DeepSeek-R1 的引入,讓這類功能的使用體驗有了一些變化,2 個點,深度推理且低成本。前者解決了可控,後者決定了,新技術可應用到商業產品中。
用戶用自然語言表達意圖時,不會像精心編寫的 Prompt 那樣清晰,DeepSeek-R1 則重在理解用戶意圖,而且 Krea 還給為了接近可用狀态所需要的後續操作,加了 buff。
如上面的視頻,加了 R1 就是為了降低門檻,讓用戶可以用自然語言生圖、改圖,所以後續的一些操作,例如改變風格、圖片生成動畫,Krea 都設定了便捷互動按鈕,但在互動上,其實是產品将按鈕功能 " 翻譯 " 成一句方便 R1 理解的話,從而讓生成結果接近用戶預期。
筆者也對 OpenAI 新推出的 o3-mini 推理模型和加入 R1 的 Krea,進行了生圖和改圖的對比測試。
生圖指令:Help me generate a picture of a sunset, beach, blue sea, coconut trees;
修改圖片指令:remove all coconut tree,注:Krea 生圖模型默認選擇 Flux,ChatGPT 選擇的是 GPT-4o 普通模型和 o3-mini 推理模型,生圖模型為 DALL-E3
首先,筆者用相同的自然語言指令,讓 Krea Chat 和 ChatGPT(兩種模型)各生成一張圖片(如左圖),然後再向兩者同時下達改圖指令,要求将海灘旁的椰子樹去掉(結果如右圖)。
我們看到,Krea 和 o3-mini 模型都将椰樹去掉了,完成了任務,GPT-4o 生成的畫面中卻仍有椰樹。而兩個推理模型相比,o3-mini 改出來的影像雖然去掉了椰子樹,但畫面幾乎等同于 " 重新生成 ",Krea 令人比較驚喜的一點是,在幾種樹中只去掉了椰子樹,而且保留了原影像的大部分元素,起碼能算是改圖。
效果差異的背後有 R1 和 o3 推理模型的區别,其實也會有生圖模型 Flux 和 DALL · E 3 的區别,由于沒有辦法進行交叉驗證,究竟是哪些因素影響了不同產品的改圖表現尚未可知。
這次,Krea 将 R1 集成到產品中,還有另一個前提條件——成本。
在考驗自然語言推理的 Zebra Logic 測試中,DeepSeek-R1 評分雖不如 OpenAI-o1,但評分卻比其他非推理模型高很多
注:上面測試中使用的 o3-mimi 上線時間晚于 DeepSeek-R1,API 價格也高于 DeepSeek
雖然 OpenAI o1 是最早上線的推理模型,但由于其昂貴的使用價格,用于改善生圖效果并不現實,DeepSeek-R1 則完完全全将價格打了下來。
而 Krea 引入 R1,除了讓生圖和改圖更接近用戶預期之外,另一個層面的顯著收益是,讓使用門檻降了下來,不論是不用再去精心編寫 prompt,還是點一下就能進行後續步驟,都對普通用戶更加友好。
訪問量增長停滞,Krea 急于破圈
白鲸出海的老讀者,應該知道我們在過去半年一直在更新 AI 圖片出海洞察系列,Krea 是我們覺得在一眾圖片編輯產品中,有自身獨特定位和特色的一個產品。
12 月圖片編輯(上)/ 生成(下)產品的人均訪問次數和人均訪問時長數據,注:Krea 功能覆蓋圖片生成、修改、與增強,很難單純的将其分類到生圖 / 修圖類别,所以這裡我們分别與修圖和生圖產品進行對比|白鲸出海制圖
從人均訪問次數和時長的角度看,Krea 的數據還是不錯的,表明獲得了一些用戶的認可。但從流量的角度,一款口碑還可以、使用數據也不錯的產品,卻一直橫盤狀态,甚至在 2024 年下半年一直下滑。
直到 1 月份,Krea 頻繁更新,上線了實時 3D 生成和快速定制化訓練 Avatar,2 個比較破圈的功能,其流量在 1 月轉好。
這其中的原因,與 Krea 相對獨特的使用體驗所吸引到的大多是偏專業的用戶有關(下文會詳細解釋),在流量下滑的情況下,Krea 嘗試破圈尋找增量用戶。Krea 的創始人 Victor Perez 也在一個播客中表示:" 目前 Krea 的用戶中專業人士占比很高,但就團隊的計劃而言,則更希望去做真正面向普通人的 AI 工具。"
秉持着這個理念,Krea 的產品設計與迭代方向,一直致力于簡化操作、優化用戶的互動體驗,以吸引更多元的用戶,引入 DeepSeek 驅動的 Krea Chat,其實也是這一思路的延續。
靠實時生圖解決 " 可控性 " 問題,Krea 賺到了 " 第一波用戶 "
Krea 成立于 2022 年,創始人 Victor Perez 從創業孵化器 HF0,獲得了數百萬美元的初期投資,并創立了 Krea。(注:HF0 是位于舊金山的一個創業孵化器,他們會為創業者提供一個為期 12 周的封閉工作空間,并視創始人在這期間的表現,為創業項目提供投資,額度超 100 萬美元以,上不封頂,占有初創公司 5% 的股權。)
Krea 自己本身并沒有自研模型,走的是 " 開源模型 + 優化工程 &UI" 的路徑,結合筆者的體驗和創始人分享,Krea 的核心差異點是 " 精準控制 ",而為了實現精準控制,Krea 着重在互動優化上下了功夫,而目前主打的實時生圖功能,就很能體現這一思路。
Krea 落地頁
Krea 于 2023 年初開始封閉測試,實時生圖功能也誕生于封測時期。根據創始人 Victor 的分享,實時生圖的靈感來源于 " 投屏 ",他想到,在用戶生成圖片時,可以将結果實時顯示出來,然後再讓用戶照着結果,進一步與 AI 進行互動,形成獨特的用戶體驗 "。
一位 Krea 的投資者的陳述|圖片來源:YC
随後,他用了一夜時間寫好了 Demo,并将測試視頻發在了 Twitter 上,很多用戶表示非常感興趣,并希望試用這個程式。用戶的反饋讓 Victor 信心倍增,經過幾個月的開發,當 2023 年 11 月 Krea 正式上線時,實時生成功能成了主打功能。一位 Krea 的投資人表示,他就是看中了 Krea 低延遲的實時生圖,才投資了 Krea。
圖片來源:AI 產品榜(2023 年 12 月)
在推出實時生圖功能 1 個月後,2023 年 12 月,Krea 的網站流量就增長了 191%,達到了 365 萬,下一個月(2024.1)訪問量又提升了 22%,接近 450 萬。
注 1:我在這裡選擇的一張參考背景,但很多創作者會選擇直接在黑色背景上進行創作,注 2:如果上傳參考圖片或者風格,Krea 中會出現了權重控制,是一個 0-1 的浮點數值,數值越接近 1,最終輸出會與參考影像 / 風格越接近。
實時生圖界面中,畫布被抽成了兩部分,左邊是創作區,右邊是成品區,用戶在下方輸入 Prompt,初版的影像就顯示在右側了。除了 Prompt 外,用戶可以上傳參考圖片,選擇預設風格(官方和社區訓練好的 Lora)來控制生圖效果,并調節各個風格 / 影像的 " 權重 ",以更精準地控制輸出。(Krea 的文生圖功能也有類似的設計)
随後,用戶可以在左側的創作區 " 手繪 " 塗鴉或插入圖形(矩形、三角形和圓形),來控制畫面中人物或物體的位置和形狀,并通過調整 AI Strength 參數來平衡自己的 " 創作 " 和 AI 的 " 發揮 " ,所有改動都會實時顯示在右側。
根據 Krea 創始人給出的數據,實時顯示的延遲大概在 40 毫秒左右,當用戶拖動圖形時,Krea 也會以每秒 4-5 幀(相當于 250 毫秒左右處理一張影像)的速度連續處理影像。創始人解釋道,實時生圖本來對算力的要求就很高,如果算上高并發,需要的算力儲備就更大了,40 毫秒的延遲,用戶既不會感到特别卡頓,還能盡量節省算力。
一位自稱是 Krea 員工的 Reddit 用戶的分享|圖片來源:Reddit
在工程方面,Krea 堅持自己部署模型,以減少使用第三方托管平台帶來的延遲,團隊也花了大量時間圍繞算力、模型等基礎設施進行了開發與優化,讓 Krea 在更大用戶量的情況下,也能維持低延遲。
而在用戶完成一版設計之後,還可以把右側的 " 成品圖 " 拖動到左邊,并以這版影像作為基礎,進一步進行修改和優化,實現多次迭代。與 Krea Chat 相似,實時生圖也算是文生圖功能的變種和延伸,用戶通過圖形、塗鴉來精準地按自己意願修改影像,并可以多次迭代,以減少生圖模型不可控性的影響,相比無限抽卡,這種模式看上去更有效率。
但相比 Krea Chat,讓用戶通過圖形和塗鴉去控制生圖效果的門檻其實不低,無論是筆者本人,還是試用過 Krea 的編輯部同事都有相同的感覺," 知道這個實時生圖功能很好,但就是不知道它對自己來說能做什麼用。"
從數據來看,到 2024 年 2 月(實時生圖上線 3 個月後),Krea 的訪問量已經突破了 600 萬,相當于過去一年時間,Krea 的訪問量都沒有突破這個 " 天花板 "。
為專業用戶打造完整工作流的 Krea,能吸引普通用戶嗎?
除了上面介紹的實時生圖和 Krea Chat 功能外,Krea 提供文生圖、改圖、影像增強等影像功能。此外,還給到了一個生成視頻的功能,這個功能于 2024 年 5 月推出,現已接入了混元、Runway、Kling、Hailuo 等市面上主流的視頻生成模型。
文生圖(上)、改圖(中),影像增強(下)|圖片來源:Krea
從生圖、改圖到影像增強,Krea 基本形成了一個較為完整的工作流。整體體驗下來,這幾項功能的效果是很在線的。而延續整體思路,基于優秀互動的精準控制,Krea 在互動也下了功夫,這些功能的操作都是比較簡便的。
用戶可以直接在畫面中框選,并輸入 Prompt,就可以在局部添加物體或修改影像
社媒上的用戶對 Krea 優化 " 精準控制 " 的思路,絕大多數都是報以好評的,這與我們之前的認知一致,作為 Krea 初期吸引到的專業用戶," 可控性 " 是剛需,而 Krea 也回應了這個需求。從在 X 中與 Krea 官号和創始人 Victor 互動的用戶來觀察,Krea 目前的用戶畫像大概是藝術家、設計師、需要經常做圖的營銷人員等相對專業一些的人士。
但是對出于娛樂目的或低頻使用 AI 影像產品的普通用戶來說,由于他們對最終的影像并沒有具像化的認知,所以實時生圖提供的 " 可控性 " 可能吸引力不大,這大概就是 Krea 近半年來很難 " 破圈 " 的原因。
但反觀 Krea Chat,不論是引入 DeepSeek-R1,以更好地理解用戶意圖,還是通過标籤,讓用戶能夠一鍵下達準确的 " 改圖 " 指令,其實都是在回應普通用戶,對簡便操作、靈感指引和改圖智能程度的需求。而推出 Krea Chat 之後,這款產品能否破圈,找到新的用戶增長點,還需要觀察他們後續的流量表現。