今天小編分享的科技經驗:對話「妙鴨」產品負責人:AIGC 的產品第一天不收錢,就可能收不到錢,歡迎閱讀。
誰都沒有想到,國内 AIGC 第一個真正意義上破圈的現象級產品,誕生在照片美化(寫實人像)這個已經相當成熟的賽道。
7 月中旬悄悄上市,憑借着只需「9.9 元和 20 張照片就能生成藝術寫真級的個人美照」這個噱頭,妙鴨在短短幾周的時間引來無數愛美女孩兒下載嘗鮮,生成的「妙鴨美照」席卷了朋友圈等社交媒體。
妙鴨破圈的速度令人側目,但背後的開發團隊卻十分神秘。在上線和快速破圈之前,既沒有在過去幾個月的數十場大模型發布會上有所劇透,也不是拿到幾千萬上億天使融資起步的「大佬下海創業」,甚至絕大多數圈内人,都不清楚妙鴨背後到底是創業團隊還是一個大廠内部項目。
近日,妙鴨產品負責人張月光接受了包括極客公園在内多家科技商業媒體的群訪。
妙鴨是阿裡大文娛孵化的内部項目。ChatGPT 掀起新一波 AI 浪潮之後,張月光拉上幾名同事今年 2 月建了一個「AIGC 破壁小組」的内部群,用 1 個月的時間讨論出了「寫實人像」這個項目方向,再用 3 個月的時間打磨出了「妙鴨」這個具體的產品。
這很難不讓人想到谷歌早年間著名的「20% 自由時間制度」,以及因此而誕生的谷歌眼鏡、Cardboard、無人駕駛汽車等令人驚豔的創新。這個更像是矽谷式創新的浪漫開場,也引起了我們對妙鴨更大的好奇。
在一個半小時的訪談裡,張月光回答了一系列有關妙鴨的問題和争議。雖然產品背後的技術、用戶規模、團隊構成和未來商業化思路等問題被他們歸為商業機密而「不方便透露」,但選擇寫實人像的理由、產品誕生的歷程、數據隐私争議、以及走紅的原因等,他們給出了詳細的闡釋,為我們揭開了妙鴨神秘面紗的一角。
以下是經極客公園整理的對話内容。
01 幾個人的興趣小組,三個月打磨出「妙鴨」
問:團隊怎麼從 0 到 1 做起來的?
答:這個項目最初是在一二月份開始,比較簡單,沒有像現在這樣有一個清晰的商業計劃,類似于一個興趣小組,我和五六個同學一起研究 AI 和影像技術方面的前沿知識和產品。在 2 月 9 号拉了名為 AIGC 破壁行動小組的群。從那時候開始,我們陸續關注到影像 AI 技術領網域中的一些新技術和生态中的新工具和插件。到三月份左右,我認為一些關鍵的技術要素已經相對成熟了,決定朝着寫實人像的方向開發。
妙鴨團隊合影|妙鴨相機公眾号
我們花了三個多月的時間來打磨這個方向,包括技術和美學項目上的模板。在產品開發到 6 月底和 7 月初時,我們終于覺得可以向用戶展示它的狀态,開始為期兩周的内測,邀請了一些身邊的朋友和同事,我們得到了大家的反饋,發現用戶對產品的效果和滿意度都比較正向。在 7 月中旬,我們正式對外發布了產品。產品上線後,引起了比較大的反響,用戶也确實比較喜歡它,發展速度超過了團隊最初的預期。
資源支持方面,資源占用最初不大,随着逐漸發展,妙鴨有了更多支持。最重要的是,公司對創新的包容和支持,讓我們做了比較多的嘗試。
問:為什麼選擇寫實人像領網域做 AIGC 落地?
答:我對產品方向有一些基本的分析。首先我以前做過相冊類產品,其中會給用戶提供基于算法的這種自動分類,在所有用戶的相冊,70% 以上是真人的照片。如果把所有照片和圖片類信息放在一起,未經篩選的話,寫實的人像将是最有價值、占比最高的,也受到最高度關注。
另一個考慮因素是,海外像 Midjourney 這樣的產品比較成功,國内也有一些類似的產品試圖復刻這種模式。然而,這些產品本身是一個什麼都能畫的畫家,對技術和算法等方面的要求相對較高。更垂直的方向更容易實現,這就是為什麼選擇寫實的大方向。
問:很多人體驗妙鴨後都說「只需 9.9 元就能打敗天真藍和海馬體」,你們怎麼看?
答:我們并沒有想要幹掉天真藍、海馬體的想法,這只是用戶的口号。我們最初的產品形态可能與現在的攝影服務形态相似,但從我們的角度來看,我們希望與攝影和攝像行業達成共識,成為行業的賦能者。海馬體作為實體拍攝服務,它永遠不可能被替代。因為拍攝的過程本身對于客戶來說非常重要。例如,拍攝全家福時,一家人聚在一起完成這個過程本身就是一個非常有意義的事情。即使 AI 技術再發達,也無法替代這樣的過程。
妙鴨相機首頁
我們希望覆蓋一些比較下沉的城市和欠發達地區的用戶,因為他們可能很難接觸到這種服務。但是,無論在哪裡,對于美和攝影的需求是存在的,因為人們總是希望為自己留下值得紀念的照片。
在我們最初的感謝信中,我們提到:邀請了攝影師和設計師參與模板的創建,他們對 AI 技術的幫助也很神奇。我們認為我們與這個生态系統是相輔,而不是對立的關系;想要給這個行業提供一些工具,而不是幹掉競争對手。
問:你們自己復盤下來,妙鴨為什麼會走紅?
答:其中最重要的因素是團隊成員的堅定和努力。團隊氛圍簡單、直接,目标清晰,追求極致的風格。我們花了三個月以上的時間打磨一個效果,以獲得更好的用戶體驗和效果。第二是公司對創新的鼓勵、支持、包容,以及看到一些階段性成果之後,進一步的支援。
在這個產品上本身去找原因的話,我覺得有幾個點。
首先,我認為我們運氣不錯。其次,用戶體驗非常重要。如果用戶無法流暢地使用產品,那麼即使產品本身價值再高,也會被用戶抛棄。產品的商業價值并不是一個線性的關系,而是在達到一個基點之後,才能真正地體現出來。因此,在設計產品時,我們一定要追求高質量的效果,至少要達到 90 分以上。當效果達到一個團隊的所有人覺得這個效果真好,有哇哦時刻,那它裂變的概率就很高。
此外,產品的可控性也非常重要。我們在設計產品時,堅持「真、像、美」三件事情,「真」是沒有 AI 感,「像」是和用戶像,「美」是要比用戶美 3 分。這些要求都同時達到 90 分以上的質量,我們才會将產品推向市場。
問:為什麼用戶上傳的照片數定在了 20 張?
答:為了達到理想的效果,20 張是目前這個階段的最優解。具體就不方便說了。
妙鴨相機需要用戶提供 20 張及以上照片|妙鴨截圖
問:有分析稱,像這種火爆的工具類產品都會面臨被復制的危機。有人猜測我們的背後模型是基于開源模型微調而來,認為這樣的產品技術壁壘不夠明顯。請問團隊,從内部看,我們的技術壁壘或產品壁壘體現在哪些方面?
答:确實不方便具體透露我們技術的實現方式,但我們确實有一些壁壘。最重要的是對其後續持續的迭代和拓展,以及效果的持續打磨。我們的技術團隊會不斷優化產品的效果。
問:有人猜妙鴨用了 Stable Diffusion 的模型,然後加 Lora 精調的方法,這個猜測符合現實嗎?
答:這可能确實也不方便發表評價。凡是有關這個技術實現的問題,可能都屬于我們的商業機密,不太方便洩露。
問:妙鴨背後影像生成的基座模型是自己訓練的嗎?會用阿裡雲的影像生成模型嗎?
答:妙鴨是阿裡大文娛團隊内部的一個項目,并沒有使用阿裡雲與這個相關的一些技術,至于怎麼實現的,其實我也不太能去講。
我們有一個模型叫「提香」(Tiziano),大家應該在(7 月 17 日官方發布的)感謝信中看到了這個名字——肖像畫之父(的名字)。通過這個名字,也可以看出我們從一開始就想要為用戶提供寫實人像服務。
問:當前妙鴨的模版風格是怎麼形成的?
答:本身團隊内有很多年輕的同學,大家會高效讨論。更多還是看用戶,比如說在社交媒體、朋友圈上公開去傳播的情況下,用戶比較偏好的一些方向。
我們也會收集很多用戶意見,比如用戶喜歡什麼樣的模板,繼續去推出模板,核心是滿足用戶訴求。未來即将上線的一批模板,基本上都是根據用戶的呼聲產生的。
問:妙鴨相機怎麼平衡出片的真實和美?
答:七八分像,兩三分美。我們在定寫實人像的業務方向時,提到真、像、美,這三個方向,一個是無 AI 感,然後能夠盡可能像我,但要比我美。不管是美顏相機,還是每一代的拍攝產品,這算是常識。
同時,我們把這個選擇權給了用戶。人像剛出來的時候很美,但可能沒有那麼像,然後我們有一個特殊的功能可以讓照片更像我,多點幾次,就會更像。
問:妙鴨會一直只針對年輕女性群嗎?
答:所有自拍或者影像類的產品的主力用戶都是女性用戶,看我們模板數量就很容易看出來。
02 隐私和數據安全争議
問:背靠阿裡很多影視資源,有聯動做動态換臉的產品計劃嗎?比如用通過的臉直接換成影視劇中的人物。
答:我們并不會以阿裡大文娛聯動為目标,不過如果有确實合适的機會,可以去考慮聯動影視、古風和清宮做產品,去洞察用戶興趣方向。
換臉本身,是我們堅決不去做的事情,因為從我最初對產品的定義,就不同于之前的換臉這類產品,甚至是我刻意不想去做的。
問:您如何看待市面上換臉類產品的發展?
答:換臉是一個蠻成熟的產品,它的產品場景不做更多評價。另一方面,它也有一定的安全問題。
我們本身用 AI 為大家生成的這個照片,它比起真正直接換臉反而是沒有那麼真實,最起碼我們去做人臉關鍵點檢測安全級别的東西,一定是過不去的,只是看上去像而已。我們這種方式用戶數據是安全的,生成也是相對安全的,這樣有更長遠的發展空間。
問:如何看待隐私條款的争議問題?
答:妙鴨在上線後因為用戶協定的原因引起了一些争議,我們第一時間進行了修改,我們承認這是我們自己的問題。從某些角度來看,沒有充分說明這個協定,或者說沒有用一個最簡單的方式告訴用戶。
即使是舊的那個協定,如果大家仔細看的話,就會發現它其實是和新協定類似的,即產品所有的生成物權益都歸用戶所有,我們不能進行二次使用。但為了能夠為用戶正常提供服務,我們需要在產品裡展示用戶的作品并對其進行操作,提供分享、下載的一些服務,肯定要獲取用戶授權。原協定也是這個意思,但表述可能有一些問題,所以我們進行了修改。
我們的本意是,所做的所有東西都屬于用戶,我們沒有所有權。你所有數據我都沒有留,也不會用,要展示的東西,給你展示一下,這個就是我們的初衷。
問:使用妙鴨的產品,需要上傳 20 張照片,但你提到,生成照片後平台會删除用戶的數字分身數據,那為什麼之前的版本裡提到用作訓練數據的條文?
答:首先我們沒有把這個數據用來作為訓練數據,從來沒有用過,也不會用。之前的協定,把大家都吓壞了。
妙鴨相機原争議用戶服務協定|圖片來源:網絡
再解釋一遍,這條協定的上一條是所有的生成物所有權是屬于用戶的。正是因為我們把所有權完全讓渡給用戶了,所以又返回來需要取得用戶的同意授權,才能夠展示這些信息。
其實大家如果關注很多產品的用戶協定的話,它是不說在我平台上制作的物品的所有權屬于用戶,而是模糊的,甚至是屬于平台的。如果屬于平台,那當然不需要要求用戶的授權使用,平台本來就擁有這個所有權。
這個操作當然是我們的問題,相當于把我們本來的好意表達成了一個大家非常非常害怕的表現形式。這裡必須要再澄清一下我們團隊的本心,從來都沒有考慮過用戶隐私數據和濫用用戶隐私數據的事情,所以當我們發現這個表述不太接地氣,用戶理解不了之後,我們也第一時間馬上就修改掉,也沒有任何心理壓力,因為我們壓根就沒幹這個事情。
問:用戶的面部特征會不會被提取和洩露?
答:我們沒有提取用戶的臉部關鍵點,根本沒有這個操作。用戶上傳照片時,會有一個識别的流程,這個識别流程是進行一些安全相關的檢測,避免用戶上傳的照片不符合國家法律規定,但是我們并沒有去獲取用戶的臉部數據點。
第二,用戶去制作數字分身的過程,也不是把臉部特征進行提取的過程。反過來說,我們沒有辦法再反向把你當時那 20 張照片推出來,不可能做得到。雖然不方便透露具體的技術原理,但是不涉及到用戶臉部數據信息的提取。
這也是為什麼剛才我提到,可能大家發個社交媒體,或者甚至朋友圈,發你本人的臉,這個危險性,如果要擔心這方面安全性的話,那他的危險性可能比我們這種生成類產品要高。
問:如果沒有提取用戶的臉部關鍵數據的話,怎麼做到現在的效果?
答:它是用一些現在 AI 的技術,但是肯定不是提取臉部特征點的這種方式來實現。我相信行業很多人會有各種各樣(技術路線)的猜測,這裡我不方便直接證實他,但是肯定不會涉及到安全問題。AI 的所有東西都是一個概率性的東西,它沒有辦法把你的照片再復刻出來,再推理出來,所以是非常安全的。
問:在用戶隐私保護上,妙鴨做了哪些舉措?
答:我們在協定裡承諾,沒有留存用戶的照片數據。用戶上傳的所有照片,不管是 20 張還是多少張,都會在數字分身的制作完畢後删除掉。所以既沒有保留用戶的數據,也沒有辦法通過用戶的數字分身反向再把這些數據反推算出來。
第二,我們也不會把你的數字分身或其他任何的數據展示給第三方看。我們的產品形式裡每個用戶只能看到自己生成的圖片,可以選擇是否與他人分享展示。
第三,我們本身也做了大量的網絡安全防護。因為即使我們保護用戶的隐私、不濫用用戶隐私,也要防止第三方黑客的獲取,但這得益于阿裡在隐私保護、安全方面的整體技術支持。
希望大家不要過度恐懼,這個工具本質上是一個制圖工具,制作出來的内容只有你自己可以看到,并且沒有公開傳播的屬性,恰恰更加安全。有人會問,AI 已經可以生成我的臉,那麼它是否可以用于惡意用途呢?但實際上可能再怎麼生成,也只是像你而已。但你在,比如說一些公開的社交媒體,直接發你的照片,那就是你,(如果有人)直接把你的臉摳下來,就可以做壞事了。反而我們做出的類似你的圖片,是一個沒有這麼大風險的產品。
綜合來看,這是一個對用戶影響極低的產品,幾乎沒有。數據沒保留,無法反向推算你的數據,沒有獲取原本的數據和特征點,所有的東西只有你自己看得到,是否傳播自己的生成物數據也是你的個人行為,傳播出去的生成物也不可能通過比如說人臉檢測安全點,因為它只是像你自己,但并不是跟自己完全一樣。
03 AIGC 的產品第一天不收錢,就收不到錢
問:現在看來,妙鴨 APP 的下載量,以及用戶復用的情況如何?
答:涉及到具體的數據指标,這些都是機密性質,不便分享。但我們覺得數據效果還不錯,符合預期。在内測兩周的時間裡,大約有 1 萬用戶,其中核心用戶主要來自同事圈,大部分是互聯網行業。
關于未來的用戶規模,我們有自己的計劃,但不便透露。我們希望能夠為更廣泛的用戶提供這種產品或服務,以滿足未來的發展趨勢。
問:妙鴨相機在保持用戶活躍方面是如何考量的?市面上有聲音在說,這種 APP 避免不了昙花一現,你怎麼看這種擔憂?
答:首先,效果類產品的刷屏在這個行業中幾乎司空見慣。每隔幾年或者在互聯網高峰期,每年都會出現類似的產品。有些產品确實能夠引起大眾的關注,然後沒有聲音了,但有些會沉澱下來。例如臉萌這個產品,大家都認為它在刷屏完之後就銷聲匿迹了。但實際上,臉萌的需求最終被抖音的特效和濾鏡所取代。這是一個非常穩定的需求,到今天仍有很多用戶每天使用。
對于妙鴨相機而言,我們期待肯定它不是「一波流」的東西,而是一個穩定的服務需求。當然,這需要我們持續提高產品效果和服務質量,也需要不斷推出更多的服務。具體實現方式不便分享,但我們的目标是為用戶提供低成本、高質量的影像服務。
問:妙鴨的 B 端工作站将于 8 月 4 日(今天)上線,已邀請了一些在AI和相關技術領網域中表現優秀的設計師進行内測。這個工作站是否具備内容社區屬性?如何與攝影師合作?主要吸引哪些方面的設計師?B 端面臨的核心痛點是什麼?妙鴨能解決什麼?
答:B 端工作站沒有内容社區屬性。我們現在的 ToB 業務比較簡單,更像是對 ToC 業務的一個生态補充。我們主要希望能夠與一些對 AI 技術有研究和興趣的設計師、攝影師合作,給其提供服務并一起制作模板,以滿足用戶的需求。具體的合作形式不便透露,簡單來說就是一起制作模板。
問:怎麼樣想到賣 9 塊 9 的?為什麼一開始就做商業化前置?
9.9 元包含的權益|妙鴨截圖
答:商業化潛質有兩個要素。首先,算力成本昂貴,這是業内人士都知道的。其次,AIGC 和互聯網時代的商業邏輯根本不同。在 AIGC 時代,如果你不能在第一天就向用戶收費,那麼你永遠都不可能收到用戶的錢。AIGC 產品應該在誕生的第一天就開始向用戶收費。
如果将互聯網的所有業務抽象出來看,本質上都是一種信息流通和渠道生意。平台的作用是将信息從 A 點搬移、分發到 B 點。無論分發的是什麼信息,抽象來看就是一個渠道。一開始這個渠道是免費的,但逐漸增加抽傭點或通過其他方式,實現二次變現。
然而,AI 時代改變的不是渠道,而是工廠。AI 產品本身就是工廠,而不是分發平台。工廠生產的貨品,如果第一天賣不到錢,你以後也賣不到錢。這就是為什麼我堅信好的 AI 產品在商業化方面有很大的潛力。
妙鴨之所以選擇 9 塊 9,是經過了各種測算和考慮,希望能夠提供一個相對簡單易懂的價格心智。從我們觀察到的用戶自發傳播的情況來看,9 塊 9 這個價格點是用戶比較容易接受和理解的。
問:爆火之後排隊很久,目前有縮短但還在 3 到 4 個小時,你們做了哪些優化?成本如何?
答:當前排隊時間減少是算力大幅擴容的結果,但我們一方面在增加容量,另一方面用戶使用量也在增加,因此排隊問題仍将存在。解決問題的本質在于擴大算力。擴容成本是可控的,我們定價時有許多考慮因素。我與其他團隊溝通過,他們表示在開發這個產品時存在許多隐形門檻無法克服,但外形上看,其他團隊也能夠開發出類似的產品。然而,他們沒有開發的原因是因為如果上傳的用戶過多,算力成本會變得特别高,從經濟上來看是不劃算的。公司在這方面給予了妙鴨非常大的空間和支持。加上付費,我們在這件事情上還是相對健康的情況。
問:toB 產品上線了之後,除了 9 塊 9 還會有其他定價嗎?答:大家對產品保持關注,具體不太方便講。肯定要符合基本的商業邏輯,最終要賺錢,無非收入、成本和利潤。是否已經實現盈利的賬還不方便算,我只能說我認為是一個相對健康的商業模式。
問:人像寫實這個賽道做到什麼程度,你會覺得比較滿意、可以開拓其他的業務了?
答:我覺得可能路還很長,我們現在剛剛上路。