今天小編分享的财經經驗:年輕人的好友列表,AI越來越多,歡迎閲讀。
出品|虎嗅黃青春頻道
作者|商業消費主筆 黃青春
題圖|視覺中國
" 孤獨的人是可恥的 ",歌手張楚在 1994 年推出的同名專輯如是唱道。然而 30 年後的互聯網,人們反復甄别,相遇到相知依然是件困難的事情。
相比 80 後、90 後,00 後會更多地為個性化和能夠彰顯自己獨特的數字產品和服務買單,這使得做年輕社交越來越像一門玄學——從 QQ、探探、Soul、積目再到小眾化的輕語、Dots、Falo,互動體驗往往決定着產品的上限。
" 年輕人的社交需求在不斷演化,關系鏈發現、建立、活躍等維度會影響用户數據,但 UI 設計、AI 能力、運營策略則會直接關系用户體驗。" 一位資深產品經理向虎嗅表示。
上周,Soul 剛剛在 GITEX GLOBAL 上(全球三大 IT 展之一)亮出了 AIGC+ 社交融合的新進展:用户不僅能利用 AI 創建 3D 數字人,還可以實時進行沉浸式語言、肢體互動。
" 以前多模态互動是一個連續生成過程,會有延時,Soul 現在語音對話延遲不到 200 毫秒,因為我們已經推出了端到端大模型能力——過去先生成文本 / 影像再轉換為語音,現在能将語音與 NLP 統一到一個集成流程中,從而消除了滞後問題。"Soul CTO 陶明解釋稱,這背後是一個數百人的技術團隊在支撐,而 AI 人員配置占了一半。
事實上,2022 年底 ChatGPT 橫空出世讓整個互聯網都為之躁動,心有猛虎的公司都在尋找向上攀爬的入口——豆包之于字節、元寶之于騰訊、文小言之于百度、通義千問之于阿裏,互聯網企業接連躬身入局。
形勢不等人,Soul 也縱身一躍跳入了這股時代浪潮——一方面,中國移動互聯網走到用户、流量趨于見頂的成熟期,監管會更側重產業互聯網的推進與建設;另一方面,在大模型浪潮的推動之下,AI 正為企業打開新的增長空間,這意味着技術走到平台重構生态的關鍵時期,互聯網公司必須敢于縱身跳入 AI 浪潮(包括技術生态迭代、研發投入等)博一張未來的船票。
于是,越來越多開發者試圖為用户構築出一個豐饒的精神樂園、賽博分身,默默打磨着產品和團隊,日拱一卒推動着產業齒輪緩慢前行。
而當 AIGC 的子彈射中社交時,往往要具備兩個條件,一是持續推進產品快速迭代;二是持續探索新業務與場景融合方式。"Soul 擁有‘人機對話’的基礎原子能力,但用户與業務之間存在鴻溝,不能直接把原子能力推向用户,而要構建一個 AI being 和 Human being 共存的社區。包括大模型六小強做的一些 AI 聊天產品都支持單點聊天能力,但社區無法僅靠單點聊天維持。"
陶明介紹, Soul 正從技術層面利用規則和策略,讓人與 AI 互動變得更沉浸、真實。" 人與 AI 在同一時空下不僅是單純聊天,還要一起參與、創造場景,才能不斷豐富用户體驗。"
順着這個邏輯,AI 不能只具備認知能力,還應當具備超強的感知能力——純認知能力給用户帶來的價值有限,用户更希望表達被感知和理解。
" 社交產品要善于創造場景,在人與 AI 的互動過程中打造更多場景,前陣子我們發布了一個 demo,智能體在跟我們用户打電話的過程當中,如果你咳了幾聲,AI 會思考你是否感冒,這個互動過程用户獲得 AI 的關心,是一種情緒價值。" 陶明説到。
他認為,要加快 AI 的感知效率,必須要在語音和 NLP 的融合上下功夫,但很多大模型公司更多在打造基座能力,Soul 是為數不多去趟這個方向的企業,就是為了讓用户能實時與具備形象、表情、記憶的 AI 多模态互動。
如此發展下去,年輕人好友列表會擴列越來越多 AI ——與 80 後、90 後社交基于某些物理連接(現實身份信息)不同,00 後社交更傾向構建一個賽博分身——他們對于互聯網懷着一種熱烈的期待,渴望被看見,卻又固執地選擇畫地為牢、圈地自萌(圈層化)成為這個世代賽博社交最顯性社交共性。
為什麼賽博社交更容易擄獲年輕人的心?
多位社交賽道從業者向虎嗅表示,市面上大多數傳統社交產品與現實關系綁定、強調顏值、中心化分發内容,反而使自在表達、注重個性化的產品凸顯出差異化優勢:
首先,以探探為代表的滑動匹配,通過產品設計放大顏值、真人照片帶來的視覺刺激。優勢在于,極高的匹配效率;劣勢在于,用户關系維護、沉澱環節缺失,容易轉移到其他主流社交平台,長期留存不理想。
其次,與傳統社交產品唯顏值論、強調荷爾蒙源動力不同,賽博社交以審美、興趣為出發點,重塑形象進行社交溝通;賽博社交倡導 " 注意力普惠 ",鼓勵每一個用户參與到内容創造與社互動動中,并通過機制保證每個用户的發聲被 " 同好 " 看到。
與此同時,主張個性表達是 00 後身上的顯著标籤,因為沒有權威崇拜,反而可以更坦然面對自我——他們并不 care 你現實中的身份,對交友質量特别在意,更注重深度自我表達、平等溝通、包容性,有更強的群體認同感——漢服、語 C、Pia 戲等亞文化圈子莫不如是。
對此,Soul 產品負責人車斌曾向虎嗅表示," 從產品功能角度來看,賽博社交核心服務是無壓力社互動動,并以多樣的產品功能滿足各個圈層個性化的社交需求。尤其 00 後,更依賴‘賽博好友’,彼此不需要成為線下好友。"
以下為虎嗅與 Soul CTO 陶明在迪拜溝通對談實錄,部分内容為方便閲讀有所删減和調整:
賽博社交被 AI 拿捏了
Q:從用户需求來説,開發虛拟數字人大模型的前景如何?
陶明:人機對話是產品基礎的原子能力,但不能直接把原子能力推向用户,而要構建一個 AI being 和 Human being 共存的社區,大模型六小強現在的一些 AI 聊天產品都支持單點聊天能力,但一個社區無法僅靠單點聊天維持住,需要更多 AI 與人共處的場景,比如語聊房場景讓 AI 融合人的模拟情境去交流,類似現實世界的仿真。
所以,產品要善于創造場景,在人與 AI 的互動過程打造更多場景。我們前陣子發布的 demo 中智能體就有感知能力,聊天中用户咳幾聲,AI 會圍繞是否生病這個 topic 展開話題,再比如用户跟 AI 語音對話,AI 聽到周邊是咖啡館或音樂派對,便會主動切入話題。
當然,AI 只具備認知能力并不夠人格化,還必須要有感知能力,所以很多公司會認為加大 o1 認知能力,才能給用户帶來更多的體驗。
Q:你們產品多模态與 o1 呈現效果差距如何?
陶明:對于 AI 的進化來講,感知能力不僅是聽得到聲音,還要聽到環境。所以,加快 AI 的感知效率必須要在語音與 NLP 的融合上下功夫。但這并非多數大模型公司的方向,他們更多是要打造基座能力,我們是為數不多去趟這個方向的公司,目前效果反饋不錯,馬上就可以發布視頻能力,屆時 AI 不僅聽得見還能實時與用户視頻聊天,它有形象、表情和語言邏輯。
而且,端到端延遲在 200 毫秒以内,它不是原來模型的串行,而是把語音和 NLP 的 talking 統一化了,延時得到極大改善,用户才能真正 " 實時 " 得到互動反饋——這對業務會是一個極大拓展,未來類似直播或露臉的功能就可以做了,可探索空間被極大延展。
Q:這個感知包括 AI 場景搭建,有哪些關鍵的指标?
陶明:今年上半年整個戰略方向做了調整,重點聚焦在 AI 手段得提效上,讓 AI 增強現有的社交網絡,站内數據反饋很不錯。滲透來講的話,AI 相關場景 / 功能應該大幾百萬日活,原來很多場景是產品策略去承接,然後打造一些產品功能,現在都慢慢有 AI 自主去承接。
不過,目前并沒有全量去鋪 AI 功能,而是一點點去滲透,因為每個人接受程度、适應能力不同,有些人願意嘗試新事物,有些人則不一定,所以只能循序漸進。
Q:互動需要對用户建立很多标籤,如何實現 AI 的長記憶能力?
陶明:最開始是搜索思路,回答之前搜機庫把答案存下來;後來做了個 AI 小模型,在進入對話大模型之前,小模型會幫用户提煉記憶點,可能有數百個記憶點,時間越長記憶點所涉及範圍會越廣。
現在設想的是對長記憶數據直接輸入進去,但這是一個大的技術方向,裏面還有很多細節,比如記憶不能説完全是持續的,比如整個記憶裏面某個點重復多次,不同時間點感冒應該取哪一次?不同場景是不一樣的,這需要人工去做一些标注輔助,不是一個模型就能解決的。所以,端到端去解決用户體驗還有改進空間,抛開產品、運營,很難純技術解決端到端。
Q:這一輪 AI 技術浪潮,你們是產品推着技術往前走還是技術研發推着產品發展?
陶明:原來邏輯是產品出需求,然後技術實現;現在情況會有一些不同,在内部需求群裏 AI 算法工程師與產品都可以提需求。現階段來看,技術工程師知道 AI 現在能做什麼、需求能實現的确定性高,但產品是創意驅動,提的需求可能現在做不了。不過,這種錯位是階段性的,最終產品與技術的認知會逐漸拉平。
當 AI 的子彈擊中社交
Q:關于社交出海,是否有具體的推進計劃?
陶明:海外一直在探索,Soul 不僅是社交,也要在 AIGC 有獨特生态位,但考慮到體驗層面及用户端粘性,現在沒有正式把海外產品放出來,依舊是主平台傳遞 AIGC + 社交的概念,即面向不同市場,有不同產品表現形式,不同功能及場景,但底層已經徹底打通。
當 AIGC 的子彈射中社交時,往往要具備兩個條件,一是持續推進產品快速迭代;二是持續探索新業務與場景融合方式,後者現在還不是很明朗,所以面對這樣一個不确定性的探索,我們還沒設計具體的時間表。
Q:你們訓練了兩個 AI 模型,在降本增效上有所體現嗎?
陶明:降本增效這個話題是繞不開的。我們有兩個模型,一個是基于形象層面的 3D 大模型,從 2020 年開始探索,希望用户在產品中打造另外一個人設,同時能一鍵生成形象;另一個是多模态大模型,希望用户不僅在 Soul 裏面能跟真人進行對話,還能跟 AI 進行對話。這兩條線一直努力往前走,AI 大模型感知層面已經蠻成熟。
具體而言,組織層面正将各個職能架構進行重組,分 NLP、3D、CV、語音等,團隊把面向單模态模型的所有工作全部 close 掉,打造一個融合團隊來構建多模态模型。
至于技術層面,組織一定會帶來技術方向的改變,所以現在整個技術上只有兩條線:一條線是圍繞類似 GPU 融合去打造 3D、CV、語音的多模态模型;另外一條線是圍繞最近 OpenAI 發布的 o1 模型這個思路去嘗試,因為語言模型是驅動底層模型更通用、更智能的方向,所以業内會保留 NLP 類似 與 o1 在推理端進行強化學習的技術方向走,只是快和慢的問題。
Q:大模型開閉源之争,您怎麼看待這個問題?
陶明:大模型從發展之初就存在開源與閉源兩條路線,背後是兩個不同的商業模式。有企業一直説閉源最好,因為它要打造閉源生态,這是最佳路徑,所以必須要強調這個方向,讓潛在客户夥伴不要去自研模型;選擇将大模型閉源的有 OpenAI 的 ChatGPT、百度的文心一言、華為的盤古、商湯的日日新等;而選擇開源的 Meta、谷歌、百川、360、阿裏等企業,希望借助 " Linux 模式 ",聚合生态力量,讓自己在 AI 市場占據一席之地,肯定會不遺餘力讓潛在客户用他的模型訓練垂類模型。
從技術鄙視鏈條來看,企業產品訓練用的開源,但内心其實也很想去打造一個閉源,這是工程師的一個執念,去打造一個完全閉源從 0~1 訓練的大模型,而不是站在開源的基礎上展示技術能力。
Q:中國互聯網公司訓練現在租卡和買卡投入上如何平衡?
陶明:很多公司沒錢建專門的 GPU 機房,會去各個雲平台買獨占的卡,也會儲備一些彈性的卡,這主要是從成本角度去考量。
但是囤卡風險太大,比如去年囤幾千張卡到現在,整個卡的價值今年可能只剩下百分之三四十,價格波動太大。所以,大模型訓練不要頭腦發熱去囤卡,現在跟供應商去聊,不管軟體還是硬體,技術層面的商務交付方案必須可變,如果含固定就沒有空間了。
Q:今年大模型行業似乎在降温,主要源于什麼?套用開源模型與自研哪個好?
陶明:技術方向其實已經逐漸明朗,面對确定性的東西大家心态就會不那麼焦慮,大概知道每家最後的底牌是什麼。最近行業又有點焦躁,因為 AI 的推理能力的提升,大家又看到一個新的不确定東西,或許行業瓶頸是在英偉達,但現在還是 OpenAI 在引領。
至于是否自研,國内資源現在沒有那麼缺,去年開源的模型越來越多,在開源的基礎上打造自己的基座并不是壞事——因為給業務賦能其實比自己埋頭去做 Api 更重要。其實從產品角度來説,要的是快速交付,可能一天就要進行微調,但對 B 端公司很難交付,所以自研也會同步進行。