今天小編分享的互聯網經驗:獨家對話Soul App CTO:看好多模态端到端大模型落地社交,新能力預計年底上線,歡迎閱讀。
圖片由 Soul 官方提供
社交平台 Soul App 在出海方向上有了新的進展。他們将最新自研的 3D 虛拟人多模态 AI 互動體驗首次落地 10 月 14 日 -18 日舉辦的迪拜 GITEX GLOBAL 海灣信息技術博覽會上。
這也是 Soul 自 2016 年上線以來,首次亮相國際大型展會。在大會現場,參與體驗的用戶可以實現高相似度的 3D 虛拟人的 AI 建模,通過包含人臉的 90 餘個形狀參數和 6 個屬性參數,于幾秒鍾内,快速在 3D 世界精細化還原真實人臉的特征 ,打造專屬的虛拟化身。
據 Soul App CTO 陶明對钛媒體 APP 介紹,該模型具備多模态理解、真實拟人、文字對話、語音通話、多語種等特性,實現更接近人類模式的互動體驗。
" 目前可以看到的是,海外市場對 AIGC+ 社交的接受度非常高。" 陶明對钛媒體 APP 表示。
從具體的數據增長情況來看,根據第三方數據公司 data.ai,美國等海外市場的社交應用榜單 TOP30 上,已經頻繁出現了如 Pengu、Linky AI 等 AI 社交類型的產品。
比如說 Character.AI,盡管已經被 Google 以 25 億美元收購,但在全球收獲超過 2 億用戶後,Character.AI 也通過 2023 上線後的瘋狂增長速度,證明了海外用戶對 AIGC+ 社交產品的歡迎與認可。
不過,陶明也發現,目前在海外還沒有見到特别亮眼的 "AIGC+ 社交 " 的相關產品。
這背後主要的原因是,海外市場的重點其實還是聚焦在技術能力的突破上,而技術突破和應用層落地之間,有比較大的割裂,或者說,海外并不着急把技術盡快落地。
而國内目前的情況是,在技術上很多公司與海外巨頭相比,存在一定的差距,但優勢在于場景和應用的快速落地。這是國内在移動互聯網、數字經濟時代就有的鮮明特征。
所以,他認為,在 "AIGC+ 社交 " 方向,國内的應用落地探索反而會是更快速和積極的。
" 在推進 AIGC+ 社交業務落地的過程中,我們采取的是‘模應一體’思路,大模型是 Soul 解決用戶社交需求的方案之一,不是最終目的。" 陶明說。
2016 年,Soul 在上線時,一個基本的思路是,希望能夠在線上創造一個新的世界,它與現實世界可以不一樣,是真實存在的另一個平行世界,但更有歸屬感。
所以,當時 Soul 沒有采用彼時社交產品流行的導入通訊錄現實關系,或者 LBS 的模式,而是采用了 AI 的解決方案,即,用基于 AI 算法的靈犀引擎,主要是通過對用戶在站内多元場景下的行為數據分析,為用戶推薦有可能結成深度社交關系的人,以去中心化的機制分發關系和内容。
這是 Soul 用 AI 對社交關系中 " 發現 " 環節的變革,也讓 Soul 在用戶層面形成了非常差異化的認知,在上線後,以很快地速度獲得了市場的使用和認可。
截至 2022 年,Soul 的月活用戶近 3000 萬,其中,Z 世代用戶占比超過 78%;平台月活躍 15 天以上的用戶占比 63.7%;人均用戶日均使用時長為 46.4 分鍾,日均私人信息數為 66.9 條。
靈犀引擎的推出和受認可,讓 Soul 堅定了對 AI 的投入,後續,Soul 還陸續推出了集成 AI 的 NAWA 引擎,以及 AI 苟蛋等相關應用。
從目前推出的一系列新功能的用戶反饋來看,AI 的應用讓 Soul 的用戶對話輪數、次留、用戶時長等關鍵數據都有不錯的表現,并且在持續增長中。
陶明舉例說,用戶平均每天會給 AI 苟蛋發送超過 70 條消息,互動平均時長超過 30 分鍾。而在輔助對話方面,在 AI 的參與下,陌生關系的對話框回復率提高了接近十個百分點。
整體來看,陶明認為,AI 對 Soul 的用戶產生了可持續的價值,同時也在 Soul 整體的用戶時長、粘性、用戶體驗等方面都有積極、正向的助力," 這對我們來說就是難以衡量的收益 "。
但 AI 在社交領網域現有的應用落地實踐,距離實現行業徹底的變革還有一定差距,陶明認為,這其中主要的挑戰還在于技術側。
以 Soul 關注的情感關懷這個方向為例,他認為,讓 AI 理解社交、理解情感和情緒這件事情,這其實也是當下 AGI 的難題。比如說,面對 " 我感冒了 " 的信息,在不同的場景中,回答 " 多喝熱水 " 可能并不是讓用戶滿意的答案。
另一方面在于應用層,如何理解用戶核心的社交需求,将前沿的技術能力轉化為用戶需要的產品功能。
諸多難點之下,可以看到的是,AI 對話類的產品正經歷新一輪的洗牌,相關產品正在批量式關停。
很大程度上,這是因為得益于 ChatGPT 橫空出世,以及對話模型的開源,很多 AI 聊天 APP,背後直接使用了開源模型,于是,市場上 AI 社交應用批量湧現,但問題也随之而來:同質化情況嚴重,人機互動體驗、情緒價值反饋沒有顯著的改善,導致用戶留存差,也無法實現有效的商業化。
而 Soul 在快速落地 "AIGC+ 社交 " 的實踐中發現,很多方向也在逐一被證偽。比如說,做 "AI 苟蛋 " 的時候,團隊希望它能說會唱、能識圖、有形象。他們原本也以為,把很多資源投入到每個點上,每個點都做得最好,一定能實現不錯的用戶反饋,但最終發現資源用了很多,效果并不明顯。
" 能說會唱只是一種增益,對話能力,即聊天的情感化再加上語境裡的場景構建是最重要的。在不同場景,一個人用同樣一句語料所表達的情感不一樣,大模型產品在這裡的改進空間還很大。我們的經驗總結是,要先把基礎分做好,然後再優化增益項。" 陶明對钛媒體 APP 說。
在市面上眾多 AI 人機互動產品之中,要做出差異化的關鍵在于 " 大模型的情感能力 "。 而陶明認為,人機互動的本質,是讓 AI 與人社交。社交的本質是情感的流動,只有能夠實現情感的識别,才能讓 AI 更好地理解人性、情緒和情感,實現理想的人機互動。
這需要大模型多模态的、具備拟人化屬性,确保實現情感化、個性化和生活化。也就是說,情感識别是 Soul 一直在持續投入攻克的難點。
下一階段,具備情感能力的大模型或許将會是 "AIGC+ 社交 " 行業競争的新焦點,同時,在 "AIGC+ 社交 " 方向的探索過程中,產品形态不會僅局限于對話場景。
AI Agent 是承載 AI 社交服務的重要載體,也是完成人機互動體驗的重要組成。從更大視角來看,當人們習慣于與 AI Agent 對話、互動,AI Agent 便成為人們接觸數字世界和數字服務的入口,這将進一步打開 "AI+ 社交 " 賽道的發展空間。
陶明更看好的是,多模态端到端大模型的應用,特别是在情感能力突破、多模态互動和端到端能力方向。
情感能力突破指向的是 AI 更能理解、反饋人類,多模态互動則更接近真實、自然的真人日常互動模式,端到端則意味着,為用戶服務的底層方案的創新和真正意義上 " 在場感 " 的實現。
" 這都是颠覆社交體驗的關鍵。" 陶明說,快的話,預計在今年年底,Soul 多模态端到端大模型将再次更新,推出全雙工視頻通話能力,讓用戶可以便捷、自然地體驗到包括文字、語音、視覺在内的多模态創新互動。(本文首發于钛媒體 APP,作者|李程程,編輯|胡潤峰)