今天小編分享的互聯網經驗:大模型To C落地,AI商業化半場開香槟?,歡迎閱讀。
圖片來源 @視覺中國
文|互聯網江湖
大模型似乎沒能帶來更多的估值上的想象力。
今年 3 月 14 日,OpenAI 發布 GPT-4,大模型理解能力、可靠性有了進一步提升。兩天後,百度聞心一言正式發布,直到 8 月底,文一言才正式向大眾開放服務。
百度之外,科大訊飛 5 月 6 日發布星火大模型,9 月 5 日,面向全民開放。商湯方面。4 月份,發布日日新大模型體系,8 月底,日日新大模型獲批。騰訊渾元、阿裡通以千問,也紛紛跑步入場。
如今,首個國產大模型亮相半年過去了,各家資本市場表現如何?
百度 3 月 14 日港收盤股價 129 港元,9 月 18 日收盤 132.2 港元。
商湯 4 月 11 日收盤 3.33 港元,9 月 18 日收盤股價 1.46 港元。
科大訊飛 5 月 8 日收盤 63.76 元,9 月 18 日收盤 48.38 元。
……
對于大模型概念,确實喧嚣過,但是目前來看,繁華褪盡,市場似乎并不買賬。
8 月 15 日,《生成式人工智能服務管理辦法(征求意見稿)》開始施行,AIGC 產品合規之路明朗,于是,國產大模型密集發布,百度、訊飛、商湯等一眾大模型玩家開始搶奪 ToC 市場。
那麼人們手機中的 " 第一個大模型應用 " 能不能成為 AI 生成的 " 第一入口 "?值得深究。
大模型 " 内卷 " 到前台,AI 落地半場開香槟?
可以确定的一點是,走到前台,市場期待的是應用意義上的 " 產品化 "。大模型能夠解決什麼樣的客觀問題,能解決問題的應用,才是有商業價值的應用。
大模型最直接的應用,是語音助手。
大模型強化一波語音互動應用,可能會給某些硬體行業帶來 " 第二春 ",比如智能音箱有了新賣點,小度智能音箱可能會找到新的增長點。
語音助手領網域的應用,最順利的可能還是汽車。
文心一言收獲了吉利、長城、紅旗、東風日產、岚圖,ChatGPT 接入奔馳,星火大模型接入廣汽,華為盤古接入賽力斯……這也是大模型最容易商業化的場景之一。畢竟,對于車載場景來說,語音助手應用是剛需,也是比較成熟的 B 端落地領網域。
大模型向 C 端滲透過程中,雖然已經邁出重要的一步,但距離真正的大規模應用,恐怕還有距離。
如今的歡呼,倒像是半場開香槟,現實是大模型還遠未到成熟的階段。
人們需要接受的是,大模型看起來很強,但你真正用它去解決問題的時候,會發現真正沒有那麼的強。
對于一些最實際的,哪怕是簡單的需求,大模型都還沒有辦法滿足,背後有數據的問題,生态的問題,但歸根到底,還是只能有限地解決實際需求。
首先是數據新鮮度的問題。在實際的使用過程中,我們發現,同樣的問題,大模型給出的答案甚至不如搜索。
這是百度搜索給出的答案:
這是文心一言給出的答案:
從時效性以及準确度來說,反而是搜索更符合常理,也更符合人們對于真實場景的認知。
" 凡是要跟語言文字或程式代碼打交道的應用場景,都可能有文心一言的用武之地。" 王海峰曾對外界表示。
的确,大模型的應用場景很大,但現實是,真實的需求場景中,當下的大模型產品似乎還有不少能夠提升的空間。
相比文心一言,訊飛星火大模型給出了答案,但時間是 2022 年度上市公司排名,并不是當下最新的數據,也同樣是數據新鮮度的問題。
數據新鮮度的問題,本質上是數據生态的孤島問題。
對于某些垂直領網域的提問,大模型給出的答案無論是從專業度上還是從時效性上都似乎不能滿足人們的需要。這可能是因為,無論是文一言,或是星火大模型,大家對垂直領網域的數據訓練其實還不夠。
比如,對于财經信息方面,大模型給出結果可能還不如财經信息網站上搜到的結果準确,可用,當然這裡面可能會涉及版權的問題,但本質上其實就是數據生态的孤島的問題。
拿 ChatGPT 來說, OpenAI、Google 及其支持的 Anthropic 多年來一直在使用其他網站或公司的在線内容來訓練他們的生成式 AI 模型,雖然數據的量有保證了,但也有潛在的法律問題。
當大模型走向前台,這種數據孤島問題會更加突出。因為用戶不在乎你怎麼獲取數據,用戶只在乎,你的工具好不好用。
天眼查 APP 搜索大模型,相關結果有 100 多家,雖然其中也有不少大模型都發布了各自的 APP,但目前來看真正好用的其實不多,大量用戶湧入還是因為有新鮮感,大模型在 C 端應用方面做的工作其實也還很有限。
比如,用戶想把一張 2K 分辨率的圖片清晰度生成為 4K,其實技術上并不復雜,但大模型卻給不出結果,對于普通用戶來說。用過一次不好用,恐怕就很難再堅持用下去了。
就像曾經的智能音箱、語音助手, 其實大家手機裡都有 AI 語音助手,為什麼使用的頻率并不高?其實還是因為不好用。所以,對于百度、訊飛甚至商湯來說,挑戰不在于能不能把 C 端的應用做出來,而在于做的夠不夠好。
百度產品上比較成功的就是百度搜索,智能搜索的确很強大,但大模型產品能不能做到像搜索一樣的水平,需要打一個問号。
對訊飛而言,一些硬體產品做得不錯,但考驗在于軟體產品的定義能力;對于商湯來說,ToB 的應用做了不少,但 ToC 顯然還是需要更多的經驗。
目前來看,國產 ToC 的大模型差異化并不大,大多是内容創作、AI 繪畫、翻譯、AI 辦公等場景應用,也能幫助人解決一些實際的問題,比如生成會議大綱,給 PPT 寫提綱、寫研報、寫工作日報。
但接下來,能不能 ToC 的大模型真正做成 " 爆款 ",做出差異化,恐怕考驗的就不僅是 AI 技術了。
大模型產品化的視窗期不多了
大模型落地 B 端的一個最大阻礙是不能理解業務。
舉個例子,金融領網域是強數據導向的領網域,人們需要在數據的基礎上去做決策,如果把大量的數據以及金融理論用來訓練 AI,那麼面對瞬息萬變的市場,大模型的決策有多少的準确度?用戶敢不敢用?
之前馬斯克曾表示,FSD V12 幾乎完全是神經網絡,構築了一套端到端自動駕駛技術。也就是說,端到端的信息輸入輸出過程是一個 " 黑箱 "。
你不知道 AI 是怎麼具體做決策的,但是你最終會得到一個可用的結果。
大多數時候,這樣的應用是沒有問題的,比如出行領網域,人們需要的是安全到達目的地,即便是決策黑箱的問題存在,但并不影響實際應用。
決策黑箱最大的問題是決策信任的問題,雲到端的大模型也有類似的問題。
比如,你問大模型一個問題,AI 問題給出的答案夠不夠真實可信?這個問題還需要花大力氣解決。簡單點說,要去教大模型什麼樣的結果是正确的,是易用的,這就需要不斷把模型的輸出結果跟現實去 " 對齊 "。
這也是大模型落地 C 端的一個重要挑戰。
輸出結果的真實性,有效性能不能得到最基本的保證?這是大模型應用能否真正迎來大爆發需要解決的前置問題。
過去 ChatGPT 花了大量的成本去做這個件事,文心一言,星火大模以及商湯的日日新大模型顯然也需要經歷這個過程。
目前階段,通用大模型的應用熱更像是人們的一場自嗨,公司發布大模型往往會伴随着一系列的公關活動,但除此之外,能給 B 端公司帶來怎樣的效益增量,仍然沒有一個較為清晰的方案,只是空有一句 "AI 智能化大模型降本提效 " 的公關話術。
這種品宣做 " 巨人 " 業務上做 " 矮子 " 的現狀,無非是想打上大模型的标籤,好讓二級市場高看自己一眼。不過,市場已經在用腳投票,最終還是會看實際的商業化表現。
互聯網江湖認為,如果說過去大模型的價值,在于對科技企業的 " 标籤化 " 想要在二級市場謀個好價格,那麼接下來能不能活下去,就在于能否完成 " 產品化 ",真正靠應用能力 " 打天下 "。
矽谷教父彼得 · 蒂爾曾說,喜歡給自己貼标籤賽道标籤的公司幾乎都是不可投資的那一檔,他曾經這樣表達這個觀點:" 我對一切主題熱點投資都抱有懷疑态度,一般來說這樣的投資毫無區分度。大家很喜歡把一大堆完全不同的東西放進一個熱點中,标籤是,雲計算,大數據,人工智能,醫療 SaaS 等等,但是實際上是底層卻完全沒有區分度的公司。"
大模型也是如此。
事實上,AI 賽道的泡沫被擠出之後,市場清楚地知道,大模型真正的價值還是在于產品化。而產品化的關鍵,不僅是技術的比拼,也是產品經理能力的比拼。
在這一點上,上個時代的 " 王者 " 們(比如阿裡、騰訊)可能比百度們更有經驗和話語權。
一方面,產品化的關鍵在于能夠精準定義用戶需求。
比如,大家目前都比較青睐于去做 AI 原生應用,但 AI 原生應用如何能夠更好地去滿足用戶的實際需求,靠的還是產品定義。
另一方面,產品化之後,大模型才有差異化,而商業化其實是產品化自然而然的結果。
在體驗過各家發布的大模型產品後,有這麼一種強烈的感覺,雖然叫不同的名字,但大家的產品并沒有太多差異,能夠完成的任務類型都差不多。
比如,剛開始用文心一言,你會覺得确實很厲害,什麼問題都能給出答案,一旦涉及稍微深度點的内容,就會發現他給出的答案太公式化,而且大多數時候像是空話、套話。
不只是文心一言、訊飛的星火大模型、商湯的商量 SenseChat,大家表現其實都差不太多。
本質上,這是因為大模型本質上不是強人工智能,還是需要靠數據去不斷訓練,并不是真正意義上根據信息去做判斷。所以差異化的關鍵,還是在于最終的應用產品。
互聯網江湖認為,大模型產品不僅需要靠場景 " 吸引住 " 用戶,更需要用體驗來留住用戶,甚至激發用戶的付費意願。
目前來看,通過審批的這些大模型應用產品集中了覆蓋用戶日常大部分場景的工具,從工作到文娛各個方向的應用都已經開始出現,想要成為新的入口。
問題在于,大多數用戶還是處于嘗鮮的狀态,用來解決實際問題的用戶可能并不多。原因可能還是在產品應用上。
就拿檢查錯别字這個簡單的需求來說,從親身的使用體驗來講,目前市面上的主流的大模型應用做得都不怎麼好,反倒是一些專門做文章校對的垂直平台,用戶體驗要好得多。作為一個文字工作者來說,對于這樣的產品其實有很強的付費意願。
不僅是文字工作,代碼生成、圖片生成也是如此,目前的大模型初步解決了 " 能不能用 " 的問題,但真正的關鍵是要解決 " 好不好用 " 的問題。
所以,這些細分應用上的產品能力,可能會是用戶能不能真正把大模型用起來的關鍵。
用戶大量用起來之後,用來訓練 AI 的數據足夠多,AI 大模型的能力便能夠突飛猛進。ChatGPT 真正的起飛,也是在大量用戶湧入之後。
可以預見的是,大模型開放之後,AI 原生應用會出現一波爆發,而在應用爆發之後,能夠有多少用戶留下來,可能是 " 文心一言 " 們需要深入思考的問題。
" 想在‘百模大戰’之中笑到最後,還是得看究竟會有多少用戶願意花真金白銀買單。" 行業觀察人士劉宇表示。
ChatGPT 用戶過億後,開始對 C 端收取訂閱費用,每月 20 美元,而且針對 B 端專門推出了企業版。這說明 OpenAI 的思路在轉變,從做技術轉變為做產品。當然,前提是 ChatGPT 已經證明了能夠去解決更多的實際問題。
國產大模型,達到 GPT4 的水平還需要一年,也就是說,真正留給大模型玩家去定義、完善大模型 AI 原生應用的視窗期還有一年。接下來,如何去做好這方面的工作,進一步提升大模型的數據時效問題,可能才是關鍵。
寫在最後:
喬布斯和 iPhone 的成功證明,真正出彩的不是永遠都不是技術,而是產品。
如何做好應用產品,可能是大模型玩家們需要更明确的目标。可以預見的是,接下來 C 端應用的确都需要用大模型重做一遍,這對百度、訊飛、商湯來說,無疑是一次機遇。
AI 行業從來不缺等風者,但真正缺的是造風者,接下來到了真刀真槍的戰場,誰能一呼百應打開大模型應用的金礦,我們且行且看。