今天小編分享的互聯網經驗:大模型激戰正酣?“小模型”或許才是出路,歡迎閱讀。
圖片來源 @視覺中國
文 | 青橙财經,作者丨青沐編輯丨六子
7 月 26 日,OpenAI 推出安卓版 ChatGPT,雖然目前僅限在美國、印度、孟加拉國和巴西四國使用,但 OpenAI 也表示,下周将在更多國家推廣安卓版 ChatGPT。這讓近期熱度稍降的 ChatGPT 重回大眾視野。
ChatGPT 在上線之初,用僅僅兩個月的時間,就一躍成為歷史上最快突破 1 億用戶的應用,沉寂了許久的全球科技市場再次沸騰,國内的投資人與創業者,紛紛飛往矽谷取經問道。
面對這一洶湧的 AI 浪潮,中國的創業者和投資人們行動很快。數月之後,中國科技行業已呈現 "百模大戰" 的壯觀姿态。2023 年上半年,國内就已出現了 80 多個大模型產品,在最新的數據中,國内市場上已經有 130 家公司在做大模型。而在全球範圍内,今年上半年新發布的大模型已超過 400 個。
中國的大模型玩家們在追逐商業利益和科技未來的同時,也被冠以民族情懷:做中國版的 OpenAI。
7 月 24 日消息,安卓版 ChatGPT 上線前夕,IDC 發布的大模型技術能力評估報告顯示,百度文心大模型 3.5 拿下 12 項指标的 7 個滿分,綜合評分第一。百度副總裁吳甜表示,新版本的文心一言 3.5 能力已超越 ChatGPT 3.5,這是在我們國内開展相關技術工作重要的裡程碑。
科大訊飛則在此前就宣布,将在 10 月 24 日對星火大模型進行第三次迭代,全面對标 ChatGPT,中文能力實現超越 GPT3.5,英文能力與 GPT3.5 相當。
01 場景,場景
事實上,正如前 Google 科學家、出門問問創始人兼 CEO 李志飛所說的那樣,中國或許不會存在一個跟 OpenAI 一樣的組織。
相比 ChatGPT 這種通用大模型,國内的大模型產品,更多注重應用和場景,即垂直大模型、行業大模型、產業大模型。對此,科技創投圈大佬們的意見幾乎表達了同一個意思。
百度創始人李彥宏早就公開表示:" 創業公司重新做一個 ChatGPT 其實沒有多大意義。我覺得基于這種大語言模型開發應用機會很大,沒有必要再重新發明一遍輪子,有了輪子之後,做汽車、飛機,價值可能比輪子大多了。"
金沙江創投董事總經理朱嘯虎在朋友圈寫道:"不要迷信通用大模型,因為明年 GPT-3.5 就成 commodity(通用基礎設施),而三年後,GPT-4 也會是。對于大部分創業者,場景優先,數據為王!"
獵豹移動董事長兼 CEO 傅盛認為,大模型會分兩條路。一條叫越來越牛的大模型,是 " 造一個愛因斯坦 "。但很多工作崗位不需要 " 愛因斯坦 ",大學畢業生就能做。這是另一條路。我相信一定有大量的人做 "平民化大模型"。
華為雲 CEO 張平安在盤古大模型 3.0 發布會上表示:"盤古大模型沒有時間作詩和聊天。參數再多、對話能力做得再好,但如果解決不了實際問題,也沒有多大用處。"
近期國内發布的大模型,大多都面向垂直產業落地,如京東發布的言犀大模型,攜程發布的旅遊行業垂直大模型 " 攜程問道 ",閱文集團發布的閱文妙筆大模型,網易有道發布的教育領網域垂直大模型 " 子曰 " 等。
京東言犀大模型沉澱了京東在零售、物流、健康、金融等行業多年積累的知識,融合 70% 通用數據與 30% 京東數智供應鏈原生數據進行訓練,帶來了商品推薦、金融政策、理财規則、物流體驗等領網域的能力。京東雲事業部總裁曹鵬認為,單一的大模型技術本身無法直接產生價值,技術只有放到場景裡,才能產生實際價值。
攜程旅遊大模型問道篩選了 200 億非結構性旅遊數據,結合攜程現有的結構性實時數據,以及攜程歷史訓練的機器人和搜索算法,進行了自研垂直模型的訓練,同時投入了巨大人力對旅行通用回復内容進行生成和校驗。攜程創始人、董事局主席梁建章表示,攜程會不遺餘力地為大模型投入,投資數額不設限。
在應用方面,百度近日與聯想在 AIGC 領網域達成合作,聯想私人定制業務全面引入百度文心一格,消費者可通過官網 AIGC 主題繪畫活動定制筆記型電腦外觀。華為雲盤古大模型與美圖視覺大模型 MiracleVision 合作推出的 AI 模特試衣功能,可以有效提升服裝類產品的電商上架效率。
垂直大模型雖然不如通用大模型那樣對參數和算力有太高的要求,但對場景和數據有着更高的要求,需要開發者具備專業的知識、豐富的行業應用實踐積累,對錯誤的容忍程度也更低,需要 AI 具備超強的穩定性和可靠性。所以越到垂直行業,垂直模型的優勢也就更大。
" 通用大模型可以在 100 個場景中,解決 70%-80% 的問題,但未必能 100% 滿足企業某個場景的需求。企業如果基于行業大模型,再加上自身數據進行精調,可以建構專屬模型,打造出高可用性的智能服務,而且模型參數比通用大模型少,訓練和推理的成本更低,模型優化也更容易。" 騰訊集團高級執行副總裁、雲與智慧產業事業群 CEO 湯道生表示。
從這個角度來說," 小模型 " 或許更性感,更能解決具體的問題。
商湯推出了千億參數的大模型,也在推出針對不同垂直領網域的百億參數小模型。大模型的長處在于能夠找到新的解法,幫助解決新問題,一旦解決以後可以在狹窄領網域產生大量數據,重新訓練小模型。有的小模型甚至可以跑在終端上,成本更低。但如果沒有大模型,小模型也不會存在。
02 大廠赢家通吃,創業公司的機會在哪?
行業裡有一種觀點認為,中國版的 ChatGPT 只會在 5 家公司產生:百度、阿裡、騰訊、字節、華為。
互聯網時代,是典型的 "721",第一名吃香喝辣,第二名勉強生存,第三名往後朝不保夕。
眼下,百模混戰,誰都想在大模型裡分一杯羹。但有一個很現實的問題是,大廠做大模型,有着創業公司無法比拟的優勢。小而美的創業公司,想靠三五個人就幹翻大廠,大概率只是一種幻覺。
大模型離不開雲平台。大模型落地需要不斷進行微調、訓練、都需要在雲平台上運行。百度、阿裡、騰訊、字節、華為都有自己的雲業務,百度和華為還完成了從還完成了從芯片到應用的布局,百度是 "昆侖芯 + 飛槳平台 + 文心大模型",華為是 "昇騰芯片 +MindSpore 框架 + 盤古大模型",這都是創業公司難以企及的優勢。
此外,在資金儲備、人才資源、使用場景、數據積累方面,大公司都有着天然的優勢。創業公司沒有落地場景,技術就沒法迭代,無法持續優化,無法形成數據網絡效應。
那麼小公司就一點機會都沒有了嗎?
不妨重提那個淘金時代的喻言:" 這個時代跟淘金時代很像,如果你那個時候去加州淘金,一大堆人會死掉。但是賣勺子、賣鏟子的人永遠可以賺錢。" 這也是奇績創壇創始人兼 CEO 陸奇在近期對創業者的分享。陸奇希望幫助中國創業者認清這次歷史性的拐點時刻,定位今天的時代坐标、找準自己的位置。
7 月初,加州大學伯克利分校計算機科學教授、《人工智能——現代方法》作者斯圖爾特 · 羅素(Stuart Russell)發出警告稱,ChatGPT 等人工智能驅動的機器人可能很快就會" 耗盡宇宙中的文本 ",通過收集大量文本來訓練機器人的技術 " 開始遇到困難 "。
上周,8500 多名作家籤署了一封信,要求 OpenAI、微軟、Meta 和 Alphabet 等公司領導者不要在未經許可或未支付報酬的情況下使用這些作家的作品來訓練人工智能系統,并要求這些人工智能公司賠償其版權損失。
存量的互聯網數據即将被耗盡,優質數據正變得越來越稀缺。一個模型的好壞,20% 由算法決定,80% 由數據質量決定。在數據、算力、算法 " 三駕馬車 " 裡,數據是最核心、最長遠、最基礎性的要素。大模型需要用海量數據進行喂養,才能持續優化、迭代。
接下來,真正的價值将會變成可持續性的高質量數據。如何持續獲取合法合規、合商業邏輯的數據源,将成為大模型性能提升的關鍵因素。因此,數據運營商或将成為制約大模型發展的重要角色。
比較理想的狀态是,模型不斷為用戶提供服務,用戶不斷為模型生成新的數據。至于下一步,則會拼私有數據。更個性化的服務,意味着需要更私有化的數據,而人類不太可能将私人化數據毫無保留地展示給大模型。
任何時代," 賣水人 " 永遠是一門好生意。頗具意味的是,無論是開創者、探索者還是掘金者,都離不開水。當然也可以賣勺子、賣鏟子。
03 結語
前幾個月,社交平台上有一則帖子流傳甚廣:
把 AI 想象成一個小孩。歐美的 AI 屬于精英教育路線,出生後家裡就一路砸錢供他讀書到博士,等到畢業後,一出場就王炸,驚豔全場。
中國的 AI 屬于功利教育路線,出生就接受生存養育,養到 15 歲,就開始逼着他想辦法給家裡掙錢,學的都是如何市場化的技巧。
寥寥數語,細細品來,滋味萬千。
雖然不一定對,但這或許也在某種程度上解釋了 OpenAI、ChatGPT 為什麼沒有出現在中國。事實上,國内的一些投資人和創業者,在剛開始也是信心滿滿,要做中國版的 OpenAI。在折騰了幾個月後,發現還是要尋找盈利模式,探索業務應用場景和商業化的能力。
值得一提的是,近來部分 C 端用戶感知到 ChatGPT-4 在某些任務上性能表現太差,這被認為是OpenAI 使用混合專家模型(MOE)進行降本增效,将重心轉向企業級服務的動作之一。
放眼望去,蘋果也在研發自己的大語言模型 Apple GPT,高通則已經在研究如何在今年底實現,讓 100 億 -150 億參數級别的模型在手機上離線運行,無需雲端處理運算。
大模型是生產力的重塑,是範式轉換。200 年前,人類用蒸汽機第一次把熱能變成動能,工業化時代開啟。今天,人類用大模型把電能轉換成腦力和通用智力,一個新的時代正在開啟。
輪子固然不需要太多,但我們仍然需要好用的輪子。
任重道遠。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App