AI競賽升温，山海大模型能否挽救雲知聲？

今天小編分享的互聯網經驗：AI競賽升温，山海大模型能否挽救雲知聲？，歡迎閲讀。

圖片來源 @視覺中國

文 | 萬點研究，作者 | 銀杏，編輯 | 陳默默

沒有造血能力的 AI 企業，為支撐龐大的 " 吸血 " 式研發投入，上市或許是唯一的玄學出路，但資本裹挾，似飲鸩止渴。

根據媒體報道，2023 年上半年，在港交所排隊的 AI 、數字化、智能化相關公司數量超過 38 家，占到整個港交所排隊等待聆訊的 40% 左右。最近一段時間，AI 制藥公司 " 英矽智能 "、智能駕駛芯片 " 黑芝麻智能 "、AI 語音 " 雲知聲 "、生成式 AI（AIGC）" 出門問問 " 等多家 AI 公司密集向港交所遞交上市申請。

這足以説明 ChatGPT 的成功給所有賽道公司帶來怎樣的巨大希望。

被科大訊飛 " 打臉 "，雲知聲科創板折戟

其中，AI 語音公司 " 雲知聲 " 是從科創板轉戰港股的。

雲知聲曾于 2020 年 11 月向科創板遞交招股書，衝刺 "AI 語音第一股 "，計劃募資 9.1 億元。2021 年 2 月 18 日，雲知聲撤回發行上市申請。根據當時的招股書顯示，公司一直處于虧損狀态，各期内虧損淨額最高達 -2.92 億，期内三年半累計虧損高達 7.91 億，期間營收僅為 5.62 億元。

雲知聲曾被同處智能語音賽道的科大訊飛質疑數據造假。2020 年 12 月 11 日，有投資者在互動平台提問科大訊飛：" 雲知聲在其招股書中稱其語音病歷和家電智能語音模組領網域的市場占有率均高達 70%，科大訊飛是放棄了這兩塊的業務還是被雲知聲反超？"

對此，科大訊飛用相關數據表達了不認同：以覆蓋醫院數量的距離，雲知聲在 2017 年至今年上半年的四個報告期分别為 10、36、91 和 112 家，科大訊飛同期分别為 11、77、264 和 489 家。

從收入看，雲知聲在上述時期智能語音病歷收入分别為 170.96 萬、926.39 萬、1628.91 萬和 895.48 萬元，科大訊飛同期分别為 664.28 萬、2937.27 萬、3554.48 萬和 3571.11 萬元。

以此來看，雲知聲至少在語音病歷的市場占有率不會超過科大訊飛達到 70％。

新版本招股書披露，雲知聲在中國智慧生活領網域的市場份額僅為 8.4%，在智慧醫院領網域的市場份額僅為 6.6%，過去的數據造假似乎 " 實錘了 "。

招股書顯示，智慧醫院解決方案提供商前五中，雲知聲份額占 6.6%，排名第三，前兩位分别占到 24% 和 20.9%。排名第四的公司占 6.3%、第五名占 6%。

現在，雲知聲轉戰港交所，與此前相比，發生了哪些變化？筆者将復盤過去、反觀現狀。

曾努力創造現金流，無奈賽道競争激烈

雲知聲創始人、CTO 梁家恩曾直言：" 大力能夠出奇迹，但蠻力出不了奇迹。" 但如何衡量 " 大力 " 和 " 蠻力 "，我們無從得知雲知聲是否創造了奇迹。互聯網當下，" 現金流為王 "，至少誰能先把現金流轉正，誰就有活下去的機會。

如何獲得現金流？2B 領網域不但競争激烈，商業化規模無法在短期内迅速爆發。因此，諸多企業家都把目光投向個人消費領網域。

雲知聲在 2019 年發布了聰聰 AI 陪伴教育機器人產品，試圖填補消費業務短板，如今銷聲匿迹。據媒體報道，公司先後放棄競争激烈且毛利率超低的智能音箱、兒童陪伴機器人等領網域業務。

事實上，從 2017 年開始，雲知聲的經營活動現金流量長期為負值，且金額不小，導致歸屬母公司股東權益已經大額負值，這屬實讓潛在投資人有點畏懼。

從數據可以看出，這幾年雲知聲的業務拓展，可以説是不太成功的。

由于受到百度、小米等具備 2B 與 2C 能力的巨頭擠壓導致雲知聲智能語音業務萎靡。

可以預見的是，随着巨頭版圖的持續擴充以及 AI 技術逐漸成為行業基礎設施後，昔日獨角獸的差異化也将會被磨平，生存空間被持續擠壓。

" 幸運 " 的是，2023 年年初，CHAT-GPT" 橫空出世 "。

山海大模型就能拯救雲知聲？

AI 實驗室競賽升温，國内企業急不可耐、先後推出自己的 " 大模型 "。但值得商榷的是，這些大模型在商業上究竟能產生多大價值？

在筆者看來，一般要從兩個角度評判：一是模型的領先性；二是模型的商業價值。至于訓練模型的數據合法性等潛在制約發展的問題，我們暫時不探讨。

先看領先性。大家都知道，在遍地大模型的國内環境裏，出現了很多不和諧的聲音。諸多廠家推出大模型之後，被網友曝光存在可能潛在套用他人模型的可能。部分大模型，輸出結果匪夷所思，智能化根本不存在。

官媒曾一針見血地指出：大家要警惕一些企業利用大模型概念，将前沿科技當作營銷手段，過分誇大其商業價值的傾向。我們要看到大模型在人工智能輔助領網域的潛力，并對其發展給予一定耐心和包容；但也要防止盲目追逐熱點出現投資過熱、重復建設、同質化競争等問題。

那麼，山海大模型的領先性如何？

雲知聲創始人、CEO 黃偉曾説：" 雲知聲将持續更新山海大模型的能力，目标是 2023 年年内通用能力比肩 ChatGPT，并在醫療、物聯、教育等垂直領網域超越 GPT4。"

我們先了解一下山海大模型。根據雲知聲的介紹，山海大模型具備十大能力：即語言生成、語言理解、知識問答、邏輯推理、代碼能力、數學能力、安全合規能力七項通用能力及插件擴展、領網域增強、企業定制三項行業落地能力。

根據媒體對發布會的報道，我們又看到了熟悉的 " 令人驚喜 " 的測試結果。

但是，對所有測試結果，不僅僅是山海大模型，都需要保持一個懷疑态度：一，大部分測試并沒有足夠的随機性，問題是否夠開放，是否經過足夠多的網友測試？正如智能駕駛一樣，任何在訓練集中存在的測試，都會出現很好的結果，但不能證明在真實環境中足夠優秀。二，所有的大模型，對于用户來説都是黑箱，我們無法知曉其底層代碼，那麼，如何保證不是 " 套娃 "？我們在面對這些發布會的時候，都是持有懷疑态度的。

首先，每一個模型都要經過大量文本、影像、聲音檔案或其他數據的訓練，讓它們能夠解讀用自然語言寫就的指令，并用文本、藝術或音樂的形式作出回應。從研發時間維度來看。根據報道，" 雲知聲能夠在半年内完成算力擴容、算法驗證、并行加速、數據優選等工作，實現 GPT 為核心的架構更新和成功發布山海大模型。" 半年時間，企業真沒有在誇大嗎？

其次，我們看研發投入。由于產品是人的技術和資金產生共振的結果，所以我們先看看競品情況。如下圖所示，雲知聲無論研發費用、員工人數，都遠不如競争對手。

根據報道，今年 1 月，微軟在早前投資了 10 億美元的基礎上，又向開發出 ChatGPT 的創業公司 OpenAI 投資了 100 億美元。

顯然，山海達模型并沒有明顯更勝一籌。

那麼，其商業價值又如何？

如果模型沒有絕對的領先性，就存在競争的問題。

雲知聲的戰略是 U+X，X 就是在細分領網域應用。根據媒體報道，在發布會現場，雲知聲演示了在山海大模型的輔助下，基于病歷輔助醫生生成完整的病歷方案、輔助醫療相關理賠等多個場景，提升了業務效率和智能化程度。此外，在 MedQA 測評中，山海大模型以 81.56% 位居第一，超過 GPT4、Med-PalM 等模型；在臨床執業醫師資格考試中，山海大模型得分高達 511 分，遠超平均分和及格線。

要知道，這個賽道是夠細分，但競争異常激烈。

首先，如果讓模型去輔助看病，且不説道德和法律風險，其收費模式将是一個大大的問号，從目前來看，除了少部分疑難雜症，大部分醫生是可以勝任其工作的，醫院不大可能為輔助醫生診斷的軟體過多付費，錦上添花的輔助應用較為有限；

其次，若是進入電子病歷市場，又是諸多巨頭存在的小眾市場。根據數據，2016-2021 年中國電子病歷市場規模由 7 億元增長至 2021 年的 23.3 億元，短期也就是一個小幾十億的規模。

這個賽道裏，嘉和美康仍居國内龍頭位置，市場份額為 18%。衞寧健康和海泰醫療位居二三位，分别占比 13.3% 和 11.2%；後面還有東華軟體、創業惠康、萬達信息等一眾上市公司都在虎視眈眈。

無造血能力的 AI 企業

人工智能正由前期研究階段迅速向應用階段滲透，特别是在擅長 1-N 階段的中國。任何技術革命一定會帶來資產泡沫。但我們有理由相信，和互聯網、共享經濟路徑類似，最終這個賽道活下來的将是少數玩家。

OpenAI 開發的大熱聊天機器人 ChatGPT 屬于 " 大語言模型‘這類模型的秘訣就在于一個 " 大 " 字。現代 AI 系統由龐大的人工神經網絡驅動，這些網絡就是以個個非常粗略地模仿生物大腦的軟體。而模型以驚人的速度變大。今年 3 月發布的 GPT-4 大約有一萬億個參數，是 GPT-3 的近六倍。（開發成本突破了一億美元）。

模型越大，運行成本越高。而且有數據稱，用于訓練的高質量文本的存量可能也會在 2026 年前後耗盡。即使訓練得以完成，生成的模型實際使用起來也可能很昂貴。

所以，" 越大越好 " 的方法似乎行不通了，筆者認為，開發者将需要解決如何以更少的資源實現更高性能的問題。

時不我待。對于雲知聲而言，如不能給創造足夠的現金流，豪賭 IPO 成為其目前的 " 救命稻草 "。但港股 IPO 能否成功、能募資多少仍是未知數。

更多精彩内容，關注钛媒體微信号（ID：taimeiti），或者下載钛媒體 App