今天小編分享的互聯網經驗:意外!又一超級獨角獸殺出:在北京海澱,全國第五,歡迎閲讀。
鉛筆道作者 | 愛羽
近日,北京殺出一個超級獨角獸:雲知聲智能,向港交所發起 IPO 衝刺,2023 年營收 7.27 億元,位列中國智能語音市場第五。
這家由前摩托羅拉科學家黃偉創立的公司,從 2012 年推出國内首個免費語音雲平台,到 2023 年發布 600 億參數 " 山海大模型 ",十年間踩準了深度學習、多模态芯片、大模型三次技術浪潮。作為國内語音 AI 領網域唯一的獨角獸,已連續六年(2018-2024 年)入選 CB Insights 全球人工智能獨角獸榜單,估值超 85 億。
這不僅是又一家 AI 企業的資本突圍,更折射出中國智能語音賽道的爆發邏輯。這個千億賽道還隐藏着哪些新機會?
01 全國排名第五
雲知聲智能科技的創始人黃偉,是一位在人工智能和語音技術專家,畢業于中國科學技術大學,獲得信号與信息處理專業博士學位。
畢業後,黃偉加入摩托羅拉中國研究中心,擔任高級研究員,專注于語音識别和自然語言處理技術的研究。
2011 年,移動互聯網的快速發展,黃偉看到了語音技術在智能設備上的潛力,決定離開摩托羅拉,創立雲知聲。
2012 年,雲知聲成立,彼時專注于物聯網人工智能領網域。同年 9 月,公司發布國内首家永久免費的語音雲平台,并率先将深度學習引入智能互動領網域。
2018 年 12 月,雲知聲與平安好醫生成立合資公司澔醫智能,布局醫療人工智能 。
2019 年 1 月,它發布多模态 AI 芯片戰略,3 月與世茂集團成立合資公司,助力地產行業智變。次年 1 月,雲知聲(子公司)推出業界首款車規級全棧語音 AI 芯片。
大模型爆火之後,它與 360 公司達成框架合作,在語音大模型等多個方向協同發展。
02 產業鏈拆解
根據雲知聲的财務數據和公開信息,其核心業務為智能語音技術,主要覆蓋智慧生活和智慧服務兩大場景 。其中,智慧生活的收入占比最高(可超 80%),比如智能家居、智能酒店等。
智能語音技術產業鏈可拆解為:上遊為基礎層,提供硬體和數據支持;中遊是技術核心層,負責算法研發與平台搭建;下遊是應用拓展層。
2-1 上遊:硬體和數據資源供應
硬體設備供應:為智能語音系統提供基礎運行硬體。芯片制造商如英偉達、英特爾等,生產用于語音處理的高性能芯片,決定了語音識别、合成等任務的計算速度與處理能力。麥克風、揚聲器等音頻采集與播放設備供應商,像樓氏電子、歌爾股份,其產品質量影響語音輸入輸出的準确性與清晰度,優質麥克風能精準采集聲音,高保真揚聲器可還原清晰語音。
數據資源供應:數據是智能語音技術訓練的關鍵。數據标注公司,如龍貓數據、海天瑞聲,通過人工或半自動方式對海量語音數據進行标注,包括語音轉文字、标注語義信息等,為模型訓練提供高質量數據。
2-2 中遊:算法創新和平台搭建,打造核心競争力
技術研發與算法創新:這是智能語音技術的核心環節。以科大訊飛、雲知聲為代表的企業,專注于語音識别、語音合成、語義理解等關鍵技術研發。
技術平台搭建:構建智能語音技術平台,方便開發者接入和使用。百度大腦語音技術平台、阿裏雲智能語音互動平台等,整合語音技術能力,提供語音識别、合成、喚醒等 API 接口和開發工具包,開發者通過簡單調用接口,就能在自己的產品或服務中集成智能語音功能。
2-3 下遊:全渠道銷售體系,觸達終端消費者
產品與服務應用:将智能語音技術融入各類產品和服務,面向終端用户。智能家居領網域,如小米智能音箱、華為全屋智能系統,用户可通過語音控制家電設備;智能客服領網域,許多企業采用智能語音客服系統,如中國移動、招商銀行,通過語音識别和語義理解,自動回答客户咨詢,提高服務效率和質量。
系統集成與解決方案提供:系統集成商将智能語音技術與其他相關技術、設備進行整合,為客户提供定制化解決方案。例如,在智慧辦公場景中,系統集成商将智能語音會議系統、智能語音文檔處理系統等集成在一起,打造高效的辦公環境。
03 智能語音賽道全景
3-1 智能語音的分類
關鍵詞識别:主要用于精準識别特定的關鍵詞或短語,常見于語音助手、語音控制等場景。語音轉文本:将語音内容轉化為文本形式,在語音轉寫、語音搜索領網域應用廣泛。
語音指令識别:專注于識别特定的語音指令,如在智能家居、智能手機設備上,用户可以通過語音指令實現打開應用、撥打電話等操作。
語音情感識别:旨在識别語音中的情感信息,如喜怒哀樂等情緒。在情感分析、客服等場景中發揮重要作用。
語音合成:是将文本轉化為語音,實現計算機生成語音輸出的技術。常見于有聲讀物、智能客服語音回復等場景。
3-2 智能語音的市場規模及增速
中國智能語音市場規模呈持續增長态勢。2023 年中國智能語音市場規模達到 382 億元 。相關機構預測,2024 年市場規模将達到 469 億元,2025 年将進一步增長至 563 億元 。如此快速的增長,反映出智能語音技術在各行業的應用不斷深化,市場需求持續擴大。
3-3 智能語音的發展階段
智能語音技術已從萌芽期邁入成熟期,并進入商業應用階段。多數技術已經成熟,實現了大規模的商業化應用落地。在消費級市場,智能音箱、智能車載語音系統等產品廣泛普及;在企業級市場,智能語音技術在智能客服、智能辦公等領網域得到大量應用。不過,該行業仍在持續發展,如車載語音市場在不斷細分,生态系統有待進一步完善 。
04 智能語音上遊產業鏈剖析
智能語音上遊賽道的核心數據要素包括語音數據和語義數據。語音數據涵蓋各種場景下采集的人類語音,像日常生活對話、特定領網域專業語音等;語義數據則涉及對語言含義的标注和解析,如語句意圖、情感傾向等,幫助模型理解語言背後的真實意圖,實現更精準互動。
4-1 解決的痛點:
在語音識别準确性上,由于缺乏大量多樣的語音數據訓練,模型難以适應不同口音、語速和復雜環境,導致識别錯誤率高。語義理解層面,有限的語義數據使得模型無法精準把握用户意圖,互動效果差 。
4-2 所處的地位強弱:
上遊話語權較強,但不如中遊。數據如同智能語音技術發展的 " 燃料 ",沒有充足、高質量的數據,中遊的技術研發和算法優化将受限,下遊應用的功能拓展和體驗提升也難以實現 。
4-3 主要代表玩家:
在數據采集和标注領網域,有海天瑞聲、标貝科技等。海天瑞聲為智能語音企業提供多場景、多語種的語音數據采集和标注服務,其數據覆蓋智能安防、智能車載等多個領網域;标貝科技自主研發 AI 數據平台,采用人機協同方式進行多模态數據标注,在智能駕駛領網域的數據采集标注服務表現突出。此外,一些大型互聯網公司如百度、阿裏巴巴等,憑借自身業務積累的海量語音和語義數據。
05 智能語音中遊產業鏈剖析
智能語音中遊賽道主要由語音技術提供商組成,負責将上遊的硬體和數據資源轉化為可應用的技術和服務。這包括智能語音解決方案提供商、大型互聯網企業以及初創企業等。
5-1 所處的地位強弱:
智能語音中遊環節在整個產業鏈中的話語權很強。在毛利率方面,中遊企業通過技術研發和創新,将上遊的基礎資源轉化為高附加值的技術和服務,通常能獲得較高的毛利率。在寡頭集中度上,全球語音市場基本形成了寡頭壟斷格局,如科大訊飛、百度等企業憑借技術和用户積累,占據較高市場份額。這些頭部企業能夠主導行業發展方向。
5-2 關鍵驅動要素:
技術突破:深度學習、大模型與語音互動技術的融合顯著提升了識别準确率和場景适配能力,推動 AI 客服、智能助手等新應用落地。
政策導向:國家《人工智能產業綜合标準化體系建設指南》等檔案明确技術研發方向,地方政府通過專項基金和税收優惠加速產業布局。
5-3 主要代表玩家:
頭部企業(如科大訊飛、百度)憑借技術壁壘主導市場,而雲知聲作為垂直領網域代表,以 " 雲端芯 " 一體化戰略聚焦醫療和物聯網場景,其語音電子病歷和車規級芯片凸顯差異化優勢。行業驅動力來自大模型技術突破(如多模态融合)、政策支持(國家 AI 标準化)及智能家居 / 車載需求爆發,形成 " 技術 - 場景 - 生态 " 閉環競争格局。
06 智能語音下遊產業鏈剖析
下遊核心是各類終端產品和服務中,直接面向消費者和企業用户。
6-1 解決的痛點:
在智能家居方面,解決了傳統家居設備操作繁瑣的問題。智能車載領網域,改善了駕駛者手動操作車載設備存在的安全隐患;智能客服領網域,有效緩解了企業人工客服成本高、效率低的問題;智能教育領網域,傳統教育模式難以滿足每個學生的學習節奏和需求,為學生提供了個性化學習支持;智能醫療領網域,解決了醫生病歷錄入耗時久的痛點,提高了病歷錄入的效率和準确性,減少醫生工作負擔。
6-2 所處的地位強弱:
下遊賽道競争激烈,產品同質化現象較為嚴重,企業需要不斷提升產品的差異化競争優勢,緊密貼合用户需求,才能在市場中立足。
6-3 主要代表玩家:
下遊產業鏈五大核心應用領網域呈現以下競争格局
場景垂直化:企業均通過深耕特定領網域構建壁壘(如雲知聲醫療電子病歷、思必馳車載芯片),技術方案高度定制化;
生态協同性:頭部廠商依托生态優勢擴張(小米家居聯動、百度内容整合),垂直企業通過技術授權融入產業鏈;
技術代際差:大模型推動競争從功能互動轉向認知互動,具備語義理解與閉環能力的企業(如科大訊飛多模态技術)占據先機。
07 未來 1-3 年新機遇
7-1 技術創新推動應用拓展:
多模态融合技術的發展将為智能語音帶來更豐富的互動方式。智能語音與視覺、手勢等融合,使設備能更全面理解用户意圖,在智能車載和智能家居領網域,實現更自然便捷的互動體驗。比如,駕駛者在雙手忙碌時,僅靠語音和簡單手勢就能完成復雜操作
7-2 新興市場需求增長:
智能語音控制領網域的新興市場需求呈現爆發式增長,主要受三大因素驅動:
智能家居普及:語音助手(如小愛同學、天貓精靈)通過生态聯動實現全屋控制,推動全球市場規模從 2024 年 127 億美元躍升至 2034 年 5146 億美元,年復合增長率達 44.8%。
車載與醫療場景深化:車載語音系統提升駕駛安全(如科大訊飛前裝方案),醫療電子病歷(如雲知聲系統)優化診療效率,垂直領網域定制化需求激增。
技術代際更新:大模型賦能多模态互動(如阿裏雲 ET 語音 API),邊緣計算降低延遲,推動智能客服、教育等場景向認知互動轉型。