今天小编分享的互联网经验:意外!又一超级独角兽杀出:在北京海淀,全国第五,欢迎阅读。
铅笔道作者 | 爱羽
近日,北京杀出一个超级独角兽:云知声智能,向港交所发起 IPO 冲刺,2023 年营收 7.27 亿元,位列中国智能语音市场第五。
这家由前摩托罗拉科学家黄伟创立的公司,从 2012 年推出国内首个免费语音云平台,到 2023 年发布 600 亿参数 " 山海大模型 ",十年间踩准了深度学习、多模态芯片、大模型三次技术浪潮。作为国内语音 AI 领網域唯一的独角兽,已连续六年(2018-2024 年)入选 CB Insights 全球人工智能独角兽榜单,估值超 85 亿。
这不仅是又一家 AI 企业的资本突围,更折射出中国智能语音赛道的爆发逻辑。这个千亿赛道还隐藏着哪些新机会?
01 全国排名第五
云知声智能科技的创始人黄伟,是一位在人工智能和语音技术专家,毕业于中国科学技术大学,获得信号与信息处理专业博士学位。
毕业后,黄伟加入摩托罗拉中国研究中心,担任高级研究员,专注于语音识别和自然语言处理技术的研究。
2011 年,移动互联网的快速发展,黄伟看到了语音技术在智能设备上的潜力,决定离开摩托罗拉,创立云知声。
2012 年,云知声成立,彼时专注于物联网人工智能领網域。同年 9 月,公司发布国内首家永久免费的语音云平台,并率先将深度学习引入智能互動领網域。
2018 年 12 月,云知声与平安好医生成立合资公司澔医智能,布局医疗人工智能 。
2019 年 1 月,它发布多模态 AI 芯片战略,3 月与世茂集团成立合资公司,助力地产行业智变。次年 1 月,云知声(子公司)推出业界首款车规级全栈语音 AI 芯片。
大模型爆火之后,它与 360 公司达成框架合作,在语音大模型等多个方向协同发展。
02 产业链拆解
根据云知声的财务数据和公开信息,其核心业务为智能语音技术,主要覆盖智慧生活和智慧服务两大场景 。其中,智慧生活的收入占比最高(可超 80%),比如智能家居、智能酒店等。
智能语音技术产业链可拆解为:上游为基础层,提供硬體和数据支持;中游是技术核心层,负责算法研发与平台搭建;下游是应用拓展层。
2-1 上游:硬體和数据资源供应
硬體设备供应:为智能语音系统提供基础运行硬體。芯片制造商如英伟达、英特尔等,生产用于语音处理的高性能芯片,决定了语音识别、合成等任务的计算速度与处理能力。麦克风、扬声器等音频采集与播放设备供应商,像楼氏电子、歌尔股份,其产品质量影响语音输入输出的准确性与清晰度,优质麦克风能精准采集声音,高保真扬声器可还原清晰语音。
数据资源供应:数据是智能语音技术训练的关键。数据标注公司,如龙猫数据、海天瑞声,通过人工或半自动方式对海量语音数据进行标注,包括语音转文字、标注语义信息等,为模型训练提供高质量数据。
2-2 中游:算法创新和平台搭建,打造核心竞争力
技术研发与算法创新:这是智能语音技术的核心环节。以科大讯飞、云知声为代表的企业,专注于语音识别、语音合成、语义理解等关键技术研发。
技术平台搭建:构建智能语音技术平台,方便开发者接入和使用。百度大腦语音技术平台、阿里云智能语音互動平台等,整合语音技术能力,提供语音识别、合成、唤醒等 API 接口和开发工具包,开发者通过简单调用接口,就能在自己的产品或服务中集成智能语音功能。
2-3 下游:全渠道销售体系,触达终端消费者
产品与服务应用:将智能语音技术融入各类产品和服务,面向终端用户。智能家居领網域,如小米智能音箱、华为全屋智能系统,用户可通过语音控制家电设备;智能客服领網域,许多企业采用智能语音客服系统,如中国移动、招商银行,通过语音识别和语义理解,自动回答客户咨询,提高服务效率和质量。
系统集成与解决方案提供:系统集成商将智能语音技术与其他相关技术、设备进行整合,为客户提供定制化解决方案。例如,在智慧办公场景中,系统集成商将智能语音会议系统、智能语音文档处理系统等集成在一起,打造高效的办公环境。
03 智能语音赛道全景
3-1 智能语音的分类
关键词识别:主要用于精准识别特定的关键词或短语,常见于语音助手、语音控制等场景。语音转文本:将语音内容转化为文本形式,在语音转写、语音搜索领網域应用广泛。
语音指令识别:专注于识别特定的语音指令,如在智能家居、智能手机设备上,用户可以通过语音指令实现打开应用、拨打电话等操作。
语音情感识别:旨在识别语音中的情感信息,如喜怒哀乐等情绪。在情感分析、客服等场景中发挥重要作用。
语音合成:是将文本转化为语音,实现计算机生成语音输出的技术。常见于有声读物、智能客服语音回复等场景。
3-2 智能语音的市场规模及增速
中国智能语音市场规模呈持续增长态势。2023 年中国智能语音市场规模达到 382 亿元 。相关机构预测,2024 年市场规模将达到 469 亿元,2025 年将进一步增长至 563 亿元 。如此快速的增长,反映出智能语音技术在各行业的应用不断深化,市场需求持续扩大。
3-3 智能语音的发展阶段
智能语音技术已从萌芽期迈入成熟期,并进入商业应用阶段。多数技术已经成熟,实现了大规模的商业化应用落地。在消费级市场,智能音箱、智能车载语音系统等产品广泛普及;在企业级市场,智能语音技术在智能客服、智能办公等领網域得到大量应用。不过,该行业仍在持续发展,如车载语音市场在不断细分,生态系统有待进一步完善 。
04 智能语音上游产业链剖析
智能语音上游赛道的核心数据要素包括语音数据和语义数据。语音数据涵盖各种场景下采集的人类语音,像日常生活对话、特定领網域专业语音等;语义数据则涉及对语言含义的标注和解析,如语句意图、情感倾向等,帮助模型理解语言背后的真实意图,实现更精准互動。
4-1 解决的痛点:
在语音识别准确性上,由于缺乏大量多样的语音数据训练,模型难以适应不同口音、语速和复杂环境,导致识别错误率高。语义理解层面,有限的语义数据使得模型无法精准把握用户意图,互動效果差 。
4-2 所处的地位强弱:
上游话语权较强,但不如中游。数据如同智能语音技术发展的 " 燃料 ",没有充足、高质量的数据,中游的技术研发和算法优化将受限,下游应用的功能拓展和体验提升也难以实现 。
4-3 主要代表玩家:
在数据采集和标注领網域,有海天瑞声、标贝科技等。海天瑞声为智能语音企业提供多场景、多语种的语音数据采集和标注服务,其数据覆盖智能安防、智能车载等多个领網域;标贝科技自主研发 AI 数据平台,采用人机协同方式进行多模态数据标注,在智能驾驶领網域的数据采集标注服务表现突出。此外,一些大型互联网公司如百度、阿里巴巴等,凭借自身业务积累的海量语音和语义数据。
05 智能语音中游产业链剖析
智能语音中游赛道主要由语音技术提供商组成,负责将上游的硬體和数据资源转化为可应用的技术和服务。这包括智能语音解决方案提供商、大型互联网企业以及初创企业等。
5-1 所处的地位强弱:
智能语音中游环节在整个产业链中的话语权很强。在毛利率方面,中游企业通过技术研发和创新,将上游的基础资源转化为高附加值的技术和服务,通常能获得较高的毛利率。在寡头集中度上,全球语音市场基本形成了寡头垄断格局,如科大讯飞、百度等企业凭借技术和用户积累,占据较高市场份额。这些头部企业能够主导行业发展方向。
5-2 关键驱动要素:
技术突破:深度学习、大模型与语音互動技术的融合显著提升了识别准确率和场景适配能力,推动 AI 客服、智能助手等新应用落地。
政策导向:国家《人工智能产业综合标准化体系建设指南》等檔案明确技术研发方向,地方政府通过专项基金和税收优惠加速产业布局。
5-3 主要代表玩家:
头部企业(如科大讯飞、百度)凭借技术壁垒主导市场,而云知声作为垂直领網域代表,以 " 云端芯 " 一体化战略聚焦医疗和物联网场景,其语音电子病历和车规级芯片凸显差异化优势。行业驱动力来自大模型技术突破(如多模态融合)、政策支持(国家 AI 标准化)及智能家居 / 车载需求爆发,形成 " 技术 - 场景 - 生态 " 闭环竞争格局。
06 智能语音下游产业链剖析
下游核心是各类终端产品和服务中,直接面向消费者和企业用户。
6-1 解决的痛点:
在智能家居方面,解决了传统家居设备操作繁琐的问题。智能车载领網域,改善了驾驶者手动操作车载设备存在的安全隐患;智能客服领網域,有效缓解了企业人工客服成本高、效率低的问题;智能教育领網域,传统教育模式难以满足每个学生的学习节奏和需求,为学生提供了个性化学习支持;智能医疗领網域,解决了医生病历录入耗时久的痛点,提高了病历录入的效率和准确性,减少医生工作负担。
6-2 所处的地位强弱:
下游赛道竞争激烈,产品同质化现象较为严重,企业需要不断提升产品的差异化竞争优势,紧密贴合用户需求,才能在市场中立足。
6-3 主要代表玩家:
下游产业链五大核心应用领網域呈现以下竞争格局
场景垂直化:企业均通过深耕特定领網域构建壁垒(如云知声医疗电子病历、思必驰车载芯片),技术方案高度定制化;
生态协同性:头部厂商依托生态优势扩张(小米家居联动、百度内容整合),垂直企业通过技术授权融入产业链;
技术代际差:大模型推动竞争从功能互動转向认知互動,具备语义理解与闭环能力的企业(如科大讯飞多模态技术)占据先机。
07 未来 1-3 年新机遇
7-1 技术创新推动应用拓展:
多模态融合技术的发展将为智能语音带来更丰富的互動方式。智能语音与视觉、手势等融合,使设备能更全面理解用户意图,在智能车载和智能家居领網域,实现更自然便捷的互動体验。比如,驾驶者在双手忙碌时,仅靠语音和简单手势就能完成复杂操作
7-2 新兴市场需求增长:
智能语音控制领網域的新兴市场需求呈现爆发式增长,主要受三大因素驱动:
智能家居普及:语音助手(如小爱同学、天猫精灵)通过生态联动实现全屋控制,推动全球市场规模从 2024 年 127 亿美元跃升至 2034 年 5146 亿美元,年复合增长率达 44.8%。
车载与医疗场景深化:车载语音系统提升驾驶安全(如科大讯飞前装方案),医疗电子病历(如云知声系统)优化诊疗效率,垂直领網域定制化需求激增。
技术代际更新:大模型赋能多模态互動(如阿里云 ET 语音 API),边缘计算降低延迟,推动智能客服、教育等场景向认知互動转型。